[BACK]Return to mdoc_argv.c CVS log [TXT][DIR] Up to [cvsweb.bsd.lv] / mandoc

Diff for /mandoc/mdoc_argv.c between version 1.2 and 1.69

version 1.2, 2009/03/31 13:50:19 version 1.69, 2011/03/17 11:09:36
Line 1 
Line 1 
 /* $Id$ */  /*      $Id$ */
 /*  /*
  * Copyright (c) 2008, 2009 Kristaps Dzonsons <kristaps@openbsd.org>   * Copyright (c) 2008, 2009, 2010 Kristaps Dzonsons <kristaps@bsd.lv>
  *   *
  * Permission to use, copy, modify, and distribute this software for any   * Permission to use, copy, modify, and distribute this software for any
  * purpose with or without fee is hereby granted, provided that the   * purpose with or without fee is hereby granted, provided that the above
  * above copyright notice and this permission notice appear in all   * copyright notice and this permission notice appear in all copies.
  * copies.  
  *   *
  * THE SOFTWARE IS PROVIDED "AS IS" AND THE AUTHOR DISCLAIMS ALL   * THE SOFTWARE IS PROVIDED "AS IS" AND THE AUTHOR DISCLAIMS ALL WARRANTIES
  * WARRANTIES WITH REGARD TO THIS SOFTWARE INCLUDING ALL IMPLIED   * WITH REGARD TO THIS SOFTWARE INCLUDING ALL IMPLIED WARRANTIES OF
  * WARRANTIES OF MERCHANTABILITY AND FITNESS. IN NO EVENT SHALL THE   * MERCHANTABILITY AND FITNESS. IN NO EVENT SHALL THE AUTHOR BE LIABLE FOR
  * AUTHOR BE LIABLE FOR ANY SPECIAL, DIRECT, INDIRECT, OR CONSEQUENTIAL   * ANY SPECIAL, DIRECT, INDIRECT, OR CONSEQUENTIAL DAMAGES OR ANY DAMAGES
  * DAMAGES OR ANY DAMAGES WHATSOEVER RESULTING FROM LOSS OF USE, DATA OR   * WHATSOEVER RESULTING FROM LOSS OF USE, DATA OR PROFITS, WHETHER IN AN
  * PROFITS, WHETHER IN AN ACTION OF CONTRACT, NEGLIGENCE OR OTHER   * ACTION OF CONTRACT, NEGLIGENCE OR OTHER TORTIOUS ACTION, ARISING OUT OF
  * TORTIOUS ACTION, ARISING OUT OF OR IN CONNECTION WITH THE USE OR   * OR IN CONNECTION WITH THE USE OR PERFORMANCE OF THIS SOFTWARE.
  * PERFORMANCE OF THIS SOFTWARE.  
  */   */
   #ifdef HAVE_CONFIG_H
   #include "config.h"
   #endif
   
 #include <sys/types.h>  #include <sys/types.h>
   
 #include <assert.h>  #include <assert.h>
Line 24 
Line 26 
 #include <stdio.h>  #include <stdio.h>
 #include <string.h>  #include <string.h>
   
   #include "mandoc.h"
 #include "libmdoc.h"  #include "libmdoc.h"
   #include "libmandoc.h"
   
 /*  #define MULTI_STEP       5 /* pre-allocate argument values */
  * Routines to parse arguments of macros.  Arguments follow the syntax  
  * of `-arg [val [valN...]]'.  Arguments come in all types:  quoted  
  * arguments, multiple arguments per value, no-value arguments, etc.  
  *  
  * There's no limit to the number or arguments that may be allocated.  
  */  
   
 #define ARGS_QUOTED     (1 << 0)  static  enum mdocargt    argv_a2arg(enum mdoct, const char *);
 #define ARGS_DELIM      (1 << 1)  static  enum margserr    args(struct mdoc *, int, int *,
 #define ARGS_TABSEP     (1 << 2)  
 #define ARGS_ARGVLIKE   (1 << 3)  
   
 #define ARGV_NONE       (1 << 0)  
 #define ARGV_SINGLE     (1 << 1)  
 #define ARGV_MULTI      (1 << 2)  
 #define ARGV_OPT_SINGLE (1 << 3)  
   
 #define MULTI_STEP       5  
   
 enum    mwarn {  
         WQUOTPARM,  
         WARGVPARM,  
         WCOLEMPTY,  
         WTAILWS  
 };  
   
 enum    merr {  
         EQUOTTERM,  
         EMALLOC,  
         EARGVAL  
 };  
   
 static  int              argv_a2arg(int, const char *);  
 static  int              args(struct mdoc *, int, int *,  
                                 char *, int, char **);                                  char *, int, char **);
   static  int              args_checkpunct(struct mdoc *,
                                   const char *, int, int, int);
 static  int              argv(struct mdoc *, int,  static  int              argv(struct mdoc *, int,
                                 struct mdoc_argv *, int *, char *);                                  struct mdoc_argv *, int *, char *);
 static  int              argv_single(struct mdoc *, int,  static  int              argv_single(struct mdoc *, int,
Line 70  static int   argv_opt_single(struct mdoc *, int, 
Line 45  static int   argv_opt_single(struct mdoc *, int, 
                                 struct mdoc_argv *, int *, char *);                                  struct mdoc_argv *, int *, char *);
 static  int              argv_multi(struct mdoc *, int,  static  int              argv_multi(struct mdoc *, int,
                                 struct mdoc_argv *, int *, char *);                                  struct mdoc_argv *, int *, char *);
 static  int              pwarn(struct mdoc *, int, int, enum mwarn);  
 static  int              perr(struct mdoc *, int, int, enum merr);  
   
 #define verr(m, t) perr((m), (m)->last->line, (m)->last->pos, (t))  enum    argvflag {
           ARGV_NONE, /* no args to flag (e.g., -split) */
           ARGV_SINGLE, /* one arg to flag (e.g., -file xxx)  */
           ARGV_MULTI, /* multiple args (e.g., -column xxx yyy) */
           ARGV_OPT_SINGLE /* optional arg (e.g., -offset [xxx]) */
   };
   
 /* Per-argument flags. */  static  const enum argvflag argvflags[MDOC_ARG_MAX] = {
   
 static  int mdoc_argvflags[MDOC_ARG_MAX] = {  
         ARGV_NONE,      /* MDOC_Split */          ARGV_NONE,      /* MDOC_Split */
         ARGV_NONE,      /* MDOC_Nosplit */          ARGV_NONE,      /* MDOC_Nosplit */
         ARGV_NONE,      /* MDOC_Ragged */          ARGV_NONE,      /* MDOC_Ragged */
         ARGV_NONE,      /* MDOC_Unfilled */          ARGV_NONE,      /* MDOC_Unfilled */
         ARGV_NONE,      /* MDOC_Literal */          ARGV_NONE,      /* MDOC_Literal */
         ARGV_NONE,      /* MDOC_File */          ARGV_SINGLE,    /* MDOC_File */
         ARGV_SINGLE,    /* MDOC_Offset */          ARGV_OPT_SINGLE, /* MDOC_Offset */
         ARGV_NONE,      /* MDOC_Bullet */          ARGV_NONE,      /* MDOC_Bullet */
         ARGV_NONE,      /* MDOC_Dash */          ARGV_NONE,      /* MDOC_Dash */
         ARGV_NONE,      /* MDOC_Hyphen */          ARGV_NONE,      /* MDOC_Hyphen */
Line 98  static int mdoc_argvflags[MDOC_ARG_MAX] = {
Line 74  static int mdoc_argvflags[MDOC_ARG_MAX] = {
         ARGV_MULTI,     /* MDOC_Column */          ARGV_MULTI,     /* MDOC_Column */
         ARGV_SINGLE,    /* MDOC_Width */          ARGV_SINGLE,    /* MDOC_Width */
         ARGV_NONE,      /* MDOC_Compact */          ARGV_NONE,      /* MDOC_Compact */
         ARGV_OPT_SINGLE, /* MDOC_Std */          ARGV_NONE,      /* MDOC_Std */
         ARGV_NONE,      /* MDOC_Filled */          ARGV_NONE,      /* MDOC_Filled */
         ARGV_NONE,      /* MDOC_Words */          ARGV_NONE,      /* MDOC_Words */
         ARGV_NONE,      /* MDOC_Emphasis */          ARGV_NONE,      /* MDOC_Emphasis */
Line 106  static int mdoc_argvflags[MDOC_ARG_MAX] = {
Line 82  static int mdoc_argvflags[MDOC_ARG_MAX] = {
         ARGV_NONE       /* MDOC_Symbolic */          ARGV_NONE       /* MDOC_Symbolic */
 };  };
   
 static  int mdoc_argflags[MDOC_MAX] = {  static  const int argflags[MDOC_MAX] = {
         0, /* \" */          0, /* Ap */
         0, /* Dd */          0, /* Dd */
         0, /* Dt */          0, /* Dt */
         0, /* Os */          0, /* Os */
         ARGS_QUOTED, /* Sh */          0, /* Sh */
         ARGS_QUOTED, /* Ss */          0, /* Ss */
         ARGS_DELIM, /* Pp */          0, /* Pp */
         ARGS_DELIM, /* D1 */          ARGS_DELIM, /* D1 */
         ARGS_DELIM | ARGS_QUOTED, /* Dl */          ARGS_DELIM, /* Dl */
         0, /* Bd */          0, /* Bd */
         0, /* Ed */          0, /* Ed */
         0, /* Bl */          0, /* Bl */
Line 123  static int mdoc_argflags[MDOC_MAX] = {
Line 99  static int mdoc_argflags[MDOC_MAX] = {
         0, /* It */          0, /* It */
         ARGS_DELIM, /* Ad */          ARGS_DELIM, /* Ad */
         ARGS_DELIM, /* An */          ARGS_DELIM, /* An */
         ARGS_DELIM | ARGS_QUOTED, /* Ar */          ARGS_DELIM, /* Ar */
         ARGS_QUOTED, /* Cd */          0, /* Cd */
         ARGS_DELIM, /* Cm */          ARGS_DELIM, /* Cm */
         ARGS_DELIM, /* Dv */          ARGS_DELIM, /* Dv */
         ARGS_DELIM, /* Er */          ARGS_DELIM, /* Er */
         ARGS_DELIM, /* Ev */          ARGS_DELIM, /* Ev */
         0, /* Ex */          0, /* Ex */
         ARGS_DELIM | ARGS_QUOTED, /* Fa */          ARGS_DELIM, /* Fa */
         0, /* Fd */          0, /* Fd */
         ARGS_DELIM, /* Fl */          ARGS_DELIM, /* Fl */
         ARGS_DELIM | ARGS_QUOTED, /* Fn */          ARGS_DELIM, /* Fn */
         ARGS_DELIM | ARGS_QUOTED, /* Ft */          ARGS_DELIM, /* Ft */
         ARGS_DELIM, /* Ic */          ARGS_DELIM, /* Ic */
         0, /* In */          0, /* In */
         ARGS_DELIM | ARGS_QUOTED, /* Li */          ARGS_DELIM, /* Li */
         ARGS_QUOTED, /* Nd */          0, /* Nd */
         ARGS_DELIM, /* Nm */          ARGS_DELIM, /* Nm */
         ARGS_DELIM, /* Op */          ARGS_DELIM, /* Op */
         0, /* Ot */          0, /* Ot */
         ARGS_DELIM, /* Pa */          ARGS_DELIM, /* Pa */
         0, /* Rv */          0, /* Rv */
         ARGS_DELIM | ARGS_ARGVLIKE, /* St */          ARGS_DELIM, /* St */
         ARGS_DELIM, /* Va */          ARGS_DELIM, /* Va */
         ARGS_DELIM, /* Vt */          ARGS_DELIM, /* Vt */
         ARGS_DELIM, /* Xr */          ARGS_DELIM, /* Xr */
         ARGS_QUOTED, /* %A */          0, /* %A */
         ARGS_QUOTED, /* %B */          0, /* %B */
         ARGS_QUOTED, /* %D */          0, /* %D */
         ARGS_QUOTED, /* %I */          0, /* %I */
         ARGS_QUOTED, /* %J */          0, /* %J */
         ARGS_QUOTED, /* %N */          0, /* %N */
         ARGS_QUOTED, /* %O */          0, /* %O */
         ARGS_QUOTED, /* %P */          0, /* %P */
         ARGS_QUOTED, /* %R */          0, /* %R */
         ARGS_QUOTED, /* %T */          0, /* %T */
         ARGS_QUOTED, /* %V */          0, /* %V */
         ARGS_DELIM, /* Ac */          ARGS_DELIM, /* Ac */
         0, /* Ao */          0, /* Ao */
         ARGS_DELIM, /* Aq */          ARGS_DELIM, /* Aq */
Line 198  static int mdoc_argflags[MDOC_MAX] = {
Line 174  static int mdoc_argflags[MDOC_MAX] = {
         ARGS_DELIM, /* Sq */          ARGS_DELIM, /* Sq */
         0, /* Sm */          0, /* Sm */
         ARGS_DELIM, /* Sx */          ARGS_DELIM, /* Sx */
         ARGS_DELIM | ARGS_QUOTED, /* Sy */          ARGS_DELIM, /* Sy */
         ARGS_DELIM, /* Tn */          ARGS_DELIM, /* Tn */
         ARGS_DELIM, /* Ux */          ARGS_DELIM, /* Ux */
         ARGS_DELIM, /* Xc */          ARGS_DELIM, /* Xc */
         0, /* Xo */          0, /* Xo */
         ARGS_QUOTED, /* Fo */          0, /* Fo */
         0, /* Fc */          0, /* Fc */
         0, /* Oo */          0, /* Oo */
         ARGS_DELIM, /* Oc */          ARGS_DELIM, /* Oc */
Line 214  static int mdoc_argflags[MDOC_MAX] = {
Line 190  static int mdoc_argflags[MDOC_MAX] = {
         0, /* Fr */          0, /* Fr */
         0, /* Ud */          0, /* Ud */
         0, /* Lb */          0, /* Lb */
         0, /* Ap */          0, /* Lp */
         ARGS_DELIM, /* Lp */          ARGS_DELIM, /* Lk */
         ARGS_DELIM | ARGS_QUOTED, /* Lk */          ARGS_DELIM, /* Mt */
         ARGS_DELIM | ARGS_QUOTED, /* Mt */  
         ARGS_DELIM, /* Brq */          ARGS_DELIM, /* Brq */
         0, /* Bro */          0, /* Bro */
         ARGS_DELIM, /* Brc */          ARGS_DELIM, /* Brc */
         ARGS_QUOTED, /* %C */          0, /* %C */
         0, /* Es */          0, /* Es */
         0, /* En */          0, /* En */
         0, /* Dx */          0, /* Dx */
         ARGS_QUOTED, /* %Q */          0, /* %Q */
           0, /* br */
           0, /* sp */
           0, /* %U */
           0, /* Ta */
 };  };
   
   
 /*  /*
  * Parse an argument from line text.  This comes in the form of -key   * Parse an argument from line text.  This comes in the form of -key
  * [value0...], which may either have a single mandatory value, at least   * [value0...], which may either have a single mandatory value, at least
  * one mandatory value, an optional single value, or no value.   * one mandatory value, an optional single value, or no value.
  */   */
 int  enum margverr
 mdoc_argv(struct mdoc *mdoc, int line, int tok,  mdoc_argv(struct mdoc *m, int line, enum mdoct tok,
                 struct mdoc_arg **v, int *pos, char *buf)                  struct mdoc_arg **v, int *pos, char *buf)
 {  {
         int               i;  
         char             *p, sv;          char             *p, sv;
         struct mdoc_argv tmp;          struct mdoc_argv tmp;
         struct mdoc_arg  *arg;          struct mdoc_arg  *arg;
   
         if (0 == buf[*pos])          if ('\0' == buf[*pos])
                 return(ARGV_EOLN);                  return(ARGV_EOLN);
   
         assert(' ' != buf[*pos]);          assert(' ' != buf[*pos]);
   
         if ('-' != buf[*pos] || ARGS_ARGVLIKE & mdoc_argflags[tok])  
                 return(ARGV_WORD);  
   
         /* Parse through to the first unescaped space. */          /* Parse through to the first unescaped space. */
   
         i = *pos;  
         p = &buf[++(*pos)];          p = &buf[++(*pos)];
   
         assert(*pos > 0);          assert(*pos > 0);
Line 268  mdoc_argv(struct mdoc *mdoc, int line, int tok,
Line 241  mdoc_argv(struct mdoc *mdoc, int line, int tok,
   
         /* XXX - save zeroed byte, if not an argument. */          /* XXX - save zeroed byte, if not an argument. */
   
         sv = 0;          sv = '\0';
         if (buf[*pos]) {          if (buf[*pos]) {
                 sv = buf[*pos];                  sv = buf[*pos];
                 buf[(*pos)++] = 0;                  buf[(*pos)++] = '\0';
         }          }
   
         (void)memset(&tmp, 0, sizeof(struct mdoc_argv));          memset(&tmp, 0, sizeof(struct mdoc_argv));
         tmp.line = line;          tmp.line = line;
         tmp.pos = *pos;          tmp.pos = *pos;
   
Line 284  mdoc_argv(struct mdoc *mdoc, int line, int tok,
Line 257  mdoc_argv(struct mdoc *mdoc, int line, int tok,
                 /* XXX - restore saved zeroed byte. */                  /* XXX - restore saved zeroed byte. */
                 if (sv)                  if (sv)
                         buf[*pos - 1] = sv;                          buf[*pos - 1] = sv;
                 if ( ! pwarn(mdoc, line, i, WARGVPARM))  
                         return(ARGV_ERROR);  
                 return(ARGV_WORD);                  return(ARGV_WORD);
         }          }
   
         while (buf[*pos] && ' ' == buf[*pos])          while (buf[*pos] && ' ' == buf[*pos])
                 (*pos)++;                  (*pos)++;
   
         if ( ! argv(mdoc, line, &tmp, pos, buf))          if ( ! argv(m, line, &tmp, pos, buf))
                 return(ARGV_ERROR);                  return(ARGV_ERROR);
   
         if (NULL == (arg = *v)) {          if (NULL == (arg = *v))
                 *v = calloc(1, sizeof(struct mdoc_arg));                  arg = *v = mandoc_calloc(1, sizeof(struct mdoc_arg));
                 if (NULL == *v) {  
                         (void)verr(mdoc, EMALLOC);  
                         return(ARGV_ERROR);  
                 }  
                 arg = *v;  
         }  
   
         arg->argc++;          arg->argc++;
         arg->argv = realloc(arg->argv, arg->argc *          arg->argv = mandoc_realloc
                         sizeof(struct mdoc_argv));                  (arg->argv, arg->argc * sizeof(struct mdoc_argv));
   
         if (NULL == arg->argv) {          memcpy(&arg->argv[(int)arg->argc - 1],
                 (void)verr(mdoc, EMALLOC);  
                 return(ARGV_ERROR);  
         }  
   
         (void)memcpy(&arg->argv[(int)arg->argc - 1],  
                         &tmp, sizeof(struct mdoc_argv));                          &tmp, sizeof(struct mdoc_argv));
   
         return(ARGV_ARG);          return(ARGV_ARG);
 }  }
   
   
 void  void
 mdoc_argv_free(struct mdoc_arg *p)  mdoc_argv_free(struct mdoc_arg *p)
 {  {
         int              i, j;          int              i;
   
         if (NULL == p)          if (NULL == p)
                 return;                  return;
Line 335  mdoc_argv_free(struct mdoc_arg *p)
Line 294  mdoc_argv_free(struct mdoc_arg *p)
         }          }
         assert(p->argc);          assert(p->argc);
   
         /* LINTED */          for (i = (int)p->argc - 1; i >= 0; i--)
         for (i = 0; i < (int)p->argc; i++) {                  mdoc_argn_free(p, i);
                 if (0 == p->argv[i].sz)  
                         continue;  
                 /* LINTED */  
                 for (j = 0; j < (int)p->argv[i].sz; j++)  
                         free(p->argv[i].value[j]);  
   
                 free(p->argv[i].value);  
         }  
   
         free(p->argv);          free(p->argv);
         free(p);          free(p);
 }  }
   
   void
   mdoc_argn_free(struct mdoc_arg *p, int iarg)
 static int  
 perr(struct mdoc *mdoc, int line, int pos, enum merr code)  
 {  {
         char            *p;          struct mdoc_argv *arg;
           int               j;
   
         p = NULL;          arg = &p->argv[iarg];
         switch (code) {  
         case (EMALLOC):          if (arg->sz && arg->value) {
                 p = "memory exhausted";                  for (j = (int)arg->sz - 1; j >= 0; j--)
                 break;                          free(arg->value[j]);
         case (EQUOTTERM):                  free(arg->value);
                 p = "unterminated quoted parameter";  
                 break;  
         case (EARGVAL):  
                 p = "argument requires a value";  
                 break;  
         }          }
         assert(p);  
         return(mdoc_perr(mdoc, line, pos, p));          for (--p->argc; iarg < (int)p->argc; iarg++)
                   p->argv[iarg] = p->argv[iarg+1];
 }  }
   
   enum margserr
 static int  mdoc_zargs(struct mdoc *m, int line, int *pos,
 pwarn(struct mdoc *mdoc, int line, int pos, enum mwarn code)                  char *buf, int flags, char **v)
 {  {
         char            *p;  
         int              c;  
   
         p = NULL;          return(args(m, line, pos, buf, flags, v));
         c = WARN_SYNTAX;  
         switch (code) {  
         case (WQUOTPARM):  
                 p = "unexpected quoted parameter";  
                 break;  
         case (WARGVPARM):  
                 p = "argument-like parameter";  
                 break;  
         case (WCOLEMPTY):  
                 p = "last list column is empty";  
                 c = WARN_COMPAT;  
                 break;  
         case (WTAILWS):  
                 p = "trailing whitespace";  
                 c = WARN_COMPAT;  
                 break;  
         }  
         assert(p);  
         return(mdoc_pwarn(mdoc, line, pos, c, p));  
 }  }
   
   enum margserr
 int  mdoc_args(struct mdoc *m, int line, int *pos,
 mdoc_args(struct mdoc *mdoc, int line,                  char *buf, enum mdoct tok, char **v)
                 int *pos, char *buf, int tok, char **v)  
 {  {
         int               fl, c, i;          int               fl;
         struct mdoc_node *n;          struct mdoc_node *n;
   
         fl = (0 == tok) ? 0 : mdoc_argflags[tok];          fl = argflags[tok];
   
         /*          if (MDOC_It != tok)
          * Override per-macro argument flags with context-specific ones.                  return(args(m, line, pos, buf, fl, v));
          * As of now, this is only valid for `It' depending on its list  
          * context.          /*
            * We know that we're in an `It', so it's reasonable to expect
            * us to be sitting in a `Bl'.  Someday this may not be the case
            * (if we allow random `It's sitting out there), so provide a
            * safe fall-back into the default behaviour.
          */           */
   
         switch (tok) {          for (n = m->last; n; n = n->parent)
         case (MDOC_It):                  if (MDOC_Bl == n->tok)
                 for (n = mdoc->last; n; n = n->parent)                          break;
                         if (MDOC_BLOCK == n->type && MDOC_Bl == n->tok)  
                                 break;  
   
                 assert(n);          if (n && LIST_column == n->norm->Bl.type) {
                 c = (int)(n->args ? n->args->argc : 0);                  fl |= ARGS_TABSEP;
                 assert(c > 0);                  fl &= ~ARGS_DELIM;
   
                 /*  
                  * Using `Bl -column' adds ARGS_TABSEP to the arguments  
                  * and invalidates ARGS_DELIM.  Using `Bl -diag' allows  
                  * for quoted arguments.  
                  */  
   
                 /* LINTED */  
                 for (i = 0; i < c; i++) {  
                         switch (n->args->argv[i].arg) {  
                         case (MDOC_Column):  
                                 fl |= ARGS_TABSEP;  
                                 fl &= ~ARGS_DELIM;  
                                 i = c;  
                                 break;  
                         case (MDOC_Diag):  
                                 fl |= ARGS_QUOTED;  
                                 i = c;  
                                 break;  
                         default:  
                                 break;  
                         }  
                 }  
                 break;  
         default:  
                 break;  
         }          }
   
         return(args(mdoc, line, pos, buf, fl, v));          return(args(m, line, pos, buf, fl, v));
 }  }
   
   static enum margserr
 static int  args(struct mdoc *m, int line, int *pos,
 args(struct mdoc *mdoc, int line,                  char *buf, int fl, char **v)
                 int *pos, char *buf, int fl, char **v)  
 {  {
         int               i;          char            *p, *pp;
         char             *p, *pp;          enum margserr    rc;
   
         assert(*pos > 0);          /*
            * Parse out the terms (like `val' in `.Xx -arg val' or simply
            * `.Xx val'), which can have all sorts of properties:
            *
            *   ARGS_DELIM: use special handling if encountering trailing
            *   delimiters in the form of [[::delim::][ ]+]+.
            *
            *   ARGS_NOWARN: don't post warnings.  This is only used when
            *   re-parsing delimiters, as the warnings have already been
            *   posted.
            *
            *   ARGS_TABSEP: use special handling for tab/`Ta' separated
            *   phrases like in `Bl -column'.
            */
   
         if (0 == buf[*pos])          assert(' ' != buf[*pos]);
                 return(ARGS_EOLN);  
   
         if ('\"' == buf[*pos] && ! (fl & ARGS_QUOTED))          if ('\0' == buf[*pos]) {
                 if ( ! pwarn(mdoc, line, *pos, WQUOTPARM))                  if (MDOC_PPHRASE & m->flags)
                         return(ARGS_ERROR);                          return(ARGS_EOLN);
                   /*
                    * If we're not in a partial phrase and the flag for
                    * being a phrase literal is still set, the punctuation
                    * is unterminated.
                    */
                   if (MDOC_PHRASELIT & m->flags)
                           mdoc_pmsg(m, line, *pos, MANDOCERR_BADQUOTE);
   
         if ( ! (fl & ARGS_ARGVLIKE) && '-' == buf[*pos])                  m->flags &= ~MDOC_PHRASELIT;
                 if ( ! pwarn(mdoc, line, *pos, WARGVPARM))                  return(ARGS_EOLN);
                         return(ARGS_ERROR);  
   
         /*  
          * If the first character is a delimiter and we're to look for  
          * delimited strings, then pass down the buffer seeing if it  
          * follows the pattern of [[::delim::][ ]+]+.  
          */  
   
         if ((fl & ARGS_DELIM) && mdoc_iscdelim(buf[*pos])) {  
                 for (i = *pos; buf[i]; ) {  
                         if ( ! mdoc_iscdelim(buf[i]))  
                                 break;  
                         i++;  
                         /* There must be at least one space... */  
                         if (0 == buf[i] || ' ' != buf[i])  
                                 break;  
                         i++;  
                         while (buf[i] && ' ' == buf[i])  
                                 i++;  
                 }  
                 if (0 == buf[i]) {  
                         *v = &buf[*pos];  
                         return(ARGS_PUNCT);  
                 }  
         }          }
   
         /* First parse non-quoted strings. */          *v = &buf[*pos];
   
         if ('\"' != buf[*pos] || ! (ARGS_QUOTED & fl)) {          if (ARGS_DELIM & fl && args_checkpunct(m, buf, *pos, line, fl))
                 *v = &buf[*pos];                  return(ARGS_PUNCT);
   
                 /*          /*
                  * Thar be dragons here!  If we're tab-separated, search           * First handle TABSEP items, restricted to `Bl -column'.  This
                  * ahead for either a tab or the `Ta' macro.           * ignores conventional token parsing and instead uses tabs or
                  * If a `Ta' is detected, it must be space-buffered before and           * `Ta' macros to separate phrases.  Phrases are parsed again
                  * after.  If either of these hold true, then prune out the           * for arguments at a later phase.
                  * extra spaces and call it an argument.           */
                  */  
   
                 if (ARGS_TABSEP & fl) {          if (ARGS_TABSEP & fl) {
                         /* Scan ahead to unescaped tab. */                  /* Scan ahead to tab (can't be escaped). */
                   p = strchr(*v, '\t');
                   pp = NULL;
   
                         p = strchr(*v, '\t');                  /* Scan ahead to unescaped `Ta'. */
                   if ( ! (MDOC_PHRASELIT & m->flags))
                         /* Scan ahead to unescaped `Ta'. */  
   
                         for (pp = *v; ; pp++) {                          for (pp = *v; ; pp++) {
                                 if (NULL == (pp = strstr(pp, "Ta")))                                  if (NULL == (pp = strstr(pp, "Ta")))
                                         break;                                          break;
                                 if (pp > *v && ' ' != *(pp - 1))                                  if (pp > *v && ' ' != *(pp - 1))
                                         continue;                                          continue;
                                 if (' ' == *(pp + 2) || 0 == *(pp + 2))                                  if (' ' == *(pp + 2) || '\0' == *(pp + 2))
                                         break;                                          break;
                         }                          }
   
                         /* Choose delimiter tab/Ta. */                  /* By default, assume a phrase. */
                   rc = ARGS_PHRASE;
   
                         if (p && pp)                  /*
                                 p = (p < pp ? p : pp);                   * Adjust new-buffer position to be beyond delimiter
                         else if ( ! p && pp)                   * mark (e.g., Ta -> end + 2).
                                 p = pp;                   */
                   if (p && pp) {
                           *pos += pp < p ? 2 : 1;
                           rc = pp < p ? ARGS_PHRASE : ARGS_PPHRASE;
                           p = pp < p ? pp : p;
                   } else if (p && ! pp) {
                           rc = ARGS_PPHRASE;
                           *pos += 1;
                   } else if (pp && ! p) {
                           p = pp;
                           *pos += 2;
                   } else {
                           rc = ARGS_PEND;
                           p = strchr(*v, 0);
                   }
   
                         /* Strip delimiter's preceding whitespace. */                  /* Whitespace check for eoln case... */
                   if ('\0' == *p && ' ' == *(p - 1) && ! (ARGS_NOWARN & fl))
                           mdoc_pmsg(m, line, *pos, MANDOCERR_EOLNSPACE);
   
                         if (p && p > *v) {                  *pos += (int)(p - *v);
                                 pp = p - 1;  
                                 while (pp > *v && ' ' == *pp)  
                                         pp--;  
                                 if (pp == *v && ' ' == *pp)  
                                         *pp = 0;  
                                 else if (' ' == *pp)  
                                         *(pp + 1) = 0;  
                         }  
   
                         /* ...in- and proceding whitespace. */                  /* Strip delimiter's preceding whitespace. */
                   pp = p - 1;
                   while (pp > *v && ' ' == *pp) {
                           if (pp > *v && '\\' == *(pp - 1))
                                   break;
                           pp--;
                   }
                   *(pp + 1) = 0;
   
                         if (p && ('\t' != *p)) {                  /* Strip delimiter's proceeding whitespace. */
                                 *p++ = 0;                  for (pp = &buf[*pos]; ' ' == *pp; pp++, (*pos)++)
                                 *p++ = 0;                          /* Skip ahead. */ ;
                         } else if (p)  
                                 *p++ = 0;  
   
                         if (p) {                  return(rc);
                                 while (' ' == *p)          }
                                         p++;  
                                 if (0 != *p)  
                                         *(p - 1) = 0;  
                                 *pos += (int)(p - *v);  
                         }  
   
                         if (p && 0 == *p)          /*
                                 if ( ! pwarn(mdoc, line, *pos, WCOLEMPTY))           * Process a quoted literal.  A quote begins with a double-quote
                                         return(0);           * and ends with a double-quote NOT preceded by a double-quote.
                         if (p && 0 == *p && p > *v && ' ' == *(p - 1))           * Whitespace is NOT involved in literal termination.
                                 if ( ! pwarn(mdoc, line, *pos, WTAILWS))           */
                                         return(0);  
   
                         if (p)          if (MDOC_PHRASELIT & m->flags || '\"' == buf[*pos]) {
                                 return(ARGS_PHRASE);                  if ( ! (MDOC_PHRASELIT & m->flags))
                           *v = &buf[++(*pos)];
   
                         /* Configure the eoln case, too. */                  if (MDOC_PPHRASE & m->flags)
                           m->flags |= MDOC_PHRASELIT;
   
                         p = strchr(*v, 0);                  for ( ; buf[*pos]; (*pos)++) {
                         assert(p);                          if ('\"' != buf[*pos])
                                   continue;
                           if ('\"' != buf[*pos + 1])
                                   break;
                           (*pos)++;
                   }
   
                         if (p > *v && ' ' == *(p - 1))                  if ('\0' == buf[*pos]) {
                                 if ( ! pwarn(mdoc, line, *pos, WTAILWS))                          if (ARGS_NOWARN & fl || MDOC_PPHRASE & m->flags)
                                         return(0);                                  return(ARGS_QWORD);
                         *pos += (int)(p - *v);                          mdoc_pmsg(m, line, *pos, MANDOCERR_BADQUOTE);
                           return(ARGS_QWORD);
                   }
   
                         return(ARGS_PHRASE);                  m->flags &= ~MDOC_PHRASELIT;
                 }                  buf[(*pos)++] = '\0';
   
                 /* Do non-tabsep look-ahead here. */  
   
                 if ( ! (ARGS_TABSEP & fl))  
                         while (buf[*pos]) {  
                                 if (' ' == buf[*pos])  
                                         if ('\\' != buf[*pos - 1])  
                                                 break;  
                                 (*pos)++;  
                         }  
   
                 if (0 == buf[*pos])                  if ('\0' == buf[*pos])
                         return(ARGS_WORD);                          return(ARGS_QWORD);
   
                 buf[(*pos)++] = 0;                  while (' ' == buf[*pos])
                           (*pos)++;
   
                 if (0 == buf[*pos])                  if (0 == buf[*pos] && ! (ARGS_NOWARN & fl))
                         return(ARGS_WORD);                          mdoc_pmsg(m, line, *pos, MANDOCERR_EOLNSPACE);
   
                 if ( ! (ARGS_TABSEP & fl))                  return(ARGS_QWORD);
                         while (buf[*pos] && ' ' == buf[*pos])          }
                                 (*pos)++;  
   
                 if (buf[*pos])          /*
                         return(ARGS_WORD);           * A non-quoted term progresses until either the end of line or
            * a non-escaped whitespace.
            */
   
                 if ( ! pwarn(mdoc, line, *pos, WTAILWS))          for ( ; buf[*pos]; (*pos)++)
                         return(ARGS_ERROR);                  if (*pos && ' ' == buf[*pos] && '\\' != buf[*pos - 1])
                           break;
   
           if ('\0' == buf[*pos])
                 return(ARGS_WORD);                  return(ARGS_WORD);
         }  
   
         /*          buf[(*pos)++] = '\0';
          * If we're a quoted string (and quoted strings are allowed),  
          * then parse ahead to the next quote.  If none's found, it's an  
          * error.  After, parse to the next word.  
          */  
   
         *v = &buf[++(*pos)];          while (' ' == buf[*pos])
   
         while (buf[*pos] && '\"' != buf[*pos])  
                 (*pos)++;                  (*pos)++;
   
         if (0 == buf[*pos]) {          if ('\0' == buf[*pos] && ! (ARGS_NOWARN & fl))
                 (void)perr(mdoc, line, *pos, EQUOTTERM);                  mdoc_pmsg(m, line, *pos, MANDOCERR_EOLNSPACE);
                 return(ARGS_ERROR);  
         }  
   
         buf[(*pos)++] = 0;          return(ARGS_WORD);
         if (0 == buf[*pos])  }
                 return(ARGS_QWORD);  
   
         while (buf[*pos] && ' ' == buf[*pos])  /*
                 (*pos)++;   * Check if the string consists only of space-separated closing
    * delimiters.  This is a bit of a dance: the first must be a close
    * delimiter, but it may be followed by middle delimiters.  Arbitrary
    * whitespace may separate these tokens.
    */
   static int
   args_checkpunct(struct mdoc *m, const char *buf, int i, int ln, int fl)
   {
           int              j;
           char             dbuf[DELIMSZ];
           enum mdelim      d;
   
         if (buf[*pos])          /* First token must be a close-delimiter. */
                 return(ARGS_QWORD);  
   
         if ( ! pwarn(mdoc, line, *pos, WTAILWS))          for (j = 0; buf[i] && ' ' != buf[i] && j < DELIMSZ; j++, i++)
                 return(ARGS_ERROR);                  dbuf[j] = buf[i];
   
         return(ARGS_QWORD);          if (DELIMSZ == j)
 }                  return(0);
   
           dbuf[j] = '\0';
           if (DELIM_CLOSE != mandoc_isdelim(dbuf))
                   return(0);
   
 static int          while (' ' == buf[i])
 argv_a2arg(int tok, const char *argv)                  i++;
   
           /* Remaining must NOT be open/none. */
   
           while (buf[i]) {
                   j = 0;
                   while (buf[i] && ' ' != buf[i] && j < DELIMSZ)
                           dbuf[j++] = buf[i++];
   
                   if (DELIMSZ == j)
                           return(0);
   
                   dbuf[j] = '\0';
                   d = mandoc_isdelim(dbuf);
                   if (DELIM_NONE == d || DELIM_OPEN == d)
                           return(0);
   
                   while (' ' == buf[i])
                           i++;
           }
   
           if ( ! (ARGS_NOWARN & fl) && i && ' ' == buf[i - 1])
                   mdoc_pmsg(m, ln, i - 1, MANDOCERR_EOLNSPACE);
   
           return('\0' == buf[i]);
   }
   
   /*
    * Match up an argument string (e.g., `-foo bar' having "foo") with the
    * correrct identifier.  It must apply to the given macro.  If none was
    * found (including bad matches), return MDOC_ARG_MAX.
    */
   static enum mdocargt
   argv_a2arg(enum mdoct tok, const char *p)
 {  {
           enum mdocargt    args[MDOC_ARG_MAX];
           int              i, len;
   
         /*          len = 0;
          * Parse an argument identifier from its text.  XXX - this  
          * should really be table-driven to clarify the code.  
          *  
          * If you add an argument to the list, make sure that you  
          * register it here with its one or more macros!  
          */  
   
         switch (tok) {          switch (tok) {
         case (MDOC_An):          case (MDOC_An):
                 if (0 == strcmp(argv, "split"))                  args[len++] = MDOC_Split;
                         return(MDOC_Split);                  args[len++] = MDOC_Nosplit;
                 else if (0 == strcmp(argv, "nosplit"))  
                         return(MDOC_Nosplit);  
                 break;                  break;
   
         case (MDOC_Bd):          case (MDOC_Bd):
                 if (0 == strcmp(argv, "ragged"))                  args[len++] = MDOC_Ragged;
                         return(MDOC_Ragged);                  args[len++] = MDOC_Unfilled;
                 else if (0 == strcmp(argv, "unfilled"))                  args[len++] = MDOC_Filled;
                         return(MDOC_Unfilled);                  args[len++] = MDOC_Literal;
                 else if (0 == strcmp(argv, "filled"))                  args[len++] = MDOC_File;
                         return(MDOC_Filled);                  args[len++] = MDOC_Offset;
                 else if (0 == strcmp(argv, "literal"))                  args[len++] = MDOC_Compact;
                         return(MDOC_Literal);                  args[len++] = MDOC_Centred;
                 else if (0 == strcmp(argv, "file"))  
                         return(MDOC_File);  
                 else if (0 == strcmp(argv, "offset"))  
                         return(MDOC_Offset);  
                 else if (0 == strcmp(argv, "compact"))  
                         return(MDOC_Compact);  
                 break;                  break;
   
         case (MDOC_Bf):          case (MDOC_Bf):
                 if (0 == strcmp(argv, "emphasis"))                  args[len++] = MDOC_Emphasis;
                         return(MDOC_Emphasis);                  args[len++] = MDOC_Literal;
                 else if (0 == strcmp(argv, "literal"))                  args[len++] = MDOC_Symbolic;
                         return(MDOC_Literal);  
                 else if (0 == strcmp(argv, "symbolic"))  
                         return(MDOC_Symbolic);  
                 break;                  break;
   
         case (MDOC_Bk):          case (MDOC_Bk):
                 if (0 == strcmp(argv, "words"))                  args[len++] = MDOC_Words;
                         return(MDOC_Words);  
                 break;                  break;
   
         case (MDOC_Bl):          case (MDOC_Bl):
                 if (0 == strcmp(argv, "bullet"))                  args[len++] = MDOC_Bullet;
                         return(MDOC_Bullet);                  args[len++] = MDOC_Dash;
                 else if (0 == strcmp(argv, "dash"))                  args[len++] = MDOC_Hyphen;
                         return(MDOC_Dash);                  args[len++] = MDOC_Item;
                 else if (0 == strcmp(argv, "hyphen"))                  args[len++] = MDOC_Enum;
                         return(MDOC_Hyphen);                  args[len++] = MDOC_Tag;
                 else if (0 == strcmp(argv, "item"))                  args[len++] = MDOC_Diag;
                         return(MDOC_Item);                  args[len++] = MDOC_Hang;
                 else if (0 == strcmp(argv, "enum"))                  args[len++] = MDOC_Ohang;
                         return(MDOC_Enum);                  args[len++] = MDOC_Inset;
                 else if (0 == strcmp(argv, "tag"))                  args[len++] = MDOC_Column;
                         return(MDOC_Tag);                  args[len++] = MDOC_Width;
                 else if (0 == strcmp(argv, "diag"))                  args[len++] = MDOC_Offset;
                         return(MDOC_Diag);                  args[len++] = MDOC_Compact;
                 else if (0 == strcmp(argv, "hang"))                  args[len++] = MDOC_Nested;
                         return(MDOC_Hang);  
                 else if (0 == strcmp(argv, "ohang"))  
                         return(MDOC_Ohang);  
                 else if (0 == strcmp(argv, "inset"))  
                         return(MDOC_Inset);  
                 else if (0 == strcmp(argv, "column"))  
                         return(MDOC_Column);  
                 else if (0 == strcmp(argv, "width"))  
                         return(MDOC_Width);  
                 else if (0 == strcmp(argv, "offset"))  
                         return(MDOC_Offset);  
                 else if (0 == strcmp(argv, "compact"))  
                         return(MDOC_Compact);  
                 else if (0 == strcmp(argv, "nested"))  
                         return(MDOC_Nested);  
                 break;                  break;
   
         case (MDOC_Rv):          case (MDOC_Rv):
                 /* FALLTHROUGH */                  /* FALLTHROUGH */
         case (MDOC_Ex):          case (MDOC_Ex):
                 if (0 == strcmp(argv, "std"))                  args[len++] = MDOC_Std;
                         return(MDOC_Std);  
                 break;                  break;
         default:          default:
                 break;                  break;
         }          }
   
           for (i = 0; i < len; i++)
                   if (0 == strcmp(p, mdoc_argnames[args[i]]))
                           return(args[i]);
   
         return(MDOC_ARG_MAX);          return(MDOC_ARG_MAX);
 }  }
   
   
 static int  static int
 argv_multi(struct mdoc *mdoc, int line,  argv_multi(struct mdoc *m, int line,
                 struct mdoc_argv *v, int *pos, char *buf)                  struct mdoc_argv *v, int *pos, char *buf)
 {  {
         int              c, ppos;          enum margserr    ac;
         char            *p;          char            *p;
   
         ppos = *pos;  
   
         for (v->sz = 0; ; v->sz++) {          for (v->sz = 0; ; v->sz++) {
                 if ('-' == buf[*pos])                  if ('-' == buf[*pos])
                         break;                          break;
                 c = args(mdoc, line, pos, buf, ARGS_QUOTED, &p);                  ac = args(m, line, pos, buf, 0, &p);
                 if (ARGS_ERROR == c)                  if (ARGS_ERROR == ac)
                         return(0);                          return(0);
                 else if (ARGS_EOLN == c)                  else if (ARGS_EOLN == ac)
                         break;                          break;
   
                 if (0 == v->sz % MULTI_STEP) {                  if (0 == v->sz % MULTI_STEP)
                         v->value = realloc(v->value,                          v->value = mandoc_realloc(v->value,
                                 (v->sz + MULTI_STEP) * sizeof(char *));                                  (v->sz + MULTI_STEP) * sizeof(char *));
                         if (NULL == v->value) {  
                                 (void)verr(mdoc, EMALLOC);                  v->value[(int)v->sz] = mandoc_strdup(p);
                                 return(ARGV_ERROR);  
                         }  
                 }  
                 if (NULL == (v->value[(int)v->sz] = strdup(p)))  
                         return(verr(mdoc, EMALLOC));  
         }          }
   
         if (v->sz)          return(1);
                 return(1);  
   
         return(perr(mdoc, line, ppos, EARGVAL));  
 }  }
   
   
 static int  static int
 argv_opt_single(struct mdoc *mdoc, int line,  argv_opt_single(struct mdoc *m, int line,
                 struct mdoc_argv *v, int *pos, char *buf)                  struct mdoc_argv *v, int *pos, char *buf)
 {  {
         int              c;          enum margserr    ac;
         char            *p;          char            *p;
   
         if ('-' == buf[*pos])          if ('-' == buf[*pos])
                 return(1);                  return(1);
   
         c = args(mdoc, line, pos, buf, ARGS_QUOTED, &p);          ac = args(m, line, pos, buf, 0, &p);
         if (ARGS_ERROR == c)          if (ARGS_ERROR == ac)
                 return(0);                  return(0);
         if (ARGS_EOLN == c)          if (ARGS_EOLN == ac)
                 return(1);                  return(1);
   
         v->sz = 1;          v->sz = 1;
         if (NULL == (v->value = calloc(1, sizeof(char *))))          v->value = mandoc_malloc(sizeof(char *));
                 return(verr(mdoc, EMALLOC));          v->value[0] = mandoc_strdup(p);
         if (NULL == (v->value[0] = strdup(p)))  
                 return(verr(mdoc, EMALLOC));  
   
         return(1);          return(1);
 }  }
   
   
 /*  /*
  * Parse a single, mandatory value from the stream.   * Parse a single, mandatory value from the stream.
  */   */
 static int  static int
 argv_single(struct mdoc *mdoc, int line,  argv_single(struct mdoc *m, int line,
                 struct mdoc_argv *v, int *pos, char *buf)                  struct mdoc_argv *v, int *pos, char *buf)
 {  {
         int              c, ppos;          int              ppos;
           enum margserr    ac;
         char            *p;          char            *p;
   
         ppos = *pos;          ppos = *pos;
   
         c = args(mdoc, line, pos, buf, ARGS_QUOTED, &p);          ac = args(m, line, pos, buf, 0, &p);
         if (ARGS_ERROR == c)          if (ARGS_EOLN == ac) {
                   mdoc_pmsg(m, line, ppos, MANDOCERR_SYNTARGVCOUNT);
                 return(0);                  return(0);
         if (ARGS_EOLN == c)          } else if (ARGS_ERROR == ac)
                 return(perr(mdoc, line, ppos, EARGVAL));                  return(0);
   
         v->sz = 1;          v->sz = 1;
         if (NULL == (v->value = calloc(1, sizeof(char *))))          v->value = mandoc_malloc(sizeof(char *));
                 return(verr(mdoc, EMALLOC));          v->value[0] = mandoc_strdup(p);
         if (NULL == (v->value[0] = strdup(p)))  
                 return(verr(mdoc, EMALLOC));  
   
         return(1);          return(1);
 }  }
   
   
 /*  /*
  * Determine rules for parsing arguments.  Arguments can either accept   * Determine rules for parsing arguments.  Arguments can either accept
  * no parameters, an optional single parameter, one parameter, or   * no parameters, an optional single parameter, one parameter, or
Line 856  argv(struct mdoc *mdoc, int line, 
Line 746  argv(struct mdoc *mdoc, int line, 
         v->sz = 0;          v->sz = 0;
         v->value = NULL;          v->value = NULL;
   
         switch (mdoc_argvflags[v->arg]) {          switch (argvflags[v->arg]) {
         case (ARGV_SINGLE):          case (ARGV_SINGLE):
                 return(argv_single(mdoc, line, v, pos, buf));                  return(argv_single(mdoc, line, v, pos, buf));
         case (ARGV_MULTI):          case (ARGV_MULTI):
                 return(argv_multi(mdoc, line, v, pos, buf));                  return(argv_multi(mdoc, line, v, pos, buf));
         case (ARGV_OPT_SINGLE):          case (ARGV_OPT_SINGLE):
                 return(argv_opt_single(mdoc, line, v, pos, buf));                  return(argv_opt_single(mdoc, line, v, pos, buf));
         default:          case (ARGV_NONE):
                 /* ARGV_NONE */  
                 break;                  break;
           default:
                   abort();
                   /* NOTREACHED */
         }          }
   
         return(1);          return(1);

Legend:
Removed from v.1.2  
changed lines
  Added in v.1.69

CVSweb