[BACK]Return to mdoc_argv.c CVS log [TXT][DIR] Up to [cvsweb.bsd.lv] / mandoc

Diff for /mandoc/mdoc_argv.c between version 1.10 and 1.64

version 1.10, 2009/07/06 11:21:34 version 1.64, 2011/03/17 00:58:14
Line 1 
Line 1 
 /*      $Id$ */  /*      $Id$ */
 /*  /*
  * Copyright (c) 2008, 2009 Kristaps Dzonsons <kristaps@kth.se>   * Copyright (c) 2008, 2009, 2010 Kristaps Dzonsons <kristaps@bsd.lv>
  *   *
  * Permission to use, copy, modify, and distribute this software for any   * Permission to use, copy, modify, and distribute this software for any
  * purpose with or without fee is hereby granted, provided that the above   * purpose with or without fee is hereby granted, provided that the above
Line 14 
Line 14 
  * ACTION OF CONTRACT, NEGLIGENCE OR OTHER TORTIOUS ACTION, ARISING OUT OF   * ACTION OF CONTRACT, NEGLIGENCE OR OTHER TORTIOUS ACTION, ARISING OUT OF
  * OR IN CONNECTION WITH THE USE OR PERFORMANCE OF THIS SOFTWARE.   * OR IN CONNECTION WITH THE USE OR PERFORMANCE OF THIS SOFTWARE.
  */   */
   #ifdef HAVE_CONFIG_H
   #include "config.h"
   #endif
   
 #include <sys/types.h>  #include <sys/types.h>
   
 #include <assert.h>  #include <assert.h>
Line 22 
Line 26 
 #include <stdio.h>  #include <stdio.h>
 #include <string.h>  #include <string.h>
   
   #include "mandoc.h"
 #include "libmdoc.h"  #include "libmdoc.h"
   #include "libmandoc.h"
   
 /*  /*
  * Routines to parse arguments of macros.  Arguments follow the syntax   * Routines to parse arguments of macros.  Arguments follow the syntax
Line 32 
Line 38 
  * There's no limit to the number or arguments that may be allocated.   * There's no limit to the number or arguments that may be allocated.
  */   */
   
 /* FIXME .Bf Li raises "macro-like parameter". */  
 /* FIXME .Bl -column should deprecate old-groff syntax. */  
   
 #define ARGS_QUOTED     (1 << 0)  
 #define ARGS_DELIM      (1 << 1)  
 #define ARGS_TABSEP     (1 << 2)  
 #define ARGS_ARGVLIKE   (1 << 3)  
   
 #define ARGV_NONE       (1 << 0)  #define ARGV_NONE       (1 << 0)
 #define ARGV_SINGLE     (1 << 1)  #define ARGV_SINGLE     (1 << 1)
 #define ARGV_MULTI      (1 << 2)  #define ARGV_MULTI      (1 << 2)
Line 47 
Line 45 
   
 #define MULTI_STEP       5  #define MULTI_STEP       5
   
 enum    merr {  static  enum mdocargt    argv_a2arg(enum mdoct, const char *);
         ETAILWS,  static  enum margserr    args(struct mdoc *, int, int *,
         ECOLEMPTY,  
         EARGVPARM,  
         EQUOTPARM,  
         EQUOTTERM,  
         EMALLOC,  
         EARGVAL  
 };  
   
 static  int              argv_a2arg(int, const char *);  
 static  int              args(struct mdoc *, int, int *,  
                                 char *, int, char **);                                  char *, int, char **);
   static  int              args_checkpunct(const char *);
 static  int              argv(struct mdoc *, int,  static  int              argv(struct mdoc *, int,
                                 struct mdoc_argv *, int *, char *);                                  struct mdoc_argv *, int *, char *);
 static  int              argv_single(struct mdoc *, int,  static  int              argv_single(struct mdoc *, int,
Line 68  static int   argv_opt_single(struct mdoc *, int, 
Line 57  static int   argv_opt_single(struct mdoc *, int, 
                                 struct mdoc_argv *, int *, char *);                                  struct mdoc_argv *, int *, char *);
 static  int              argv_multi(struct mdoc *, int,  static  int              argv_multi(struct mdoc *, int,
                                 struct mdoc_argv *, int *, char *);                                  struct mdoc_argv *, int *, char *);
 static  int              perr(struct mdoc *, int, int, enum merr, int);  
   
 #define pwarn(m, l, p, t) perr((m), (l), (p), (t), 0)  
 #define verr(m, t) perr((m), (m)->last->line, (m)->last->pos, (t), 1)  
   
 /* Per-argument flags. */  /* Per-argument flags. */
   
 static  int mdoc_argvflags[MDOC_ARG_MAX] = {  static  int mdoc_argvflags[MDOC_ARG_MAX] = {
Line 81  static int mdoc_argvflags[MDOC_ARG_MAX] = {
Line 66  static int mdoc_argvflags[MDOC_ARG_MAX] = {
         ARGV_NONE,      /* MDOC_Ragged */          ARGV_NONE,      /* MDOC_Ragged */
         ARGV_NONE,      /* MDOC_Unfilled */          ARGV_NONE,      /* MDOC_Unfilled */
         ARGV_NONE,      /* MDOC_Literal */          ARGV_NONE,      /* MDOC_Literal */
         ARGV_NONE,      /* MDOC_File */          ARGV_SINGLE,    /* MDOC_File */
         ARGV_SINGLE,    /* MDOC_Offset */          ARGV_OPT_SINGLE, /* MDOC_Offset */
         ARGV_NONE,      /* MDOC_Bullet */          ARGV_NONE,      /* MDOC_Bullet */
         ARGV_NONE,      /* MDOC_Dash */          ARGV_NONE,      /* MDOC_Dash */
         ARGV_NONE,      /* MDOC_Hyphen */          ARGV_NONE,      /* MDOC_Hyphen */
Line 96  static int mdoc_argvflags[MDOC_ARG_MAX] = {
Line 81  static int mdoc_argvflags[MDOC_ARG_MAX] = {
         ARGV_MULTI,     /* MDOC_Column */          ARGV_MULTI,     /* MDOC_Column */
         ARGV_SINGLE,    /* MDOC_Width */          ARGV_SINGLE,    /* MDOC_Width */
         ARGV_NONE,      /* MDOC_Compact */          ARGV_NONE,      /* MDOC_Compact */
         ARGV_OPT_SINGLE, /* MDOC_Std */          ARGV_NONE,      /* MDOC_Std */
         ARGV_NONE,      /* MDOC_Filled */          ARGV_NONE,      /* MDOC_Filled */
         ARGV_NONE,      /* MDOC_Words */          ARGV_NONE,      /* MDOC_Words */
         ARGV_NONE,      /* MDOC_Emphasis */          ARGV_NONE,      /* MDOC_Emphasis */
Line 109  static int mdoc_argflags[MDOC_MAX] = {
Line 94  static int mdoc_argflags[MDOC_MAX] = {
         0, /* Dd */          0, /* Dd */
         0, /* Dt */          0, /* Dt */
         0, /* Os */          0, /* Os */
         ARGS_QUOTED, /* Sh */          0, /* Sh */
         ARGS_QUOTED, /* Ss */          0, /* Ss */
         ARGS_DELIM, /* Pp */          0, /* Pp */
         ARGS_DELIM, /* D1 */          ARGS_DELIM, /* D1 */
         ARGS_DELIM | ARGS_QUOTED, /* Dl */          ARGS_DELIM, /* Dl */
         0, /* Bd */          0, /* Bd */
         0, /* Ed */          0, /* Ed */
         ARGS_QUOTED, /* Bl */          0, /* Bl */
         0, /* El */          0, /* El */
         0, /* It */          0, /* It */
         ARGS_DELIM, /* Ad */          ARGS_DELIM, /* Ad */
         ARGS_DELIM, /* An */          ARGS_DELIM, /* An */
         ARGS_DELIM | ARGS_QUOTED, /* Ar */          ARGS_DELIM, /* Ar */
         ARGS_QUOTED, /* Cd */          0, /* Cd */
         ARGS_DELIM, /* Cm */          ARGS_DELIM, /* Cm */
         ARGS_DELIM, /* Dv */          ARGS_DELIM, /* Dv */
         ARGS_DELIM, /* Er */          ARGS_DELIM, /* Er */
         ARGS_DELIM, /* Ev */          ARGS_DELIM, /* Ev */
         0, /* Ex */          0, /* Ex */
         ARGS_DELIM | ARGS_QUOTED, /* Fa */          ARGS_DELIM, /* Fa */
         0, /* Fd */          0, /* Fd */
         ARGS_DELIM, /* Fl */          ARGS_DELIM, /* Fl */
         ARGS_DELIM | ARGS_QUOTED, /* Fn */          ARGS_DELIM, /* Fn */
         ARGS_DELIM | ARGS_QUOTED, /* Ft */          ARGS_DELIM, /* Ft */
         ARGS_DELIM, /* Ic */          ARGS_DELIM, /* Ic */
         0, /* In */          0, /* In */
         ARGS_DELIM | ARGS_QUOTED, /* Li */          ARGS_DELIM, /* Li */
         ARGS_QUOTED, /* Nd */          0, /* Nd */
         ARGS_DELIM, /* Nm */          ARGS_DELIM, /* Nm */
         ARGS_DELIM, /* Op */          ARGS_DELIM, /* Op */
         0, /* Ot */          0, /* Ot */
         ARGS_DELIM, /* Pa */          ARGS_DELIM, /* Pa */
         0, /* Rv */          0, /* Rv */
         ARGS_DELIM | ARGS_ARGVLIKE, /* St */          ARGS_DELIM, /* St */
         ARGS_DELIM, /* Va */          ARGS_DELIM, /* Va */
         ARGS_DELIM, /* Vt */          ARGS_DELIM, /* Vt */
         ARGS_DELIM, /* Xr */          ARGS_DELIM, /* Xr */
         ARGS_QUOTED, /* %A */          0, /* %A */
         ARGS_QUOTED, /* %B */          0, /* %B */
         ARGS_QUOTED, /* %D */          0, /* %D */
         ARGS_QUOTED, /* %I */          0, /* %I */
         ARGS_QUOTED, /* %J */          0, /* %J */
         ARGS_QUOTED, /* %N */          0, /* %N */
         ARGS_QUOTED, /* %O */          0, /* %O */
         ARGS_QUOTED, /* %P */          0, /* %P */
         ARGS_QUOTED, /* %R */          0, /* %R */
         ARGS_QUOTED, /* %T */          0, /* %T */
         ARGS_QUOTED, /* %V */          0, /* %V */
         ARGS_DELIM, /* Ac */          ARGS_DELIM, /* Ac */
         0, /* Ao */          0, /* Ao */
         ARGS_DELIM, /* Aq */          ARGS_DELIM, /* Aq */
Line 196  static int mdoc_argflags[MDOC_MAX] = {
Line 181  static int mdoc_argflags[MDOC_MAX] = {
         ARGS_DELIM, /* Sq */          ARGS_DELIM, /* Sq */
         0, /* Sm */          0, /* Sm */
         ARGS_DELIM, /* Sx */          ARGS_DELIM, /* Sx */
         ARGS_DELIM | ARGS_QUOTED, /* Sy */          ARGS_DELIM, /* Sy */
         ARGS_DELIM, /* Tn */          ARGS_DELIM, /* Tn */
         ARGS_DELIM, /* Ux */          ARGS_DELIM, /* Ux */
         ARGS_DELIM, /* Xc */          ARGS_DELIM, /* Xc */
         0, /* Xo */          0, /* Xo */
         ARGS_QUOTED, /* Fo */          0, /* Fo */
         0, /* Fc */          0, /* Fc */
         0, /* Oo */          0, /* Oo */
         ARGS_DELIM, /* Oc */          ARGS_DELIM, /* Oc */
Line 212  static int mdoc_argflags[MDOC_MAX] = {
Line 197  static int mdoc_argflags[MDOC_MAX] = {
         0, /* Fr */          0, /* Fr */
         0, /* Ud */          0, /* Ud */
         0, /* Lb */          0, /* Lb */
         ARGS_DELIM, /* Lp */          0, /* Lp */
         ARGS_DELIM | ARGS_QUOTED, /* Lk */          ARGS_DELIM, /* Lk */
         ARGS_DELIM | ARGS_QUOTED, /* Mt */          ARGS_DELIM, /* Mt */
         ARGS_DELIM, /* Brq */          ARGS_DELIM, /* Brq */
         0, /* Bro */          0, /* Bro */
         ARGS_DELIM, /* Brc */          ARGS_DELIM, /* Brc */
         ARGS_QUOTED, /* %C */          0, /* %C */
         0, /* Es */          0, /* Es */
         0, /* En */          0, /* En */
         0, /* Dx */          0, /* Dx */
         ARGS_QUOTED, /* %Q */          0, /* %Q */
           0, /* br */
           0, /* sp */
           0, /* %U */
           0, /* Ta */
 };  };
   
   
Line 231  static int mdoc_argflags[MDOC_MAX] = {
Line 220  static int mdoc_argflags[MDOC_MAX] = {
  * [value0...], which may either have a single mandatory value, at least   * [value0...], which may either have a single mandatory value, at least
  * one mandatory value, an optional single value, or no value.   * one mandatory value, an optional single value, or no value.
  */   */
 int  enum margverr
 mdoc_argv(struct mdoc *mdoc, int line, int tok,  mdoc_argv(struct mdoc *m, int line, enum mdoct tok,
                 struct mdoc_arg **v, int *pos, char *buf)                  struct mdoc_arg **v, int *pos, char *buf)
 {  {
         int               i;  
         char             *p, sv;          char             *p, sv;
         struct mdoc_argv tmp;          struct mdoc_argv tmp;
         struct mdoc_arg  *arg;          struct mdoc_arg  *arg;
   
         if (0 == buf[*pos])          if ('\0' == buf[*pos])
                 return(ARGV_EOLN);                  return(ARGV_EOLN);
   
         assert(' ' != buf[*pos]);          assert(' ' != buf[*pos]);
   
         if ('-' != buf[*pos] || ARGS_ARGVLIKE & mdoc_argflags[tok])  
                 return(ARGV_WORD);  
   
         /* Parse through to the first unescaped space. */          /* Parse through to the first unescaped space. */
   
         i = *pos;  
         p = &buf[++(*pos)];          p = &buf[++(*pos)];
   
         assert(*pos > 0);          assert(*pos > 0);
Line 265  mdoc_argv(struct mdoc *mdoc, int line, int tok,
Line 249  mdoc_argv(struct mdoc *mdoc, int line, int tok,
   
         /* XXX - save zeroed byte, if not an argument. */          /* XXX - save zeroed byte, if not an argument. */
   
         sv = 0;          sv = '\0';
         if (buf[*pos]) {          if (buf[*pos]) {
                 sv = buf[*pos];                  sv = buf[*pos];
                 buf[(*pos)++] = 0;                  buf[(*pos)++] = '\0';
         }          }
   
         (void)memset(&tmp, 0, sizeof(struct mdoc_argv));          (void)memset(&tmp, 0, sizeof(struct mdoc_argv));
Line 281  mdoc_argv(struct mdoc *mdoc, int line, int tok,
Line 265  mdoc_argv(struct mdoc *mdoc, int line, int tok,
                 /* XXX - restore saved zeroed byte. */                  /* XXX - restore saved zeroed byte. */
                 if (sv)                  if (sv)
                         buf[*pos - 1] = sv;                          buf[*pos - 1] = sv;
                 if ( ! pwarn(mdoc, line, i, EARGVPARM))  
                         return(ARGV_ERROR);  
                 return(ARGV_WORD);                  return(ARGV_WORD);
         }          }
   
         while (buf[*pos] && ' ' == buf[*pos])          while (buf[*pos] && ' ' == buf[*pos])
                 (*pos)++;                  (*pos)++;
   
         if ( ! argv(mdoc, line, &tmp, pos, buf))          if ( ! argv(m, line, &tmp, pos, buf))
                 return(ARGV_ERROR);                  return(ARGV_ERROR);
   
         if (NULL == (arg = *v)) {          if (NULL == (arg = *v))
                 *v = calloc(1, sizeof(struct mdoc_arg));                  arg = *v = mandoc_calloc(1, sizeof(struct mdoc_arg));
                 if (NULL == *v) {  
                         (void)verr(mdoc, EMALLOC);  
                         return(ARGV_ERROR);  
                 }  
                 arg = *v;  
         }  
   
         arg->argc++;          arg->argc++;
         arg->argv = realloc(arg->argv, arg->argc *          arg->argv = mandoc_realloc
                         sizeof(struct mdoc_argv));                  (arg->argv, arg->argc * sizeof(struct mdoc_argv));
   
         if (NULL == arg->argv) {  
                 (void)verr(mdoc, EMALLOC);  
                 return(ARGV_ERROR);  
         }  
   
         (void)memcpy(&arg->argv[(int)arg->argc - 1],          (void)memcpy(&arg->argv[(int)arg->argc - 1],
                         &tmp, sizeof(struct mdoc_argv));                          &tmp, sizeof(struct mdoc_argv));
   
Line 320  mdoc_argv(struct mdoc *mdoc, int line, int tok,
Line 291  mdoc_argv(struct mdoc *mdoc, int line, int tok,
 void  void
 mdoc_argv_free(struct mdoc_arg *p)  mdoc_argv_free(struct mdoc_arg *p)
 {  {
         int              i, j;          int              i;
   
         if (NULL == p)          if (NULL == p)
                 return;                  return;
Line 332  mdoc_argv_free(struct mdoc_arg *p)
Line 303  mdoc_argv_free(struct mdoc_arg *p)
         }          }
         assert(p->argc);          assert(p->argc);
   
         /* LINTED */          for (i = (int)p->argc - 1; i >= 0; i--)
         for (i = 0; i < (int)p->argc; i++) {                  mdoc_argn_free(p, i);
                 if (0 == p->argv[i].sz)  
                         continue;  
                 /* LINTED */  
                 for (j = 0; j < (int)p->argv[i].sz; j++)  
                         free(p->argv[i].value[j]);  
   
                 free(p->argv[i].value);  
         }  
   
         free(p->argv);          free(p->argv);
         free(p);          free(p);
 }  }
   
   
   void
 static int  mdoc_argn_free(struct mdoc_arg *p, int iarg)
 perr(struct mdoc *mdoc, int line, int pos, enum merr code, int iserr)  
 {  {
         char            *p;          struct mdoc_argv *arg;
           int               j;
   
         p = NULL;          arg = &p->argv[iarg];
   
         switch (code) {          if (arg->sz && arg->value) {
         case (EMALLOC):                  for (j = (int)arg->sz - 1; j >= 0; j--)
                 p = "memory exhausted";                          free(arg->value[j]);
                 break;                  free(arg->value);
         case (EQUOTTERM):  
                 p = "unterminated quoted parameter";  
                 break;  
         case (EARGVAL):  
                 p = "argument requires a value";  
                 break;  
         case (EQUOTPARM):  
                 p = "unexpected quoted parameter";  
                 break;  
         case (EARGVPARM):  
                 p = "argument-like parameter";  
                 break;  
         case (ECOLEMPTY):  
                 p = "last list column is empty";  
                 break;  
         case (ETAILWS):  
                 p = "trailing whitespace";  
                 break;  
         }          }
   
         assert(p);          for (--p->argc; iarg < (int)p->argc; iarg++)
         if (iserr)                  p->argv[iarg] = p->argv[iarg+1];
                 return(mdoc_perr(mdoc, line, pos, p));  }
   
         return(mdoc_pwarn(mdoc, line, pos, p));  
   enum margserr
   mdoc_zargs(struct mdoc *m, int line, int *pos,
                   char *buf, int flags, char **v)
   {
   
           return(args(m, line, pos, buf, flags, v));
 }  }
   
   
 int  enum margserr
 mdoc_args(struct mdoc *mdoc, int line,  mdoc_args(struct mdoc *m, int line, int *pos,
                 int *pos, char *buf, int tok, char **v)                  char *buf, enum mdoct tok, char **v)
 {  {
         int               fl, c, i;          int               fl;
         struct mdoc_node *n;          struct mdoc_node *n;
   
         fl = (0 == tok) ? 0 : mdoc_argflags[tok];          fl = mdoc_argflags[tok];
   
         /*          if (MDOC_It != tok)
          * Override per-macro argument flags with context-specific ones.                  return(args(m, line, pos, buf, fl, v));
          * As of now, this is only valid for `It' depending on its list  
          * context.          /*
            * We know that we're in an `It', so it's reasonable to expect
            * us to be sitting in a `Bl'.  Someday this may not be the case
            * (if we allow random `It's sitting out there), so provide a
            * safe fall-back into the default behaviour.
          */           */
   
         switch (tok) {          for (n = m->last; n; n = n->parent)
         case (MDOC_It):                  if (MDOC_Bl == n->tok)
                 for (n = mdoc->last; n; n = n->parent)                          break;
                         if (MDOC_BLOCK == n->type && MDOC_Bl == n->tok)  
                                 break;  
   
                 assert(n);          if (n && LIST_column == n->norm->Bl.type) {
                 c = (int)(n->args ? n->args->argc : 0);                  fl |= ARGS_TABSEP;
                 assert(c > 0);                  fl &= ~ARGS_DELIM;
   
                 /*  
                  * Using `Bl -column' adds ARGS_TABSEP to the arguments  
                  * and invalidates ARGS_DELIM.  Using `Bl -diag' allows  
                  * for quoted arguments.  
                  */  
   
                 /* LINTED */  
                 for (i = 0; i < c; i++) {  
                         switch (n->args->argv[i].arg) {  
                         case (MDOC_Column):  
                                 fl |= ARGS_TABSEP;  
                                 fl &= ~ARGS_DELIM;  
                                 i = c;  
                                 break;  
                         case (MDOC_Diag):  
                                 fl |= ARGS_QUOTED;  
                                 i = c;  
                                 break;  
                         default:  
                                 break;  
                         }  
                 }  
                 break;  
         default:  
                 break;  
         }          }
   
         return(args(mdoc, line, pos, buf, fl, v));          return(args(m, line, pos, buf, fl, v));
 }  }
   
   
 static int  static enum margserr
 args(struct mdoc *mdoc, int line,  args(struct mdoc *m, int line, int *pos,
                 int *pos, char *buf, int fl, char **v)                  char *buf, int fl, char **v)
 {  {
         int               i;          int              i;
         char             *p, *pp;          char            *p, *pp;
           enum margserr    rc;
   
         assert(*pos > 0);          /*
            * Parse out the terms (like `val' in `.Xx -arg val' or simply
            * `.Xx val'), which can have all sorts of properties:
            *
            *   ARGS_DELIM: use special handling if encountering trailing
            *   delimiters in the form of [[::delim::][ ]+]+.
            *
            *   ARGS_NOWARN: don't post warnings.  This is only used when
            *   re-parsing delimiters, as the warnings have already been
            *   posted.
            *
            *   ARGS_TABSEP: use special handling for tab/`Ta' separated
            *   phrases like in `Bl -column'.
            */
   
         if (0 == buf[*pos])          assert(' ' != buf[*pos]);
                 return(ARGS_EOLN);  
   
         if ('\"' == buf[*pos] && ! (fl & ARGS_QUOTED))          if ('\0' == buf[*pos]) {
                 if ( ! pwarn(mdoc, line, *pos, EQUOTPARM))                  if (MDOC_PPHRASE & m->flags)
                         return(ARGS_ERROR);                          return(ARGS_EOLN);
                   /*
                    * If we're not in a partial phrase and the flag for
                    * being a phrase literal is still set, the punctuation
                    * is unterminated.
                    */
                   if (MDOC_PHRASELIT & m->flags)
                           if ( ! mdoc_pmsg(m, line, *pos, MANDOCERR_BADQUOTE))
                                   return(ARGS_ERROR);
   
         if ( ! (fl & ARGS_ARGVLIKE) && '-' == buf[*pos])                  m->flags &= ~MDOC_PHRASELIT;
                 if ( ! pwarn(mdoc, line, *pos, EARGVPARM))                  return(ARGS_EOLN);
                         return(ARGS_ERROR);          }
   
         /*          /*
          * If the first character is a delimiter and we're to look for           * If the first character is a closing delimiter and we're to
          * delimited strings, then pass down the buffer seeing if it           * look for delimited strings, then pass down the buffer seeing
          * follows the pattern of [[::delim::][ ]+]+.           * if it follows the pattern of [[::delim::][ ]+]+.  Note that
            * we ONLY care about closing delimiters.
          */           */
   
         if ((fl & ARGS_DELIM) && mdoc_iscdelim(buf[*pos])) {          *v = &buf[*pos];
                 for (i = *pos; buf[i]; ) {  
                         if ( ! mdoc_iscdelim(buf[i]))          if (ARGS_DELIM & fl && args_checkpunct(&buf[*pos])) {
                                 break;                  i = strlen(&buf[*pos]) + *pos;
                         i++;                  if (i && ' ' != buf[i - 1])
                         /* There must be at least one space... */  
                         if (0 == buf[i] || ' ' != buf[i])  
                                 break;  
                         i++;  
                         while (buf[i] && ' ' == buf[i])  
                                 i++;  
                 }  
                 if (0 == buf[i]) {  
                         *v = &buf[*pos];  
                         return(ARGS_PUNCT);                          return(ARGS_PUNCT);
                 }                  if (ARGS_NOWARN & fl)
                           return(ARGS_PUNCT);
                   /* FIXME: remove conditional messages... */
                   if ( ! mdoc_pmsg(m, line, *pos, MANDOCERR_EOLNSPACE))
                           return(ARGS_ERROR);
                   return(ARGS_PUNCT);
         }          }
   
         /* First parse non-quoted strings. */          /*
            * First handle TABSEP items, restricted to `Bl -column'.  This
            * ignores conventional token parsing and instead uses tabs or
            * `Ta' macros to separate phrases.  Phrases are parsed again
            * for arguments at a later phase.
            */
   
         if ('\"' != buf[*pos] || ! (ARGS_QUOTED & fl)) {          if (ARGS_TABSEP & fl) {
                 *v = &buf[*pos];                  /* Scan ahead to tab (can't be escaped). */
                   p = strchr(*v, '\t');
                   pp = NULL;
   
                 /*                  /* Scan ahead to unescaped `Ta'. */
                  * Thar be dragons here!  If we're tab-separated, search                  if ( ! (MDOC_PHRASELIT & m->flags))
                  * ahead for either a tab or the `Ta' macro.  
                  * If a `Ta' is detected, it must be space-buffered before and  
                  * after.  If either of these hold true, then prune out the  
                  * extra spaces and call it an argument.  
                  */  
   
                 if (ARGS_TABSEP & fl) {  
                         /* Scan ahead to unescaped tab. */  
   
                         p = strchr(*v, '\t');  
   
                         /* Scan ahead to unescaped `Ta'. */  
   
                         for (pp = *v; ; pp++) {                          for (pp = *v; ; pp++) {
                                 if (NULL == (pp = strstr(pp, "Ta")))                                  if (NULL == (pp = strstr(pp, "Ta")))
                                         break;                                          break;
                                 if (pp > *v && ' ' != *(pp - 1))                                  if (pp > *v && ' ' != *(pp - 1))
                                         continue;                                          continue;
                                 if (' ' == *(pp + 2) || 0 == *(pp + 2))                                  if (' ' == *(pp + 2) || '\0' == *(pp + 2))
                                         break;                                          break;
                         }                          }
   
                         /* Choose delimiter tab/Ta. */                  /* By default, assume a phrase. */
                   rc = ARGS_PHRASE;
   
                         if (p && pp)                  /*
                                 p = (p < pp ? p : pp);                   * Adjust new-buffer position to be beyond delimiter
                         else if ( ! p && pp)                   * mark (e.g., Ta -> end + 2).
                                 p = pp;                   */
                   if (p && pp) {
                           *pos += pp < p ? 2 : 1;
                           rc = pp < p ? ARGS_PHRASE : ARGS_PPHRASE;
                           p = pp < p ? pp : p;
                   } else if (p && ! pp) {
                           rc = ARGS_PPHRASE;
                           *pos += 1;
                   } else if (pp && ! p) {
                           p = pp;
                           *pos += 2;
                   } else {
                           rc = ARGS_PEND;
                           p = strchr(*v, 0);
                   }
   
                         /* Strip delimiter's preceding whitespace. */                  /* Whitespace check for eoln case... */
                   if ('\0' == *p && ' ' == *(p - 1) && ! (ARGS_NOWARN & fl))
                           if ( ! mdoc_pmsg(m, line, *pos, MANDOCERR_EOLNSPACE))
                                   return(ARGS_ERROR);
   
                         if (p && p > *v) {                  *pos += (int)(p - *v);
                                 pp = p - 1;  
                                 while (pp > *v && ' ' == *pp)  
                                         pp--;  
                                 if (pp == *v && ' ' == *pp)  
                                         *pp = 0;  
                                 else if (' ' == *pp)  
                                         *(pp + 1) = 0;  
                         }  
   
                         /* ...in- and proceding whitespace. */                  /* Strip delimiter's preceding whitespace. */
                   pp = p - 1;
                   while (pp > *v && ' ' == *pp) {
                           if (pp > *v && '\\' == *(pp - 1))
                                   break;
                           pp--;
                   }
                   *(pp + 1) = 0;
   
                         if (p && ('\t' != *p)) {                  /* Strip delimiter's proceeding whitespace. */
                                 *p++ = 0;                  for (pp = &buf[*pos]; ' ' == *pp; pp++, (*pos)++)
                                 *p++ = 0;                          /* Skip ahead. */ ;
                         } else if (p)  
                                 *p++ = 0;  
   
                         if (p) {                  return(rc);
                                 while (' ' == *p)          }
                                         p++;  
                                 if (0 != *p)  
                                         *(p - 1) = 0;  
                                 *pos += (int)(p - *v);  
                         }  
   
                         if (p && 0 == *p)          /*
                                 if ( ! pwarn(mdoc, line, *pos, ECOLEMPTY))           * Process a quoted literal.  A quote begins with a double-quote
                                         return(0);           * and ends with a double-quote NOT preceded by a double-quote.
                         if (p && 0 == *p && p > *v && ' ' == *(p - 1))           * Whitespace is NOT involved in literal termination.
                                 if ( ! pwarn(mdoc, line, *pos, ETAILWS))           */
                                         return(0);  
   
                         if (p)          if (MDOC_PHRASELIT & m->flags || '\"' == buf[*pos]) {
                                 return(ARGS_PHRASE);                  if ( ! (MDOC_PHRASELIT & m->flags))
                           *v = &buf[++(*pos)];
   
                         /* Configure the eoln case, too. */                  if (MDOC_PPHRASE & m->flags)
                           m->flags |= MDOC_PHRASELIT;
   
                         p = strchr(*v, 0);                  for ( ; buf[*pos]; (*pos)++) {
                         assert(p);                          if ('\"' != buf[*pos])
                                   continue;
                           if ('\"' != buf[*pos + 1])
                                   break;
                           (*pos)++;
                   }
   
                         if (p > *v && ' ' == *(p - 1))                  if ('\0' == buf[*pos]) {
                                 if ( ! pwarn(mdoc, line, *pos, ETAILWS))                          if (ARGS_NOWARN & fl || MDOC_PPHRASE & m->flags)
                                         return(0);                                  return(ARGS_QWORD);
                         *pos += (int)(p - *v);                          if ( ! mdoc_pmsg(m, line, *pos, MANDOCERR_BADQUOTE))
                                   return(ARGS_ERROR);
                           return(ARGS_QWORD);
                   }
   
                         return(ARGS_PHRASE);                  m->flags &= ~MDOC_PHRASELIT;
                 }                  buf[(*pos)++] = '\0';
   
                 /* Do non-tabsep look-ahead here. */  
   
                 if ( ! (ARGS_TABSEP & fl))  
                         while (buf[*pos]) {  
                                 if (' ' == buf[*pos])  
                                         if ('\\' != buf[*pos - 1])  
                                                 break;  
                                 (*pos)++;  
                         }  
   
                 if (0 == buf[*pos])                  if ('\0' == buf[*pos])
                         return(ARGS_WORD);                          return(ARGS_QWORD);
   
                 buf[(*pos)++] = 0;                  while (' ' == buf[*pos])
                           (*pos)++;
   
                 if (0 == buf[*pos])                  if (0 == buf[*pos] && ! (ARGS_NOWARN & fl))
                         return(ARGS_WORD);                          if ( ! mdoc_pmsg(m, line, *pos, MANDOCERR_EOLNSPACE))
                                   return(ARGS_ERROR);
   
                 if ( ! (ARGS_TABSEP & fl))                  return(ARGS_QWORD);
                         while (buf[*pos] && ' ' == buf[*pos])          }
                                 (*pos)++;  
   
                 if (buf[*pos])          /*
                         return(ARGS_WORD);           * A non-quoted term progresses until either the end of line or
            * a non-escaped whitespace.
            */
   
                 if ( ! pwarn(mdoc, line, *pos, ETAILWS))          for ( ; buf[*pos]; (*pos)++)
                         return(ARGS_ERROR);                  if (*pos && ' ' == buf[*pos] && '\\' != buf[*pos - 1])
                           break;
   
           if ('\0' == buf[*pos])
                 return(ARGS_WORD);                  return(ARGS_WORD);
         }  
   
         /*          buf[(*pos)++] = '\0';
          * If we're a quoted string (and quoted strings are allowed),  
          * then parse ahead to the next quote.  If none's found, it's an  
          * error.  After, parse to the next word.  
          */  
   
         *v = &buf[++(*pos)];          while (' ' == buf[*pos])
   
         while (buf[*pos] && '\"' != buf[*pos])  
                 (*pos)++;                  (*pos)++;
   
         if (0 == buf[*pos]) {          if ('\0' == buf[*pos] && ! (ARGS_NOWARN & fl))
                 (void)perr(mdoc, line, *pos, EQUOTTERM, 1);                  if ( ! mdoc_pmsg(m, line, *pos, MANDOCERR_EOLNSPACE))
                 return(ARGS_ERROR);                          return(ARGS_ERROR);
         }  
   
         buf[(*pos)++] = 0;          return(ARGS_WORD);
         if (0 == buf[*pos])  }
                 return(ARGS_QWORD);  
   
         while (buf[*pos] && ' ' == buf[*pos])  /*
                 (*pos)++;   * Check if the string consists only of space-separated closing
    * delimiters.
    */
   static int
   args_checkpunct(const char *p)
   {
           int              i;
           enum mdelim      d;
   
         if (buf[*pos])          i = 0;
                 return(ARGS_QWORD);  
   
         if ( ! pwarn(mdoc, line, *pos, ETAILWS))          if (DELIM_CLOSE != mdoc_iscdelim(p[i]))
                 return(ARGS_ERROR);                  return(0);
   
         return(ARGS_QWORD);          while ('\0' != p[i]) {
                   d = mdoc_iscdelim(p[i]);
                   if (DELIM_NONE == d || DELIM_OPEN == d)
                           break;
                   i++;
                   if ('\0' == p[i] || ' ' != p[i])
                           break;
                   i++;
                   while (p[i] && ' ' == p[i])
                           i++;
           }
   
           return('\0' == p[i]);
 }  }
   
   /*
 static int   * Match up an argument string (e.g., `-foo bar' having "foo") with the
 argv_a2arg(int tok, const char *argv)   * correrct identifier.  It must apply to the given macro.  If none was
    * found (including bad matches), return MDOC_ARG_MAX.
    */
   static enum mdocargt
   argv_a2arg(enum mdoct tok, const char *p)
 {  {
           enum mdocargt    args[MDOC_ARG_MAX];
           int              i, len;
   
         /*          len = 0;
          * Parse an argument identifier from its text.  XXX - this  
          * should really be table-driven to clarify the code.  
          *  
          * If you add an argument to the list, make sure that you  
          * register it here with its one or more macros!  
          */  
   
         switch (tok) {          switch (tok) {
         case (MDOC_An):          case (MDOC_An):
                 if (0 == strcmp(argv, "split"))                  args[len++] = MDOC_Split;
                         return(MDOC_Split);                  args[len++] = MDOC_Nosplit;
                 else if (0 == strcmp(argv, "nosplit"))  
                         return(MDOC_Nosplit);  
                 break;                  break;
   
         case (MDOC_Bd):          case (MDOC_Bd):
                 if (0 == strcmp(argv, "ragged"))                  args[len++] = MDOC_Ragged;
                         return(MDOC_Ragged);                  args[len++] = MDOC_Unfilled;
                 else if (0 == strcmp(argv, "unfilled"))                  args[len++] = MDOC_Filled;
                         return(MDOC_Unfilled);                  args[len++] = MDOC_Literal;
                 else if (0 == strcmp(argv, "filled"))                  args[len++] = MDOC_File;
                         return(MDOC_Filled);                  args[len++] = MDOC_Offset;
                 else if (0 == strcmp(argv, "literal"))                  args[len++] = MDOC_Compact;
                         return(MDOC_Literal);                  args[len++] = MDOC_Centred;
                 else if (0 == strcmp(argv, "file"))  
                         return(MDOC_File);  
                 else if (0 == strcmp(argv, "offset"))  
                         return(MDOC_Offset);  
                 else if (0 == strcmp(argv, "compact"))  
                         return(MDOC_Compact);  
                 break;                  break;
   
         case (MDOC_Bf):          case (MDOC_Bf):
                 if (0 == strcmp(argv, "emphasis"))                  args[len++] = MDOC_Emphasis;
                         return(MDOC_Emphasis);                  args[len++] = MDOC_Literal;
                 else if (0 == strcmp(argv, "literal"))                  args[len++] = MDOC_Symbolic;
                         return(MDOC_Literal);  
                 else if (0 == strcmp(argv, "symbolic"))  
                         return(MDOC_Symbolic);  
                 break;                  break;
   
         case (MDOC_Bk):          case (MDOC_Bk):
                 if (0 == strcmp(argv, "words"))                  args[len++] = MDOC_Words;
                         return(MDOC_Words);  
                 break;                  break;
   
         case (MDOC_Bl):          case (MDOC_Bl):
                 if (0 == strcmp(argv, "bullet"))                  args[len++] = MDOC_Bullet;
                         return(MDOC_Bullet);                  args[len++] = MDOC_Dash;
                 else if (0 == strcmp(argv, "dash"))                  args[len++] = MDOC_Hyphen;
                         return(MDOC_Dash);                  args[len++] = MDOC_Item;
                 else if (0 == strcmp(argv, "hyphen"))                  args[len++] = MDOC_Enum;
                         return(MDOC_Hyphen);                  args[len++] = MDOC_Tag;
                 else if (0 == strcmp(argv, "item"))                  args[len++] = MDOC_Diag;
                         return(MDOC_Item);                  args[len++] = MDOC_Hang;
                 else if (0 == strcmp(argv, "enum"))                  args[len++] = MDOC_Ohang;
                         return(MDOC_Enum);                  args[len++] = MDOC_Inset;
                 else if (0 == strcmp(argv, "tag"))                  args[len++] = MDOC_Column;
                         return(MDOC_Tag);                  args[len++] = MDOC_Width;
                 else if (0 == strcmp(argv, "diag"))                  args[len++] = MDOC_Offset;
                         return(MDOC_Diag);                  args[len++] = MDOC_Compact;
                 else if (0 == strcmp(argv, "hang"))                  args[len++] = MDOC_Nested;
                         return(MDOC_Hang);  
                 else if (0 == strcmp(argv, "ohang"))  
                         return(MDOC_Ohang);  
                 else if (0 == strcmp(argv, "inset"))  
                         return(MDOC_Inset);  
                 else if (0 == strcmp(argv, "column"))  
                         return(MDOC_Column);  
                 else if (0 == strcmp(argv, "width"))  
                         return(MDOC_Width);  
                 else if (0 == strcmp(argv, "offset"))  
                         return(MDOC_Offset);  
                 else if (0 == strcmp(argv, "compact"))  
                         return(MDOC_Compact);  
                 else if (0 == strcmp(argv, "nested"))  
                         return(MDOC_Nested);  
                 break;                  break;
   
         case (MDOC_Rv):          case (MDOC_Rv):
                 /* FALLTHROUGH */                  /* FALLTHROUGH */
         case (MDOC_Ex):          case (MDOC_Ex):
                 if (0 == strcmp(argv, "std"))                  args[len++] = MDOC_Std;
                         return(MDOC_Std);  
                 break;                  break;
         default:          default:
                 break;                  break;
         }          }
   
           for (i = 0; i < len; i++)
                   if (0 == strcmp(p, mdoc_argnames[args[i]]))
                           return(args[i]);
   
         return(MDOC_ARG_MAX);          return(MDOC_ARG_MAX);
 }  }
   
   
 static int  static int
 argv_multi(struct mdoc *mdoc, int line,  argv_multi(struct mdoc *m, int line,
                 struct mdoc_argv *v, int *pos, char *buf)                  struct mdoc_argv *v, int *pos, char *buf)
 {  {
         int              c;          enum margserr    ac;
         char            *p;          char            *p;
   
         for (v->sz = 0; ; v->sz++) {          for (v->sz = 0; ; v->sz++) {
                 if ('-' == buf[*pos])                  if ('-' == buf[*pos])
                         break;                          break;
                 c = args(mdoc, line, pos, buf, ARGS_QUOTED, &p);                  ac = args(m, line, pos, buf, 0, &p);
                 if (ARGS_ERROR == c)                  if (ARGS_ERROR == ac)
                         return(0);                          return(0);
                 else if (ARGS_EOLN == c)                  else if (ARGS_EOLN == ac)
                         break;                          break;
   
                 if (0 == v->sz % MULTI_STEP) {                  if (0 == v->sz % MULTI_STEP)
                         v->value = realloc(v->value,                          v->value = mandoc_realloc(v->value,
                                 (v->sz + MULTI_STEP) * sizeof(char *));                                  (v->sz + MULTI_STEP) * sizeof(char *));
                         if (NULL == v->value) {  
                                 (void)verr(mdoc, EMALLOC);                  v->value[(int)v->sz] = mandoc_strdup(p);
                                 return(ARGV_ERROR);  
                         }  
                 }  
                 if (NULL == (v->value[(int)v->sz] = strdup(p)))  
                         return(verr(mdoc, EMALLOC));  
         }          }
   
         return(1);          return(1);
Line 770  argv_multi(struct mdoc *mdoc, int line, 
Line 698  argv_multi(struct mdoc *mdoc, int line, 
   
   
 static int  static int
 argv_opt_single(struct mdoc *mdoc, int line,  argv_opt_single(struct mdoc *m, int line,
                 struct mdoc_argv *v, int *pos, char *buf)                  struct mdoc_argv *v, int *pos, char *buf)
 {  {
         int              c;          enum margserr    ac;
         char            *p;          char            *p;
   
         if ('-' == buf[*pos])          if ('-' == buf[*pos])
                 return(1);                  return(1);
   
         c = args(mdoc, line, pos, buf, ARGS_QUOTED, &p);          ac = args(m, line, pos, buf, 0, &p);
         if (ARGS_ERROR == c)          if (ARGS_ERROR == ac)
                 return(0);                  return(0);
         if (ARGS_EOLN == c)          if (ARGS_EOLN == ac)
                 return(1);                  return(1);
   
         v->sz = 1;          v->sz = 1;
         if (NULL == (v->value = calloc(1, sizeof(char *))))          v->value = mandoc_malloc(sizeof(char *));
                 return(verr(mdoc, EMALLOC));          v->value[0] = mandoc_strdup(p);
         if (NULL == (v->value[0] = strdup(p)))  
                 return(verr(mdoc, EMALLOC));  
   
         return(1);          return(1);
 }  }
Line 799  argv_opt_single(struct mdoc *mdoc, int line, 
Line 725  argv_opt_single(struct mdoc *mdoc, int line, 
  * Parse a single, mandatory value from the stream.   * Parse a single, mandatory value from the stream.
  */   */
 static int  static int
 argv_single(struct mdoc *mdoc, int line,  argv_single(struct mdoc *m, int line,
                 struct mdoc_argv *v, int *pos, char *buf)                  struct mdoc_argv *v, int *pos, char *buf)
 {  {
         int              c, ppos;          int              ppos;
           enum margserr    ac;
         char            *p;          char            *p;
   
         ppos = *pos;          ppos = *pos;
   
         c = args(mdoc, line, pos, buf, ARGS_QUOTED, &p);          ac = args(m, line, pos, buf, 0, &p);
         if (ARGS_ERROR == c)          if (ARGS_EOLN == ac) {
                   mdoc_pmsg(m, line, ppos, MANDOCERR_SYNTARGVCOUNT);
                 return(0);                  return(0);
         if (ARGS_EOLN == c)          } else if (ARGS_ERROR == ac)
                 return(perr(mdoc, line, ppos, EARGVAL, 1));                  return(0);
   
         v->sz = 1;          v->sz = 1;
         if (NULL == (v->value = calloc(1, sizeof(char *))))          v->value = mandoc_malloc(sizeof(char *));
                 return(verr(mdoc, EMALLOC));          v->value[0] = mandoc_strdup(p);
         if (NULL == (v->value[0] = strdup(p)))  
                 return(verr(mdoc, EMALLOC));  
   
         return(1);          return(1);
 }  }

Legend:
Removed from v.1.10  
changed lines
  Added in v.1.64

CVSweb