[BACK]Return to mdoc_argv.c CVS log [TXT][DIR] Up to [cvsweb.bsd.lv] / mandoc

Diff for /mandoc/mdoc_argv.c between version 1.68 and 1.119

version 1.68, 2011/03/17 10:59:27 version 1.119, 2018/12/21 17:15:19
Line 1 
Line 1 
 /*      $Id$ */  /*      $Id$ */
 /*  /*
  * Copyright (c) 2008, 2009, 2010 Kristaps Dzonsons <kristaps@bsd.lv>   * Copyright (c) 2008, 2009, 2010, 2011 Kristaps Dzonsons <kristaps@bsd.lv>
    * Copyright (c) 2012, 2014-2018 Ingo Schwarze <schwarze@openbsd.org>
  *   *
  * Permission to use, copy, modify, and distribute this software for any   * Permission to use, copy, modify, and distribute this software for any
  * purpose with or without fee is hereby granted, provided that the above   * purpose with or without fee is hereby granted, provided that the above
  * copyright notice and this permission notice appear in all copies.   * copyright notice and this permission notice appear in all copies.
  *   *
  * THE SOFTWARE IS PROVIDED "AS IS" AND THE AUTHOR DISCLAIMS ALL WARRANTIES   * THE SOFTWARE IS PROVIDED "AS IS" AND THE AUTHORS DISCLAIM ALL WARRANTIES
  * WITH REGARD TO THIS SOFTWARE INCLUDING ALL IMPLIED WARRANTIES OF   * WITH REGARD TO THIS SOFTWARE INCLUDING ALL IMPLIED WARRANTIES OF
  * MERCHANTABILITY AND FITNESS. IN NO EVENT SHALL THE AUTHOR BE LIABLE FOR   * MERCHANTABILITY AND FITNESS. IN NO EVENT SHALL THE AUTHORS BE LIABLE FOR
  * ANY SPECIAL, DIRECT, INDIRECT, OR CONSEQUENTIAL DAMAGES OR ANY DAMAGES   * ANY SPECIAL, DIRECT, INDIRECT, OR CONSEQUENTIAL DAMAGES OR ANY DAMAGES
  * WHATSOEVER RESULTING FROM LOSS OF USE, DATA OR PROFITS, WHETHER IN AN   * WHATSOEVER RESULTING FROM LOSS OF USE, DATA OR PROFITS, WHETHER IN AN
  * ACTION OF CONTRACT, NEGLIGENCE OR OTHER TORTIOUS ACTION, ARISING OUT OF   * ACTION OF CONTRACT, NEGLIGENCE OR OTHER TORTIOUS ACTION, ARISING OUT OF
  * OR IN CONNECTION WITH THE USE OR PERFORMANCE OF THIS SOFTWARE.   * OR IN CONNECTION WITH THE USE OR PERFORMANCE OF THIS SOFTWARE.
  */   */
 #ifdef HAVE_CONFIG_H  
 #include "config.h"  #include "config.h"
 #endif  
   
 #include <sys/types.h>  #include <sys/types.h>
   
 #include <assert.h>  #include <assert.h>
 #include <ctype.h>  
 #include <stdlib.h>  #include <stdlib.h>
 #include <stdio.h>  #include <stdio.h>
 #include <string.h>  #include <string.h>
   
   #include "mandoc_aux.h"
 #include "mandoc.h"  #include "mandoc.h"
 #include "libmdoc.h"  #include "roff.h"
   #include "mdoc.h"
 #include "libmandoc.h"  #include "libmandoc.h"
   #include "roff_int.h"
   #include "libmdoc.h"
   
 #define MULTI_STEP       5 /* pre-allocate argument values */  #define MULTI_STEP       5 /* pre-allocate argument values */
   #define DELIMSZ          6 /* max possible size of a delimiter */
   
 static  enum mdocargt    argv_a2arg(enum mdoct, const char *);  enum    argsflag {
 static  enum margserr    args(struct mdoc *, int, int *,          ARGSFL_NONE = 0,
                                 char *, int, char **);          ARGSFL_DELIM, /* handle delimiters of [[::delim::][ ]+]+ */
 static  int              args_checkpunct(const char *);          ARGSFL_TABSEP /* handle tab/`Ta' separated phrases */
 static  int              argv(struct mdoc *, int,  };
                                 struct mdoc_argv *, int *, char *);  
 static  int              argv_single(struct mdoc *, int,  
                                 struct mdoc_argv *, int *, char *);  
 static  int              argv_opt_single(struct mdoc *, int,  
                                 struct mdoc_argv *, int *, char *);  
 static  int              argv_multi(struct mdoc *, int,  
                                 struct mdoc_argv *, int *, char *);  
   
 enum    argvflag {  enum    argvflag {
         ARGV_NONE, /* no args to flag (e.g., -split) */          ARGV_NONE, /* no args to flag (e.g., -split) */
         ARGV_SINGLE, /* one arg to flag (e.g., -file xxx)  */          ARGV_SINGLE, /* one arg to flag (e.g., -file xxx)  */
         ARGV_MULTI, /* multiple args (e.g., -column xxx yyy) */          ARGV_MULTI /* multiple args (e.g., -column xxx yyy) */
         ARGV_OPT_SINGLE /* optional arg (e.g., -offset [xxx]) */  
 };  };
   
   struct  mdocarg {
           enum argsflag    flags;
           const enum mdocargt *argvs;
   };
   
   static  void             argn_free(struct mdoc_arg *, int);
   static  enum margserr    args(struct roff_man *, int, int *,
                                   char *, enum argsflag, char **);
   static  int              args_checkpunct(const char *, int);
   static  void             argv_multi(struct roff_man *, int,
                                   struct mdoc_argv *, int *, char *);
   static  void             argv_single(struct roff_man *, int,
                                   struct mdoc_argv *, int *, char *);
   
 static  const enum argvflag argvflags[MDOC_ARG_MAX] = {  static  const enum argvflag argvflags[MDOC_ARG_MAX] = {
         ARGV_NONE,      /* MDOC_Split */          ARGV_NONE,      /* MDOC_Split */
         ARGV_NONE,      /* MDOC_Nosplit */          ARGV_NONE,      /* MDOC_Nosplit */
Line 59  static const enum argvflag argvflags[MDOC_ARG_MAX] = {
Line 68  static const enum argvflag argvflags[MDOC_ARG_MAX] = {
         ARGV_NONE,      /* MDOC_Unfilled */          ARGV_NONE,      /* MDOC_Unfilled */
         ARGV_NONE,      /* MDOC_Literal */          ARGV_NONE,      /* MDOC_Literal */
         ARGV_SINGLE,    /* MDOC_File */          ARGV_SINGLE,    /* MDOC_File */
         ARGV_OPT_SINGLE, /* MDOC_Offset */          ARGV_SINGLE,    /* MDOC_Offset */
         ARGV_NONE,      /* MDOC_Bullet */          ARGV_NONE,      /* MDOC_Bullet */
         ARGV_NONE,      /* MDOC_Dash */          ARGV_NONE,      /* MDOC_Dash */
         ARGV_NONE,      /* MDOC_Hyphen */          ARGV_NONE,      /* MDOC_Hyphen */
Line 81  static const enum argvflag argvflags[MDOC_ARG_MAX] = {
Line 90  static const enum argvflag argvflags[MDOC_ARG_MAX] = {
         ARGV_NONE       /* MDOC_Symbolic */          ARGV_NONE       /* MDOC_Symbolic */
 };  };
   
 static  const int argflags[MDOC_MAX] = {  static  const enum mdocargt args_Ex[] = {
         0, /* Ap */          MDOC_Std,
         0, /* Dd */          MDOC_ARG_MAX
         0, /* Dt */  
         0, /* Os */  
         0, /* Sh */  
         0, /* Ss */  
         0, /* Pp */  
         ARGS_DELIM, /* D1 */  
         ARGS_DELIM, /* Dl */  
         0, /* Bd */  
         0, /* Ed */  
         0, /* Bl */  
         0, /* El */  
         0, /* It */  
         ARGS_DELIM, /* Ad */  
         ARGS_DELIM, /* An */  
         ARGS_DELIM, /* Ar */  
         0, /* Cd */  
         ARGS_DELIM, /* Cm */  
         ARGS_DELIM, /* Dv */  
         ARGS_DELIM, /* Er */  
         ARGS_DELIM, /* Ev */  
         0, /* Ex */  
         ARGS_DELIM, /* Fa */  
         0, /* Fd */  
         ARGS_DELIM, /* Fl */  
         ARGS_DELIM, /* Fn */  
         ARGS_DELIM, /* Ft */  
         ARGS_DELIM, /* Ic */  
         0, /* In */  
         ARGS_DELIM, /* Li */  
         0, /* Nd */  
         ARGS_DELIM, /* Nm */  
         ARGS_DELIM, /* Op */  
         0, /* Ot */  
         ARGS_DELIM, /* Pa */  
         0, /* Rv */  
         ARGS_DELIM, /* St */  
         ARGS_DELIM, /* Va */  
         ARGS_DELIM, /* Vt */  
         ARGS_DELIM, /* Xr */  
         0, /* %A */  
         0, /* %B */  
         0, /* %D */  
         0, /* %I */  
         0, /* %J */  
         0, /* %N */  
         0, /* %O */  
         0, /* %P */  
         0, /* %R */  
         0, /* %T */  
         0, /* %V */  
         ARGS_DELIM, /* Ac */  
         0, /* Ao */  
         ARGS_DELIM, /* Aq */  
         ARGS_DELIM, /* At */  
         ARGS_DELIM, /* Bc */  
         0, /* Bf */  
         0, /* Bo */  
         ARGS_DELIM, /* Bq */  
         ARGS_DELIM, /* Bsx */  
         ARGS_DELIM, /* Bx */  
         0, /* Db */  
         ARGS_DELIM, /* Dc */  
         0, /* Do */  
         ARGS_DELIM, /* Dq */  
         ARGS_DELIM, /* Ec */  
         0, /* Ef */  
         ARGS_DELIM, /* Em */  
         0, /* Eo */  
         ARGS_DELIM, /* Fx */  
         ARGS_DELIM, /* Ms */  
         ARGS_DELIM, /* No */  
         ARGS_DELIM, /* Ns */  
         ARGS_DELIM, /* Nx */  
         ARGS_DELIM, /* Ox */  
         ARGS_DELIM, /* Pc */  
         ARGS_DELIM, /* Pf */  
         0, /* Po */  
         ARGS_DELIM, /* Pq */  
         ARGS_DELIM, /* Qc */  
         ARGS_DELIM, /* Ql */  
         0, /* Qo */  
         ARGS_DELIM, /* Qq */  
         0, /* Re */  
         0, /* Rs */  
         ARGS_DELIM, /* Sc */  
         0, /* So */  
         ARGS_DELIM, /* Sq */  
         0, /* Sm */  
         ARGS_DELIM, /* Sx */  
         ARGS_DELIM, /* Sy */  
         ARGS_DELIM, /* Tn */  
         ARGS_DELIM, /* Ux */  
         ARGS_DELIM, /* Xc */  
         0, /* Xo */  
         0, /* Fo */  
         0, /* Fc */  
         0, /* Oo */  
         ARGS_DELIM, /* Oc */  
         0, /* Bk */  
         0, /* Ek */  
         0, /* Bt */  
         0, /* Hf */  
         0, /* Fr */  
         0, /* Ud */  
         0, /* Lb */  
         0, /* Lp */  
         ARGS_DELIM, /* Lk */  
         ARGS_DELIM, /* Mt */  
         ARGS_DELIM, /* Brq */  
         0, /* Bro */  
         ARGS_DELIM, /* Brc */  
         0, /* %C */  
         0, /* Es */  
         0, /* En */  
         0, /* Dx */  
         0, /* %Q */  
         0, /* br */  
         0, /* sp */  
         0, /* %U */  
         0, /* Ta */  
 };  };
   
   static  const enum mdocargt args_An[] = {
           MDOC_Split,
           MDOC_Nosplit,
           MDOC_ARG_MAX
   };
   
   static  const enum mdocargt args_Bd[] = {
           MDOC_Ragged,
           MDOC_Unfilled,
           MDOC_Filled,
           MDOC_Literal,
           MDOC_File,
           MDOC_Offset,
           MDOC_Compact,
           MDOC_Centred,
           MDOC_ARG_MAX
   };
   
   static  const enum mdocargt args_Bf[] = {
           MDOC_Emphasis,
           MDOC_Literal,
           MDOC_Symbolic,
           MDOC_ARG_MAX
   };
   
   static  const enum mdocargt args_Bk[] = {
           MDOC_Words,
           MDOC_ARG_MAX
   };
   
   static  const enum mdocargt args_Bl[] = {
           MDOC_Bullet,
           MDOC_Dash,
           MDOC_Hyphen,
           MDOC_Item,
           MDOC_Enum,
           MDOC_Tag,
           MDOC_Diag,
           MDOC_Hang,
           MDOC_Ohang,
           MDOC_Inset,
           MDOC_Column,
           MDOC_Width,
           MDOC_Offset,
           MDOC_Compact,
           MDOC_Nested,
           MDOC_ARG_MAX
   };
   
   static  const struct mdocarg mdocargs[MDOC_MAX - MDOC_Dd] = {
           { ARGSFL_NONE, NULL }, /* Dd */
           { ARGSFL_NONE, NULL }, /* Dt */
           { ARGSFL_NONE, NULL }, /* Os */
           { ARGSFL_NONE, NULL }, /* Sh */
           { ARGSFL_NONE, NULL }, /* Ss */
           { ARGSFL_NONE, NULL }, /* Pp */
           { ARGSFL_DELIM, NULL }, /* D1 */
           { ARGSFL_DELIM, NULL }, /* Dl */
           { ARGSFL_NONE, args_Bd }, /* Bd */
           { ARGSFL_NONE, NULL }, /* Ed */
           { ARGSFL_NONE, args_Bl }, /* Bl */
           { ARGSFL_NONE, NULL }, /* El */
           { ARGSFL_NONE, NULL }, /* It */
           { ARGSFL_DELIM, NULL }, /* Ad */
           { ARGSFL_DELIM, args_An }, /* An */
           { ARGSFL_DELIM, NULL }, /* Ap */
           { ARGSFL_DELIM, NULL }, /* Ar */
           { ARGSFL_DELIM, NULL }, /* Cd */
           { ARGSFL_DELIM, NULL }, /* Cm */
           { ARGSFL_DELIM, NULL }, /* Dv */
           { ARGSFL_DELIM, NULL }, /* Er */
           { ARGSFL_DELIM, NULL }, /* Ev */
           { ARGSFL_NONE, args_Ex }, /* Ex */
           { ARGSFL_DELIM, NULL }, /* Fa */
           { ARGSFL_NONE, NULL }, /* Fd */
           { ARGSFL_DELIM, NULL }, /* Fl */
           { ARGSFL_DELIM, NULL }, /* Fn */
           { ARGSFL_DELIM, NULL }, /* Ft */
           { ARGSFL_DELIM, NULL }, /* Ic */
           { ARGSFL_DELIM, NULL }, /* In */
           { ARGSFL_DELIM, NULL }, /* Li */
           { ARGSFL_NONE, NULL }, /* Nd */
           { ARGSFL_DELIM, NULL }, /* Nm */
           { ARGSFL_DELIM, NULL }, /* Op */
           { ARGSFL_DELIM, NULL }, /* Ot */
           { ARGSFL_DELIM, NULL }, /* Pa */
           { ARGSFL_NONE, args_Ex }, /* Rv */
           { ARGSFL_DELIM, NULL }, /* St */
           { ARGSFL_DELIM, NULL }, /* Va */
           { ARGSFL_DELIM, NULL }, /* Vt */
           { ARGSFL_DELIM, NULL }, /* Xr */
           { ARGSFL_NONE, NULL }, /* %A */
           { ARGSFL_NONE, NULL }, /* %B */
           { ARGSFL_NONE, NULL }, /* %D */
           { ARGSFL_NONE, NULL }, /* %I */
           { ARGSFL_NONE, NULL }, /* %J */
           { ARGSFL_NONE, NULL }, /* %N */
           { ARGSFL_NONE, NULL }, /* %O */
           { ARGSFL_NONE, NULL }, /* %P */
           { ARGSFL_NONE, NULL }, /* %R */
           { ARGSFL_NONE, NULL }, /* %T */
           { ARGSFL_NONE, NULL }, /* %V */
           { ARGSFL_DELIM, NULL }, /* Ac */
           { ARGSFL_NONE, NULL }, /* Ao */
           { ARGSFL_DELIM, NULL }, /* Aq */
           { ARGSFL_DELIM, NULL }, /* At */
           { ARGSFL_DELIM, NULL }, /* Bc */
           { ARGSFL_NONE, args_Bf }, /* Bf */
           { ARGSFL_NONE, NULL }, /* Bo */
           { ARGSFL_DELIM, NULL }, /* Bq */
           { ARGSFL_DELIM, NULL }, /* Bsx */
           { ARGSFL_DELIM, NULL }, /* Bx */
           { ARGSFL_NONE, NULL }, /* Db */
           { ARGSFL_DELIM, NULL }, /* Dc */
           { ARGSFL_NONE, NULL }, /* Do */
           { ARGSFL_DELIM, NULL }, /* Dq */
           { ARGSFL_DELIM, NULL }, /* Ec */
           { ARGSFL_NONE, NULL }, /* Ef */
           { ARGSFL_DELIM, NULL }, /* Em */
           { ARGSFL_NONE, NULL }, /* Eo */
           { ARGSFL_DELIM, NULL }, /* Fx */
           { ARGSFL_DELIM, NULL }, /* Ms */
           { ARGSFL_DELIM, NULL }, /* No */
           { ARGSFL_DELIM, NULL }, /* Ns */
           { ARGSFL_DELIM, NULL }, /* Nx */
           { ARGSFL_DELIM, NULL }, /* Ox */
           { ARGSFL_DELIM, NULL }, /* Pc */
           { ARGSFL_DELIM, NULL }, /* Pf */
           { ARGSFL_NONE, NULL }, /* Po */
           { ARGSFL_DELIM, NULL }, /* Pq */
           { ARGSFL_DELIM, NULL }, /* Qc */
           { ARGSFL_DELIM, NULL }, /* Ql */
           { ARGSFL_NONE, NULL }, /* Qo */
           { ARGSFL_DELIM, NULL }, /* Qq */
           { ARGSFL_NONE, NULL }, /* Re */
           { ARGSFL_NONE, NULL }, /* Rs */
           { ARGSFL_DELIM, NULL }, /* Sc */
           { ARGSFL_NONE, NULL }, /* So */
           { ARGSFL_DELIM, NULL }, /* Sq */
           { ARGSFL_NONE, NULL }, /* Sm */
           { ARGSFL_DELIM, NULL }, /* Sx */
           { ARGSFL_DELIM, NULL }, /* Sy */
           { ARGSFL_DELIM, NULL }, /* Tn */
           { ARGSFL_DELIM, NULL }, /* Ux */
           { ARGSFL_DELIM, NULL }, /* Xc */
           { ARGSFL_NONE, NULL }, /* Xo */
           { ARGSFL_NONE, NULL }, /* Fo */
           { ARGSFL_DELIM, NULL }, /* Fc */
           { ARGSFL_NONE, NULL }, /* Oo */
           { ARGSFL_DELIM, NULL }, /* Oc */
           { ARGSFL_NONE, args_Bk }, /* Bk */
           { ARGSFL_NONE, NULL }, /* Ek */
           { ARGSFL_NONE, NULL }, /* Bt */
           { ARGSFL_NONE, NULL }, /* Hf */
           { ARGSFL_DELIM, NULL }, /* Fr */
           { ARGSFL_NONE, NULL }, /* Ud */
           { ARGSFL_DELIM, NULL }, /* Lb */
           { ARGSFL_NONE, NULL }, /* Lp */
           { ARGSFL_DELIM, NULL }, /* Lk */
           { ARGSFL_DELIM, NULL }, /* Mt */
           { ARGSFL_DELIM, NULL }, /* Brq */
           { ARGSFL_NONE, NULL }, /* Bro */
           { ARGSFL_DELIM, NULL }, /* Brc */
           { ARGSFL_NONE, NULL }, /* %C */
           { ARGSFL_NONE, NULL }, /* Es */
           { ARGSFL_DELIM, NULL }, /* En */
           { ARGSFL_DELIM, NULL }, /* Dx */
           { ARGSFL_NONE, NULL }, /* %Q */
           { ARGSFL_NONE, NULL }, /* %U */
           { ARGSFL_NONE, NULL }, /* Ta */
   };
   
   
 /*  /*
  * Parse an argument from line text.  This comes in the form of -key   * Parse flags and their arguments from the input line.
  * [value0...], which may either have a single mandatory value, at least   * These come in the form -flag [argument ...].
  * one mandatory value, an optional single value, or no value.   * Some flags take no argument, some one, some multiple.
  */   */
 enum margverr  void
 mdoc_argv(struct mdoc *m, int line, enum mdoct tok,  mdoc_argv(struct roff_man *mdoc, int line, enum roff_tok tok,
                 struct mdoc_arg **v, int *pos, char *buf)          struct mdoc_arg **reta, int *pos, char *buf)
 {  {
         char             *p, sv;          struct mdoc_argv          tmpv;
         struct mdoc_argv tmp;          struct mdoc_argv        **retv;
         struct mdoc_arg  *arg;          const enum mdocargt      *argtable;
           char                     *argname;
           int                       ipos, retc;
           char                      savechar;
   
         if ('\0' == buf[*pos])          *reta = NULL;
                 return(ARGV_EOLN);  
   
         assert(' ' != buf[*pos]);          /* Which flags does this macro support? */
   
         /* Parse through to the first unescaped space. */          assert(tok >= MDOC_Dd && tok < MDOC_MAX);
           argtable = mdocargs[tok - MDOC_Dd].argvs;
           if (argtable == NULL)
                   return;
   
         p = &buf[++(*pos)];          /* Loop over the flags on the input line. */
   
         assert(*pos > 0);          ipos = *pos;
           while (buf[ipos] == '-') {
   
         /* LINTED */                  /* Seek to the first unescaped space. */
         while (buf[*pos]) {  
                 if (' ' == buf[*pos])                  for (argname = buf + ++ipos; buf[ipos] != '\0'; ipos++)
                         if ('\\' != buf[*pos - 1])                          if (buf[ipos] == ' ' && buf[ipos - 1] != '\\')
                                 break;                                  break;
                 (*pos)++;  
         }  
   
         /* XXX - save zeroed byte, if not an argument. */                  /*
                    * We want to nil-terminate the word to look it up.
                    * But we may not have a flag, in which case we need
                    * to restore the line as-is.  So keep around the
                    * stray byte, which we'll reset upon exiting.
                    */
   
         sv = '\0';                  if ((savechar = buf[ipos]) != '\0')
         if (buf[*pos]) {                          buf[ipos++] = '\0';
                 sv = buf[*pos];  
                 buf[(*pos)++] = '\0';  
         }  
   
         memset(&tmp, 0, sizeof(struct mdoc_argv));                  /*
         tmp.line = line;                   * Now look up the word as a flag.  Use temporary
         tmp.pos = *pos;                   * storage that we'll copy into the node's flags.
                    */
   
         /* See if our token accepts the argument. */                  while ((tmpv.arg = *argtable++) != MDOC_ARG_MAX)
                           if ( ! strcmp(argname, mdoc_argnames[tmpv.arg]))
                                   break;
   
         if (MDOC_ARG_MAX == (tmp.arg = argv_a2arg(tok, p))) {                  /* If it isn't a flag, restore the saved byte. */
                 /* XXX - restore saved zeroed byte. */  
                 if (sv)  
                         buf[*pos - 1] = sv;  
                 return(ARGV_WORD);  
         }  
   
         while (buf[*pos] && ' ' == buf[*pos])                  if (tmpv.arg == MDOC_ARG_MAX) {
                 (*pos)++;                          if (savechar != '\0')
                                   buf[ipos - 1] = savechar;
                           break;
                   }
   
         if ( ! argv(m, line, &tmp, pos, buf))                  /* Read to the next word (the first argument). */
                 return(ARGV_ERROR);  
   
         if (NULL == (arg = *v))                  while (buf[ipos] == ' ')
                 arg = *v = mandoc_calloc(1, sizeof(struct mdoc_arg));                          ipos++;
   
         arg->argc++;                  /* Parse the arguments of the flag. */
         arg->argv = mandoc_realloc  
                 (arg->argv, arg->argc * sizeof(struct mdoc_argv));  
   
         memcpy(&arg->argv[(int)arg->argc - 1],                  tmpv.line  = line;
                         &tmp, sizeof(struct mdoc_argv));                  tmpv.pos   = *pos;
                   tmpv.sz    = 0;
                   tmpv.value = NULL;
   
         return(ARGV_ARG);                  switch (argvflags[tmpv.arg]) {
                   case ARGV_SINGLE:
                           argv_single(mdoc, line, &tmpv, &ipos, buf);
                           break;
                   case ARGV_MULTI:
                           argv_multi(mdoc, line, &tmpv, &ipos, buf);
                           break;
                   case ARGV_NONE:
                           break;
                   }
   
                   /* Append to the return values. */
   
                   if (*reta == NULL)
                           *reta = mandoc_calloc(1, sizeof(**reta));
   
                   retc = ++(*reta)->argc;
                   retv = &(*reta)->argv;
                   *retv = mandoc_reallocarray(*retv, retc, sizeof(**retv));
                   memcpy(*retv + retc - 1, &tmpv, sizeof(**retv));
   
                   /* Prepare for parsing the next flag. */
   
                   *pos = ipos;
                   argtable = mdocargs[tok - MDOC_Dd].argvs;
           }
 }  }
   
 void  void
Line 294  mdoc_argv_free(struct mdoc_arg *p)
Line 387  mdoc_argv_free(struct mdoc_arg *p)
         assert(p->argc);          assert(p->argc);
   
         for (i = (int)p->argc - 1; i >= 0; i--)          for (i = (int)p->argc - 1; i >= 0; i--)
                 mdoc_argn_free(p, i);                  argn_free(p, i);
   
         free(p->argv);          free(p->argv);
         free(p);          free(p);
 }  }
   
 void  static void
 mdoc_argn_free(struct mdoc_arg *p, int iarg)  argn_free(struct mdoc_arg *p, int iarg)
 {  {
         struct mdoc_argv *arg;          struct mdoc_argv *arg;
         int               j;          int               j;
Line 309  mdoc_argn_free(struct mdoc_arg *p, int iarg)
Line 402  mdoc_argn_free(struct mdoc_arg *p, int iarg)
         arg = &p->argv[iarg];          arg = &p->argv[iarg];
   
         if (arg->sz && arg->value) {          if (arg->sz && arg->value) {
                 for (j = (int)arg->sz - 1; j >= 0; j--)                  for (j = (int)arg->sz - 1; j >= 0; j--)
                         free(arg->value[j]);                          free(arg->value[j]);
                 free(arg->value);                  free(arg->value);
         }          }
Line 319  mdoc_argn_free(struct mdoc_arg *p, int iarg)
Line 412  mdoc_argn_free(struct mdoc_arg *p, int iarg)
 }  }
   
 enum margserr  enum margserr
 mdoc_zargs(struct mdoc *m, int line, int *pos,  mdoc_args(struct roff_man *mdoc, int line, int *pos,
                 char *buf, int flags, char **v)          char *buf, enum roff_tok tok, char **v)
 {  {
           struct roff_node *n;
           enum argsflag     fl;
   
         return(args(m, line, pos, buf, flags, v));          fl = tok == TOKEN_NONE ? ARGSFL_NONE : mdocargs[tok - MDOC_Dd].flags;
 }  
   
 enum margserr  
 mdoc_args(struct mdoc *m, int line, int *pos,  
                 char *buf, enum mdoct tok, char **v)  
 {  
         int               fl;  
         struct mdoc_node *n;  
   
         fl = argflags[tok];  
   
         if (MDOC_It != tok)  
                 return(args(m, line, pos, buf, fl, v));  
   
         /*          /*
          * We know that we're in an `It', so it's reasonable to expect           * We know that we're in an `It', so it's reasonable to expect
          * us to be sitting in a `Bl'.  Someday this may not be the case           * us to be sitting in a `Bl'.  Someday this may not be the case
Line 345  mdoc_args(struct mdoc *m, int line, int *pos, 
Line 427  mdoc_args(struct mdoc *m, int line, int *pos, 
          * safe fall-back into the default behaviour.           * safe fall-back into the default behaviour.
          */           */
   
         for (n = m->last; n; n = n->parent)          if (tok == MDOC_It) {
                 if (MDOC_Bl == n->tok)                  for (n = mdoc->last; n != NULL; n = n->parent) {
                           if (n->tok != MDOC_Bl)
                                   continue;
                           if (n->norm->Bl.type == LIST_column)
                                   fl = ARGSFL_TABSEP;
                         break;                          break;
                   }
         if (n && LIST_column == n->norm->Bl.type) {  
                 fl |= ARGS_TABSEP;  
                 fl &= ~ARGS_DELIM;  
         }          }
   
         return(args(m, line, pos, buf, fl, v));          return args(mdoc, line, pos, buf, fl, v);
 }  }
   
 static enum margserr  static enum margserr
 args(struct mdoc *m, int line, int *pos,  args(struct roff_man *mdoc, int line, int *pos,
                 char *buf, int fl, char **v)                  char *buf, enum argsflag fl, char **v)
 {  {
         int              i;          char            *p;
         char            *p, *pp;          char            *v_local;
         enum margserr    rc;          int              pairs;
   
         /*          if (buf[*pos] == '\0') {
          * Parse out the terms (like `val' in `.Xx -arg val' or simply                  if (mdoc->flags & MDOC_PHRASELIT &&
          * `.Xx val'), which can have all sorts of properties:                      ! (mdoc->flags & MDOC_PHRASE)) {
          *                          mandoc_msg(MANDOCERR_ARG_QUOTE, line, *pos, NULL);
          *   ARGS_DELIM: use special handling if encountering trailing                          mdoc->flags &= ~MDOC_PHRASELIT;
          *   delimiters in the form of [[::delim::][ ]+]+.                  }
          *                  return ARGS_EOLN;
          *   ARGS_NOWARN: don't post warnings.  This is only used when  
          *   re-parsing delimiters, as the warnings have already been  
          *   posted.  
          *  
          *   ARGS_TABSEP: use special handling for tab/`Ta' separated  
          *   phrases like in `Bl -column'.  
          */  
   
         assert(' ' != buf[*pos]);  
   
         if ('\0' == buf[*pos]) {  
                 if (MDOC_PPHRASE & m->flags)  
                         return(ARGS_EOLN);  
                 /*  
                  * If we're not in a partial phrase and the flag for  
                  * being a phrase literal is still set, the punctuation  
                  * is unterminated.  
                  */  
                 if (MDOC_PHRASELIT & m->flags)  
                         mdoc_pmsg(m, line, *pos, MANDOCERR_BADQUOTE);  
   
                 m->flags &= ~MDOC_PHRASELIT;  
                 return(ARGS_EOLN);  
         }          }
   
         *v = &buf[*pos];          if (v == NULL)
                   v = &v_local;
           *v = buf + *pos;
   
         if (ARGS_DELIM & fl && args_checkpunct(&buf[*pos])) {          if (fl == ARGSFL_DELIM && args_checkpunct(buf, *pos))
                 i = strlen(&buf[*pos]) + *pos;                  return ARGS_PUNCT;
                 if (i && ' ' != buf[i - 1])  
                         return(ARGS_PUNCT);  
                 if (ARGS_NOWARN & fl)  
                         return(ARGS_PUNCT);  
                 mdoc_pmsg(m, line, *pos, MANDOCERR_EOLNSPACE);  
                 return(ARGS_PUNCT);  
         }  
   
         /*          /*
          * First handle TABSEP items, restricted to `Bl -column'.  This           * Tabs in `It' lines in `Bl -column' can't be escaped.
          * ignores conventional token parsing and instead uses tabs or           * Phrases are reparsed for `Ta' and other macros later.
          * `Ta' macros to separate phrases.  Phrases are parsed again  
          * for arguments at a later phase.  
          */           */
   
         if (ARGS_TABSEP & fl) {          if (fl == ARGSFL_TABSEP) {
                 /* Scan ahead to tab (can't be escaped). */                  if ((p = strchr(*v, '\t')) != NULL) {
                 p = strchr(*v, '\t');  
                 pp = NULL;  
   
                 /* Scan ahead to unescaped `Ta'. */                          /*
                 if ( ! (MDOC_PHRASELIT & m->flags))                           * Words right before and right after
                         for (pp = *v; ; pp++) {                           * tab characters are not parsed,
                                 if (NULL == (pp = strstr(pp, "Ta")))                           * unless there is a blank in between.
                                         break;                           */
                                 if (pp > *v && ' ' != *(pp - 1))  
                                         continue;  
                                 if (' ' == *(pp + 2) || '\0' == *(pp + 2))  
                                         break;  
                         }  
   
                 /* By default, assume a phrase. */                          if (p > buf && p[-1] != ' ')
                 rc = ARGS_PHRASE;                                  mdoc->flags |= MDOC_PHRASEQL;
                           if (p[1] != ' ')
                                   mdoc->flags |= MDOC_PHRASEQN;
   
                 /*                          /*
                  * Adjust new-buffer position to be beyond delimiter                           * One or more blanks after a tab cause
                  * mark (e.g., Ta -> end + 2).                           * one leading blank in the next column.
                  */                           * So skip all but one of them.
                 if (p && pp) {                           */
                         *pos += pp < p ? 2 : 1;  
                         rc = pp < p ? ARGS_PHRASE : ARGS_PPHRASE;  
                         p = pp < p ? pp : p;  
                 } else if (p && ! pp) {  
                         rc = ARGS_PPHRASE;  
                         *pos += 1;  
                 } else if (pp && ! p) {  
                         p = pp;  
                         *pos += 2;  
                 } else {  
                         rc = ARGS_PEND;  
                         p = strchr(*v, 0);  
                 }  
   
                 /* Whitespace check for eoln case... */                          *pos += (int)(p - *v) + 1;
                 if ('\0' == *p && ' ' == *(p - 1) && ! (ARGS_NOWARN & fl))                          while (buf[*pos] == ' ' && buf[*pos + 1] == ' ')
                         mdoc_pmsg(m, line, *pos, MANDOCERR_EOLNSPACE);                                  (*pos)++;
   
                 *pos += (int)(p - *v);                          /*
                            * A tab at the end of an input line
                            * switches to the next column.
                            */
   
                 /* Strip delimiter's preceding whitespace. */                          if (buf[*pos] == '\0' || buf[*pos + 1] == '\0')
                 pp = p - 1;                                  mdoc->flags |= MDOC_PHRASEQN;
                 while (pp > *v && ' ' == *pp) {                  } else {
                         if (pp > *v && '\\' == *(pp - 1))                          p = strchr(*v, '\0');
                                 break;                          if (p[-1] == ' ')
                         pp--;                                  mandoc_msg(MANDOCERR_SPACE_EOL,
                                       line, *pos, NULL);
                           *pos += (int)(p - *v);
                 }                  }
                 *(pp + 1) = 0;  
   
                 /* Strip delimiter's proceeding whitespace. */                  /* Skip any trailing blank characters. */
                 for (pp = &buf[*pos]; ' ' == *pp; pp++, (*pos)++)                  while (p > *v && p[-1] == ' ' &&
                         /* Skip ahead. */ ;                      (p - 1 == *v || p[-2] != '\\'))
                           p--;
                   *p = '\0';
   
                 return(rc);                  return ARGS_PHRASE;
         }          }
   
         /*          /*
          * Process a quoted literal.  A quote begins with a double-quote           * Process a quoted literal.  A quote begins with a double-quote
          * and ends with a double-quote NOT preceded by a double-quote.           * and ends with a double-quote NOT preceded by a double-quote.
            * NUL-terminate the literal in place.
            * Collapse pairs of quotes inside quoted literals.
          * Whitespace is NOT involved in literal termination.           * Whitespace is NOT involved in literal termination.
          */           */
   
         if (MDOC_PHRASELIT & m->flags || '\"' == buf[*pos]) {          if (mdoc->flags & MDOC_PHRASELIT ||
                 if ( ! (MDOC_PHRASELIT & m->flags))              (mdoc->flags & MDOC_PHRASE && buf[*pos] == '\"')) {
                   if ((mdoc->flags & MDOC_PHRASELIT) == 0) {
                         *v = &buf[++(*pos)];                          *v = &buf[++(*pos)];
                           mdoc->flags |= MDOC_PHRASELIT;
                 if (MDOC_PPHRASE & m->flags)                  }
                         m->flags |= MDOC_PHRASELIT;                  pairs = 0;
   
                 for ( ; buf[*pos]; (*pos)++) {                  for ( ; buf[*pos]; (*pos)++) {
                           /* Move following text left after quoted quotes. */
                           if (pairs)
                                   buf[*pos - pairs] = buf[*pos];
                         if ('\"' != buf[*pos])                          if ('\"' != buf[*pos])
                                 continue;                                  continue;
                           /* Unquoted quotes end quoted args. */
                         if ('\"' != buf[*pos + 1])                          if ('\"' != buf[*pos + 1])
                                 break;                                  break;
                           /* Quoted quotes collapse. */
                           pairs++;
                         (*pos)++;                          (*pos)++;
                 }                  }
                   if (pairs)
                           buf[*pos - pairs] = '\0';
   
                 if ('\0' == buf[*pos]) {                  if (buf[*pos] == '\0') {
                         if (ARGS_NOWARN & fl || MDOC_PPHRASE & m->flags)                          if ( ! (mdoc->flags & MDOC_PHRASE))
                                 return(ARGS_QWORD);                                  mandoc_msg(MANDOCERR_ARG_QUOTE,
                         mdoc_pmsg(m, line, *pos, MANDOCERR_BADQUOTE);                                      line, *pos, NULL);
                         return(ARGS_QWORD);                          return ARGS_WORD;
                 }                  }
   
                 m->flags &= ~MDOC_PHRASELIT;                  mdoc->flags &= ~MDOC_PHRASELIT;
                 buf[(*pos)++] = '\0';                  buf[(*pos)++] = '\0';
   
                 if ('\0' == buf[*pos])                  if ('\0' == buf[*pos])
                         return(ARGS_QWORD);                          return ARGS_WORD;
   
                 while (' ' == buf[*pos])                  while (' ' == buf[*pos])
                         (*pos)++;                          (*pos)++;
   
                 if (0 == buf[*pos] && ! (ARGS_NOWARN & fl))                  if ('\0' == buf[*pos])
                         mdoc_pmsg(m, line, *pos, MANDOCERR_EOLNSPACE);                          mandoc_msg(MANDOCERR_SPACE_EOL, line, *pos, NULL);
   
                 return(ARGS_QWORD);                  return ARGS_WORD;
         }          }
   
         /*          p = &buf[*pos];
          * A non-quoted term progresses until either the end of line or          *v = roff_getarg(mdoc->roff, &p, line, pos);
          * a non-escaped whitespace.          if (v == &v_local)
                   free(*v);
   
           /*
            * After parsing the last word in this phrase,
            * tell lookup() whether or not to interpret it.
          */           */
   
         for ( ; buf[*pos]; (*pos)++)          if (*p == '\0' && mdoc->flags & MDOC_PHRASEQL) {
                 if (*pos && ' ' == buf[*pos] && '\\' != buf[*pos - 1])                  mdoc->flags &= ~MDOC_PHRASEQL;
                         break;                  mdoc->flags |= MDOC_PHRASEQF;
           }
         if ('\0' == buf[*pos])          return ARGS_ALLOC;
                 return(ARGS_WORD);  
   
         buf[(*pos)++] = '\0';  
   
         while (' ' == buf[*pos])  
                 (*pos)++;  
   
         if ('\0' == buf[*pos] && ! (ARGS_NOWARN & fl))  
                 mdoc_pmsg(m, line, *pos, MANDOCERR_EOLNSPACE);  
   
         return(ARGS_WORD);  
 }  }
   
 /*  /*
  * Check if the string consists only of space-separated closing   * Check if the string consists only of space-separated closing
  * delimiters.  This is a bit of a dance: the first must be a close   * delimiters.  This is a bit of a dance: the first must be a close
  * delimiter, but it may be followed by middle delimiters.  Arbitrary   * delimiter, but it may be followed by middle delimiters.  Arbitrary
  * whitespace may separate these tokens.   * whitespace may separate these tokens.
  */   */
 static int  static int
 args_checkpunct(const char *p)  args_checkpunct(const char *buf, int i)
 {  {
         int              i, j;          int              j;
         char             buf[DELIMSZ];          char             dbuf[DELIMSZ];
         enum mdelim      d;          enum mdelim      d;
   
         i = 0;  
   
         /* First token must be a close-delimiter. */          /* First token must be a close-delimiter. */
   
         for (j = 0; p[i] && ' ' != p[i] && j < DELIMSZ; j++, i++)          for (j = 0; buf[i] && ' ' != buf[i] && j < DELIMSZ; j++, i++)
                 buf[j] = p[i];                  dbuf[j] = buf[i];
   
         if (DELIMSZ == j)          if (DELIMSZ == j)
                 return(0);                  return 0;
   
         buf[j] = '\0';          dbuf[j] = '\0';
         if (DELIM_CLOSE != mandoc_isdelim(buf))          if (DELIM_CLOSE != mdoc_isdelim(dbuf))
                 return(0);                  return 0;
   
         while (' ' == p[i])          while (' ' == buf[i])
                 i++;                  i++;
   
         /* Remaining must NOT be open/none. */          /* Remaining must NOT be open/none. */
   
         while (p[i]) {          while (buf[i]) {
                 j = 0;                  j = 0;
                 while (p[i] && ' ' != p[i] && j < DELIMSZ)                  while (buf[i] && ' ' != buf[i] && j < DELIMSZ)
                         buf[j++] = p[i++];                          dbuf[j++] = buf[i++];
   
                 if (DELIMSZ == j)                  if (DELIMSZ == j)
                         return(0);                          return 0;
   
                 buf[j] = '\0';                  dbuf[j] = '\0';
                 d = mandoc_isdelim(buf);                  d = mdoc_isdelim(dbuf);
                 if (DELIM_NONE == d || DELIM_OPEN == d)                  if (DELIM_NONE == d || DELIM_OPEN == d)
                         return(0);                          return 0;
   
                 while (' ' == p[i])                  while (' ' == buf[i])
                         i++;                          i++;
         }          }
   
         return('\0' == p[i]);          return '\0' == buf[i];
 }  }
   
 /*  static void
  * Match up an argument string (e.g., `-foo bar' having "foo") with the  argv_multi(struct roff_man *mdoc, int line,
  * correrct identifier.  It must apply to the given macro.  If none was  
  * found (including bad matches), return MDOC_ARG_MAX.  
  */  
 static enum mdocargt  
 argv_a2arg(enum mdoct tok, const char *p)  
 {  
         enum mdocargt    args[MDOC_ARG_MAX];  
         int              i, len;  
   
         len = 0;  
   
         switch (tok) {  
         case (MDOC_An):  
                 args[len++] = MDOC_Split;  
                 args[len++] = MDOC_Nosplit;  
                 break;  
         case (MDOC_Bd):  
                 args[len++] = MDOC_Ragged;  
                 args[len++] = MDOC_Unfilled;  
                 args[len++] = MDOC_Filled;  
                 args[len++] = MDOC_Literal;  
                 args[len++] = MDOC_File;  
                 args[len++] = MDOC_Offset;  
                 args[len++] = MDOC_Compact;  
                 args[len++] = MDOC_Centred;  
                 break;  
         case (MDOC_Bf):  
                 args[len++] = MDOC_Emphasis;  
                 args[len++] = MDOC_Literal;  
                 args[len++] = MDOC_Symbolic;  
                 break;  
         case (MDOC_Bk):  
                 args[len++] = MDOC_Words;  
                 break;  
         case (MDOC_Bl):  
                 args[len++] = MDOC_Bullet;  
                 args[len++] = MDOC_Dash;  
                 args[len++] = MDOC_Hyphen;  
                 args[len++] = MDOC_Item;  
                 args[len++] = MDOC_Enum;  
                 args[len++] = MDOC_Tag;  
                 args[len++] = MDOC_Diag;  
                 args[len++] = MDOC_Hang;  
                 args[len++] = MDOC_Ohang;  
                 args[len++] = MDOC_Inset;  
                 args[len++] = MDOC_Column;  
                 args[len++] = MDOC_Width;  
                 args[len++] = MDOC_Offset;  
                 args[len++] = MDOC_Compact;  
                 args[len++] = MDOC_Nested;  
                 break;  
         case (MDOC_Rv):  
                 /* FALLTHROUGH */  
         case (MDOC_Ex):  
                 args[len++] = MDOC_Std;  
                 break;  
         default:  
                 break;  
         }  
   
         for (i = 0; i < len; i++)  
                 if (0 == strcmp(p, mdoc_argnames[args[i]]))  
                         return(args[i]);  
   
         return(MDOC_ARG_MAX);  
 }  
   
 static int  
 argv_multi(struct mdoc *m, int line,  
                 struct mdoc_argv *v, int *pos, char *buf)                  struct mdoc_argv *v, int *pos, char *buf)
 {  {
         enum margserr    ac;          enum margserr    ac;
         char            *p;          char            *p;
   
         for (v->sz = 0; ; v->sz++) {          for (v->sz = 0; ; v->sz++) {
                 if ('-' == buf[*pos])                  if (buf[*pos] == '-')
                         break;                          break;
                 ac = args(m, line, pos, buf, 0, &p);                  ac = args(mdoc, line, pos, buf, ARGSFL_NONE, &p);
                 if (ARGS_ERROR == ac)                  if (ac == ARGS_EOLN)
                         return(0);  
                 else if (ARGS_EOLN == ac)  
                         break;                          break;
   
                 if (0 == v->sz % MULTI_STEP)                  if (v->sz % MULTI_STEP == 0)
                         v->value = mandoc_realloc(v->value,                          v->value = mandoc_reallocarray(v->value,
                                 (v->sz + MULTI_STEP) * sizeof(char *));                              v->sz + MULTI_STEP, sizeof(char *));
   
                 v->value[(int)v->sz] = mandoc_strdup(p);                  if (ac != ARGS_ALLOC)
                           p = mandoc_strdup(p);
                   v->value[(int)v->sz] = p;
         }          }
   
         return(1);  
 }  }
   
 static int  static void
 argv_opt_single(struct mdoc *m, int line,  argv_single(struct roff_man *mdoc, int line,
                 struct mdoc_argv *v, int *pos, char *buf)                  struct mdoc_argv *v, int *pos, char *buf)
 {  {
         enum margserr    ac;          enum margserr    ac;
         char            *p;          char            *p;
   
         if ('-' == buf[*pos])          ac = args(mdoc, line, pos, buf, ARGSFL_NONE, &p);
                 return(1);          if (ac == ARGS_EOLN)
                   return;
   
         ac = args(m, line, pos, buf, 0, &p);          if (ac != ARGS_ALLOC)
         if (ARGS_ERROR == ac)                  p = mandoc_strdup(p);
                 return(0);  
         if (ARGS_EOLN == ac)  
                 return(1);  
   
         v->sz = 1;          v->sz = 1;
         v->value = mandoc_malloc(sizeof(char *));          v->value = mandoc_malloc(sizeof(char *));
         v->value[0] = mandoc_strdup(p);          v->value[0] = p;
   
         return(1);  
 }  
   
 /*  
  * Parse a single, mandatory value from the stream.  
  */  
 static int  
 argv_single(struct mdoc *m, int line,  
                 struct mdoc_argv *v, int *pos, char *buf)  
 {  
         int              ppos;  
         enum margserr    ac;  
         char            *p;  
   
         ppos = *pos;  
   
         ac = args(m, line, pos, buf, 0, &p);  
         if (ARGS_EOLN == ac) {  
                 mdoc_pmsg(m, line, ppos, MANDOCERR_SYNTARGVCOUNT);  
                 return(0);  
         } else if (ARGS_ERROR == ac)  
                 return(0);  
   
         v->sz = 1;  
         v->value = mandoc_malloc(sizeof(char *));  
         v->value[0] = mandoc_strdup(p);  
   
         return(1);  
 }  
   
 /*  
  * Determine rules for parsing arguments.  Arguments can either accept  
  * no parameters, an optional single parameter, one parameter, or  
  * multiple parameters.  
  */  
 static int  
 argv(struct mdoc *mdoc, int line,  
                 struct mdoc_argv *v, int *pos, char *buf)  
 {  
   
         v->sz = 0;  
         v->value = NULL;  
   
         switch (argvflags[v->arg]) {  
         case (ARGV_SINGLE):  
                 return(argv_single(mdoc, line, v, pos, buf));  
         case (ARGV_MULTI):  
                 return(argv_multi(mdoc, line, v, pos, buf));  
         case (ARGV_OPT_SINGLE):  
                 return(argv_opt_single(mdoc, line, v, pos, buf));  
         case (ARGV_NONE):  
                 break;  
         default:  
                 abort();  
                 /* NOTREACHED */  
         }  
   
         return(1);  
 }  }

Legend:
Removed from v.1.68  
changed lines
  Added in v.1.119

CVSweb