[BACK]Return to roff.c CVS log [TXT][DIR] Up to [cvsweb.bsd.lv] / mandoc

Diff for /mandoc/roff.c between version 1.368 and 1.400

version 1.368, 2019/12/26 19:51:51 version 1.400, 2023/10/24 20:53:12
Line 1 
Line 1 
 /*      $Id$ */  /* $Id$ */
 /*  /*
    * Copyright (c) 2010-2015, 2017-2023 Ingo Schwarze <schwarze@openbsd.org>
  * Copyright (c) 2008-2012, 2014 Kristaps Dzonsons <kristaps@bsd.lv>   * Copyright (c) 2008-2012, 2014 Kristaps Dzonsons <kristaps@bsd.lv>
  * Copyright (c) 2010-2015, 2017-2019 Ingo Schwarze <schwarze@openbsd.org>  
  *   *
  * Permission to use, copy, modify, and distribute this software for any   * Permission to use, copy, modify, and distribute this software for any
  * purpose with or without fee is hereby granted, provided that the above   * purpose with or without fee is hereby granted, provided that the above
Line 14 
Line 14 
  * WHATSOEVER RESULTING FROM LOSS OF USE, DATA OR PROFITS, WHETHER IN AN   * WHATSOEVER RESULTING FROM LOSS OF USE, DATA OR PROFITS, WHETHER IN AN
  * ACTION OF CONTRACT, NEGLIGENCE OR OTHER TORTIOUS ACTION, ARISING OUT OF   * ACTION OF CONTRACT, NEGLIGENCE OR OTHER TORTIOUS ACTION, ARISING OUT OF
  * OR IN CONNECTION WITH THE USE OR PERFORMANCE OF THIS SOFTWARE.   * OR IN CONNECTION WITH THE USE OR PERFORMANCE OF THIS SOFTWARE.
    *
    * Implementation of the roff(7) parser for mandoc(1).
  */   */
 #include "config.h"  #include "config.h"
   
Line 38 
Line 40 
 #include "tbl_parse.h"  #include "tbl_parse.h"
 #include "eqn_parse.h"  #include "eqn_parse.h"
   
 /*  
  * ASCII_ESC is used to signal from roff_getarg() to roff_expand()  
  * that an escape sequence resulted from copy-in processing and  
  * needs to be checked or interpolated.  As it is used nowhere  
  * else, it is defined here rather than in a header file.  
  */  
 #define ASCII_ESC       27  
   
 /* Maximum number of string expansions per line, to break infinite loops. */  /* Maximum number of string expansions per line, to break infinite loops. */
 #define EXPAND_LIMIT    1000  #define EXPAND_LIMIT    1000
   
Line 190  static int   roff_cc(ROFF_ARGS);
Line 184  static int   roff_cc(ROFF_ARGS);
 static  int              roff_ccond(struct roff *, int, int);  static  int              roff_ccond(struct roff *, int, int);
 static  int              roff_char(ROFF_ARGS);  static  int              roff_char(ROFF_ARGS);
 static  int              roff_cond(ROFF_ARGS);  static  int              roff_cond(ROFF_ARGS);
   static  int              roff_cond_checkend(ROFF_ARGS);
 static  int              roff_cond_text(ROFF_ARGS);  static  int              roff_cond_text(ROFF_ARGS);
 static  int              roff_cond_sub(ROFF_ARGS);  static  int              roff_cond_sub(ROFF_ARGS);
 static  int              roff_ds(ROFF_ARGS);  static  int              roff_ds(ROFF_ARGS);
 static  int              roff_ec(ROFF_ARGS);  static  int              roff_ec(ROFF_ARGS);
 static  int              roff_eo(ROFF_ARGS);  static  int              roff_eo(ROFF_ARGS);
 static  int              roff_eqndelim(struct roff *, struct buf *, int);  static  int              roff_eqndelim(struct roff *, struct buf *, int);
 static  int              roff_evalcond(struct roff *r, int, char *, int *);  static  int              roff_evalcond(struct roff *, int, char *, int *);
 static  int              roff_evalnum(struct roff *, int,  static  int              roff_evalnum(struct roff *, int,
                                 const char *, int *, int *, int);                                  const char *, int *, int *, int);
 static  int              roff_evalpar(struct roff *, int,  static  int              roff_evalpar(struct roff *, int,
Line 204  static int   roff_evalpar(struct roff *, int,
Line 199  static int   roff_evalpar(struct roff *, int,
 static  int              roff_evalstrcond(const char *, int *);  static  int              roff_evalstrcond(const char *, int *);
 static  int              roff_expand(struct roff *, struct buf *,  static  int              roff_expand(struct roff *, struct buf *,
                                 int, int, char);                                  int, int, char);
   static  void             roff_expand_patch(struct buf *, int,
                                   const char *, int);
 static  void             roff_free1(struct roff *);  static  void             roff_free1(struct roff *);
 static  void             roff_freereg(struct roffreg *);  static  void             roff_freereg(struct roffreg *);
 static  void             roff_freestr(struct roffkv *);  static  void             roff_freestr(struct roffkv *);
Line 224  static int   roff_line_ignore(ROFF_ARGS);
Line 221  static int   roff_line_ignore(ROFF_ARGS);
 static  void             roff_man_alloc1(struct roff_man *);  static  void             roff_man_alloc1(struct roff_man *);
 static  void             roff_man_free1(struct roff_man *);  static  void             roff_man_free1(struct roff_man *);
 static  int              roff_manyarg(ROFF_ARGS);  static  int              roff_manyarg(ROFF_ARGS);
   static  int              roff_mc(ROFF_ARGS);
 static  int              roff_noarg(ROFF_ARGS);  static  int              roff_noarg(ROFF_ARGS);
 static  int              roff_nop(ROFF_ARGS);  static  int              roff_nop(ROFF_ARGS);
 static  int              roff_nr(ROFF_ARGS);  static  int              roff_nr(ROFF_ARGS);
 static  int              roff_onearg(ROFF_ARGS);  static  int              roff_onearg(ROFF_ARGS);
 static  enum roff_tok    roff_parse(struct roff *, char *, int *,  static  enum roff_tok    roff_parse(struct roff *, char *, int *,
                                 int, int);                                  int, int);
   static  int              roff_parse_comment(struct roff *, struct buf *,
                                   int, int, char);
 static  int              roff_parsetext(struct roff *, struct buf *,  static  int              roff_parsetext(struct roff *, struct buf *,
                                 int, int *);                                  int, int *);
 static  int              roff_renamed(ROFF_ARGS);  static  int              roff_renamed(ROFF_ARGS);
   static  int              roff_req_or_macro(ROFF_ARGS);
 static  int              roff_return(ROFF_ARGS);  static  int              roff_return(ROFF_ARGS);
 static  int              roff_rm(ROFF_ARGS);  static  int              roff_rm(ROFF_ARGS);
 static  int              roff_rn(ROFF_ARGS);  static  int              roff_rn(ROFF_ARGS);
Line 355  const char *__roff_name[MAN_MAX + 1] = {
Line 356  const char *__roff_name[MAN_MAX + 1] = {
         "Lk",           "Mt",           "Brq",          "Bro",          "Lk",           "Mt",           "Brq",          "Bro",
         "Brc",          "%C",           "Es",           "En",          "Brc",          "%C",           "Es",           "En",
         "Dx",           "%Q",           "%U",           "Ta",          "Dx",           "%Q",           "%U",           "Ta",
         NULL,          "Tg",           NULL,
         "TH",           "SH",           "SS",           "TP",          "TH",           "SH",           "SS",           "TP",
         "TQ",          "TQ",
         "LP",           "PP",           "P",            "IP",          "LP",           "PP",           "P",            "IP",
Line 366  const char *__roff_name[MAN_MAX + 1] = {
Line 367  const char *__roff_name[MAN_MAX + 1] = {
         "PD",           "AT",           "in",          "PD",           "AT",           "in",
         "SY",           "YS",           "OP",          "SY",           "YS",           "OP",
         "EX",           "EE",           "UR",          "EX",           "EE",           "UR",
         "UE",           "MT",           "ME",           NULL          "UE",           "MT",           "ME",           "MR",
           NULL
 };  };
 const   char *const *roff_name = __roff_name;  const   char *const *roff_name = __roff_name;
   
Line 376  static struct roffmac  roffs[TOKEN_NONE] = {
Line 378  static struct roffmac  roffs[TOKEN_NONE] = {
         { roff_noarg, NULL, NULL, 0 },  /* fi */          { roff_noarg, NULL, NULL, 0 },  /* fi */
         { roff_onearg, NULL, NULL, 0 },  /* ft */          { roff_onearg, NULL, NULL, 0 },  /* ft */
         { roff_onearg, NULL, NULL, 0 },  /* ll */          { roff_onearg, NULL, NULL, 0 },  /* ll */
         { roff_onearg, NULL, NULL, 0 },  /* mc */          { roff_mc, NULL, NULL, 0 },  /* mc */
         { roff_noarg, NULL, NULL, 0 },  /* nf */          { roff_noarg, NULL, NULL, 0 },  /* nf */
         { roff_onearg, NULL, NULL, 0 },  /* po */          { roff_onearg, NULL, NULL, 0 },  /* po */
         { roff_onearg, NULL, NULL, 0 },  /* rj */          { roff_onearg, NULL, NULL, 0 },  /* rj */
Line 858  void
Line 860  void
 roff_man_free(struct roff_man *man)  roff_man_free(struct roff_man *man)
 {  {
         roff_man_free1(man);          roff_man_free1(man);
           free(man->os_r);
         free(man);          free(man);
 }  }
   
Line 1101  roff_node_free(struct roff_node *n)
Line 1104  roff_node_free(struct roff_node *n)
                 free(n->norm);                  free(n->norm);
         eqn_box_free(n->eqn);          eqn_box_free(n->eqn);
         free(n->string);          free(n->string);
           free(n->tag);
         free(n);          free(n);
 }  }
   
Line 1114  roff_node_delete(struct roff_man *man, struct roff_nod
Line 1118  roff_node_delete(struct roff_man *man, struct roff_nod
         roff_node_free(n);          roff_node_free(n);
 }  }
   
   int
   roff_node_transparent(struct roff_node *n)
   {
           if (n == NULL)
                   return 0;
           if (n->type == ROFFT_COMMENT || n->flags & NODE_NOPRT)
                   return 1;
           return roff_tok_transparent(n->tok);
   }
   
   int
   roff_tok_transparent(enum roff_tok tok)
   {
           switch (tok) {
           case ROFF_ft:
           case ROFF_ll:
           case ROFF_mc:
           case ROFF_po:
           case ROFF_ta:
           case MDOC_Db:
           case MDOC_Es:
           case MDOC_Sm:
           case MDOC_Tg:
           case MAN_DT:
           case MAN_UC:
           case MAN_PD:
           case MAN_AT:
                   return 1;
           default:
                   return 0;
           }
   }
   
   struct roff_node *
   roff_node_child(struct roff_node *n)
   {
           for (n = n->child; roff_node_transparent(n); n = n->next)
                   continue;
           return n;
   }
   
   struct roff_node *
   roff_node_prev(struct roff_node *n)
   {
           do {
                   n = n->prev;
           } while (roff_node_transparent(n));
           return n;
   }
   
   struct roff_node *
   roff_node_next(struct roff_node *n)
   {
           do {
                   n = n->next;
           } while (roff_node_transparent(n));
           return n;
   }
   
 void  void
 deroff(char **dest, const struct roff_node *n)  deroff(char **dest, const struct roff_node *n)
 {  {
         char    *cp;          char    *cp;
         size_t   sz;          size_t   sz;
   
         if (n->type != ROFFT_TEXT) {          if (n->string == NULL) {
                 for (n = n->child; n != NULL; n = n->next)                  for (n = n->child; n != NULL; n = n->next)
                         deroff(dest, n);                          deroff(dest, n);
                 return;                  return;
Line 1166  deroff(char **dest, const struct roff_node *n)
Line 1229  deroff(char **dest, const struct roff_node *n)
 /* --- main functions of the roff parser ---------------------------------- */  /* --- main functions of the roff parser ---------------------------------- */
   
 /*  /*
  * In the current line, expand escape sequences that produce parsable   * Save comments preceding the title macro, for example in order to
  * input text.  Also check the syntax of the remaining escape sequences,   * preserve Copyright and license headers in HTML output,
  * which typically produce output glyphs or change formatter state.   * provide diagnostics about RCS ids and trailing whitespace in comments,
    * then discard comments including preceding whitespace.
    * This function also handles input line continuation.
  */   */
 static int  static int
 roff_expand(struct roff *r, struct buf *buf, int ln, int pos, char newesc)  roff_parse_comment(struct roff *r, struct buf *buf, int ln, int pos, char ec)
 {  {
         struct mctx     *ctx;   /* current macro call context */  
         char             ubuf[24]; /* buffer to print the number */  
         struct roff_node *n;    /* used for header comments */          struct roff_node *n;    /* used for header comments */
         const char      *start; /* start of the string to process */          const char      *start; /* start of the string to process */
           const char      *cp;    /* for RCS id parsing */
         char            *stesc; /* start of an escape sequence ('\\') */          char            *stesc; /* start of an escape sequence ('\\') */
         const char      *esct;  /* type of esccape sequence */  
         char            *ep;    /* end of comment string */          char            *ep;    /* end of comment string */
         const char      *stnam; /* start of the name, after "[(*" */  
         const char      *cp;    /* end of the name, e.g. before ']' */  
         const char      *res;   /* the string to be substituted */  
         char            *nbuf;  /* new buffer to copy buf->buf to */  
         size_t           maxl;  /* expected length of the escape name */  
         size_t           naml;  /* actual length of the escape name */  
         size_t           asz;   /* length of the replacement */  
         size_t           rsz;   /* length of the rest of the string */  
         int              inaml; /* length returned from mandoc_escape() */  
         int              expand_count;  /* to avoid infinite loops */  
         int              npos;  /* position in numeric expression */  
         int              arg_complete; /* argument not interrupted by eol */  
         int              quote_args; /* true for \\$@, false for \\$* */  
         int              done;  /* no more input available */  
         int              deftype; /* type of definition to paste */  
         int              rcsid; /* kind of RCS id seen */          int              rcsid; /* kind of RCS id seen */
         enum mandocerr   err;   /* for escape sequence problems */  
         char             sign;  /* increment number register */  
         char             term;  /* character terminating the escape */  
   
         /* Search forward for comments. */          for (start = stesc = buf->buf + pos;; stesc++) {
                   /*
         done = 0;                   * XXX Ugly hack: Remove the newline character that
         start = buf->buf + pos;                   * mparse_buf_r() appended to mark the end of input
         for (stesc = buf->buf + pos; *stesc != '\0'; stesc++) {                   * if it is not preceded by an escape character.
                 if (stesc[0] != newesc || stesc[1] == '\0')                   */
                         continue;                  if (stesc[0] == '\n') {
                 stesc++;                          assert(stesc[1] == '\0');
                 if (*stesc != '"' && *stesc != '#')                          stesc[0] = '\0';
                         continue;  
   
                 /* Comment found, look for RCS id. */  
   
                 rcsid = 0;  
                 if ((cp = strstr(stesc, "$" "OpenBSD")) != NULL) {  
                         rcsid = 1 << MANDOC_OS_OPENBSD;  
                         cp += 8;  
                 } else if ((cp = strstr(stesc, "$" "NetBSD")) != NULL) {  
                         rcsid = 1 << MANDOC_OS_NETBSD;  
                         cp += 7;  
                 }                  }
                 if (cp != NULL &&  
                     isalnum((unsigned char)*cp) == 0 &&  
                     strchr(cp, '$') != NULL) {  
                         if (r->man->meta.rcsids & rcsid)  
                                 mandoc_msg(MANDOCERR_RCS_REP, ln,  
                                     (int)(stesc - buf->buf) + 1,  
                                     "%s", stesc + 1);  
                         r->man->meta.rcsids |= rcsid;  
                 }  
   
                 /* Handle trailing whitespace. */                  /* The line ends without continuation or comment. */
                   if (stesc[0] == '\0')
                           return ROFF_CONT;
   
                 ep = strchr(stesc--, '\0') - 1;                  /* Unescaped byte: skip it. */
                 if (*ep == '\n') {                  if (stesc[0] != ec)
                         done = 1;                          continue;
                         ep--;  
                 }  
                 if (*ep == ' ' || *ep == '\t')  
                         mandoc_msg(MANDOCERR_SPACE_EOL,  
                             ln, (int)(ep - buf->buf), NULL);  
   
                 /*                  /*
                  * Save comments preceding the title macro                   * XXX Ugly hack: Do not attempt to append another line
                  * in the syntax tree.                   * if the function mparse_buf_r() appended a newline
                    * character to indicate the end of input.
                  */                   */
                   if (stesc[1] == '\n') {
                 if (newesc != ASCII_ESC && r->options & MPARSE_COMMENT) {                          assert(stesc[2] == '\0');
                         while (*ep == ' ' || *ep == '\t')                          stesc[0] = '\0';
                                 ep--;                          return ROFF_CONT;
                         ep[1] = '\0';  
                         n = roff_node_alloc(r->man,  
                             ln, stesc + 1 - buf->buf,  
                             ROFFT_COMMENT, TOKEN_NONE);  
                         n->string = mandoc_strdup(stesc + 2);  
                         roff_node_append(r->man, n);  
                         n->flags |= NODE_VALID | NODE_ENDED;  
                         r->man->next = ROFF_NEXT_SIBLING;  
                 }                  }
   
                 /* Line continuation with comment. */                  /*
                    * An escape character at the end of an input line
                 if (stesc[1] == '#') {                   * requests line continuation.
                         *stesc = '\0';                   */
                   if (stesc[1] == '\0') {
                           stesc[0] = '\0';
                         return ROFF_IGN | ROFF_APPEND;                          return ROFF_IGN | ROFF_APPEND;
                 }                  }
   
                 /* Discard normal comments. */                  /* Found a comment: process it. */
                   if (stesc[1] == '"' || stesc[1] == '#')
                           break;
   
                 while (stesc > start && stesc[-1] == ' ' &&                  /* Escaped escape character: skip them both. */
                     (stesc == start + 1 || stesc[-2] != '\\'))                  if (stesc[1] == ec)
                         stesc--;                          stesc++;
                 *stesc = '\0';  
                 break;  
         }          }
         if (stesc == start)  
                 return ROFF_CONT;  
         stesc--;  
   
         /* Notice the end of the input. */          /* Look for an RCS id in the comment. */
   
         if (*stesc == '\n') {          rcsid = 0;
                 *stesc-- = '\0';          if ((cp = strstr(stesc + 2, "$" "OpenBSD")) != NULL) {
                 done = 1;                  rcsid = 1 << MANDOC_OS_OPENBSD;
                   cp += 8;
           } else if ((cp = strstr(stesc + 2, "$" "NetBSD")) != NULL) {
                   rcsid = 1 << MANDOC_OS_NETBSD;
                   cp += 7;
         }          }
           if (cp != NULL && isalnum((unsigned char)*cp) == 0 &&
               strchr(cp, '$') != NULL) {
                   if (r->man->meta.rcsids & rcsid)
                           mandoc_msg(MANDOCERR_RCS_REP, ln,
                               (int)(stesc - buf->buf) + 2, "%s", stesc + 1);
                   r->man->meta.rcsids |= rcsid;
           }
   
         expand_count = 0;          /* Warn about trailing whitespace at the end of the comment. */
         while (stesc >= start) {  
                 if (*stesc != newesc) {  
   
                         /*          ep = strchr(stesc + 2, '\0') - 1;
                          * If we have a non-standard escape character,          if (*ep == '\n')
                          * escape literal backslashes because all                  *ep-- = '\0';
                          * processing in subsequent functions uses          if (*ep == ' ' || *ep == '\t')
                          * the standard escaping rules.                  mandoc_msg(MANDOCERR_SPACE_EOL,
                          */                      ln, (int)(ep - buf->buf), NULL);
   
                         if (newesc != ASCII_ESC && *stesc == '\\') {          /* Save comments preceding the title macro in the syntax tree. */
                                 *stesc = '\0';  
                                 buf->sz = mandoc_asprintf(&nbuf, "%s\\e%s",  
                                     buf->buf, stesc + 1) + 1;  
                                 start = nbuf + pos;  
                                 stesc = nbuf + (stesc - buf->buf);  
                                 free(buf->buf);  
                                 buf->buf = nbuf;  
                         }  
   
                         /* Search backwards for the next escape. */          if (r->options & MPARSE_COMMENT) {
                   while (*ep == ' ' || *ep == '\t')
                           ep--;
                   ep[1] = '\0';
                   n = roff_node_alloc(r->man, ln, stesc + 1 - buf->buf,
                       ROFFT_COMMENT, TOKEN_NONE);
                   n->string = mandoc_strdup(stesc + 2);
                   roff_node_append(r->man, n);
                   n->flags |= NODE_VALID | NODE_ENDED;
                   r->man->next = ROFF_NEXT_SIBLING;
           }
   
                         stesc--;          /* The comment requests line continuation. */
                         continue;  
                 }  
   
                 /* If it is escaped, skip it. */          if (stesc[1] == '#') {
                   *stesc = '\0';
                   return ROFF_IGN | ROFF_APPEND;
           }
   
                 for (cp = stesc - 1; cp >= start; cp--)          /* Discard the comment including preceding whitespace. */
                         if (*cp != r->escape)  
                                 break;  
   
                 if ((stesc - cp) % 2 == 0) {          while (stesc > start && stesc[-1] == ' ' &&
                         while (stesc > cp)              (stesc == start + 1 || stesc[-2] != '\\'))
                                 *stesc-- = '\\';                  stesc--;
                         continue;          *stesc = '\0';
                 } else if (stesc[1] != '\0') {          return ROFF_CONT;
                         *stesc = '\\';  }
                 } else {  
                         *stesc-- = '\0';  
                         if (done)  
                                 continue;  
                         else  
                                 return ROFF_IGN | ROFF_APPEND;  
                 }  
   
                 /* Decide whether to expand or to check only. */  /*
    * In the current line, expand escape sequences that produce parsable
    * input text.  Also check the syntax of the remaining escape sequences,
    * which typically produce output glyphs or change formatter state.
    */
   static int
   roff_expand(struct roff *r, struct buf *buf, int ln, int pos, char ec)
   {
           char             ubuf[24];      /* buffer to print a number */
           struct mctx     *ctx;           /* current macro call context */
           const char      *res;           /* the string to be pasted */
           const char      *src;           /* source for copying */
           char            *dst;           /* destination for copying */
           enum mandoc_esc  subtype;       /* return value from roff_escape */
           int              iesc;          /* index of leading escape char */
           int              inam;          /* index of the escape name */
           int              iarg;          /* index beginning the argument */
           int              iendarg;       /* index right after the argument */
           int              iend;          /* index right after the sequence */
           int              isrc, idst;    /* to reduce \\ and \. in names */
           int              deftype;       /* type of definition to paste */
           int              argi;          /* macro argument index */
           int              quote_args;    /* true for \\$@, false for \\$* */
           int              asz;           /* length of the replacement */
           int              rsz;           /* length of the rest of the string */
           int              npos;          /* position in numeric expression */
           int              expand_count;  /* to avoid infinite loops */
   
                 term = '\0';          expand_count = 0;
                 cp = stesc + 1;          while (buf->buf[pos] != '\0') {
                 if (*cp == 'E')  
                         cp++;                  /*
                 esct = cp;                   * Skip plain ASCII characters.
                 switch (*esct) {                   * If we have a non-standard escape character,
                 case '*':                   * escape literal backslashes because all processing in
                 case '$':                   * subsequent functions uses the standard escaping rules.
                         res = NULL;                   */
                         break;  
                 case 'B':                  if (buf->buf[pos] != ec) {
                 case 'w':                          if (buf->buf[pos] == '\\') {
                         term = cp[1];                                  roff_expand_patch(buf, pos, "\\e", pos + 1);
                         /* FALLTHROUGH */                                  pos++;
                 case 'n':  
                         sign = cp[1];  
                         if (sign == '+' || sign == '-')  
                                 cp++;  
                         res = ubuf;  
                         break;  
                 default:  
                         err = MANDOCERR_OK;  
                         switch(mandoc_escape(&cp, &stnam, &inaml)) {  
                         case ESCAPE_SPECIAL:  
                                 if (mchars_spec2cp(stnam, inaml) >= 0)  
                                         break;  
                                 /* FALLTHROUGH */  
                         case ESCAPE_ERROR:  
                                 err = MANDOCERR_ESC_BAD;  
                                 break;  
                         case ESCAPE_UNDEF:  
                                 err = MANDOCERR_ESC_UNDEF;  
                                 break;  
                         case ESCAPE_UNSUPP:  
                                 err = MANDOCERR_ESC_UNSUPP;  
                                 break;  
                         default:  
                                 break;  
                         }                          }
                         if (err != MANDOCERR_OK)                          pos++;
                                 mandoc_msg(err, ln, (int)(stesc - buf->buf),  
                                     "%.*s", (int)(cp - stesc), stesc);  
                         stesc--;  
                         continue;                          continue;
                 }                  }
   
                 if (EXPAND_LIMIT < ++expand_count) {  
                         mandoc_msg(MANDOCERR_ROFFLOOP,  
                             ln, (int)(stesc - buf->buf), NULL);  
                         return ROFF_IGN;  
                 }  
   
                 /*                  /*
                  * The third character decides the length                   * Parse escape sequences,
                  * of the name of the string or register.                   * issue diagnostic messages when appropriate,
                  * Save a pointer to the name.                   * and skip sequences that do not need expansion.
                    * If we have a non-standard escape character, translate
                    * it to backslashes and translate backslashes to \e.
                  */                   */
   
                 if (term == '\0') {                  if (roff_escape(buf->buf, ln, pos, &iesc, &inam,
                         switch (*++cp) {                      &iarg, &iendarg, &iend) != ESCAPE_EXPAND) {
                         case '\0':                          while (pos < iend) {
                                 maxl = 0;                                  if (buf->buf[pos] == ec) {
                                 break;                                          buf->buf[pos] = '\\';
                         case '(':                                          if (pos + 1 < iend)
                                 cp++;                                                  pos++;
                                 maxl = 2;                                  } else if (buf->buf[pos] == '\\') {
                                 break;                                          roff_expand_patch(buf,
                         case '[':                                              pos, "\\e", pos + 1);
                                 cp++;                                          pos++;
                                 term = ']';                                          iend++;
                                 maxl = 0;                                  }
                                 break;                                  pos++;
                         default:  
                                 maxl = 1;  
                                 break;  
                         }                          }
                 } else {                          continue;
                         cp += 2;  
                         maxl = 0;  
                 }                  }
                 stnam = cp;  
   
                 /* Advance to the end of the name. */                  /* Reduce \\ and \. in names. */
   
                 naml = 0;                  if (buf->buf[inam] == '*' || buf->buf[inam] == 'n') {
                 arg_complete = 1;                          isrc = idst = iarg;
                 while (maxl == 0 || naml < maxl) {                          while (isrc < iendarg) {
                         if (*cp == '\0') {                                  if (isrc + 1 < iendarg &&
                                 mandoc_msg(MANDOCERR_ESC_BAD, ln,                                      buf->buf[isrc] == '\\' &&
                                     (int)(stesc - buf->buf), "%s", stesc);                                      (buf->buf[isrc + 1] == '\\' ||
                                 arg_complete = 0;                                       buf->buf[isrc + 1] == '.'))
                                 break;                                          isrc++;
                                   buf->buf[idst++] = buf->buf[isrc++];
                         }                          }
                         if (maxl == 0 && *cp == term) {                          iendarg -= isrc - idst;
                                 cp++;  
                                 break;  
                         }  
                         if (*cp++ != '\\' || *esct != 'w') {  
                                 naml++;  
                                 continue;  
                         }  
                         switch (mandoc_escape(&cp, NULL, NULL)) {  
                         case ESCAPE_SPECIAL:  
                         case ESCAPE_UNICODE:  
                         case ESCAPE_NUMBERED:  
                         case ESCAPE_UNDEF:  
                         case ESCAPE_OVERSTRIKE:  
                                 naml++;  
                                 break;  
                         default:  
                                 break;  
                         }  
                 }                  }
   
                 /*                  /* Handle expansion. */
                  * Retrieve the replacement string; if it is  
                  * undefined, resume searching for escapes.  
                  */  
   
                 switch (*esct) {                  res = NULL;
                   switch (buf->buf[inam]) {
                 case '*':                  case '*':
                         if (arg_complete) {                          if (iendarg == iarg)
                                 deftype = ROFFDEF_USER | ROFFDEF_PRE;                                  break;
                                 res = roff_getstrn(r, stnam, naml, &deftype);                          deftype = ROFFDEF_USER | ROFFDEF_PRE;
                           if ((res = roff_getstrn(r, buf->buf + iarg,
                               iendarg - iarg, &deftype)) != NULL)
                                   break;
   
                                 /*                          /*
                                  * If not overriden, let \*(.T                           * If not overridden,
                                  * through to the formatters.                           * let \*(.T through to the formatters.
                                  */                           */
   
                                 if (res == NULL && naml == 2 &&                          if (iendarg - iarg == 2 &&
                                     stnam[0] == '.' && stnam[1] == 'T') {                              buf->buf[iarg] == '.' &&
                                         roff_setstrn(&r->strtab,                              buf->buf[iarg + 1] == 'T') {
                                             ".T", 2, NULL, 0, 0);                                  roff_setstrn(&r->strtab, ".T", 2, NULL, 0, 0);
                                         stesc--;                                  pos = iend;
                                         continue;                                  continue;
                                 }  
                         }                          }
   
                           mandoc_msg(MANDOCERR_STR_UNDEF, ln, iesc,
                               "%.*s", iendarg - iarg, buf->buf + iarg);
                         break;                          break;
   
                 case '$':                  case '$':
                         if (r->mstackpos < 0) {                          if (r->mstackpos < 0) {
                                 mandoc_msg(MANDOCERR_ARG_UNDEF, ln,                                  mandoc_msg(MANDOCERR_ARG_UNDEF, ln, iesc,
                                     (int)(stesc - buf->buf), "%.3s", stesc);                                      "%.*s", iend - iesc, buf->buf + iesc);
                                 break;                                  break;
                         }                          }
                         ctx = r->mstack + r->mstackpos;                          ctx = r->mstack + r->mstackpos;
                         npos = esct[1] - '1';                          argi = buf->buf[iarg] - '1';
                         if (npos >= 0 && npos <= 8) {                          if (argi >= 0 && argi <= 8) {
                                 res = npos < ctx->argc ?                                  if (argi < ctx->argc)
                                     ctx->argv[npos] : "";                                          res = ctx->argv[argi];
                                 break;                                  break;
                         }                          }
                         if (esct[1] == '*')                          if (buf->buf[iarg] == '*')
                                 quote_args = 0;                                  quote_args = 0;
                         else if (esct[1] == '@')                          else if (buf->buf[iarg] == '@')
                                 quote_args = 1;                                  quote_args = 1;
                         else {                          else {
                                 mandoc_msg(MANDOCERR_ARG_NONUM, ln,                                  mandoc_msg(MANDOCERR_ARG_NONUM, ln, iesc,
                                     (int)(stesc - buf->buf), "%.3s", stesc);                                      "%.*s", iend - iesc, buf->buf + iesc);
                                 break;                                  break;
                         }                          }
                         asz = 0;                          asz = 0;
                         for (npos = 0; npos < ctx->argc; npos++) {                          for (argi = 0; argi < ctx->argc; argi++) {
                                 if (npos)                                  if (argi)
                                         asz++;  /* blank */                                          asz++;  /* blank */
                                 if (quote_args)                                  if (quote_args)
                                         asz += 2;  /* quotes */                                          asz += 2;  /* quotes */
                                 asz += strlen(ctx->argv[npos]);                                  asz += strlen(ctx->argv[argi]);
                         }                          }
                         if (asz != 3) {                          if (asz != iend - iesc) {
                                 rsz = buf->sz - (stesc - buf->buf) - 3;                                  rsz = buf->sz - iend;
                                 if (asz < 3)                                  if (asz < iend - iesc)
                                         memmove(stesc + asz, stesc + 3, rsz);                                          memmove(buf->buf + iesc + asz,
                                 buf->sz += asz - 3;                                              buf->buf + iend, rsz);
                                 nbuf = mandoc_realloc(buf->buf, buf->sz);                                  buf->sz = iesc + asz + rsz;
                                 start = nbuf + pos;                                  buf->buf = mandoc_realloc(buf->buf, buf->sz);
                                 stesc = nbuf + (stesc - buf->buf);                                  if (asz > iend - iesc)
                                 buf->buf = nbuf;                                          memmove(buf->buf + iesc + asz,
                                 if (asz > 3)                                              buf->buf + iend, rsz);
                                         memmove(stesc + asz, stesc + 3, rsz);  
                         }                          }
                         for (npos = 0; npos < ctx->argc; npos++) {                          dst = buf->buf + iesc;
                                 if (npos)                          for (argi = 0; argi < ctx->argc; argi++) {
                                         *stesc++ = ' ';                                  if (argi)
                                           *dst++ = ' ';
                                 if (quote_args)                                  if (quote_args)
                                         *stesc++ = '"';                                          *dst++ = '"';
                                 cp = ctx->argv[npos];                                  src = ctx->argv[argi];
                                 while (*cp != '\0')                                  while (*src != '\0')
                                         *stesc++ = *cp++;                                          *dst++ = *src++;
                                 if (quote_args)                                  if (quote_args)
                                         *stesc++ = '"';                                          *dst++ = '"';
                         }                          }
                         continue;                          continue;
                   case 'A':
                           ubuf[0] = iendarg > iarg ? '1' : '0';
                           ubuf[1] = '\0';
                           res = ubuf;
                           break;
                 case 'B':                  case 'B':
                         npos = 0;                          npos = 0;
                         ubuf[0] = arg_complete &&                          ubuf[0] = iendarg > iarg && iend > iendarg &&
                             roff_evalnum(r, ln, stnam, &npos,                              roff_evalnum(r, ln, buf->buf + iarg, &npos,
                               NULL, ROFFNUM_SCALE) &&                                           NULL, ROFFNUM_SCALE) &&
                             stnam + npos + 1 == cp ? '1' : '0';                              npos == iendarg - iarg ? '1' : '0';
                         ubuf[1] = '\0';                          ubuf[1] = '\0';
                           res = ubuf;
                         break;                          break;
                   case 'V':
                           mandoc_msg(MANDOCERR_UNSUPP, ln, iesc,
                               "%.*s", iend - iesc, buf->buf + iesc);
                           roff_expand_patch(buf, iendarg, "}", iend);
                           roff_expand_patch(buf, iesc, "${", iarg);
                           continue;
                   case 'g':
                           break;
                 case 'n':                  case 'n':
                         if (arg_complete)                          if (iendarg > iarg)
                                 (void)snprintf(ubuf, sizeof(ubuf), "%d",                                  (void)snprintf(ubuf, sizeof(ubuf), "%d",
                                     roff_getregn(r, stnam, naml, sign));                                      roff_getregn(r, buf->buf + iarg,
                                       iendarg - iarg, buf->buf[inam + 1]));
                         else                          else
                                 ubuf[0] = '\0';                                  ubuf[0] = '\0';
                           res = ubuf;
                         break;                          break;
                 case 'w':                  case 'w':
                         /* use even incomplete args */                          rsz = 0;
                         (void)snprintf(ubuf, sizeof(ubuf), "%d",                          subtype = ESCAPE_UNDEF;
                             24 * (int)naml);                          while (iarg < iendarg) {
                                   asz = subtype == ESCAPE_SKIPCHAR ? 0 : 1;
                                   if (buf->buf[iarg] != '\\') {
                                           rsz += asz;
                                           iarg++;
                                           continue;
                                   }
                                   switch ((subtype = roff_escape(buf->buf, 0,
                                       iarg, NULL, NULL, NULL, NULL, &iarg))) {
                                   case ESCAPE_SPECIAL:
                                   case ESCAPE_NUMBERED:
                                   case ESCAPE_UNICODE:
                                   case ESCAPE_OVERSTRIKE:
                                   case ESCAPE_UNDEF:
                                           break;
                                   case ESCAPE_DEVICE:
                                           asz *= 8;
                                           break;
                                   case ESCAPE_EXPAND:
                                           abort();
                                   default:
                                           continue;
                                   }
                                   rsz += asz;
                           }
                           (void)snprintf(ubuf, sizeof(ubuf), "%d", rsz * 24);
                           res = ubuf;
                         break;                          break;
                   default:
                           break;
                 }                  }
                   if (res == NULL)
                 if (res == NULL) {  
                         if (*esct == '*')  
                                 mandoc_msg(MANDOCERR_STR_UNDEF,  
                                     ln, (int)(stesc - buf->buf),  
                                     "%.*s", (int)naml, stnam);  
                         res = "";                          res = "";
                 } else if (buf->sz + strlen(res) > SHRT_MAX) {                  if (++expand_count > EXPAND_LIMIT ||
                         mandoc_msg(MANDOCERR_ROFFLOOP,                      buf->sz + strlen(res) > SHRT_MAX) {
                             ln, (int)(stesc - buf->buf), NULL);                          mandoc_msg(MANDOCERR_ROFFLOOP, ln, iesc, NULL);
                         return ROFF_IGN;                          return ROFF_IGN;
                 }                  }
                   roff_expand_patch(buf, iesc, res, iend);
                 /* Replace the escape sequence by the string. */  
   
                 *stesc = '\0';  
                 buf->sz = mandoc_asprintf(&nbuf, "%s%s%s",  
                     buf->buf, res, cp) + 1;  
   
                 /* Prepare for the next replacement. */  
   
                 start = nbuf + pos;  
                 stesc = nbuf + (stesc - buf->buf) + strlen(res);  
                 free(buf->buf);  
                 buf->buf = nbuf;  
         }          }
         return ROFF_CONT;          return ROFF_CONT;
 }  }
   
 /*  /*
    * Replace the substring from the start position (inclusive)
    * to end position (exclusive) with the repl(acement) string.
    */
   static void
   roff_expand_patch(struct buf *buf, int start, const char *repl, int end)
   {
           char    *nbuf;
   
           buf->sz = mandoc_asprintf(&nbuf, "%.*s%s%s", start, buf->buf,
               repl, buf->buf + end) + 1;
           free(buf->buf);
           buf->buf = nbuf;
   }
   
   /*
  * Parse a quoted or unquoted roff-style request or macro argument.   * Parse a quoted or unquoted roff-style request or macro argument.
  * Return a pointer to the parsed argument, which is either the original   * Return a pointer to the parsed argument, which is either the original
  * pointer or advanced by one byte in case the argument is quoted.   * pointer or advanced by one byte in case the argument is quoted.
Line 1625  roff_getarg(struct roff *r, char **cpp, int ln, int *p
Line 1660  roff_getarg(struct roff *r, char **cpp, int ln, int *p
                                 cp++;                                  cp++;
                                 break;                                  break;
                         case '\\':                          case '\\':
                                   cp[-pairs] = '\\';
                                 newesc = 1;                                  newesc = 1;
                                 cp[-pairs] = ASCII_ESC;  
                                 pairs++;                                  pairs++;
                                 cp++;                                  cp++;
                                 break;                                  break;
Line 1682  roff_getarg(struct roff *r, char **cpp, int ln, int *p
Line 1717  roff_getarg(struct roff *r, char **cpp, int ln, int *p
         buf.buf = start;          buf.buf = start;
         buf.sz = strlen(start) + 1;          buf.sz = strlen(start) + 1;
         buf.next = NULL;          buf.next = NULL;
         if (roff_expand(r, &buf, ln, 0, ASCII_ESC) & ROFF_IGN) {          if (roff_expand(r, &buf, ln, 0, '\\') == ROFF_IGN) {
                 free(buf.buf);                  free(buf.buf);
                 buf.buf = mandoc_strdup("");                  buf.buf = mandoc_strdup("");
         }          }
Line 1760  roff_parsetext(struct roff *r, struct buf *buf, int po
Line 1795  roff_parsetext(struct roff *r, struct buf *buf, int po
 }  }
   
 int  int
 roff_parseln(struct roff *r, int ln, struct buf *buf, int *offs)  roff_parseln(struct roff *r, int ln, struct buf *buf, int *offs, size_t len)
 {  {
         enum roff_tok    t;          enum roff_tok    t;
         int              e;          int              e;
Line 1771  roff_parseln(struct roff *r, int ln, struct buf *buf, 
Line 1806  roff_parseln(struct roff *r, int ln, struct buf *buf, 
   
         ppos = pos = *offs;          ppos = pos = *offs;
   
           if (len > 80 && r->tbl == NULL && r->eqn == NULL &&
               (r->man->flags & ROFF_NOFILL) == 0 &&
               strchr(" .\\", buf->buf[pos]) == NULL &&
               buf->buf[pos] != r->control &&
               strcspn(buf->buf, " ") < 80)
                   mandoc_msg(MANDOCERR_TEXT_LONG, ln, (int)len - 1,
                       "%.20s...", buf->buf + pos);
   
         /* Handle in-line equation delimiters. */          /* Handle in-line equation delimiters. */
   
         if (r->tbl == NULL &&          if (r->tbl == NULL &&
Line 1782  roff_parseln(struct roff *r, int ln, struct buf *buf, 
Line 1825  roff_parseln(struct roff *r, int ln, struct buf *buf, 
                 assert(e == ROFF_CONT);                  assert(e == ROFF_CONT);
         }          }
   
         /* Expand some escape sequences. */          /* Handle comments and escape sequences. */
   
           e = roff_parse_comment(r, buf, ln, pos, r->escape);
           if ((e & ROFF_MASK) == ROFF_IGN)
                   return e;
           assert(e == ROFF_CONT);
   
         e = roff_expand(r, buf, ln, pos, r->escape);          e = roff_expand(r, buf, ln, pos, r->escape);
         if ((e & ROFF_MASK) == ROFF_IGN)          if ((e & ROFF_MASK) == ROFF_IGN)
                 return e;                  return e;
Line 1832  roff_parseln(struct roff *r, int ln, struct buf *buf, 
Line 1880  roff_parseln(struct roff *r, int ln, struct buf *buf, 
         /*          /*
          * If a scope is open, go to the child handler for that macro,           * If a scope is open, go to the child handler for that macro,
          * as it may want to preprocess before doing anything with it.           * as it may want to preprocess before doing anything with it.
          * Don't do so if an equation is open.  
          */           */
   
         if (r->last) {          if (r->last) {
Line 1840  roff_parseln(struct roff *r, int ln, struct buf *buf, 
Line 1887  roff_parseln(struct roff *r, int ln, struct buf *buf, 
                 return (*roffs[t].sub)(r, t, buf, ln, ppos, pos, offs);                  return (*roffs[t].sub)(r, t, buf, ln, ppos, pos, offs);
         }          }
   
         /* No scope is open.  This is a new request or macro. */  
   
         r->options &= ~MPARSE_COMMENT;          r->options &= ~MPARSE_COMMENT;
         spos = pos;          spos = pos;
         t = roff_parse(r, buf->buf, &pos, ln, ppos);          t = roff_parse(r, buf->buf, &pos, ln, ppos);
           return roff_req_or_macro(r, t, buf, ln, spos, pos, offs);
   }
   
         /* Tables ignore most macros. */  /*
    * Handle a new request or macro.
    * May be called outside any scope or from inside a conditional scope.
    */
   static int
   roff_req_or_macro(ROFF_ARGS) {
   
         if (r->tbl != NULL && (t == TOKEN_NONE || t == ROFF_TS ||          /* For now, tables ignore most macros and some request. */
             t == ROFF_br || t == ROFF_ce || t == ROFF_rj || t == ROFF_sp)) {  
           if (r->tbl != NULL && (tok == TOKEN_NONE || tok == ROFF_TS ||
               tok == ROFF_br || tok == ROFF_ce || tok == ROFF_rj ||
               tok == ROFF_sp)) {
                 mandoc_msg(MANDOCERR_TBLMACRO,                  mandoc_msg(MANDOCERR_TBLMACRO,
                     ln, pos, "%s", buf->buf + spos);                      ln, ppos, "%s", buf->buf + ppos);
                 if (t != TOKEN_NONE)                  if (tok != TOKEN_NONE)
                         return ROFF_IGN;                          return ROFF_IGN;
                 while (buf->buf[pos] != '\0' && buf->buf[pos] != ' ')                  while (buf->buf[pos] != '\0' && buf->buf[pos] != ' ')
                         pos++;                          pos++;
Line 1865  roff_parseln(struct roff *r, int ln, struct buf *buf, 
Line 1920  roff_parseln(struct roff *r, int ln, struct buf *buf, 
   
         /* For now, let high level macros abort .ce mode. */          /* For now, let high level macros abort .ce mode. */
   
         if (ctl && roffce_node != NULL &&          if (roffce_node != NULL &&
             (t == TOKEN_NONE || t == ROFF_Dd || t == ROFF_EQ ||              (tok == TOKEN_NONE || tok == ROFF_Dd || tok == ROFF_EQ ||
              t == ROFF_TH || t == ROFF_TS)) {               tok == ROFF_TH || tok == ROFF_TS)) {
                 r->man->last = roffce_node;                  r->man->last = roffce_node;
                 r->man->next = ROFF_NEXT_SIBLING;                  r->man->next = ROFF_NEXT_SIBLING;
                 roffce_lines = 0;                  roffce_lines = 0;
Line 1879  roff_parseln(struct roff *r, int ln, struct buf *buf, 
Line 1934  roff_parseln(struct roff *r, int ln, struct buf *buf, 
          * Let the standard macro set parsers handle it.           * Let the standard macro set parsers handle it.
          */           */
   
         if (t == TOKEN_NONE)          if (tok == TOKEN_NONE)
                 return ROFF_CONT;                  return ROFF_CONT;
   
         /* Execute a roff request or a user defined macro. */          /* Execute a roff request or a user-defined macro. */
   
         return (*roffs[t].proc)(r, t, buf, ln, spos, pos, offs);          return (*roffs[tok].proc)(r, tok, buf, ln, ppos, pos, offs);
 }  }
   
 /*  /*
Line 1927  roff_endparse(struct roff *r)
Line 1982  roff_endparse(struct roff *r)
 }  }
   
 /*  /*
  * Parse a roff node's type from the input buffer.  This must be in the   * Parse the request or macro name at buf[*pos].
  * form of ".foo xxx" in the usual way.   * Return ROFF_RENAMED, ROFF_USERDEF, or a ROFF_* token value.
    * For empty, undefined, mdoc(7), and man(7) macros, return TOKEN_NONE.
    * As a side effect, set r->current_string to the definition or to NULL.
  */   */
 static enum roff_tok  static enum roff_tok
 roff_parse(struct roff *r, char *buf, int *pos, int ln, int ppos)  roff_parse(struct roff *r, char *buf, int *pos, int ln, int ppos)
Line 1972  roff_parse(struct roff *r, char *buf, int *pos, int ln
Line 2029  roff_parse(struct roff *r, char *buf, int *pos, int ln
   
 /* --- handling of request blocks ----------------------------------------- */  /* --- handling of request blocks ----------------------------------------- */
   
   /*
    * Close a macro definition block or an "ignore" block.
    */
 static int  static int
 roff_cblock(ROFF_ARGS)  roff_cblock(ROFF_ARGS)
 {  {
           int      rr;
   
         /*  
          * A block-close `..' should only be invoked as a child of an  
          * ignore macro, otherwise raise a warning and just ignore it.  
          */  
   
         if (r->last == NULL) {          if (r->last == NULL) {
                 mandoc_msg(MANDOCERR_BLK_NOTOPEN, ln, ppos, "..");                  mandoc_msg(MANDOCERR_BLK_NOTOPEN, ln, ppos, "..");
                 return ROFF_IGN;                  return ROFF_IGN;
Line 1988  roff_cblock(ROFF_ARGS)
Line 2044  roff_cblock(ROFF_ARGS)
   
         switch (r->last->tok) {          switch (r->last->tok) {
         case ROFF_am:          case ROFF_am:
                 /* ROFF_am1 is remapped to ROFF_am in roff_block(). */  
         case ROFF_ami:          case ROFF_ami:
         case ROFF_de:          case ROFF_de:
                 /* ROFF_de1 is remapped to ROFF_de in roff_block(). */  
         case ROFF_dei:          case ROFF_dei:
         case ROFF_ig:          case ROFF_ig:
                 break;                  break;
           case ROFF_am1:
           case ROFF_de1:
                   /* Remapped in roff_block(). */
                   abort();
         default:          default:
                 mandoc_msg(MANDOCERR_BLK_NOTOPEN, ln, ppos, "..");                  mandoc_msg(MANDOCERR_BLK_NOTOPEN, ln, ppos, "..");
                 return ROFF_IGN;                  return ROFF_IGN;
         }          }
   
           roffnode_pop(r);
           roffnode_cleanscope(r);
   
           /*
            * If a conditional block with braces is still open,
            * check for "\}" block end markers.
            */
   
           if (r->last != NULL && r->last->endspan < 0) {
                   rr = 1;  /* If arguments follow "\}", warn about them. */
                   roff_cond_checkend(r, tok, buf, ln, ppos, pos, &rr);
           }
   
         if (buf->buf[pos] != '\0')          if (buf->buf[pos] != '\0')
                 mandoc_msg(MANDOCERR_ARG_SKIP, ln, pos,                  mandoc_msg(MANDOCERR_ARG_SKIP, ln, pos,
                     ".. %s", buf->buf + pos);                      ".. %s", buf->buf + pos);
   
         roffnode_pop(r);  
         roffnode_cleanscope(r);  
         return ROFF_IGN;          return ROFF_IGN;
   
 }  }
   
 /*  /*
Line 2020  roffnode_cleanscope(struct roff *r)
Line 2088  roffnode_cleanscope(struct roff *r)
         int inloop;          int inloop;
   
         inloop = 0;          inloop = 0;
         while (r->last != NULL) {          while (r->last != NULL && r->last->endspan > 0) {
                 if (--r->last->endspan != 0)                  if (--r->last->endspan != 0)
                         break;                          break;
                 inloop += roffnode_pop(r);                  inloop += roffnode_pop(r);
Line 2029  roffnode_cleanscope(struct roff *r)
Line 2097  roffnode_cleanscope(struct roff *r)
 }  }
   
 /*  /*
  * Handle the closing \} of a conditional block.   * Handle the closing "\}" of a conditional block.
  * Apart from generating warnings, this only pops nodes.   * Apart from generating warnings, this only pops nodes.
  * Return the number of loops ended.   * Return the number of loops ended.
  */   */
Line 2192  roff_block_sub(ROFF_ARGS)
Line 2260  roff_block_sub(ROFF_ARGS)
         int             i, j;          int             i, j;
   
         /*          /*
          * First check whether a custom macro exists at this level.  If           * If a custom end marker is a user-defined or predefined macro
          * it does, then check against it.  This is some of groff's           * or a request, interpret it.
          * stranger behaviours.  If we encountered a custom end-scope  
          * tag and that tag also happens to be a "real" macro, then we  
          * need to try interpreting it again as a real macro.  If it's  
          * not, then return ignore.  Else continue.  
          */           */
   
         if (r->last->end) {          if (r->last->end) {
Line 2223  roff_block_sub(ROFF_ARGS)
Line 2287  roff_block_sub(ROFF_ARGS)
                 }                  }
         }          }
   
         /*          /* Handle the standard end marker. */
          * If we have no custom end-query or lookup failed, then try  
          * pulling it out of the hashtable.  
          */  
   
         t = roff_parse(r, buf->buf, &pos, ln, ppos);          t = roff_parse(r, buf->buf, &pos, ln, ppos);
           if (t == ROFF_cblock)
                   return roff_cblock(r, t, buf, ln, ppos, pos, offs);
   
         if (t != ROFF_cblock) {          /* Not an end marker, so append the line to the block. */
                 if (tok != ROFF_ig)  
                         roff_setstr(r, r->last->name, buf->buf + ppos, 2);  
                 return ROFF_IGN;  
         }  
   
         return (*roffs[t].proc)(r, t, buf, ln, ppos, pos, offs);          if (tok != ROFF_ig)
                   roff_setstr(r, r->last->name, buf->buf + ppos, 2);
           return ROFF_IGN;
 }  }
   
 static int  static int
Line 2249  roff_block_text(ROFF_ARGS)
Line 2310  roff_block_text(ROFF_ARGS)
         return ROFF_IGN;          return ROFF_IGN;
 }  }
   
   /*
    * Check for a closing "\}" and handle it.
    * In this function, the final "int *offs" argument is used for
    * different purposes than elsewhere:
    * Input: *offs == 0: caller wants to discard arguments following \}
    *        *offs == 1: caller wants to preserve text following \}
    * Output: *offs = 0: tell caller to discard input line
    *         *offs = 1: tell caller to use input line
    */
 static int  static int
 roff_cond_sub(ROFF_ARGS)  roff_cond_checkend(ROFF_ARGS)
 {  {
         struct roffnode *bl;  
         char            *ep;          char            *ep;
         int              endloop, irc, rr;          int              endloop, irc, rr;
         enum roff_tok    t;  
   
         irc = ROFF_IGN;          irc = ROFF_IGN;
         rr = r->last->rule;          rr = r->last->rule;
Line 2265  roff_cond_sub(ROFF_ARGS)
Line 2333  roff_cond_sub(ROFF_ARGS)
                 irc |= endloop;                  irc |= endloop;
   
         /*          /*
          * If `\}' occurs on a macro line without a preceding macro,           * If "\}" occurs on a macro line without a preceding macro or
          * drop the line completely.           * a text line contains nothing else, drop the line completely.
          */           */
   
         ep = buf->buf + pos;          ep = buf->buf + pos;
         if (ep[0] == '\\' && ep[1] == '}')          if (ep[0] == '\\' && ep[1] == '}' && (ep[2] == '\0' || *offs == 0))
                 rr = 0;                  rr = 0;
   
         /*          /*
          * The closing delimiter `\}' rewinds the conditional scope           * The closing delimiter "\}" rewinds the conditional scope
          * but is otherwise ignored when interpreting the line.           * but is otherwise ignored when interpreting the line.
          */           */
   
         while ((ep = strchr(ep, '\\')) != NULL) {          while ((ep = strchr(ep, '\\')) != NULL) {
                 switch (ep[1]) {                  switch (ep[1]) {
                 case '}':                  case '}':
                         memmove(ep, ep + 2, strlen(ep + 2) + 1);                          if (ep[2] == '\0')
                                   ep[0] = '\0';
                           else if (rr)
                                   ep[1] = '&';
                           else
                                   memmove(ep, ep + 2, strlen(ep + 2) + 1);
                         if (roff_ccond(r, ln, ep - buf->buf))                          if (roff_ccond(r, ln, ep - buf->buf))
                                 irc |= endloop;                                  irc |= endloop;
                         break;                          break;
Line 2293  roff_cond_sub(ROFF_ARGS)
Line 2366  roff_cond_sub(ROFF_ARGS)
                         break;                          break;
                 }                  }
         }          }
           *offs = rr;
           return irc;
   }
   
   /*
    * Parse and process a request or macro line in conditional scope.
    */
   static int
   roff_cond_sub(ROFF_ARGS)
   {
           struct roffnode *bl;
           int              irc, rr, spos;
           enum roff_tok    t;
   
           rr = 0;  /* If arguments follow "\}", skip them. */
           irc = roff_cond_checkend(r, tok, buf, ln, ppos, pos, &rr);
           spos = pos;
         t = roff_parse(r, buf->buf, &pos, ln, ppos);          t = roff_parse(r, buf->buf, &pos, ln, ppos);
   
         /* For now, let high level macros abort .ce mode. */  
   
         if (roffce_node != NULL &&  
             (t == TOKEN_NONE || t == ROFF_Dd || t == ROFF_EQ ||  
              t == ROFF_TH || t == ROFF_TS)) {  
                 r->man->last = roffce_node;  
                 r->man->next = ROFF_NEXT_SIBLING;  
                 roffce_lines = 0;  
                 roffce_node = NULL;  
         }  
   
         /*          /*
          * Fully handle known macros when they are structurally           * Handle requests and macros if the conditional evaluated
          * required or when the conditional evaluated to true.           * to true or if they are structurally required.
            * The .break request is always handled specially.
          */           */
   
         if (t == ROFF_break) {          if (t == ROFF_break) {
Line 2322  roff_cond_sub(ROFF_ARGS)
Line 2401  roff_cond_sub(ROFF_ARGS)
                                         break;                                          break;
                         }                          }
                 }                  }
         } else if (t != TOKEN_NONE &&          } else if (rr || (t < TOKEN_NONE && roffs[t].flags & ROFFMAC_STRUCT)) {
             (rr || roffs[t].flags & ROFFMAC_STRUCT))                  irc |= roff_req_or_macro(r, t, buf, ln, spos, pos, offs);
                 irc |= (*roffs[t].proc)(r, t, buf, ln, ppos, pos, offs);                  if (irc & ROFF_WHILE)
         else                          irc &= ~(ROFF_LOOPCONT | ROFF_LOOPEXIT);
                 irc |= rr ? ROFF_CONT : ROFF_IGN;          }
         return irc;          return irc;
 }  }
   
   /*
    * Parse and process a text line in conditional scope.
    */
 static int  static int
 roff_cond_text(ROFF_ARGS)  roff_cond_text(ROFF_ARGS)
 {  {
         char            *ep;          int      irc, rr;
         int              endloop, irc, rr;  
   
         irc = ROFF_IGN;          rr = 1;  /* If arguments follow "\}", preserve them. */
         rr = r->last->rule;          irc = roff_cond_checkend(r, tok, buf, ln, ppos, pos, &rr);
         endloop = tok != ROFF_while ? ROFF_IGN :  
             rr ? ROFF_LOOPCONT : ROFF_LOOPEXIT;  
         if (roffnode_cleanscope(r))  
                 irc |= endloop;  
   
         /*  
          * If `\}' occurs on a text line with neither preceding  
          * nor following characters, drop the line completely.  
          */  
   
         ep = buf->buf + pos;  
         if (strcmp(ep, "\\}") == 0)  
                 rr = 0;  
   
         /*  
          * The closing delimiter `\}' rewinds the conditional scope  
          * but is otherwise ignored when interpreting the line.  
          */  
   
         while ((ep = strchr(ep, '\\')) != NULL) {  
                 switch (ep[1]) {  
                 case '}':  
                         memmove(ep, ep + 2, strlen(ep + 2) + 1);  
                         if (roff_ccond(r, ln, ep - buf->buf))  
                                 irc |= endloop;  
                         break;  
                 case '\0':  
                         ++ep;  
                         break;  
                 default:  
                         ep += 2;  
                         break;  
                 }  
         }  
         if (rr)          if (rr)
                 irc |= ROFF_CONT;                  irc |= ROFF_CONT;
         return irc;          return irc;
Line 2455  roff_getnum(const char *v, int *pos, int *res, int fla
Line 2502  roff_getnum(const char *v, int *pos, int *res, int fla
  * Evaluate a string comparison condition.   * Evaluate a string comparison condition.
  * The first character is the delimiter.   * The first character is the delimiter.
  * Succeed if the string up to its second occurrence   * Succeed if the string up to its second occurrence
  * matches the string up to its third occurence.   * matches the string up to its third occurrence.
  * Advance the cursor after the third occurrence   * Advance the cursor after the third occurrence
  * or lacking that, to the end of the line.   * or lacking that, to the end of the line.
  */   */
Line 3590  roff_char(ROFF_ARGS)
Line 3637  roff_char(ROFF_ARGS)
                 case ESCAPE_FONTITALIC:                  case ESCAPE_FONTITALIC:
                 case ESCAPE_FONTBOLD:                  case ESCAPE_FONTBOLD:
                 case ESCAPE_FONTBI:                  case ESCAPE_FONTBI:
                 case ESCAPE_FONTCW:                  case ESCAPE_FONTCR:
                   case ESCAPE_FONTCB:
                   case ESCAPE_FONTCI:
                 case ESCAPE_FONTPREV:                  case ESCAPE_FONTPREV:
                         font++;                          font++;
                         break;                          break;
Line 3650  roff_eo(ROFF_ARGS)
Line 3699  roff_eo(ROFF_ARGS)
 }  }
   
 static int  static int
   roff_mc(ROFF_ARGS)
   {
           struct roff_node        *n;
           char                    *cp;
   
           /* Parse the first argument. */
   
           cp = buf->buf + pos;
           if (*cp != '\0')
                   cp++;
           if (buf->buf[pos] == '\\') {
                   switch (mandoc_escape((const char **)&cp, NULL, NULL)) {
                   case ESCAPE_SPECIAL:
                   case ESCAPE_UNICODE:
                   case ESCAPE_NUMBERED:
                           break;
                   default:
                           *cp = '\0';
                           mandoc_msg(MANDOCERR_MC_ESC, ln, pos,
                               "mc %s", buf->buf + pos);
                           buf->buf[pos] = '\0';
                           break;
                   }
           }
   
           /* Ignore additional arguments. */
   
           while (*cp == ' ')
                   *cp++ = '\0';
           if (*cp != '\0') {
                   mandoc_msg(MANDOCERR_MC_DIST, ln, (int)(cp - buf->buf),
                       "mc ... %s", cp);
                   *cp = '\0';
           }
   
           /* Create the .mc node. */
   
           roff_elem_alloc(r->man, ln, ppos, tok);
           n = r->man->last;
           if (buf->buf[pos] != '\0')
                   roff_word_alloc(r->man, ln, pos, buf->buf + pos);
           n->flags |= NODE_LINE | NODE_VALID | NODE_ENDED;
           r->man->last = n;
           r->man->next = ROFF_NEXT_SIBLING;
           return ROFF_IGN;
   }
   
   static int
 roff_nop(ROFF_ARGS)  roff_nop(ROFF_ARGS)
 {  {
         while (buf->buf[pos] == ' ')          while (buf->buf[pos] == ' ')
Line 3663  roff_tr(ROFF_ARGS)
Line 3760  roff_tr(ROFF_ARGS)
 {  {
         const char      *p, *first, *second;          const char      *p, *first, *second;
         size_t           fsz, ssz;          size_t           fsz, ssz;
         enum mandoc_esc  esc;  
   
         p = buf->buf + pos;          p = buf->buf + pos;
   
Line 3677  roff_tr(ROFF_ARGS)
Line 3773  roff_tr(ROFF_ARGS)
   
                 first = p++;                  first = p++;
                 if (*first == '\\') {                  if (*first == '\\') {
                         esc = mandoc_escape(&p, NULL, NULL);                          if (mandoc_escape(&p, NULL, NULL) == ESCAPE_ERROR)
                         if (esc == ESCAPE_ERROR) {  
                                 mandoc_msg(MANDOCERR_ESC_BAD, ln,  
                                     (int)(p - buf->buf), "%s", first);  
                                 return ROFF_IGN;                                  return ROFF_IGN;
                         }  
                         fsz = (size_t)(p - first);                          fsz = (size_t)(p - first);
                 }                  }
   
                 second = p++;                  second = p++;
                 if (*second == '\\') {                  if (*second == '\\') {
                         esc = mandoc_escape(&p, NULL, NULL);                          if (mandoc_escape(&p, NULL, NULL) == ESCAPE_ERROR)
                         if (esc == ESCAPE_ERROR) {  
                                 mandoc_msg(MANDOCERR_ESC_BAD, ln,  
                                     (int)(p - buf->buf), "%s", second);  
                                 return ROFF_IGN;                                  return ROFF_IGN;
                         }  
                         ssz = (size_t)(p - second);                          ssz = (size_t)(p - second);
                 } else if (*second == '\0') {                  } else if (*second == '\0') {
                         mandoc_msg(MANDOCERR_TR_ODD, ln,                          mandoc_msg(MANDOCERR_TR_ODD, ln,
Line 3790  static int
Line 3878  static int
 roff_shift(ROFF_ARGS)  roff_shift(ROFF_ARGS)
 {  {
         struct mctx     *ctx;          struct mctx     *ctx;
         int              levels, i;          int              argpos, levels, i;
   
           argpos = pos;
         levels = 1;          levels = 1;
         if (buf->buf[pos] != '\0' &&          if (buf->buf[pos] != '\0' &&
             roff_evalnum(r, ln, buf->buf, &pos, &levels, 0) == 0) {              roff_evalnum(r, ln, buf->buf, &pos, &levels, 0) == 0) {
Line 3806  roff_shift(ROFF_ARGS)
Line 3895  roff_shift(ROFF_ARGS)
         ctx = r->mstack + r->mstackpos;          ctx = r->mstack + r->mstackpos;
         if (levels > ctx->argc) {          if (levels > ctx->argc) {
                 mandoc_msg(MANDOCERR_SHIFT,                  mandoc_msg(MANDOCERR_SHIFT,
                     ln, pos, "%d, but max is %d", levels, ctx->argc);                      ln, argpos, "%d, but max is %d", levels, ctx->argc);
                 levels = ctx->argc;                  levels = ctx->argc;
         }          }
           if (levels < 0) {
                   mandoc_msg(MANDOCERR_ARG_NEG, ln, argpos, "shift %d", levels);
                   levels = 0;
           }
         if (levels == 0)          if (levels == 0)
                 return ROFF_IGN;                  return ROFF_IGN;
         for (i = 0; i < levels; i++)          for (i = 0; i < levels; i++)
Line 3870  roff_userdef(ROFF_ARGS)
Line 3963  roff_userdef(ROFF_ARGS)
                 r->mstacksz += 8;                  r->mstacksz += 8;
         }          }
         ctx = r->mstack + r->mstackpos;          ctx = r->mstack + r->mstackpos;
         ctx->argsz = 0;  
         ctx->argc = 0;          ctx->argc = 0;
         ctx->argv = NULL;  
   
         /*          /*
          * Collect pointers to macro argument strings,           * Collect pointers to macro argument strings,
Line 3938  static size_t
Line 4029  static size_t
 roff_getname(struct roff *r, char **cpp, int ln, int pos)  roff_getname(struct roff *r, char **cpp, int ln, int pos)
 {  {
         char     *name, *cp;          char     *name, *cp;
         size_t    namesz;          int       namesz, inam, iend;
   
         name = *cpp;          name = *cpp;
         if (*name == '\0')          if (*name == '\0')
Line 3946  roff_getname(struct roff *r, char **cpp, int ln, int p
Line 4037  roff_getname(struct roff *r, char **cpp, int ln, int p
   
         /* Advance cp to the byte after the end of the name. */          /* Advance cp to the byte after the end of the name. */
   
         for (cp = name; 1; cp++) {          cp = name;
                 namesz = cp - name;          namesz = 0;
           for (;;) {
                 if (*cp == '\0')                  if (*cp == '\0')
                         break;                          break;
                 if (*cp == ' ' || *cp == '\t') {                  if (*cp == ' ' || *cp == '\t') {
                         cp++;                          cp++;
                         break;                          break;
                 }                  }
                 if (*cp != '\\')                  if (*cp != '\\') {
                           if (name + namesz < cp) {
                                   name[namesz] = *cp;
                                   *cp = ' ';
                           }
                           namesz++;
                           cp++;
                         continue;                          continue;
                   }
                 if (cp[1] == '{' || cp[1] == '}')                  if (cp[1] == '{' || cp[1] == '}')
                         break;                          break;
                 if (*++cp == '\\')                  if (roff_escape(cp, 0, 0, NULL, &inam,
                         continue;                      NULL, NULL, &iend) != ESCAPE_UNDEF) {
                 mandoc_msg(MANDOCERR_NAMESC, ln, pos,                          mandoc_msg(MANDOCERR_NAMESC, ln, pos,
                     "%.*s", (int)(cp - name + 1), name);                              "%.*s%.*s", namesz, name, iend, cp);
                 mandoc_escape((const char **)&cp, NULL, NULL);                          cp += iend;
                 break;                          break;
                   }
   
                   /*
                    * In an identifier, \\, \., \G and so on
                    * are reduced to \, ., G and so on,
                    * vaguely similar to copy mode.
                    */
   
                   name[namesz++] = cp[inam];
                   while (iend--) {
                           if (cp >= name + namesz)
                                   *cp = ' ';
                           cp++;
                   }
         }          }
   
         /* Read past spaces. */          /* Read past spaces. */
Line 4281  roff_getformat(const struct roff *r)
Line 4394  roff_getformat(const struct roff *r)
  * return zero and don't change the current position.   * return zero and don't change the current position.
  * If the control character has been set with `.cc', then let that grain   * If the control character has been set with `.cc', then let that grain
  * precedence.   * precedence.
  * This is slighly contrary to groff, where using the non-breaking   * This is slightly contrary to groff, where using the non-breaking
  * control character when `cc' has been invoked will cause the   * control character when `cc' has been invoked will cause the
  * non-breaking macro contents to be printed verbatim.   * non-breaking macro contents to be printed verbatim.
  */   */

Legend:
Removed from v.1.368  
changed lines
  Added in v.1.400

CVSweb