[BACK]Return to roff.c CVS log [TXT][DIR] Up to [cvsweb.bsd.lv] / mandoc

Diff for /mandoc/roff.c between version 1.375 and 1.389

version 1.375, 2020/08/03 11:02:57 version 1.389, 2022/05/30 23:03:47
Line 1 
Line 1 
 /* $Id$ */  /* $Id$ */
 /*  /*
  * Copyright (c) 2010-2015, 2017-2020 Ingo Schwarze <schwarze@openbsd.org>   * Copyright (c) 2010-2015, 2017-2022 Ingo Schwarze <schwarze@openbsd.org>
  * Copyright (c) 2008-2012, 2014 Kristaps Dzonsons <kristaps@bsd.lv>   * Copyright (c) 2008-2012, 2014 Kristaps Dzonsons <kristaps@bsd.lv>
  *   *
  * Permission to use, copy, modify, and distribute this software for any   * Permission to use, copy, modify, and distribute this software for any
Line 207  static int   roff_evalpar(struct roff *, int,
Line 207  static int   roff_evalpar(struct roff *, int,
 static  int              roff_evalstrcond(const char *, int *);  static  int              roff_evalstrcond(const char *, int *);
 static  int              roff_expand(struct roff *, struct buf *,  static  int              roff_expand(struct roff *, struct buf *,
                                 int, int, char);                                  int, int, char);
   static  void             roff_expand_patch(struct buf *, int,
                                   const char *, int);
 static  void             roff_free1(struct roff *);  static  void             roff_free1(struct roff *);
 static  void             roff_freereg(struct roffreg *);  static  void             roff_freereg(struct roffreg *);
 static  void             roff_freestr(struct roffkv *);  static  void             roff_freestr(struct roffkv *);
Line 227  static int   roff_line_ignore(ROFF_ARGS);
Line 229  static int   roff_line_ignore(ROFF_ARGS);
 static  void             roff_man_alloc1(struct roff_man *);  static  void             roff_man_alloc1(struct roff_man *);
 static  void             roff_man_free1(struct roff_man *);  static  void             roff_man_free1(struct roff_man *);
 static  int              roff_manyarg(ROFF_ARGS);  static  int              roff_manyarg(ROFF_ARGS);
   static  int              roff_mc(ROFF_ARGS);
 static  int              roff_noarg(ROFF_ARGS);  static  int              roff_noarg(ROFF_ARGS);
 static  int              roff_nop(ROFF_ARGS);  static  int              roff_nop(ROFF_ARGS);
 static  int              roff_nr(ROFF_ARGS);  static  int              roff_nr(ROFF_ARGS);
 static  int              roff_onearg(ROFF_ARGS);  static  int              roff_onearg(ROFF_ARGS);
 static  enum roff_tok    roff_parse(struct roff *, char *, int *,  static  enum roff_tok    roff_parse(struct roff *, char *, int *,
                                 int, int);                                  int, int);
   static  int              roff_parse_comment(struct roff *, struct buf *,
                                   int, int, char);
 static  int              roff_parsetext(struct roff *, struct buf *,  static  int              roff_parsetext(struct roff *, struct buf *,
                                 int, int *);                                  int, int *);
 static  int              roff_renamed(ROFF_ARGS);  static  int              roff_renamed(ROFF_ARGS);
   static  int              roff_req_or_macro(ROFF_ARGS);
 static  int              roff_return(ROFF_ARGS);  static  int              roff_return(ROFF_ARGS);
 static  int              roff_rm(ROFF_ARGS);  static  int              roff_rm(ROFF_ARGS);
 static  int              roff_rn(ROFF_ARGS);  static  int              roff_rn(ROFF_ARGS);
Line 379  static struct roffmac  roffs[TOKEN_NONE] = {
Line 385  static struct roffmac  roffs[TOKEN_NONE] = {
         { roff_noarg, NULL, NULL, 0 },  /* fi */          { roff_noarg, NULL, NULL, 0 },  /* fi */
         { roff_onearg, NULL, NULL, 0 },  /* ft */          { roff_onearg, NULL, NULL, 0 },  /* ft */
         { roff_onearg, NULL, NULL, 0 },  /* ll */          { roff_onearg, NULL, NULL, 0 },  /* ll */
         { roff_onearg, NULL, NULL, 0 },  /* mc */          { roff_mc, NULL, NULL, 0 },  /* mc */
         { roff_noarg, NULL, NULL, 0 },  /* nf */          { roff_noarg, NULL, NULL, 0 },  /* nf */
         { roff_onearg, NULL, NULL, 0 },  /* po */          { roff_onearg, NULL, NULL, 0 },  /* po */
         { roff_onearg, NULL, NULL, 0 },  /* rj */          { roff_onearg, NULL, NULL, 0 },  /* rj */
Line 861  void
Line 867  void
 roff_man_free(struct roff_man *man)  roff_man_free(struct roff_man *man)
 {  {
         roff_man_free1(man);          roff_man_free1(man);
           free(man->os_r);
         free(man);          free(man);
 }  }
   
Line 1229  deroff(char **dest, const struct roff_node *n)
Line 1236  deroff(char **dest, const struct roff_node *n)
 /* --- main functions of the roff parser ---------------------------------- */  /* --- main functions of the roff parser ---------------------------------- */
   
 /*  /*
  * In the current line, expand escape sequences that produce parsable   * Save comments preceding the title macro, for example in order to
  * input text.  Also check the syntax of the remaining escape sequences,   * preserve Copyright and license headers in HTML output,
  * which typically produce output glyphs or change formatter state.   * provide diagnostics about RCS ids and trailing whitespace in comments,
    * then discard comments including preceding whitespace.
    * This function also handles input line continuation.
  */   */
 static int  static int
 roff_expand(struct roff *r, struct buf *buf, int ln, int pos, char newesc)  roff_parse_comment(struct roff *r, struct buf *buf, int ln, int pos, char ec)
 {  {
         struct mctx     *ctx;   /* current macro call context */  
         char             ubuf[24]; /* buffer to print the number */  
         struct roff_node *n;    /* used for header comments */          struct roff_node *n;    /* used for header comments */
         const char      *start; /* start of the string to process */          const char      *start; /* start of the string to process */
           const char      *cp;    /* for RCS id parsing */
         char            *stesc; /* start of an escape sequence ('\\') */          char            *stesc; /* start of an escape sequence ('\\') */
         const char      *esct;  /* type of esccape sequence */  
         char            *ep;    /* end of comment string */          char            *ep;    /* end of comment string */
         const char      *stnam; /* start of the name, after "[(*" */  
         const char      *cp;    /* end of the name, e.g. before ']' */  
         const char      *res;   /* the string to be substituted */  
         char            *nbuf;  /* new buffer to copy buf->buf to */  
         size_t           maxl;  /* expected length of the escape name */  
         size_t           naml;  /* actual length of the escape name */  
         size_t           asz;   /* length of the replacement */  
         size_t           rsz;   /* length of the rest of the string */  
         int              inaml; /* length returned from mandoc_escape() */  
         int              expand_count;  /* to avoid infinite loops */  
         int              npos;  /* position in numeric expression */  
         int              arg_complete; /* argument not interrupted by eol */  
         int              quote_args; /* true for \\$@, false for \\$* */  
         int              done;  /* no more input available */  
         int              deftype; /* type of definition to paste */  
         int              rcsid; /* kind of RCS id seen */          int              rcsid; /* kind of RCS id seen */
         enum mandocerr   err;   /* for escape sequence problems */  
         char             sign;  /* increment number register */  
         char             term;  /* character terminating the escape */  
   
         /* Search forward for comments. */          for (start = stesc = buf->buf + pos;; stesc++) {
                   /*
         done = 0;                   * XXX Ugly hack: Remove the newline character that
         start = buf->buf + pos;                   * mparse_buf_r() appended to mark the end of input
         for (stesc = buf->buf + pos; *stesc != '\0'; stesc++) {                   * if it is not preceded by an escape character.
                 if (stesc[0] != newesc || stesc[1] == '\0')                   */
                         continue;                  if (stesc[0] == '\n') {
                 stesc++;                          assert(stesc[1] == '\0');
                 if (*stesc != '"' && *stesc != '#')                          stesc[0] = '\0';
                         continue;  
   
                 /* Comment found, look for RCS id. */  
   
                 rcsid = 0;  
                 if ((cp = strstr(stesc, "$" "OpenBSD")) != NULL) {  
                         rcsid = 1 << MANDOC_OS_OPENBSD;  
                         cp += 8;  
                 } else if ((cp = strstr(stesc, "$" "NetBSD")) != NULL) {  
                         rcsid = 1 << MANDOC_OS_NETBSD;  
                         cp += 7;  
                 }                  }
                 if (cp != NULL &&  
                     isalnum((unsigned char)*cp) == 0 &&  
                     strchr(cp, '$') != NULL) {  
                         if (r->man->meta.rcsids & rcsid)  
                                 mandoc_msg(MANDOCERR_RCS_REP, ln,  
                                     (int)(stesc - buf->buf) + 1,  
                                     "%s", stesc + 1);  
                         r->man->meta.rcsids |= rcsid;  
                 }  
   
                 /* Handle trailing whitespace. */                  /* The line ends without continuation or comment. */
                   if (stesc[0] == '\0')
                           return ROFF_CONT;
   
                 ep = strchr(stesc--, '\0') - 1;                  /* Unescaped byte: skip it. */
                 if (*ep == '\n') {                  if (stesc[0] != ec)
                         done = 1;                          continue;
                         ep--;  
                 }  
                 if (*ep == ' ' || *ep == '\t')  
                         mandoc_msg(MANDOCERR_SPACE_EOL,  
                             ln, (int)(ep - buf->buf), NULL);  
   
                 /*                  /*
                  * Save comments preceding the title macro                   * XXX Ugly hack: Do not attempt to append another line
                  * in the syntax tree.                   * if the function mparse_buf_r() appended a newline
                    * character to indicate the end of input.
                  */                   */
                   if (stesc[1] == '\n') {
                 if (newesc != ASCII_ESC && r->options & MPARSE_COMMENT) {                          assert(stesc[2] == '\0');
                         while (*ep == ' ' || *ep == '\t')                          stesc[0] = '\0';
                                 ep--;                          return ROFF_CONT;
                         ep[1] = '\0';  
                         n = roff_node_alloc(r->man,  
                             ln, stesc + 1 - buf->buf,  
                             ROFFT_COMMENT, TOKEN_NONE);  
                         n->string = mandoc_strdup(stesc + 2);  
                         roff_node_append(r->man, n);  
                         n->flags |= NODE_VALID | NODE_ENDED;  
                         r->man->next = ROFF_NEXT_SIBLING;  
                 }                  }
   
                 /* Line continuation with comment. */                  /*
                    * An escape character at the end of an input line
                 if (stesc[1] == '#') {                   * requests line continuation.
                         *stesc = '\0';                   */
                   if (stesc[1] == '\0') {
                           stesc[0] = '\0';
                         return ROFF_IGN | ROFF_APPEND;                          return ROFF_IGN | ROFF_APPEND;
                 }                  }
   
                 /* Discard normal comments. */                  /* Found a comment: process it. */
                   if (stesc[1] == '"' || stesc[1] == '#')
                           break;
   
                 while (stesc > start && stesc[-1] == ' ' &&                  /* Escaped escape character: skip them both. */
                     (stesc == start + 1 || stesc[-2] != '\\'))                  if (stesc[1] == ec)
                         stesc--;                          stesc++;
                 *stesc = '\0';  
                 break;  
         }          }
         if (stesc == start)  
                 return ROFF_CONT;  
         stesc--;  
   
         /* Notice the end of the input. */          /* Look for an RCS id in the comment. */
   
         if (*stesc == '\n') {          rcsid = 0;
                 *stesc-- = '\0';          if ((cp = strstr(stesc + 2, "$" "OpenBSD")) != NULL) {
                 done = 1;                  rcsid = 1 << MANDOC_OS_OPENBSD;
                   cp += 8;
           } else if ((cp = strstr(stesc + 2, "$" "NetBSD")) != NULL) {
                   rcsid = 1 << MANDOC_OS_NETBSD;
                   cp += 7;
         }          }
           if (cp != NULL && isalnum((unsigned char)*cp) == 0 &&
               strchr(cp, '$') != NULL) {
                   if (r->man->meta.rcsids & rcsid)
                           mandoc_msg(MANDOCERR_RCS_REP, ln,
                               (int)(stesc - buf->buf) + 2, "%s", stesc + 1);
                   r->man->meta.rcsids |= rcsid;
           }
   
         expand_count = 0;          /* Warn about trailing whitespace at the end of the comment. */
         while (stesc >= start) {  
                 if (*stesc != newesc) {  
   
                         /*          ep = strchr(stesc + 2, '\0') - 1;
                          * If we have a non-standard escape character,          if (*ep == '\n')
                          * escape literal backslashes because all                  *ep-- = '\0';
                          * processing in subsequent functions uses          if (*ep == ' ' || *ep == '\t')
                          * the standard escaping rules.                  mandoc_msg(MANDOCERR_SPACE_EOL,
                          */                      ln, (int)(ep - buf->buf), NULL);
   
                         if (newesc != ASCII_ESC && *stesc == '\\') {          /* Save comments preceding the title macro in the syntax tree. */
                                 *stesc = '\0';  
                                 buf->sz = mandoc_asprintf(&nbuf, "%s\\e%s",  
                                     buf->buf, stesc + 1) + 1;  
                                 start = nbuf + pos;  
                                 stesc = nbuf + (stesc - buf->buf);  
                                 free(buf->buf);  
                                 buf->buf = nbuf;  
                         }  
   
                         /* Search backwards for the next escape. */          if (r->options & MPARSE_COMMENT) {
                   while (*ep == ' ' || *ep == '\t')
                           ep--;
                   ep[1] = '\0';
                   n = roff_node_alloc(r->man, ln, stesc + 1 - buf->buf,
                       ROFFT_COMMENT, TOKEN_NONE);
                   n->string = mandoc_strdup(stesc + 2);
                   roff_node_append(r->man, n);
                   n->flags |= NODE_VALID | NODE_ENDED;
                   r->man->next = ROFF_NEXT_SIBLING;
           }
   
                         stesc--;          /* The comment requests line continuation. */
                         continue;  
                 }  
   
                 /* If it is escaped, skip it. */          if (stesc[1] == '#') {
                   *stesc = '\0';
                   return ROFF_IGN | ROFF_APPEND;
           }
   
                 for (cp = stesc - 1; cp >= start; cp--)          /* Discard the comment including preceding whitespace. */
                         if (*cp != r->escape)  
                                 break;  
   
                 if ((stesc - cp) % 2 == 0) {          while (stesc > start && stesc[-1] == ' ' &&
                         while (stesc > cp)              (stesc == start + 1 || stesc[-2] != '\\'))
                                 *stesc-- = '\\';                  stesc--;
                         continue;          *stesc = '\0';
                 } else if (stesc[1] != '\0') {          return ROFF_CONT;
                         *stesc = '\\';  }
                 } else {  
                         *stesc-- = '\0';  
                         if (done)  
                                 continue;  
                         else  
                                 return ROFF_IGN | ROFF_APPEND;  
                 }  
   
                 /* Decide whether to expand or to check only. */  /*
    * In the current line, expand escape sequences that produce parsable
    * input text.  Also check the syntax of the remaining escape sequences,
    * which typically produce output glyphs or change formatter state.
    */
   static int
   roff_expand(struct roff *r, struct buf *buf, int ln, int pos, char ec)
   {
           char             ubuf[24];      /* buffer to print a number */
           struct mctx     *ctx;           /* current macro call context */
           const char      *res;           /* the string to be pasted */
           const char      *src;           /* source for copying */
           char            *dst;           /* destination for copying */
           int              iesc;          /* index of leading escape char */
           int              inam;          /* index of the escape name */
           int              iarg;          /* index beginning the argument */
           int              iendarg;       /* index right after the argument */
           int              iend;          /* index right after the sequence */
           int              deftype;       /* type of definition to paste */
           int              argi;          /* macro argument index */
           int              quote_args;    /* true for \\$@, false for \\$* */
           int              asz;           /* length of the replacement */
           int              rsz;           /* length of the rest of the string */
           int              npos;          /* position in numeric expression */
           int              expand_count;  /* to avoid infinite loops */
   
                 term = '\0';          expand_count = 0;
                 cp = stesc + 1;          while (buf->buf[pos] != '\0') {
                 if (*cp == 'E')  
                         cp++;  
                 esct = cp;  
                 switch (*esct) {  
                 case '*':  
                 case '$':  
                         res = NULL;  
                         break;  
                 case 'B':  
                 case 'w':  
                         term = cp[1];  
                         /* FALLTHROUGH */  
                 case 'n':  
                         sign = cp[1];  
                         if (sign == '+' || sign == '-')  
                                 cp++;  
                         res = ubuf;  
                         break;  
                 default:  
                         err = MANDOCERR_OK;  
                         switch(mandoc_escape(&cp, &stnam, &inaml)) {  
                         case ESCAPE_SPECIAL:  
                                 if (mchars_spec2cp(stnam, inaml) >= 0)  
                                         break;  
                                 /* FALLTHROUGH */  
                         case ESCAPE_ERROR:  
                                 err = MANDOCERR_ESC_BAD;  
                                 break;  
                         case ESCAPE_UNDEF:  
                                 err = MANDOCERR_ESC_UNDEF;  
                                 break;  
                         case ESCAPE_UNSUPP:  
                                 err = MANDOCERR_ESC_UNSUPP;  
                                 break;  
                         default:  
                                 break;  
                         }  
                         if (err != MANDOCERR_OK)  
                                 mandoc_msg(err, ln, (int)(stesc - buf->buf),  
                                     "%.*s", (int)(cp - stesc), stesc);  
                         stesc--;  
                         continue;  
                 }  
   
                 if (EXPAND_LIMIT < ++expand_count) {  
                         mandoc_msg(MANDOCERR_ROFFLOOP,  
                             ln, (int)(stesc - buf->buf), NULL);  
                         return ROFF_IGN;  
                 }  
   
                 /*                  /*
                  * The third character decides the length                   * Skip plain ASCII characters.
                  * of the name of the string or register.                   * If we have a non-standard escape character,
                  * Save a pointer to the name.                   * escape literal backslashes because all processing in
                    * subsequent functions uses the standard escaping rules.
                  */                   */
   
                 if (term == '\0') {                  if (buf->buf[pos] != ec) {
                         switch (*++cp) {                          if (ec != ASCII_ESC && buf->buf[pos] == '\\') {
                         case '\0':                                  roff_expand_patch(buf, pos, "\\e", pos + 1);
                                 maxl = 0;                                  pos++;
                                 break;  
                         case '(':  
                                 cp++;  
                                 maxl = 2;  
                                 break;  
                         case '[':  
                                 cp++;  
                                 term = ']';  
                                 maxl = 0;  
                                 break;  
                         default:  
                                 maxl = 1;  
                                 break;  
                         }                          }
                 } else {                          pos++;
                         cp += 2;                          continue;
                         maxl = 0;  
                 }                  }
                 stnam = cp;  
   
                 /* Advance to the end of the name. */                  /*
                    * Parse escape sequences,
                    * issue diagnostic messages when appropriate,
                    * and skip sequences that do not need expansion.
                    * If we have a non-standard escape character, translate
                    * it to backslashes and translate backslashes to \e.
                    */
   
                 naml = 0;                  if (roff_escape(buf->buf, ln, pos,
                 arg_complete = 1;                      &iesc, &iarg, &iendarg, &iend) != ESCAPE_EXPAND) {
                 while (maxl == 0 || naml < maxl) {                          while (pos < iend) {
                         if (*cp == '\0') {                                  if (buf->buf[pos] == ec) {
                                 mandoc_msg(MANDOCERR_ESC_BAD, ln,                                          buf->buf[pos] = '\\';
                                     (int)(stesc - buf->buf), "%s", stesc);                                          if (pos + 1 < iend)
                                 arg_complete = 0;                                                  pos++;
                                 break;                                  } else if (buf->buf[pos] == '\\') {
                                           roff_expand_patch(buf,
                                               pos, "\\e", pos + 1);
                                           pos++;
                                           iend++;
                                   }
                                   pos++;
                         }                          }
                         if (maxl == 0 && *cp == term) {                          continue;
                                 cp++;  
                                 break;  
                         }  
                         if (*cp++ != '\\' || *esct != 'w') {  
                                 naml++;  
                                 continue;  
                         }  
                         switch (mandoc_escape(&cp, NULL, NULL)) {  
                         case ESCAPE_SPECIAL:  
                         case ESCAPE_UNICODE:  
                         case ESCAPE_NUMBERED:  
                         case ESCAPE_UNDEF:  
                         case ESCAPE_OVERSTRIKE:  
                                 naml++;  
                                 break;  
                         default:  
                                 break;  
                         }  
                 }                  }
   
                 /*                  /*
                  * Retrieve the replacement string; if it is                   * Treat "\E" just like "\";
                  * undefined, resume searching for escapes.                   * it only makes a difference in copy mode.
                  */                   */
   
                 switch (*esct) {                  inam = iesc + 1;
                   while (buf->buf[inam] == 'E')
                           inam++;
   
                   /* Handle expansion. */
   
                   res = NULL;
                   switch (buf->buf[inam]) {
                 case '*':                  case '*':
                         if (arg_complete) {                          if (iendarg == iarg)
                                 deftype = ROFFDEF_USER | ROFFDEF_PRE;                                  break;
                                 res = roff_getstrn(r, stnam, naml, &deftype);                          deftype = ROFFDEF_USER | ROFFDEF_PRE;
                           if ((res = roff_getstrn(r, buf->buf + iarg,
                               iendarg - iarg, &deftype)) != NULL)
                                   break;
   
                                 /*                          /*
                                  * If not overriden, let \*(.T                           * If not overriden,
                                  * through to the formatters.                           * let \*(.T through to the formatters.
                                  */                           */
   
                                 if (res == NULL && naml == 2 &&                          if (iendarg - iarg == 2 &&
                                     stnam[0] == '.' && stnam[1] == 'T') {                              buf->buf[iarg] == '.' &&
                                         roff_setstrn(&r->strtab,                              buf->buf[iarg + 1] == 'T') {
                                             ".T", 2, NULL, 0, 0);                                  roff_setstrn(&r->strtab, ".T", 2, NULL, 0, 0);
                                         stesc--;                                  pos = iend;
                                         continue;                                  continue;
                                 }  
                         }                          }
   
                           mandoc_msg(MANDOCERR_STR_UNDEF, ln, iesc,
                               "%.*s", iendarg - iarg, buf->buf + iarg);
                         break;                          break;
   
                 case '$':                  case '$':
                         if (r->mstackpos < 0) {                          if (r->mstackpos < 0) {
                                 mandoc_msg(MANDOCERR_ARG_UNDEF, ln,                                  mandoc_msg(MANDOCERR_ARG_UNDEF, ln, iesc,
                                     (int)(stesc - buf->buf), "%.3s", stesc);                                      "%.*s", iend - iesc, buf->buf + iesc);
                                 break;                                  break;
                         }                          }
                         ctx = r->mstack + r->mstackpos;                          ctx = r->mstack + r->mstackpos;
                         npos = esct[1] - '1';                          argi = buf->buf[iarg] - '1';
                         if (npos >= 0 && npos <= 8) {                          if (argi >= 0 && argi <= 8) {
                                 res = npos < ctx->argc ?                                  if (argi < ctx->argc)
                                     ctx->argv[npos] : "";                                          res = ctx->argv[argi];
                                 break;                                  break;
                         }                          }
                         if (esct[1] == '*')                          if (buf->buf[iarg] == '*')
                                 quote_args = 0;                                  quote_args = 0;
                         else if (esct[1] == '@')                          else if (buf->buf[iarg] == '@')
                                 quote_args = 1;                                  quote_args = 1;
                         else {                          else {
                                 mandoc_msg(MANDOCERR_ARG_NONUM, ln,                                  mandoc_msg(MANDOCERR_ARG_NONUM, ln, iesc,
                                     (int)(stesc - buf->buf), "%.3s", stesc);                                      "%.*s", iend - iesc, buf->buf + iesc);
                                 break;                                  break;
                         }                          }
                         asz = 0;                          asz = 0;
                         for (npos = 0; npos < ctx->argc; npos++) {                          for (argi = 0; argi < ctx->argc; argi++) {
                                 if (npos)                                  if (argi)
                                         asz++;  /* blank */                                          asz++;  /* blank */
                                 if (quote_args)                                  if (quote_args)
                                         asz += 2;  /* quotes */                                          asz += 2;  /* quotes */
                                 asz += strlen(ctx->argv[npos]);                                  asz += strlen(ctx->argv[argi]);
                         }                          }
                         if (asz != 3) {                          if (asz != iend - iesc) {
                                 rsz = buf->sz - (stesc - buf->buf) - 3;                                  rsz = buf->sz - iend;
                                 if (asz < 3)                                  if (asz < iend - iesc)
                                         memmove(stesc + asz, stesc + 3, rsz);                                          memmove(buf->buf + iesc + asz,
                                 buf->sz += asz - 3;                                              buf->buf + iend, rsz);
                                 nbuf = mandoc_realloc(buf->buf, buf->sz);                                  buf->sz = iesc + asz + rsz;
                                 start = nbuf + pos;                                  buf->buf = mandoc_realloc(buf->buf, buf->sz);
                                 stesc = nbuf + (stesc - buf->buf);                                  if (asz > iend - iesc)
                                 buf->buf = nbuf;                                          memmove(buf->buf + iesc + asz,
                                 if (asz > 3)                                              buf->buf + iend, rsz);
                                         memmove(stesc + asz, stesc + 3, rsz);  
                         }                          }
                         for (npos = 0; npos < ctx->argc; npos++) {                          dst = buf->buf + iesc;
                                 if (npos)                          for (argi = 0; argi < ctx->argc; argi++) {
                                         *stesc++ = ' ';                                  if (argi)
                                           *dst++ = ' ';
                                 if (quote_args)                                  if (quote_args)
                                         *stesc++ = '"';                                          *dst++ = '"';
                                 cp = ctx->argv[npos];                                  src = ctx->argv[argi];
                                 while (*cp != '\0')                                  while (*src != '\0')
                                         *stesc++ = *cp++;                                          *dst++ = *src++;
                                 if (quote_args)                                  if (quote_args)
                                         *stesc++ = '"';                                          *dst++ = '"';
                         }                          }
                         continue;                          continue;
                 case 'B':                  case 'B':
                         npos = 0;                          npos = 0;
                         ubuf[0] = arg_complete &&                          ubuf[0] = iendarg > iarg && iend > iendarg &&
                             roff_evalnum(r, ln, stnam, &npos,                              roff_evalnum(r, ln, buf->buf + iarg, &npos,
                               NULL, ROFFNUM_SCALE) &&                                           NULL, ROFFNUM_SCALE) &&
                             stnam + npos + 1 == cp ? '1' : '0';                              npos == iendarg - iarg ? '1' : '0';
                         ubuf[1] = '\0';                          ubuf[1] = '\0';
                           res = ubuf;
                         break;                          break;
                   case 'V':
                           mandoc_msg(MANDOCERR_UNSUPP, ln, iesc,
                               "%.*s", iend - iesc, buf->buf + iesc);
                           roff_expand_patch(buf, iendarg, "}", iend);
                           roff_expand_patch(buf, iesc, "${", iarg);
                           continue;
                 case 'n':                  case 'n':
                         if (arg_complete)                          if (iendarg > iarg)
                                 (void)snprintf(ubuf, sizeof(ubuf), "%d",                                  (void)snprintf(ubuf, sizeof(ubuf), "%d",
                                     roff_getregn(r, stnam, naml, sign));                                      roff_getregn(r, buf->buf + iarg,
                                       iendarg - iarg, buf->buf[inam + 1]));
                         else                          else
                                 ubuf[0] = '\0';                                  ubuf[0] = '\0';
                           res = ubuf;
                         break;                          break;
                 case 'w':                  case 'w':
                         /* use even incomplete args */                          (void)snprintf(ubuf, sizeof(ubuf),
                         (void)snprintf(ubuf, sizeof(ubuf), "%d",                              "%d", (iendarg - iarg) * 24);
                             24 * (int)naml);                          res = ubuf;
                         break;                          break;
                   default:
                           break;
                 }                  }
                   if (res == NULL)
                 if (res == NULL) {  
                         if (*esct == '*')  
                                 mandoc_msg(MANDOCERR_STR_UNDEF,  
                                     ln, (int)(stesc - buf->buf),  
                                     "%.*s", (int)naml, stnam);  
                         res = "";                          res = "";
                 } else if (buf->sz + strlen(res) > SHRT_MAX) {                  if (++expand_count > EXPAND_LIMIT ||
                         mandoc_msg(MANDOCERR_ROFFLOOP,                      buf->sz + strlen(res) > SHRT_MAX) {
                             ln, (int)(stesc - buf->buf), NULL);                          mandoc_msg(MANDOCERR_ROFFLOOP, ln, iesc, NULL);
                         return ROFF_IGN;                          return ROFF_IGN;
                 }                  }
                   roff_expand_patch(buf, iesc, res, iend);
                 /* Replace the escape sequence by the string. */  
   
                 *stesc = '\0';  
                 buf->sz = mandoc_asprintf(&nbuf, "%s%s%s",  
                     buf->buf, res, cp) + 1;  
   
                 /* Prepare for the next replacement. */  
   
                 start = nbuf + pos;  
                 stesc = nbuf + (stesc - buf->buf) + strlen(res);  
                 free(buf->buf);  
                 buf->buf = nbuf;  
         }          }
         return ROFF_CONT;          return ROFF_CONT;
 }  }
   
 /*  /*
    * Replace the substring from the start position (inclusive)
    * to end position (exclusive) with the repl(acement) string.
    */
   static void
   roff_expand_patch(struct buf *buf, int start, const char *repl, int end)
   {
           char    *nbuf;
   
           buf->sz = mandoc_asprintf(&nbuf, "%.*s%s%s", start, buf->buf,
               repl, buf->buf + end) + 1;
           free(buf->buf);
           buf->buf = nbuf;
   }
   
   /*
  * Parse a quoted or unquoted roff-style request or macro argument.   * Parse a quoted or unquoted roff-style request or macro argument.
  * Return a pointer to the parsed argument, which is either the original   * Return a pointer to the parsed argument, which is either the original
  * pointer or advanced by one byte in case the argument is quoted.   * pointer or advanced by one byte in case the argument is quoted.
Line 1823  roff_parsetext(struct roff *r, struct buf *buf, int po
Line 1761  roff_parsetext(struct roff *r, struct buf *buf, int po
 }  }
   
 int  int
 roff_parseln(struct roff *r, int ln, struct buf *buf, int *offs)  roff_parseln(struct roff *r, int ln, struct buf *buf, int *offs, size_t len)
 {  {
         enum roff_tok    t;          enum roff_tok    t;
         int              e;          int              e;
Line 1834  roff_parseln(struct roff *r, int ln, struct buf *buf, 
Line 1772  roff_parseln(struct roff *r, int ln, struct buf *buf, 
   
         ppos = pos = *offs;          ppos = pos = *offs;
   
           if (len > 80 && r->tbl == NULL && r->eqn == NULL &&
               (r->man->flags & ROFF_NOFILL) == 0 &&
               strchr(" .\\", buf->buf[pos]) == NULL &&
               buf->buf[pos] != r->control &&
               strcspn(buf->buf, " ") < 80)
                   mandoc_msg(MANDOCERR_TEXT_LONG, ln, (int)len - 1,
                       "%.20s...", buf->buf + pos);
   
         /* Handle in-line equation delimiters. */          /* Handle in-line equation delimiters. */
   
         if (r->tbl == NULL &&          if (r->tbl == NULL &&
Line 1845  roff_parseln(struct roff *r, int ln, struct buf *buf, 
Line 1791  roff_parseln(struct roff *r, int ln, struct buf *buf, 
                 assert(e == ROFF_CONT);                  assert(e == ROFF_CONT);
         }          }
   
         /* Expand some escape sequences. */          /* Handle comments and escape sequences. */
   
           e = roff_parse_comment(r, buf, ln, pos, r->escape);
           if ((e & ROFF_MASK) == ROFF_IGN)
                   return e;
           assert(e == ROFF_CONT);
   
         e = roff_expand(r, buf, ln, pos, r->escape);          e = roff_expand(r, buf, ln, pos, r->escape);
         if ((e & ROFF_MASK) == ROFF_IGN)          if ((e & ROFF_MASK) == ROFF_IGN)
                 return e;                  return e;
Line 1895  roff_parseln(struct roff *r, int ln, struct buf *buf, 
Line 1846  roff_parseln(struct roff *r, int ln, struct buf *buf, 
         /*          /*
          * If a scope is open, go to the child handler for that macro,           * If a scope is open, go to the child handler for that macro,
          * as it may want to preprocess before doing anything with it.           * as it may want to preprocess before doing anything with it.
          * Don't do so if an equation is open.  
          */           */
   
         if (r->last) {          if (r->last) {
Line 1903  roff_parseln(struct roff *r, int ln, struct buf *buf, 
Line 1853  roff_parseln(struct roff *r, int ln, struct buf *buf, 
                 return (*roffs[t].sub)(r, t, buf, ln, ppos, pos, offs);                  return (*roffs[t].sub)(r, t, buf, ln, ppos, pos, offs);
         }          }
   
         /* No scope is open.  This is a new request or macro. */  
   
         r->options &= ~MPARSE_COMMENT;          r->options &= ~MPARSE_COMMENT;
         spos = pos;          spos = pos;
         t = roff_parse(r, buf->buf, &pos, ln, ppos);          t = roff_parse(r, buf->buf, &pos, ln, ppos);
           return roff_req_or_macro(r, t, buf, ln, spos, pos, offs);
   }
   
         /* Tables ignore most macros. */  /*
    * Handle a new request or macro.
    * May be called outside any scope or from inside a conditional scope.
    */
   static int
   roff_req_or_macro(ROFF_ARGS) {
   
         if (r->tbl != NULL && (t == TOKEN_NONE || t == ROFF_TS ||          /* For now, tables ignore most macros and some request. */
             t == ROFF_br || t == ROFF_ce || t == ROFF_rj || t == ROFF_sp)) {  
           if (r->tbl != NULL && (tok == TOKEN_NONE || tok == ROFF_TS ||
               tok == ROFF_br || tok == ROFF_ce || tok == ROFF_rj ||
               tok == ROFF_sp)) {
                 mandoc_msg(MANDOCERR_TBLMACRO,                  mandoc_msg(MANDOCERR_TBLMACRO,
                     ln, pos, "%s", buf->buf + spos);                      ln, ppos, "%s", buf->buf + ppos);
                 if (t != TOKEN_NONE)                  if (tok != TOKEN_NONE)
                         return ROFF_IGN;                          return ROFF_IGN;
                 while (buf->buf[pos] != '\0' && buf->buf[pos] != ' ')                  while (buf->buf[pos] != '\0' && buf->buf[pos] != ' ')
                         pos++;                          pos++;
Line 1928  roff_parseln(struct roff *r, int ln, struct buf *buf, 
Line 1886  roff_parseln(struct roff *r, int ln, struct buf *buf, 
   
         /* For now, let high level macros abort .ce mode. */          /* For now, let high level macros abort .ce mode. */
   
         if (ctl && roffce_node != NULL &&          if (roffce_node != NULL &&
             (t == TOKEN_NONE || t == ROFF_Dd || t == ROFF_EQ ||              (tok == TOKEN_NONE || tok == ROFF_Dd || tok == ROFF_EQ ||
              t == ROFF_TH || t == ROFF_TS)) {               tok == ROFF_TH || tok == ROFF_TS)) {
                 r->man->last = roffce_node;                  r->man->last = roffce_node;
                 r->man->next = ROFF_NEXT_SIBLING;                  r->man->next = ROFF_NEXT_SIBLING;
                 roffce_lines = 0;                  roffce_lines = 0;
Line 1942  roff_parseln(struct roff *r, int ln, struct buf *buf, 
Line 1900  roff_parseln(struct roff *r, int ln, struct buf *buf, 
          * Let the standard macro set parsers handle it.           * Let the standard macro set parsers handle it.
          */           */
   
         if (t == TOKEN_NONE)          if (tok == TOKEN_NONE)
                 return ROFF_CONT;                  return ROFF_CONT;
   
         /* Execute a roff request or a user defined macro. */          /* Execute a roff request or a user-defined macro. */
   
         return (*roffs[t].proc)(r, t, buf, ln, spos, pos, offs);          return (*roffs[tok].proc)(r, tok, buf, ln, ppos, pos, offs);
 }  }
   
 /*  /*
Line 1990  roff_endparse(struct roff *r)
Line 1948  roff_endparse(struct roff *r)
 }  }
   
 /*  /*
  * Parse a roff node's type from the input buffer.  This must be in the   * Parse the request or macro name at buf[*pos].
  * form of ".foo xxx" in the usual way.   * Return ROFF_RENAMED, ROFF_USERDEF, or a ROFF_* token value.
    * For empty, undefined, mdoc(7), and man(7) macros, return TOKEN_NONE.
    * As a side effect, set r->current_string to the definition or to NULL.
  */   */
 static enum roff_tok  static enum roff_tok
 roff_parse(struct roff *r, char *buf, int *pos, int ln, int ppos)  roff_parse(struct roff *r, char *buf, int *pos, int ln, int ppos)
Line 2266  roff_block_sub(ROFF_ARGS)
Line 2226  roff_block_sub(ROFF_ARGS)
         int             i, j;          int             i, j;
   
         /*          /*
          * First check whether a custom macro exists at this level.  If           * If a custom end marker is a user-defined or predefined macro
          * it does, then check against it.  This is some of groff's           * or a request, interpret it.
          * stranger behaviours.  If we encountered a custom end-scope  
          * tag and that tag also happens to be a "real" macro, then we  
          * need to try interpreting it again as a real macro.  If it's  
          * not, then return ignore.  Else continue.  
          */           */
   
         if (r->last->end) {          if (r->last->end) {
Line 2297  roff_block_sub(ROFF_ARGS)
Line 2253  roff_block_sub(ROFF_ARGS)
                 }                  }
         }          }
   
         /*          /* Handle the standard end marker. */
          * If we have no custom end-query or lookup failed, then try  
          * pulling it out of the hashtable.  
          */  
   
         t = roff_parse(r, buf->buf, &pos, ln, ppos);          t = roff_parse(r, buf->buf, &pos, ln, ppos);
           if (t == ROFF_cblock)
                   return roff_cblock(r, t, buf, ln, ppos, pos, offs);
   
         if (t != ROFF_cblock) {          /* Not an end marker, so append the line to the block. */
                 if (tok != ROFF_ig)  
                         roff_setstr(r, r->last->name, buf->buf + ppos, 2);  
                 return ROFF_IGN;  
         }  
   
         return (*roffs[t].proc)(r, t, buf, ln, ppos, pos, offs);          if (tok != ROFF_ig)
                   roff_setstr(r, r->last->name, buf->buf + ppos, 2);
           return ROFF_IGN;
 }  }
   
 static int  static int
Line 2362  roff_cond_checkend(ROFF_ARGS)
Line 2315  roff_cond_checkend(ROFF_ARGS)
         while ((ep = strchr(ep, '\\')) != NULL) {          while ((ep = strchr(ep, '\\')) != NULL) {
                 switch (ep[1]) {                  switch (ep[1]) {
                 case '}':                  case '}':
                         if (rr)                          if (ep[2] == '\0')
                                   ep[0] = '\0';
                           else if (rr)
                                 ep[1] = '&';                                  ep[1] = '&';
                         else                          else
                                 memmove(ep, ep + 2, strlen(ep + 2) + 1);                                  memmove(ep, ep + 2, strlen(ep + 2) + 1);
Line 2388  static int
Line 2343  static int
 roff_cond_sub(ROFF_ARGS)  roff_cond_sub(ROFF_ARGS)
 {  {
         struct roffnode *bl;          struct roffnode *bl;
         int              irc, rr;          int              irc, rr, spos;
         enum roff_tok    t;          enum roff_tok    t;
   
         rr = 0;  /* If arguments follow "\}", skip them. */          rr = 0;  /* If arguments follow "\}", skip them. */
         irc = roff_cond_checkend(r, tok, buf, ln, ppos, pos, &rr);          irc = roff_cond_checkend(r, tok, buf, ln, ppos, pos, &rr);
           spos = pos;
         t = roff_parse(r, buf->buf, &pos, ln, ppos);          t = roff_parse(r, buf->buf, &pos, ln, ppos);
   
         /* For now, let high level macros abort .ce mode. */  
   
         if (roffce_node != NULL &&  
             (t == TOKEN_NONE || t == ROFF_Dd || t == ROFF_EQ ||  
              t == ROFF_TH || t == ROFF_TS)) {  
                 r->man->last = roffce_node;  
                 r->man->next = ROFF_NEXT_SIBLING;  
                 roffce_lines = 0;  
                 roffce_node = NULL;  
         }  
   
         /*          /*
          * Fully handle known macros when they are structurally           * Handle requests and macros if the conditional evaluated
          * required or when the conditional evaluated to true.           * to true or if they are structurally required.
            * The .break request is always handled specially.
          */           */
   
         if (t == ROFF_break) {          if (t == ROFF_break) {
Line 2421  roff_cond_sub(ROFF_ARGS)
Line 2367  roff_cond_sub(ROFF_ARGS)
                                         break;                                          break;
                         }                          }
                 }                  }
         } else if (t != TOKEN_NONE &&          } else if (rr || (t < TOKEN_NONE && roffs[t].flags & ROFFMAC_STRUCT)) {
             (rr || roffs[t].flags & ROFFMAC_STRUCT))                  irc |= roff_req_or_macro(r, t, buf, ln, spos, pos, offs);
                 irc |= (*roffs[t].proc)(r, t, buf, ln, ppos, pos, offs);                  if (irc & ROFF_WHILE)
         else                          irc &= ~(ROFF_LOOPCONT | ROFF_LOOPEXIT);
                 irc |= rr ? ROFF_CONT : ROFF_IGN;          }
         return irc;          return irc;
 }  }
   
Line 3657  roff_char(ROFF_ARGS)
Line 3603  roff_char(ROFF_ARGS)
                 case ESCAPE_FONTITALIC:                  case ESCAPE_FONTITALIC:
                 case ESCAPE_FONTBOLD:                  case ESCAPE_FONTBOLD:
                 case ESCAPE_FONTBI:                  case ESCAPE_FONTBI:
                 case ESCAPE_FONTCW:                  case ESCAPE_FONTCR:
                   case ESCAPE_FONTCB:
                   case ESCAPE_FONTCI:
                 case ESCAPE_FONTPREV:                  case ESCAPE_FONTPREV:
                         font++;                          font++;
                         break;                          break;
Line 3717  roff_eo(ROFF_ARGS)
Line 3665  roff_eo(ROFF_ARGS)
 }  }
   
 static int  static int
   roff_mc(ROFF_ARGS)
   {
           struct roff_node        *n;
           char                    *cp;
   
           /* Parse the first argument. */
   
           cp = buf->buf + pos;
           if (*cp != '\0')
                   cp++;
           if (buf->buf[pos] == '\\') {
                   switch (mandoc_escape((const char **)&cp, NULL, NULL)) {
                   case ESCAPE_SPECIAL:
                   case ESCAPE_UNICODE:
                   case ESCAPE_NUMBERED:
                           break;
                   default:
                           *cp = '\0';
                           mandoc_msg(MANDOCERR_MC_ESC, ln, pos,
                               "mc %s", buf->buf + pos);
                           buf->buf[pos] = '\0';
                           break;
                   }
           }
   
           /* Ignore additional arguments. */
   
           while (*cp == ' ')
                   *cp++ = '\0';
           if (*cp != '\0') {
                   mandoc_msg(MANDOCERR_MC_DIST, ln, (int)(cp - buf->buf),
                       "mc ... %s", cp);
                   *cp = '\0';
           }
   
           /* Create the .mc node. */
   
           roff_elem_alloc(r->man, ln, ppos, tok);
           n = r->man->last;
           if (buf->buf[pos] != '\0')
                   roff_word_alloc(r->man, ln, pos, buf->buf + pos);
           n->flags |= NODE_LINE | NODE_VALID | NODE_ENDED;
           r->man->last = n;
           r->man->next = ROFF_NEXT_SIBLING;
           return ROFF_IGN;
   }
   
   static int
 roff_nop(ROFF_ARGS)  roff_nop(ROFF_ARGS)
 {  {
         while (buf->buf[pos] == ' ')          while (buf->buf[pos] == ' ')
Line 3857  static int
Line 3853  static int
 roff_shift(ROFF_ARGS)  roff_shift(ROFF_ARGS)
 {  {
         struct mctx     *ctx;          struct mctx     *ctx;
         int              levels, i;          int              argpos, levels, i;
   
           argpos = pos;
         levels = 1;          levels = 1;
         if (buf->buf[pos] != '\0' &&          if (buf->buf[pos] != '\0' &&
             roff_evalnum(r, ln, buf->buf, &pos, &levels, 0) == 0) {              roff_evalnum(r, ln, buf->buf, &pos, &levels, 0) == 0) {
Line 3873  roff_shift(ROFF_ARGS)
Line 3870  roff_shift(ROFF_ARGS)
         ctx = r->mstack + r->mstackpos;          ctx = r->mstack + r->mstackpos;
         if (levels > ctx->argc) {          if (levels > ctx->argc) {
                 mandoc_msg(MANDOCERR_SHIFT,                  mandoc_msg(MANDOCERR_SHIFT,
                     ln, pos, "%d, but max is %d", levels, ctx->argc);                      ln, argpos, "%d, but max is %d", levels, ctx->argc);
                 levels = ctx->argc;                  levels = ctx->argc;
         }          }
           if (levels < 0) {
                   mandoc_msg(MANDOCERR_ARG_NEG, ln, argpos, "shift %d", levels);
                   levels = 0;
           }
         if (levels == 0)          if (levels == 0)
                 return ROFF_IGN;                  return ROFF_IGN;
         for (i = 0; i < levels; i++)          for (i = 0; i < levels; i++)
Line 3937  roff_userdef(ROFF_ARGS)
Line 3938  roff_userdef(ROFF_ARGS)
                 r->mstacksz += 8;                  r->mstacksz += 8;
         }          }
         ctx = r->mstack + r->mstackpos;          ctx = r->mstack + r->mstackpos;
         ctx->argsz = 0;  
         ctx->argc = 0;          ctx->argc = 0;
         ctx->argv = NULL;  
   
         /*          /*
          * Collect pointers to macro argument strings,           * Collect pointers to macro argument strings,

Legend:
Removed from v.1.375  
changed lines
  Added in v.1.389

CVSweb