[BACK]Return to roff.c CVS log [TXT][DIR] Up to [cvsweb.bsd.lv] / mandoc

Diff for /mandoc/roff.c between version 1.385 and 1.387

version 1.385, 2022/04/30 11:32:42 version 1.387, 2022/05/01 16:22:06
Line 234  static int   roff_nr(ROFF_ARGS);
Line 234  static int   roff_nr(ROFF_ARGS);
 static  int              roff_onearg(ROFF_ARGS);  static  int              roff_onearg(ROFF_ARGS);
 static  enum roff_tok    roff_parse(struct roff *, char *, int *,  static  enum roff_tok    roff_parse(struct roff *, char *, int *,
                                 int, int);                                  int, int);
   static  int              roff_parse_comment(struct roff *, struct buf *,
                                   int, int, char);
 static  int              roff_parsetext(struct roff *, struct buf *,  static  int              roff_parsetext(struct roff *, struct buf *,
                                 int, int *);                                  int, int *);
 static  int              roff_renamed(ROFF_ARGS);  static  int              roff_renamed(ROFF_ARGS);
   static  int              roff_req_or_macro(ROFF_ARGS);
 static  int              roff_return(ROFF_ARGS);  static  int              roff_return(ROFF_ARGS);
 static  int              roff_rm(ROFF_ARGS);  static  int              roff_rm(ROFF_ARGS);
 static  int              roff_rn(ROFF_ARGS);  static  int              roff_rn(ROFF_ARGS);
Line 1230  deroff(char **dest, const struct roff_node *n)
Line 1233  deroff(char **dest, const struct roff_node *n)
   
 /* --- main functions of the roff parser ---------------------------------- */  /* --- main functions of the roff parser ---------------------------------- */
   
   static int
   roff_parse_comment(struct roff *r, struct buf *buf, int ln, int pos,
       char newesc)
   {
           struct roff_node *n;    /* used for header comments */
           const char      *start; /* start of the string to process */
           const char      *cp;    /* for RCS id parsing */
           char            *stesc; /* start of an escape sequence ('\\') */
           char            *ep;    /* end of comment string */
           int              rcsid; /* kind of RCS id seen */
   
           for (start = stesc = buf->buf + pos;; stesc++) {
                   /* The line ends without continuation or comment. */
                   if (stesc[0] == '\0')
                           return ROFF_CONT;
   
                   /* Unescaped byte: skip it. */
                   if (stesc[0] != newesc)
                           continue;
   
                   /* Backslash at end of line requests line continuation. */
                   if (stesc[1] == '\0') {
                           stesc[0] = '\0';
                           return ROFF_IGN | ROFF_APPEND;
                   }
   
                   /* Found a comment: process it. */
                   if (stesc[1] == '"' || stesc[1] == '#')
                           break;
   
                   /* Escaped escape character: skip them both. */
                   if (stesc[1] == newesc)
                           stesc++;
           }
   
           /* Look for an RCS id in the comment. */
   
           rcsid = 0;
           if ((cp = strstr(stesc + 2, "$" "OpenBSD")) != NULL) {
                   rcsid = 1 << MANDOC_OS_OPENBSD;
                   cp += 8;
           } else if ((cp = strstr(stesc + 2, "$" "NetBSD")) != NULL) {
                   rcsid = 1 << MANDOC_OS_NETBSD;
                   cp += 7;
           }
           if (cp != NULL && isalnum((unsigned char)*cp) == 0 &&
               strchr(cp, '$') != NULL) {
                   if (r->man->meta.rcsids & rcsid)
                           mandoc_msg(MANDOCERR_RCS_REP, ln,
                               (int)(stesc - buf->buf) + 2, "%s", stesc + 1);
                   r->man->meta.rcsids |= rcsid;
           }
   
           /* Warn about trailing whitespace at the end of the comment. */
   
           ep = strchr(stesc + 2, '\0') - 1;
           if (*ep == '\n')
                   *ep-- = '\0';
           if (*ep == ' ' || *ep == '\t')
                   mandoc_msg(MANDOCERR_SPACE_EOL,
                       ln, (int)(ep - buf->buf), NULL);
   
           /* Save comments preceding the title macro in the syntax tree. */
   
           if (r->options & MPARSE_COMMENT) {
                   while (*ep == ' ' || *ep == '\t')
                           ep--;
                   ep[1] = '\0';
                   n = roff_node_alloc(r->man, ln, stesc + 1 - buf->buf,
                       ROFFT_COMMENT, TOKEN_NONE);
                   n->string = mandoc_strdup(stesc + 2);
                   roff_node_append(r->man, n);
                   n->flags |= NODE_VALID | NODE_ENDED;
                   r->man->next = ROFF_NEXT_SIBLING;
           }
   
           /* The comment requests line continuation. */
   
           if (stesc[1] == '#') {
                   *stesc = '\0';
                   return ROFF_IGN | ROFF_APPEND;
           }
   
           /* Discard the comment including preceding whitespace. */
   
           while (stesc > start && stesc[-1] == ' ' &&
               (stesc == start + 1 || stesc[-2] != '\\'))
                   stesc--;
           *stesc = '\0';
           return ROFF_CONT;
   }
   
 /*  /*
  * In the current line, expand escape sequences that produce parsable   * In the current line, expand escape sequences that produce parsable
  * input text.  Also check the syntax of the remaining escape sequences,   * input text.  Also check the syntax of the remaining escape sequences,
Line 1240  roff_expand(struct roff *r, struct buf *buf, int ln, i
Line 1335  roff_expand(struct roff *r, struct buf *buf, int ln, i
 {  {
         struct mctx     *ctx;   /* current macro call context */          struct mctx     *ctx;   /* current macro call context */
         char             ubuf[24]; /* buffer to print the number */          char             ubuf[24]; /* buffer to print the number */
         struct roff_node *n;    /* used for header comments */  
         const char      *start; /* start of the string to process */          const char      *start; /* start of the string to process */
         char            *stesc; /* start of an escape sequence ('\\') */          char            *stesc; /* start of an escape sequence ('\\') */
         const char      *esct;  /* type of esccape sequence */          const char      *esct;  /* type of esccape sequence */
         char            *ep;    /* end of comment string */  
         const char      *stnam; /* start of the name, after "[(*" */          const char      *stnam; /* start of the name, after "[(*" */
         const char      *cp;    /* end of the name, e.g. before ']' */          const char      *cp;    /* end of the name, e.g. before ']' */
         const char      *res;   /* the string to be substituted */          const char      *res;   /* the string to be substituted */
Line 1258  roff_expand(struct roff *r, struct buf *buf, int ln, i
Line 1351  roff_expand(struct roff *r, struct buf *buf, int ln, i
         int              npos;  /* position in numeric expression */          int              npos;  /* position in numeric expression */
         int              arg_complete; /* argument not interrupted by eol */          int              arg_complete; /* argument not interrupted by eol */
         int              quote_args; /* true for \\$@, false for \\$* */          int              quote_args; /* true for \\$@, false for \\$* */
         int              done;  /* no more input available */  
         int              deftype; /* type of definition to paste */          int              deftype; /* type of definition to paste */
         int              rcsid; /* kind of RCS id seen */  
         enum mandocerr   err;   /* for escape sequence problems */          enum mandocerr   err;   /* for escape sequence problems */
         char             sign;  /* increment number register */          char             sign;  /* increment number register */
         char             term;  /* character terminating the escape */          char             term;  /* character terminating the escape */
   
         /* Search forward for comments. */  
   
         done = 0;  
         start = buf->buf + pos;          start = buf->buf + pos;
         for (stesc = buf->buf + pos; *stesc != '\0'; stesc++) {          stesc = strchr(start, '\0') - 1;
                 if (stesc[0] != newesc || stesc[1] == '\0')          if (stesc >= start && *stesc == '\n')
                         continue;  
                 stesc++;  
                 if (*stesc != '"' && *stesc != '#')  
                         continue;  
   
                 /* Comment found, look for RCS id. */  
   
                 rcsid = 0;  
                 if ((cp = strstr(stesc, "$" "OpenBSD")) != NULL) {  
                         rcsid = 1 << MANDOC_OS_OPENBSD;  
                         cp += 8;  
                 } else if ((cp = strstr(stesc, "$" "NetBSD")) != NULL) {  
                         rcsid = 1 << MANDOC_OS_NETBSD;  
                         cp += 7;  
                 }  
                 if (cp != NULL &&  
                     isalnum((unsigned char)*cp) == 0 &&  
                     strchr(cp, '$') != NULL) {  
                         if (r->man->meta.rcsids & rcsid)  
                                 mandoc_msg(MANDOCERR_RCS_REP, ln,  
                                     (int)(stesc - buf->buf) + 1,  
                                     "%s", stesc + 1);  
                         r->man->meta.rcsids |= rcsid;  
                 }  
   
                 /* Handle trailing whitespace. */  
   
                 ep = strchr(stesc--, '\0') - 1;  
                 if (*ep == '\n') {  
                         done = 1;  
                         ep--;  
                 }  
                 if (*ep == ' ' || *ep == '\t')  
                         mandoc_msg(MANDOCERR_SPACE_EOL,  
                             ln, (int)(ep - buf->buf), NULL);  
   
                 /*  
                  * Save comments preceding the title macro  
                  * in the syntax tree.  
                  */  
   
                 if (newesc != ASCII_ESC && r->options & MPARSE_COMMENT) {  
                         while (*ep == ' ' || *ep == '\t')  
                                 ep--;  
                         ep[1] = '\0';  
                         n = roff_node_alloc(r->man,  
                             ln, stesc + 1 - buf->buf,  
                             ROFFT_COMMENT, TOKEN_NONE);  
                         n->string = mandoc_strdup(stesc + 2);  
                         roff_node_append(r->man, n);  
                         n->flags |= NODE_VALID | NODE_ENDED;  
                         r->man->next = ROFF_NEXT_SIBLING;  
                 }  
   
                 /* Line continuation with comment. */  
   
                 if (stesc[1] == '#') {  
                         *stesc = '\0';  
                         return ROFF_IGN | ROFF_APPEND;  
                 }  
   
                 /* Discard normal comments. */  
   
                 while (stesc > start && stesc[-1] == ' ' &&  
                     (stesc == start + 1 || stesc[-2] != '\\'))  
                         stesc--;  
                 *stesc = '\0';  
                 break;  
         }  
         if (stesc == start)  
                 return ROFF_CONT;  
         stesc--;  
   
         /* Notice the end of the input. */  
   
         if (*stesc == '\n') {  
                 *stesc-- = '\0';                  *stesc-- = '\0';
                 done = 1;  
         }  
   
         expand_count = 0;          expand_count = 0;
         while (stesc >= start) {          while (stesc >= start) {
Line 1388  roff_expand(struct roff *r, struct buf *buf, int ln, i
Line 1398  roff_expand(struct roff *r, struct buf *buf, int ln, i
                         while (stesc > cp)                          while (stesc > cp)
                                 *stesc-- = '\\';                                  *stesc-- = '\\';
                         continue;                          continue;
                 } else if (stesc[1] != '\0') {                  } else if (stesc[1] == '\0') {
                         *stesc = '\\';  
                 } else {  
                         *stesc-- = '\0';                          *stesc-- = '\0';
                         if (done)                          continue;
                                 continue;                  } else
                         else                          *stesc = '\\';
                                 return ROFF_IGN | ROFF_APPEND;  
                 }  
   
                 /* Decide whether to expand or to check only. */                  /* Decide whether to expand or to check only. */
   
Line 1855  roff_parseln(struct roff *r, int ln, struct buf *buf, 
Line 1861  roff_parseln(struct roff *r, int ln, struct buf *buf, 
                 assert(e == ROFF_CONT);                  assert(e == ROFF_CONT);
         }          }
   
         /* Expand some escape sequences. */          /* Handle comments and escape sequences. */
   
           e = roff_parse_comment(r, buf, ln, pos, r->escape);
           if ((e & ROFF_MASK) == ROFF_IGN)
                   return e;
           assert(e == ROFF_CONT);
   
         e = roff_expand(r, buf, ln, pos, r->escape);          e = roff_expand(r, buf, ln, pos, r->escape);
         if ((e & ROFF_MASK) == ROFF_IGN)          if ((e & ROFF_MASK) == ROFF_IGN)
                 return e;                  return e;
Line 1905  roff_parseln(struct roff *r, int ln, struct buf *buf, 
Line 1916  roff_parseln(struct roff *r, int ln, struct buf *buf, 
         /*          /*
          * If a scope is open, go to the child handler for that macro,           * If a scope is open, go to the child handler for that macro,
          * as it may want to preprocess before doing anything with it.           * as it may want to preprocess before doing anything with it.
          * Don't do so if an equation is open.  
          */           */
   
         if (r->last) {          if (r->last) {
Line 1913  roff_parseln(struct roff *r, int ln, struct buf *buf, 
Line 1923  roff_parseln(struct roff *r, int ln, struct buf *buf, 
                 return (*roffs[t].sub)(r, t, buf, ln, ppos, pos, offs);                  return (*roffs[t].sub)(r, t, buf, ln, ppos, pos, offs);
         }          }
   
         /* No scope is open.  This is a new request or macro. */  
   
         r->options &= ~MPARSE_COMMENT;          r->options &= ~MPARSE_COMMENT;
         spos = pos;          spos = pos;
         t = roff_parse(r, buf->buf, &pos, ln, ppos);          t = roff_parse(r, buf->buf, &pos, ln, ppos);
           return roff_req_or_macro(r, t, buf, ln, spos, pos, offs);
   }
   
         /* Tables ignore most macros. */  /*
    * Handle a new request or macro.
    * May be called outside any scope or from inside a conditional scope.
    */
   static int
   roff_req_or_macro(ROFF_ARGS) {
   
         if (r->tbl != NULL && (t == TOKEN_NONE || t == ROFF_TS ||          /* For now, tables ignore most macros and some request. */
             t == ROFF_br || t == ROFF_ce || t == ROFF_rj || t == ROFF_sp)) {  
           if (r->tbl != NULL && (tok == TOKEN_NONE || tok == ROFF_TS ||
               tok == ROFF_br || tok == ROFF_ce || tok == ROFF_rj ||
               tok == ROFF_sp)) {
                 mandoc_msg(MANDOCERR_TBLMACRO,                  mandoc_msg(MANDOCERR_TBLMACRO,
                     ln, pos, "%s", buf->buf + spos);                      ln, ppos, "%s", buf->buf + ppos);
                 if (t != TOKEN_NONE)                  if (tok != TOKEN_NONE)
                         return ROFF_IGN;                          return ROFF_IGN;
                 while (buf->buf[pos] != '\0' && buf->buf[pos] != ' ')                  while (buf->buf[pos] != '\0' && buf->buf[pos] != ' ')
                         pos++;                          pos++;
Line 1938  roff_parseln(struct roff *r, int ln, struct buf *buf, 
Line 1956  roff_parseln(struct roff *r, int ln, struct buf *buf, 
   
         /* For now, let high level macros abort .ce mode. */          /* For now, let high level macros abort .ce mode. */
   
         if (ctl && roffce_node != NULL &&          if (roffce_node != NULL &&
             (t == TOKEN_NONE || t == ROFF_Dd || t == ROFF_EQ ||              (tok == TOKEN_NONE || tok == ROFF_Dd || tok == ROFF_EQ ||
              t == ROFF_TH || t == ROFF_TS)) {               tok == ROFF_TH || tok == ROFF_TS)) {
                 r->man->last = roffce_node;                  r->man->last = roffce_node;
                 r->man->next = ROFF_NEXT_SIBLING;                  r->man->next = ROFF_NEXT_SIBLING;
                 roffce_lines = 0;                  roffce_lines = 0;
Line 1952  roff_parseln(struct roff *r, int ln, struct buf *buf, 
Line 1970  roff_parseln(struct roff *r, int ln, struct buf *buf, 
          * Let the standard macro set parsers handle it.           * Let the standard macro set parsers handle it.
          */           */
   
         if (t == TOKEN_NONE)          if (tok == TOKEN_NONE)
                 return ROFF_CONT;                  return ROFF_CONT;
   
         /* Execute a roff request or a user defined macro. */          /* Execute a roff request or a user-defined macro. */
   
         return (*roffs[t].proc)(r, t, buf, ln, spos, pos, offs);          return (*roffs[tok].proc)(r, tok, buf, ln, ppos, pos, offs);
 }  }
   
 /*  /*
Line 2000  roff_endparse(struct roff *r)
Line 2018  roff_endparse(struct roff *r)
 }  }
   
 /*  /*
  * Parse a roff node's type from the input buffer.  This must be in the   * Parse the request or macro name at buf[*pos].
  * form of ".foo xxx" in the usual way.   * Return ROFF_RENAMED, ROFF_USERDEF, or a ROFF_* token value.
    * For empty, undefined, mdoc(7), and man(7) macros, return TOKEN_NONE.
    * As a side effect, set r->current_string to the definition or to NULL.
  */   */
 static enum roff_tok  static enum roff_tok
 roff_parse(struct roff *r, char *buf, int *pos, int ln, int ppos)  roff_parse(struct roff *r, char *buf, int *pos, int ln, int ppos)
Line 2393  static int
Line 2413  static int
 roff_cond_sub(ROFF_ARGS)  roff_cond_sub(ROFF_ARGS)
 {  {
         struct roffnode *bl;          struct roffnode *bl;
         int              irc, rr;          int              irc, rr, spos;
         enum roff_tok    t;          enum roff_tok    t;
   
         rr = 0;  /* If arguments follow "\}", skip them. */          rr = 0;  /* If arguments follow "\}", skip them. */
         irc = roff_cond_checkend(r, tok, buf, ln, ppos, pos, &rr);          irc = roff_cond_checkend(r, tok, buf, ln, ppos, pos, &rr);
           spos = pos;
         t = roff_parse(r, buf->buf, &pos, ln, ppos);          t = roff_parse(r, buf->buf, &pos, ln, ppos);
   
         /* For now, let high level macros abort .ce mode. */  
   
         if (roffce_node != NULL &&  
             (t == TOKEN_NONE || t == ROFF_Dd || t == ROFF_EQ ||  
              t == ROFF_TH || t == ROFF_TS)) {  
                 r->man->last = roffce_node;  
                 r->man->next = ROFF_NEXT_SIBLING;  
                 roffce_lines = 0;  
                 roffce_node = NULL;  
         }  
   
         /*          /*
          * Fully handle known macros when they are structurally           * Handle requests and macros if the conditional evaluated
          * required or when the conditional evaluated to true.           * to true or if they are structurally required.
            * The .break request is always handled specially.
          */           */
   
         if (t == ROFF_break) {          if (t == ROFF_break) {
Line 2426  roff_cond_sub(ROFF_ARGS)
Line 2437  roff_cond_sub(ROFF_ARGS)
                                         break;                                          break;
                         }                          }
                 }                  }
         } else if (t != TOKEN_NONE &&          } else if (rr || (t < TOKEN_NONE && roffs[t].flags & ROFFMAC_STRUCT)) {
             (rr || roffs[t].flags & ROFFMAC_STRUCT)) {                  irc |= roff_req_or_macro(r, t, buf, ln, spos, pos, offs);
                 irc |= (*roffs[t].proc)(r, t, buf, ln, ppos, pos, offs);  
                 if (irc & ROFF_WHILE)                  if (irc & ROFF_WHILE)
                         irc &= ~(ROFF_LOOPCONT | ROFF_LOOPEXIT);                          irc &= ~(ROFF_LOOPCONT | ROFF_LOOPEXIT);
         } else          }
                 irc |= rr ? ROFF_CONT : ROFF_IGN;  
         return irc;          return irc;
 }  }
   

Legend:
Removed from v.1.385  
changed lines
  Added in v.1.387

CVSweb