[BACK]Return to roff.c CVS log [TXT][DIR] Up to [cvsweb.bsd.lv] / mandoc

Diff for /mandoc/roff.c between version 1.75 and 1.81

version 1.75, 2010/05/16 13:49:23 version 1.81, 2010/05/17 00:46:35
Line 28 
Line 28 
   
 #define ROFF_CTL(c) \  #define ROFF_CTL(c) \
         ('.' == (c) || '\'' == (c))          ('.' == (c) || '\'' == (c))
 #ifdef  ROFF_DEBUG  
 #define ROFF_MDEBUG(p, str) \  
         fprintf(stderr, "%s: %s (%d:%d)\n", (str), \  
                 roffs[(p)->last->tok].name, \  
                 (p)->last->line, (p)->last->col)  
 #else  
 #define ROFF_MDEBUG(p, str) while (/* CONSTCOND */ 0)  
 #endif  
   
 enum    rofft {  enum    rofft {
         ROFF_if,  
         ROFF_ccond,  
 #if 0  
         ROFF_am,          ROFF_am,
         ROFF_ami,          ROFF_ami,
           ROFF_am1,
         ROFF_de,          ROFF_de,
         ROFF_dei,          ROFF_dei,
           ROFF_de1,
           ROFF_if,
         ROFF_ig,          ROFF_ig,
         ROFF_close,          ROFF_cblock,
           ROFF_ccond,
   #if 0
           ROFF_ie,
           ROFF_el,
 #endif  #endif
         ROFF_MAX          ROFF_MAX
 };  };
Line 57  struct roff {
Line 53  struct roff {
         void            *data; /* privdata for messages */          void            *data; /* privdata for messages */
 };  };
   
   enum    roffrule {
           ROFFRULE_ALLOW,
           ROFFRULE_DENY
   };
   
 struct  roffnode {  struct  roffnode {
         enum rofft       tok; /* type of node */          enum rofft       tok; /* type of node */
         struct roffnode *parent; /* up one in stack */          struct roffnode *parent; /* up one in stack */
         char            *end; /* end-token: custom */  
         int              line; /* parse line */          int              line; /* parse line */
         int              col; /* parse col */          int              col; /* parse col */
         int              endspan;          char            *end; /* end-rules: custom token */
           int              endspan; /* end-rules: next-line or infty */
           enum roffrule    rule;
 };  };
   
 #define ROFF_ARGS        struct roff *r, /* parse ctx */ \  #define ROFF_ARGS        struct roff *r, /* parse ctx */ \
Line 79  typedef enum rofferr (*roffproc)(ROFF_ARGS);
Line 81  typedef enum rofferr (*roffproc)(ROFF_ARGS);
   
 struct  roffmac {  struct  roffmac {
         const char      *name; /* macro name */          const char      *name; /* macro name */
         roffproc         proc;          roffproc         proc; /* process new macro */
           roffproc         text; /* process as child text of macro */
           roffproc         sub; /* process as child of macro */
           int              flags;
   #define ROFFMAC_STRUCT  (1 << 0) /* always interpret */
 };  };
   
 static  enum rofferr     roff_if(ROFF_ARGS);  static  enum rofferr     roff_block(ROFF_ARGS);
   static  enum rofferr     roff_block_text(ROFF_ARGS);
   static  enum rofferr     roff_block_sub(ROFF_ARGS);
   static  enum rofferr     roff_cblock(ROFF_ARGS);
 static  enum rofferr     roff_ccond(ROFF_ARGS);  static  enum rofferr     roff_ccond(ROFF_ARGS);
 #if 0  static  enum rofferr     roff_if(ROFF_ARGS);
 static  enum rofferr     roff_new_close(ROFF_ARGS);  static  enum rofferr     roff_if_text(ROFF_ARGS);
 static  enum rofferr     roff_new_ig(ROFF_ARGS);  static  enum rofferr     roff_if_sub(ROFF_ARGS);
 static  enum rofferr     roff_sub_ig(ROFF_ARGS);  
 #endif  
   
 const   struct roffmac   roffs[ROFF_MAX] = {  const   struct roffmac   roffs[ROFF_MAX] = {
         { "if", roff_if },          { "am", roff_block, roff_block_text, roff_block_sub, 0 },
         { "\\}", roff_ccond },          { "ami", roff_block, roff_block_text, roff_block_sub, 0 },
 #if 0          { "am1", roff_block, roff_block_text, roff_block_sub, 0 },
         { "am", roff_sub_ig, roff_new_ig },          { "de", roff_block, roff_block_text, roff_block_sub, 0 },
         { "ami", roff_sub_ig, roff_new_ig },          { "dei", roff_block, roff_block_text, roff_block_sub, 0 },
         { "de", roff_sub_ig, roff_new_ig },          { "de1", roff_block, roff_block_text, roff_block_sub, 0 },
         { "dei", roff_sub_ig, roff_new_ig },          { "if", roff_if, roff_if_text, roff_if_sub, ROFFMAC_STRUCT },
         { "ig", roff_sub_ig, roff_new_ig },          { "ig", roff_block, roff_block_text, roff_block_sub, 0 },
         { ".", NULL, roff_new_close },          { ".", roff_cblock, NULL, NULL, 0 },
 #endif          { "\\}", roff_ccond, NULL, NULL, 0 },
 };  };
   
 static  void             roff_free1(struct roff *);  static  void             roff_free1(struct roff *);
 static  enum rofft       roff_hash_find(const char *);  static  enum rofft       roff_hash_find(const char *);
   static  void             roffnode_cleanscope(struct roff *);
 static  int              roffnode_push(struct roff *,  static  int              roffnode_push(struct roff *,
                                 enum rofft, int, int);                                  enum rofft, int, int);
 static  void             roffnode_pop(struct roff *);  static  void             roffnode_pop(struct roff *);
Line 166  roffnode_push(struct roff *r, enum rofft tok, int line
Line 174  roffnode_push(struct roff *r, enum rofft tok, int line
         p->parent = r->last;          p->parent = r->last;
         p->line = line;          p->line = line;
         p->col = col;          p->col = col;
           p->rule = p->parent ? p->parent->rule : ROFFRULE_DENY;
   
         r->last = p;          r->last = p;
         return(1);          return(1);
Line 221  roff_parseln(struct roff *r, int ln, 
Line 230  roff_parseln(struct roff *r, int ln, 
         enum rofft       t;          enum rofft       t;
         int              ppos;          int              ppos;
   
         /* Return when in free text without a context. */          /*
            * First, if a scope is open and we're not a macro, pass the
            * text through the macro's filter.  If a scope isn't open and
            * we're not a macro, just let it through.
            */
   
         if (r->last && ! ROFF_CTL((*bufp)[pos])) {          if (r->last && ! ROFF_CTL((*bufp)[pos])) {
                 /* XXX: this assumes we're just discarding. */                  t = r->last->tok;
                 while (r->last) {                  assert(roffs[t].text);
                         if (r->last->endspan-- < 0)                  return((*roffs[t].text)
                                 break;                                  (r, t, bufp, szp, ln, pos, pos, offs));
                         ROFF_MDEBUG(r, "closing implicit scope");  
                         roffnode_pop(r);  
                 }  
                 return(ROFF_IGN);  
         } else if ( ! ROFF_CTL((*bufp)[pos]))          } else if ( ! ROFF_CTL((*bufp)[pos]))
                 return(ROFF_CONT);                  return(ROFF_CONT);
   
         /* There's nothing on the stack: make us anew. */          /*
            * If a scope is open, go to the child handler for that macro,
            * as it may want to preprocess before doing anything with it.
            */
   
           if (r->last) {
                   t = r->last->tok;
                   assert(roffs[t].sub);
                   return((*roffs[t].sub)
                                   (r, t, bufp, szp, ln, pos, pos, offs));
           }
   
           /*
            * Lastly, as we've no scope open, try to look up and execute
            * the new macro.  If no macro is found, simply return and let
            * the compilers handle it.
            */
   
         ppos = pos;          ppos = pos;
         if (ROFF_MAX == (t = roff_parse(*bufp, &pos)))          if (ROFF_MAX == (t = roff_parse(*bufp, &pos)))
                 return(ROFF_CONT);                  return(ROFF_CONT);
   
         assert(roffs[t].proc);          assert(roffs[t].proc);
         return((*roffs[t].proc)(r, t, bufp, szp, ln, ppos, pos, offs));          return((*roffs[t].proc)
                           (r, t, bufp, szp, ln, ppos, pos, offs));
 }  }
   
   
Line 298  roff_parse(const char *buf, int *pos)
Line 324  roff_parse(const char *buf, int *pos)
 }  }
   
   
 #if 0  
 /* ARGSUSED */  /* ARGSUSED */
 static enum rofferr  static enum rofferr
 roff_sub_ig(ROFF_ARGS)  roff_cblock(ROFF_ARGS)
 {  {
         int              i, j;  
   
         /* Ignore free-text lines. */          /*
            * A block-close `..' should only be invoked as a child of an
            * ignore macro, otherwise raise a warning and just ignore it.
            */
   
         if ('.' != (*bufp)[ppos] && '\'' != (*bufp)[ppos])          if (NULL == r->last) {
                   if ( ! (*r->msg)(MANDOCERR_NOSCOPE, r->data, ln, ppos, NULL))
                           return(ROFF_ERR);
                 return(ROFF_IGN);                  return(ROFF_IGN);
           }
   
         if (r->last->end) {          switch (r->last->tok) {
                 i = ppos + 1;          case (ROFF_am):
                   /* FALLTHROUGH */
           case (ROFF_ami):
                   /* FALLTHROUGH */
           case (ROFF_am1):
                   /* FALLTHROUGH */
           case (ROFF_de):
                   /* FALLTHROUGH */
           case (ROFF_dei):
                   /* FALLTHROUGH */
           case (ROFF_de1):
                   /* FALLTHROUGH */
           case (ROFF_ig):
                   break;
           default:
                   if ( ! (*r->msg)(MANDOCERR_NOSCOPE, r->data, ln, ppos, NULL))
                           return(ROFF_ERR);
                   return(ROFF_IGN);
           }
   
                 while ((*bufp)[i] && ' ' == (*bufp)[i])          if ((*bufp)[pos])
                         i++;                  if ( ! (*r->msg)(MANDOCERR_ARGSLOST, r->data, ln, pos, NULL))
                           return(ROFF_ERR);
   
                 for (j = 0; r->last->end[j]; i++, j++)          roffnode_pop(r);
                         if ((*bufp)[i] != r->last->end[j])          roffnode_cleanscope(r);
                                 return(ROFF_IGN);          return(ROFF_IGN);
   
                 if (r->last->end[j])  }
                         return(ROFF_IGN);  
                 if ((*bufp)[i] && ' ' != (*bufp)[i])  
                         return(ROFF_IGN);  
   
                 while (' ' == (*bufp)[i])  
                         i++;  
   
         } else if (ROFF_close != roff_parse(*bufp, &i))  static void
   roffnode_cleanscope(struct roff *r)
   {
   
           while (r->last) {
                   if (--r->last->endspan < 0)
                           break;
                   roffnode_pop(r);
           }
   }
   
   
   /* ARGSUSED */
   static enum rofferr
   roff_ccond(ROFF_ARGS)
   {
   
           if (NULL == r->last) {
                   if ( ! (*r->msg)(MANDOCERR_NOSCOPE, r->data, ln, ppos, NULL))
                           return(ROFF_ERR);
                 return(ROFF_IGN);                  return(ROFF_IGN);
           }
   
         roffnode_pop(r);          if (ROFF_if != r->last->tok) {
                   if ( ! (*r->msg)(MANDOCERR_NOSCOPE, r->data, ln, ppos, NULL))
                           return(ROFF_ERR);
                   return(ROFF_IGN);
           }
   
         if ('\0' == (*bufp)[i])          if (r->last->endspan > -1) {
                   if ( ! (*r->msg)(MANDOCERR_NOSCOPE, r->data, ln, ppos, NULL))
                           return(ROFF_ERR);
                 return(ROFF_IGN);                  return(ROFF_IGN);
         if ( ! (*r->msg)(MANDOCERR_ARGSLOST, r->data, ln, i, NULL))          }
                 return(ROFF_ERR);  
   
           if ((*bufp)[pos])
                   if ( ! (*r->msg)(MANDOCERR_ARGSLOST, r->data, ln, pos, NULL))
                           return(ROFF_ERR);
   
           roffnode_pop(r);
           roffnode_cleanscope(r);
         return(ROFF_IGN);          return(ROFF_IGN);
 }  }
   
   
 /* ARGSUSED */  /* ARGSUSED */
 static enum rofferr  static enum rofferr
 roff_new_close(ROFF_ARGS)  roff_block(ROFF_ARGS)
 {  {
           int             sv;
           size_t          sz;
   
         if ( ! (*r->msg)(MANDOCERR_NOSCOPE, r->data, ln, ppos, NULL))          if (ROFF_ig != tok && '\0' == (*bufp)[pos]) {
                   if ( ! (*r->msg)(MANDOCERR_NOARGS, r->data, ln, ppos, NULL))
                           return(ROFF_ERR);
                   return(ROFF_IGN);
           } else if (ROFF_ig != tok) {
                   while ((*bufp)[pos] && ' ' != (*bufp)[pos])
                           pos++;
                   while (' ' == (*bufp)[pos])
                           pos++;
           }
   
           if ( ! roffnode_push(r, tok, ln, ppos))
                 return(ROFF_ERR);                  return(ROFF_ERR);
   
           if ('\0' == (*bufp)[pos])
                   return(ROFF_IGN);
   
           sv = pos;
           while ((*bufp)[pos] && ' ' != (*bufp)[pos] &&
                           '\t' != (*bufp)[pos])
                   pos++;
   
           /*
            * Note: groff does NOT like escape characters in the input.
            * Instead of detecting this, we're just going to let it fly and
            * to hell with it.
            */
   
           assert(pos > sv);
           sz = (size_t)(pos - sv);
   
           if (1 == sz && '.' == (*bufp)[sv])
                   return(ROFF_IGN);
   
           r->last->end = malloc(sz + 1);
   
           if (NULL == r->last->end) {
                   (*r->msg)(MANDOCERR_MEM, r->data, ln, pos, NULL);
                   return(ROFF_ERR);
           }
   
           memcpy(r->last->end, *bufp + sv, sz);
           r->last->end[(int)sz] = '\0';
   
           if ((*bufp)[pos])
                   if ( ! (*r->msg)(MANDOCERR_ARGSLOST, r->data, ln, pos, NULL))
                           return(ROFF_ERR);
   
         return(ROFF_IGN);          return(ROFF_IGN);
 }  }
 #endif  
   
   
 /* ARGSUSED */  /* ARGSUSED */
 static enum rofferr  static enum rofferr
 roff_ccond(ROFF_ARGS)  roff_if_sub(ROFF_ARGS)
 {  {
           enum rofft       t;
           enum roffrule    rr;
   
         if (NULL == r->last || ROFF_if != r->last->tok || r->last->endspan > -1) {          ppos = pos;
                 if ( ! (*r->msg)(MANDOCERR_NOSCOPE, r->data, ln, ppos, NULL))          rr = r->last->rule;
                         return(ROFF_ERR);          roffnode_cleanscope(r);
                 return(ROFF_IGN);  
           if (ROFF_MAX == (t = roff_parse(*bufp, &pos)))
                   return(ROFFRULE_DENY == rr ? ROFF_IGN : ROFF_CONT);
   
           /*
            * A denied conditional must evaluate its children if and only
            * if they're either structurally required (such as loops and
            * conditionals) or a closing macro.
            */
           if (ROFFRULE_DENY == rr)
                   if ( ! (ROFFMAC_STRUCT & roffs[t].flags))
                           if (ROFF_ccond != t)
                                   return(ROFF_IGN);
   
           assert(roffs[t].proc);
           return((*roffs[t].proc)
                           (r, t, bufp, szp, ln, ppos, pos, offs));
   }
   
   
   /* ARGSUSED */
   static enum rofferr
   roff_block_sub(ROFF_ARGS)
   {
           enum rofft      t;
           int             i, j;
   
           /*
            * First check whether a custom macro exists at this level.  If
            * it does, then check against it.  This is some of groff's
            * stranger behaviours.  If we encountered a custom end-scope
            * tag and that tag also happens to be a "real" macro, then we
            * need to try interpreting it again as a real macro.  If it's
            * not, then return ignore.  Else continue.
            */
   
           if (r->last->end) {
                   i = pos + 1;
                   while (' ' == (*bufp)[i] || '\t' == (*bufp)[i])
                           i++;
   
                   for (j = 0; r->last->end[j]; j++, i++)
                           if ((*bufp)[i] != r->last->end[j])
                                   break;
   
                   if ('\0' == r->last->end[j] &&
                                   ('\0' == (*bufp)[i] ||
                                    ' ' == (*bufp)[i] ||
                                    '\t' == (*bufp)[i])) {
                           roffnode_pop(r);
                           roffnode_cleanscope(r);
   
                           if (ROFF_MAX != roff_parse(*bufp, &pos))
                                   return(ROFF_RERUN);
                           return(ROFF_IGN);
                   }
         }          }
   
         ROFF_MDEBUG(r, "closing explicit scope");          /*
         roffnode_pop(r);           * If we have no custom end-query or lookup failed, then try
            * pulling it out of the hashtable.
            */
   
         while (r->last) {          ppos = pos;
                 if (--r->last->endspan < 0)          t = roff_parse(*bufp, &pos);
                         break;  
   
                 ROFF_MDEBUG(r, "closing implicit scope");          /* If we're not a comment-end, then throw it away. */
                 roffnode_pop(r);          if (ROFF_cblock != t)
                   return(ROFF_IGN);
   
           assert(roffs[t].proc);
           return((*roffs[t].proc)(r, t, bufp,
                           szp, ln, ppos, pos, offs));
   }
   
   
   /* ARGSUSED */
   static enum rofferr
   roff_block_text(ROFF_ARGS)
   {
   
           return(ROFF_IGN);
   }
   
   
   /* ARGSUSED */
   static enum rofferr
   roff_if_text(ROFF_ARGS)
   {
           char            *ep, *st;
   
           st = &(*bufp)[pos];
           if (NULL == (ep = strstr(st, "\\}"))) {
                   roffnode_cleanscope(r);
                   return(ROFF_IGN);
         }          }
   
           if (ep > st && '\\' != *(ep - 1))
                   roffnode_pop(r);
   
           roffnode_cleanscope(r);
         return(ROFF_IGN);          return(ROFF_IGN);
 }  }
   
Line 385  roff_ccond(ROFF_ARGS)
Line 595  roff_ccond(ROFF_ARGS)
 static enum rofferr  static enum rofferr
 roff_if(ROFF_ARGS)  roff_if(ROFF_ARGS)
 {  {
           int              sv;
   
         /*          /*
          * Read ahead past the conditional.           * Read ahead past the conditional.
Line 393  roff_if(ROFF_ARGS)
Line 604  roff_if(ROFF_ARGS)
          * It's good enough for now, however.           * It's good enough for now, however.
          */           */
   
         if ( ! roffnode_push(r, tok, ln, ppos))  
                 return(ROFF_ERR);  
   
         while ((*bufp)[pos] && ' ' != (*bufp)[pos])          while ((*bufp)[pos] && ' ' != (*bufp)[pos])
                 pos++;                  pos++;
   
           sv = pos;
         while (' ' == (*bufp)[pos])          while (' ' == (*bufp)[pos])
                 pos++;                  pos++;
   
           /*
            * Roff is weird.  If we have just white-space after the
            * conditional, it's considered the BODY and we exit without
            * really doing anything.  Warn about this.  It's probably
            * wrong.
            */
   
           if ('\0' == (*bufp)[pos] && sv != pos) {
                   if ( ! (*r->msg)(MANDOCERR_NOARGS, r->data, ln, ppos, NULL))
                           return(ROFF_ERR);
                   return(ROFF_IGN);
           }
   
           if ( ! roffnode_push(r, tok, ln, ppos))
                   return(ROFF_ERR);
   
         /* Don't evaluate: just assume NO. */          /* Don't evaluate: just assume NO. */
   
         r->last->endspan = 1;          r->last->endspan = 1;
   
         if ('\\' == (*bufp)[pos] && '{' == (*bufp)[pos + 1]) {          if ('\\' == (*bufp)[pos] && '{' == (*bufp)[pos + 1]) {
                 ROFF_MDEBUG(r, "opening explicit scope");  
                 r->last->endspan = -1;                  r->last->endspan = -1;
                 pos += 2;                  pos += 2;
         } else          }
                 ROFF_MDEBUG(r, "opening implicit scope");  
   
         if ('\0' == (*bufp)[pos])  
                 return(ROFF_IGN);  
   
         *offs = pos;  
         return(ROFF_RERUN);  
 }  
   
   
 #if 0  
 static enum rofferr  
 roff_new_ig(ROFF_ARGS)  
 {  
         int              i;  
   
         if ( ! roffnode_push(r, tok, ln, ppos))  
                 return(ROFF_ERR);  
   
         /*          /*
          * Other macros (not `ig') using this routine have additional           * If there are no arguments on the line, the next-line scope is
          * crap here that we discard.           * assumed.
          */           */
   
         if (ROFF_ig != tok) {          if ('\0' == (*bufp)[pos])
                 while ((*bufp)[ppos] && ' ' != (*bufp)[ppos])  
                         ppos++;  
                 while (' ' == (*bufp)[ppos])  
                         ppos++;  
         }  
   
         i = (int)ppos;  
   
         while ((*bufp)[i] && ' ' != (*bufp)[i])  
                 i++;  
   
         if (i == (int)ppos)  
                 return(ROFF_IGN);                  return(ROFF_IGN);
   
         if ((*bufp)[i])          /* Otherwise re-run the roff parser after recalculating. */
                 if ( ! (*r->msg)(MANDOCERR_ARGSLOST, r->data, ln, i, NULL))  
                         return(ROFF_ERR);  
   
         /*          *offs = pos;
          * If the macro has arguments, the first argument (up to the          return(ROFF_RERUN);
          * next whitespace) is interpreted as an argument marking the  
          * macro close.  Thus, `.ig foo' will close at `.foo'.  
          *  
          * NOTE: the closing macro `.foo' in the above case is not  
          * allowed to have leading spaces with old groff!  Thus `.foo'  
          * != `. foo'.  Oh yeah, everything after the `.foo' is lost.  
          * Merry fucking Christmas.  
          */  
   
         r->last->end = malloc((size_t)(i - ppos) + 1);  
         if (NULL == r->last->end) {  
                 (*r->msg)(MANDOCERR_MEM, r->data, ln, ppos, NULL);  
                 return(ROFF_ERR);  
         }  
   
         memcpy(r->last->end, &(*bufp)[ppos], (size_t)(i - ppos));  
         r->last->end[i - ppos] = '\0';  
   
         return(ROFF_IGN);  
 }  }
 #endif  

Legend:
Removed from v.1.75  
changed lines
  Added in v.1.81

CVSweb