[BACK]Return to roff.c CVS log [TXT][DIR] Up to [cvsweb.bsd.lv] / mandoc

Diff for /mandoc/roff.c between version 1.84 and 1.89

version 1.84, 2010/05/24 23:54:18 version 1.89, 2010/06/26 15:22:19
Line 19 
Line 19 
 #endif  #endif
   
 #include <assert.h>  #include <assert.h>
   #include <errno.h>
   #include <ctype.h>
   #include <limits.h>
 #include <stdlib.h>  #include <stdlib.h>
 #include <string.h>  #include <string.h>
 #include <stdio.h>  #include <stdio.h>
   
 #include "mandoc.h"  #include "mandoc.h"
   #include "regs.h"
 #include "roff.h"  #include "roff.h"
   
 #define RSTACK_MAX      128  #define RSTACK_MAX      128
Line 31 
Line 35 
 #define ROFF_CTL(c) \  #define ROFF_CTL(c) \
         ('.' == (c) || '\'' == (c))          ('.' == (c) || '\'' == (c))
   
   #if 1
   #define ROFF_DEBUG(fmt, args...) \
           do { /* Nothing. */ } while (/*CONSTCOND*/ 0)
   #else
   #define ROFF_DEBUG(fmt, args...) \
           do { fprintf(stderr, fmt , ##args); } while (/*CONSTCOND*/ 0)
   #endif
   
 enum    rofft {  enum    rofft {
         ROFF_am,          ROFF_am,
         ROFF_ami,          ROFF_ami,
Line 47  enum rofft {
Line 59  enum rofft {
         ROFF_tr,          ROFF_tr,
         ROFF_cblock,          ROFF_cblock,
         ROFF_ccond,          ROFF_ccond,
           ROFF_nr,
         ROFF_MAX          ROFF_MAX
 };  };
   
Line 74  struct roffnode {
Line 87  struct roffnode {
 };  };
   
 #define ROFF_ARGS        struct roff *r, /* parse ctx */ \  #define ROFF_ARGS        struct roff *r, /* parse ctx */ \
                            struct regset *regs, /* registers */ \
                          enum rofft tok, /* tok of macro */ \                           enum rofft tok, /* tok of macro */ \
                          char **bufp, /* input buffer */ \                           char **bufp, /* input buffer */ \
                          size_t *szp, /* size of input buffer */ \                           size_t *szp, /* size of input buffer */ \
Line 91  struct roffmac {
Line 105  struct roffmac {
         roffproc         sub; /* process as child of macro */          roffproc         sub; /* process as child of macro */
         int              flags;          int              flags;
 #define ROFFMAC_STRUCT  (1 << 0) /* always interpret */  #define ROFFMAC_STRUCT  (1 << 0) /* always interpret */
           struct roffmac  *next;
 };  };
   
 static  enum rofferr     roff_block(ROFF_ARGS);  static  enum rofferr     roff_block(ROFF_ARGS);
Line 102  static enum rofferr  roff_cond(ROFF_ARGS);
Line 117  static enum rofferr  roff_cond(ROFF_ARGS);
 static  enum rofferr     roff_cond_text(ROFF_ARGS);  static  enum rofferr     roff_cond_text(ROFF_ARGS);
 static  enum rofferr     roff_cond_sub(ROFF_ARGS);  static  enum rofferr     roff_cond_sub(ROFF_ARGS);
 static  enum rofferr     roff_line(ROFF_ARGS);  static  enum rofferr     roff_line(ROFF_ARGS);
   static  enum rofferr     roff_nr(ROFF_ARGS);
   static  enum roffrule    roff_evalcond(const char *, int *);
   
 const   struct roffmac   roffs[ROFF_MAX] = {  /* See roff_hash_find() */
         { "am", roff_block, roff_block_text, roff_block_sub, 0 },  
         { "ami", roff_block, roff_block_text, roff_block_sub, 0 },  #define ASCII_HI         126
         { "am1", roff_block, roff_block_text, roff_block_sub, 0 },  #define ASCII_LO         33
         { "de", roff_block, roff_block_text, roff_block_sub, 0 },  #define HASHWIDTH       (ASCII_HI - ASCII_LO + 1)
         { "dei", roff_block, roff_block_text, roff_block_sub, 0 },  
         { "de1", roff_block, roff_block_text, roff_block_sub, 0 },  static  struct roffmac  *hash[HASHWIDTH];
         { "ds", roff_line, NULL, NULL, 0 },  
         { "el", roff_cond, roff_cond_text, roff_cond_sub, ROFFMAC_STRUCT },  static  struct roffmac   roffs[ROFF_MAX] = {
         { "ie", roff_cond, roff_cond_text, roff_cond_sub, ROFFMAC_STRUCT },          { "am", roff_block, roff_block_text, roff_block_sub, 0, NULL },
         { "if", roff_cond, roff_cond_text, roff_cond_sub, ROFFMAC_STRUCT },          { "ami", roff_block, roff_block_text, roff_block_sub, 0, NULL },
         { "ig", roff_block, roff_block_text, roff_block_sub, 0 },          { "am1", roff_block, roff_block_text, roff_block_sub, 0, NULL },
         { "rm", roff_line, NULL, NULL, 0 },          { "de", roff_block, roff_block_text, roff_block_sub, 0, NULL },
         { "tr", roff_line, NULL, NULL, 0 },          { "dei", roff_block, roff_block_text, roff_block_sub, 0, NULL },
         { ".", roff_cblock, NULL, NULL, 0 },          { "de1", roff_block, roff_block_text, roff_block_sub, 0, NULL },
         { "\\}", roff_ccond, NULL, NULL, 0 },          { "ds", roff_line, NULL, NULL, 0, NULL },
           { "el", roff_cond, roff_cond_text, roff_cond_sub, ROFFMAC_STRUCT, NULL },
           { "ie", roff_cond, roff_cond_text, roff_cond_sub, ROFFMAC_STRUCT, NULL },
           { "if", roff_cond, roff_cond_text, roff_cond_sub, ROFFMAC_STRUCT, NULL },
           { "ig", roff_block, roff_block_text, roff_block_sub, 0, NULL },
           { "rm", roff_line, NULL, NULL, 0, NULL },
           { "tr", roff_line, NULL, NULL, 0, NULL },
           { ".", roff_cblock, NULL, NULL, 0, NULL },
           { "\\}", roff_ccond, NULL, NULL, 0, NULL },
           { "nr", roff_nr, NULL, NULL, 0, NULL },
 };  };
   
 static  void             roff_free1(struct roff *);  static  void             roff_free1(struct roff *);
 static  enum rofft       roff_hash_find(const char *);  static  enum rofft       roff_hash_find(const char *);
   static  void             roff_hash_init(void);
 static  void             roffnode_cleanscope(struct roff *);  static  void             roffnode_cleanscope(struct roff *);
 static  int              roffnode_push(struct roff *,  static  int              roffnode_push(struct roff *,
                                 enum rofft, int, int);                                  enum rofft, int, int);
 static  void             roffnode_pop(struct roff *);  static  void             roffnode_pop(struct roff *);
 static  enum rofft       roff_parse(const char *, int *);  static  enum rofft       roff_parse(const char *, int *);
   static  int              roff_parse_nat(const char *, int *);
   
   /* See roff_hash_find() */
   #define ROFF_HASH(p)    (p[0] - ASCII_LO)
   
   static void
   roff_hash_init(void)
   {
           struct roffmac   *n;
           int               buc, i;
   
           for (i = 0; i < (int)ROFF_MAX; i++) {
                   assert(roffs[i].name[0] >= ASCII_LO);
                   assert(roffs[i].name[0] <= ASCII_HI);
   
                   buc = ROFF_HASH(roffs[i].name);
   
                   if (NULL != (n = hash[buc])) {
                           for ( ; n->next; n = n->next)
                                   /* Do nothing. */ ;
                           n->next = &roffs[i];
                   } else
                           hash[buc] = &roffs[i];
           }
   }
   
   
 /*  /*
  * Look up a roff token by its name.  Returns ROFF_MAX if no macro by   * Look up a roff token by its name.  Returns ROFF_MAX if no macro by
  * the nil-terminated string name could be found.   * the nil-terminated string name could be found.
Line 137  static enum rofft  roff_parse(const char *, int *);
Line 189  static enum rofft  roff_parse(const char *, int *);
 static enum rofft  static enum rofft
 roff_hash_find(const char *p)  roff_hash_find(const char *p)
 {  {
         int              i;          int              buc;
           struct roffmac  *n;
   
         /* FIXME: make this be fast and efficient. */          /*
            * libroff has an extremely simple hashtable, for the time
            * being, which simply keys on the first character, which must
            * be printable, then walks a chain.  It works well enough until
            * optimised.
            */
   
         for (i = 0; i < (int)ROFF_MAX; i++)          if (p[0] < ASCII_LO || p[0] > ASCII_HI)
                 if (0 == strcmp(roffs[i].name, p))                  return(ROFF_MAX);
                         return((enum rofft)i);  
   
           buc = ROFF_HASH(p);
   
           if (NULL == (n = hash[buc]))
                   return(ROFF_MAX);
           for ( ; n; n = n->next)
                   if (0 == strcmp(n->name, p))
                           return((enum rofft)(n - roffs));
   
         return(ROFF_MAX);          return(ROFF_MAX);
 }  }
   
Line 236  roff_alloc(const mandocmsg msg, void *data)
Line 301  roff_alloc(const mandocmsg msg, void *data)
         r->msg = msg;          r->msg = msg;
         r->data = data;          r->data = data;
         r->rstackpos = -1;          r->rstackpos = -1;
   
           roff_hash_init();
         return(r);          return(r);
 }  }
   
   
 enum rofferr  enum rofferr
 roff_parseln(struct roff *r, int ln,  roff_parseln(struct roff *r, struct regset *regs, int ln,
                 char **bufp, size_t *szp, int pos, int *offs)                  char **bufp, size_t *szp, int pos, int *offs)
 {  {
         enum rofft       t;          enum rofft       t;
Line 256  roff_parseln(struct roff *r, int ln, 
Line 323  roff_parseln(struct roff *r, int ln, 
         if (r->last && ! ROFF_CTL((*bufp)[pos])) {          if (r->last && ! ROFF_CTL((*bufp)[pos])) {
                 t = r->last->tok;                  t = r->last->tok;
                 assert(roffs[t].text);                  assert(roffs[t].text);
                   ROFF_DEBUG("roff: intercept scoped text: %s, [%s]\n",
                                   roffs[t].name, &(*bufp)[pos]);
                 return((*roffs[t].text)                  return((*roffs[t].text)
                                 (r, t, bufp, szp, ln, pos, pos, offs));                                  (r, regs, t, bufp,
         } else if ( ! ROFF_CTL((*bufp)[pos]))                                   szp, ln, pos, pos, offs));
           } else if ( ! ROFF_CTL((*bufp)[pos])) {
                   ROFF_DEBUG("roff: pass non-scoped text: [%s]\n",
                                   &(*bufp)[pos]);
                 return(ROFF_CONT);                  return(ROFF_CONT);
           }
   
         /*          /*
          * If a scope is open, go to the child handler for that macro,           * If a scope is open, go to the child handler for that macro,
Line 269  roff_parseln(struct roff *r, int ln, 
Line 342  roff_parseln(struct roff *r, int ln, 
         if (r->last) {          if (r->last) {
                 t = r->last->tok;                  t = r->last->tok;
                 assert(roffs[t].sub);                  assert(roffs[t].sub);
                   ROFF_DEBUG("roff: intercept scoped context: %s\n",
                                   roffs[t].name);
                 return((*roffs[t].sub)                  return((*roffs[t].sub)
                                 (r, t, bufp, szp, ln, pos, pos, offs));                                  (r, regs, t, bufp,
                                    szp, ln, pos, pos, offs));
         }          }
   
         /*          /*
Line 280  roff_parseln(struct roff *r, int ln, 
Line 356  roff_parseln(struct roff *r, int ln, 
          */           */
   
         ppos = pos;          ppos = pos;
         if (ROFF_MAX == (t = roff_parse(*bufp, &pos)))          if (ROFF_MAX == (t = roff_parse(*bufp, &pos))) {
                   ROFF_DEBUG("roff: pass non-scoped non-macro: [%s]\n",
                                   &(*bufp)[pos]);
                 return(ROFF_CONT);                  return(ROFF_CONT);
           }
   
           ROFF_DEBUG("roff: intercept new-scope: %s, [%s]\n",
                           roffs[t].name, &(*bufp)[pos]);
         assert(roffs[t].proc);          assert(roffs[t].proc);
         return((*roffs[t].proc)          return((*roffs[t].proc)
                         (r, t, bufp, szp, ln, ppos, pos, offs));                          (r, regs, t, bufp,
                            szp, ln, ppos, pos, offs));
 }  }
   
   
Line 341  roff_parse(const char *buf, int *pos)
Line 423  roff_parse(const char *buf, int *pos)
 }  }
   
   
   static int
   roff_parse_nat(const char *buf, int *res)
   {
           char            *ep;
           long             lval;
   
           errno = 0;
           lval = strtol(buf, &ep, 10);
           if (buf[0] == '\0' || *ep != '\0')
                   return(0);
           if ((errno == ERANGE &&
                           (lval == LONG_MAX || lval == LONG_MIN)) ||
                           (lval > INT_MAX || lval <= 0))
                   return(0);
   
           *res = (int)lval;
           return(1);
   }
   
   
 /* ARGSUSED */  /* ARGSUSED */
 static enum rofferr  static enum rofferr
 roff_cblock(ROFF_ARGS)  roff_cblock(ROFF_ARGS)
Line 551  roff_block_sub(ROFF_ARGS)
Line 653  roff_block_sub(ROFF_ARGS)
                 return(ROFF_IGN);                  return(ROFF_IGN);
   
         assert(roffs[t].proc);          assert(roffs[t].proc);
         return((*roffs[t].proc)(r, t, bufp,          return((*roffs[t].proc)(r, regs, t, bufp,
                         szp, ln, ppos, pos, offs));                          szp, ln, ppos, pos, offs));
 }  }
   
Line 571  roff_cond_sub(ROFF_ARGS)
Line 673  roff_cond_sub(ROFF_ARGS)
 {  {
         enum rofft       t;          enum rofft       t;
         enum roffrule    rr;          enum roffrule    rr;
           struct roffnode *l;
   
         ppos = pos;          ppos = pos;
         rr = r->last->rule;          rr = r->last->rule;
   
         roff_cond_text(r, tok, bufp, szp, ln, ppos, pos, offs);          /*
            * Clean out scope.  If we've closed ourselves, then don't
            * continue.
            */
   
           l = r->last;
           roffnode_cleanscope(r);
   
           if (l != r->last)
                   return(ROFFRULE_DENY == rr ? ROFF_IGN : ROFF_CONT);
   
         if (ROFF_MAX == (t = roff_parse(*bufp, &pos)))          if (ROFF_MAX == (t = roff_parse(*bufp, &pos)))
                 return(ROFFRULE_DENY == rr ? ROFF_IGN : ROFF_CONT);                  return(ROFFRULE_DENY == rr ? ROFF_IGN : ROFF_CONT);
   
Line 592  roff_cond_sub(ROFF_ARGS)
Line 704  roff_cond_sub(ROFF_ARGS)
   
         assert(roffs[t].proc);          assert(roffs[t].proc);
         return((*roffs[t].proc)          return((*roffs[t].proc)
                         (r, t, bufp, szp, ln, ppos, pos, offs));                          (r, regs, t, bufp, szp, ln, ppos, pos, offs));
 }  }
   
   
Line 616  roff_cond_text(ROFF_ARGS)
Line 728  roff_cond_text(ROFF_ARGS)
                 return(ROFFRULE_DENY == rr ? ROFF_IGN : ROFF_CONT);                  return(ROFFRULE_DENY == rr ? ROFF_IGN : ROFF_CONT);
         }          }
   
         if (ep > st && '\\' != *(ep - 1)) {          if (ep == st || (ep > st && '\\' != *(ep - 1)))
                 ep = '\0';  
                 roffnode_pop(r);                  roffnode_pop(r);
         }  
   
         roffnode_cleanscope(r);          roffnode_cleanscope(r);
         return(ROFFRULE_DENY == rr ? ROFF_IGN : ROFF_CONT);          return(ROFFRULE_DENY == rr ? ROFF_IGN : ROFF_CONT);
 }  }
   
   
   static enum roffrule
   roff_evalcond(const char *v, int *pos)
   {
   
           switch (v[*pos]) {
           case ('n'):
                   (*pos)++;
                   return(ROFFRULE_ALLOW);
           case ('e'):
                   /* FALLTHROUGH */
           case ('o'):
                   /* FALLTHROUGH */
           case ('t'):
                   (*pos)++;
                   return(ROFFRULE_DENY);
           default:
                   break;
           }
   
           while (v[*pos] && ' ' != v[*pos])
                   (*pos)++;
           return(ROFFRULE_DENY);
   }
   
   
 /* ARGSUSED */  /* ARGSUSED */
 static enum rofferr  static enum rofferr
   roff_line(ROFF_ARGS)
   {
   
           return(ROFF_IGN);
   }
   
   
   /* ARGSUSED */
   static enum rofferr
 roff_cond(ROFF_ARGS)  roff_cond(ROFF_ARGS)
 {  {
         int              cpos;  /* position of the condition */  
         int              sv;          int              sv;
           enum roffrule    rule;
   
         /* Stack overflow! */          /* Stack overflow! */
   
Line 640  roff_cond(ROFF_ARGS)
Line 784  roff_cond(ROFF_ARGS)
                 return(ROFF_ERR);                  return(ROFF_ERR);
         }          }
   
         cpos = pos;          /* First, evaluate the conditional. */
   
         if (ROFF_if == tok || ROFF_ie == tok) {          if (ROFF_el == tok) {
                 /*                  /*
                  * Read ahead past the conditional.  FIXME: this does                   * An `.el' will get the value of the current rstack
                  * not work, as conditionals don't end on whitespace,                   * entry set in prior `ie' calls or defaults to DENY.
                  * but are parsed according to a formal grammar.  It's                   */
                  * good enough for now, however.                  if (r->rstackpos < 0)
                  */                          rule = ROFFRULE_DENY;
                 while ((*bufp)[pos] && ' ' != (*bufp)[pos])                  else
                         pos++;                          rule = r->rstack[r->rstackpos];
         }          } else
                   rule = roff_evalcond(*bufp, &pos);
   
         sv = pos;          sv = pos;
   
         while (' ' == (*bufp)[pos])          while (' ' == (*bufp)[pos])
                 pos++;                  pos++;
   
Line 663  roff_cond(ROFF_ARGS)
Line 809  roff_cond(ROFF_ARGS)
          * really doing anything.  Warn about this.  It's probably           * really doing anything.  Warn about this.  It's probably
          * wrong.           * wrong.
          */           */
   
         if ('\0' == (*bufp)[pos] && sv != pos) {          if ('\0' == (*bufp)[pos] && sv != pos) {
                 if ( ! (*r->msg)(MANDOCERR_NOARGS, r->data, ln, ppos, NULL))                  if ((*r->msg)(MANDOCERR_NOARGS, r->data, ln, ppos, NULL))
                         return(ROFF_ERR);                          return(ROFF_IGN);
                 return(ROFF_IGN);                  return(ROFF_ERR);
         }          }
   
         if ( ! roffnode_push(r, tok, ln, ppos))          if ( ! roffnode_push(r, tok, ln, ppos))
                 return(ROFF_ERR);                  return(ROFF_ERR);
   
         /* XXX: Implement more conditionals. */          r->last->rule = rule;
   
         if (ROFF_if == tok || ROFF_ie == tok)          ROFF_DEBUG("roff: cond: %s -> %s\n", roffs[tok].name,
                 r->last->rule = 'n' == (*bufp)[cpos] ?                          ROFFRULE_ALLOW == rule ?  "allow" : "deny");
                     ROFFRULE_ALLOW : ROFFRULE_DENY;  
         else if (ROFF_el == tok) {  
                 /*  
                  * An `.el' will get the value of the current rstack  
                  * entry set in prior `ie' calls or defaults to DENY.  
                  */  
                 if (r->rstackpos < 0)  
                         r->last->rule = ROFFRULE_DENY;  
                 else  
                         r->last->rule = r->rstack[r->rstackpos];  
         }  
         if (ROFF_ie == tok) {          if (ROFF_ie == tok) {
                 /*                  /*
                  * An if-else will put the NEGATION of the current                   * An if-else will put the NEGATION of the current
Line 698  roff_cond(ROFF_ARGS)
Line 835  roff_cond(ROFF_ARGS)
                 else                  else
                         r->rstack[r->rstackpos] = ROFFRULE_DENY;                          r->rstack[r->rstackpos] = ROFFRULE_DENY;
         }          }
         if (r->last->parent && ROFFRULE_DENY == r->last->parent->rule)  
           /* If the parent has false as its rule, then so do we. */
   
           if (r->last->parent && ROFFRULE_DENY == r->last->parent->rule) {
                 r->last->rule = ROFFRULE_DENY;                  r->last->rule = ROFFRULE_DENY;
                   ROFF_DEBUG("roff: cond override: %s -> deny\n",
                                   roffs[tok].name);
           }
   
           /*
            * Determine scope.  If we're invoked with "\{" trailing the
            * conditional, then we're in a multiline scope.  Else our scope
            * expires on the next line.
            */
   
         r->last->endspan = 1;          r->last->endspan = 1;
   
         if ('\\' == (*bufp)[pos] && '{' == (*bufp)[pos + 1]) {          if ('\\' == (*bufp)[pos] && '{' == (*bufp)[pos + 1]) {
                 r->last->endspan = -1;                  r->last->endspan = -1;
                 pos += 2;                  pos += 2;
         }                  ROFF_DEBUG("roff: cond-scope: %s, multi-line\n",
                                   roffs[tok].name);
           } else
                   ROFF_DEBUG("roff: cond-scope: %s, one-line\n",
                                   roffs[tok].name);
   
         /*          /*
          * If there are no arguments on the line, the next-line scope is           * If there are no arguments on the line, the next-line scope is
Line 725  roff_cond(ROFF_ARGS)
Line 878  roff_cond(ROFF_ARGS)
   
 /* ARGSUSED */  /* ARGSUSED */
 static enum rofferr  static enum rofferr
 roff_line(ROFF_ARGS)  roff_nr(ROFF_ARGS)
 {  {
           const char      *key, *val;
   
           key = &(*bufp)[pos];
   
           /* Parse register request. */
           while ((*bufp)[pos] && ' ' != (*bufp)[pos])
                   pos++;
   
           /*
            * Set our nil terminator.  Because this line is going to be
            * ignored anyway, we can munge it as we please.
            */
           if ((*bufp)[pos])
                   (*bufp)[pos++] = '\0';
   
           /* Skip whitespace to register token. */
           while ((*bufp)[pos] && ' ' == (*bufp)[pos])
                   pos++;
   
           val = &(*bufp)[pos];
   
           /* Process register token. */
   
           if (0 == strcmp(key, "nS")) {
                   if ( ! roff_parse_nat(val, &regs->regs[(int)REG_nS].i))
                           regs->regs[(int)REG_nS].i = 0;
   
                   ROFF_DEBUG("roff: register nS: %d\n",
                                   regs->regs[(int)REG_nS].i);
           } else
                   ROFF_DEBUG("roff: ignoring register: %s\n", key);
   
         return(ROFF_IGN);          return(ROFF_IGN);
 }  }

Legend:
Removed from v.1.84  
changed lines
  Added in v.1.89

CVSweb