[BACK]Return to roff.c CVS log [TXT][DIR] Up to [cvsweb.bsd.lv] / mandoc

Diff for /mandoc/roff.c between version 1.154 and 1.167

version 1.154, 2011/07/27 07:09:41 version 1.167, 2011/07/29 10:16:59
Line 77  enum roffrule {
Line 77  enum roffrule {
  * Registers are assumed to be unsigned ints for now.   * Registers are assumed to be unsigned ints for now.
  */   */
 struct  reg {  struct  reg {
         int               set; /* whether set or not */          int              set; /* whether set or not */
         unsigned int      u; /* unsigned integer */          unsigned int     u; /* unsigned integer */
 };  };
   
   /*
    * An incredibly-simple string buffer.
    */
 struct  roffstr {  struct  roffstr {
         char            *name; /* key of symbol */          char            *p; /* nil-terminated buffer */
         char            *string; /* current value */          size_t           sz; /* saved strlen(p) */
         struct roffstr  *next; /* next in list */  
 };  };
   
   /*
    * A key-value roffstr pair as part of a singly-linked list.
    */
   struct  roffkv {
           struct roffstr   key;
           struct roffstr   val;
           struct roffkv   *next; /* next in list */
   };
   
 struct  roff {  struct  roff {
         struct mparse   *parse; /* parse point */          struct mparse   *parse; /* parse point */
         struct roffnode *last; /* leaf of stack */          struct roffnode *last; /* leaf of stack */
         enum roffrule    rstack[RSTACK_MAX]; /* stack of !`ie' rules */          enum roffrule    rstack[RSTACK_MAX]; /* stack of !`ie' rules */
         int              rstackpos; /* position in rstack */          int              rstackpos; /* position in rstack */
         struct reg       regs[REG__MAX];          struct reg       regs[REG__MAX];
         struct roffstr  *first_string; /* user-defined strings & macros */          struct roffkv   *strtab; /* user-defined strings & macros */
           struct roffkv   *xmbtab; /* multi-byte trans table (`tr') */
           struct roffstr  *xtab; /* single-byte trans table (`tr') */
         const char      *current_string; /* value of last called user macro */          const char      *current_string; /* value of last called user macro */
         struct tbl_node *first_tbl; /* first table parsed */          struct tbl_node *first_tbl; /* first table parsed */
         struct tbl_node *last_tbl; /* last table parsed */          struct tbl_node *last_tbl; /* last table parsed */
Line 143  struct predef {
Line 156  struct predef {
 #define PREDEF(__name, __str) \  #define PREDEF(__name, __str) \
         { (__name), (__str) },          { (__name), (__str) },
   
   static  enum rofft       roffhash_find(const char *, size_t);
   static  void             roffhash_init(void);
   static  void             roffnode_cleanscope(struct roff *);
   static  void             roffnode_pop(struct roff *);
   static  void             roffnode_push(struct roff *, enum rofft,
                                   const char *, int, int);
 static  enum rofferr     roff_block(ROFF_ARGS);  static  enum rofferr     roff_block(ROFF_ARGS);
 static  enum rofferr     roff_block_text(ROFF_ARGS);  static  enum rofferr     roff_block_text(ROFF_ARGS);
 static  enum rofferr     roff_block_sub(ROFF_ARGS);  static  enum rofferr     roff_block_sub(ROFF_ARGS);
Line 153  static enum rofferr  roff_cond_text(ROFF_ARGS);
Line 172  static enum rofferr  roff_cond_text(ROFF_ARGS);
 static  enum rofferr     roff_cond_sub(ROFF_ARGS);  static  enum rofferr     roff_cond_sub(ROFF_ARGS);
 static  enum rofferr     roff_ds(ROFF_ARGS);  static  enum rofferr     roff_ds(ROFF_ARGS);
 static  enum roffrule    roff_evalcond(const char *, int *);  static  enum roffrule    roff_evalcond(const char *, int *);
 static  void             roff_freestr(struct roff *);  static  void             roff_free1(struct roff *);
   static  void             roff_freestr(struct roffkv *);
 static  char            *roff_getname(struct roff *, char **, int, int);  static  char            *roff_getname(struct roff *, char **, int, int);
 static  const char      *roff_getstrn(const struct roff *,  static  const char      *roff_getstrn(const struct roff *,
                                 const char *, size_t);                                  const char *, size_t);
 static  enum rofferr     roff_line_ignore(ROFF_ARGS);  static  enum rofferr     roff_line_ignore(ROFF_ARGS);
 static  enum rofferr     roff_nr(ROFF_ARGS);  static  enum rofferr     roff_nr(ROFF_ARGS);
   static  void             roff_openeqn(struct roff *, const char *,
                                   int, int, const char *);
   static  enum rofft       roff_parse(struct roff *, const char *, int *);
   static  enum rofferr     roff_parsetext(char *);
 static  void             roff_res(struct roff *,  static  void             roff_res(struct roff *,
                                 char **, size_t *, int, int);                                  char **, size_t *, int, int);
 static  enum rofferr     roff_rm(ROFF_ARGS);  static  enum rofferr     roff_rm(ROFF_ARGS);
 static  void             roff_setstr(struct roff *,  static  void             roff_setstr(struct roff *,
                                 const char *, const char *, int);                                  const char *, const char *, int);
   static  void             roff_setstrn(struct roffkv **, const char *,
                                   size_t, const char *, size_t, int);
 static  enum rofferr     roff_so(ROFF_ARGS);  static  enum rofferr     roff_so(ROFF_ARGS);
   static  enum rofferr     roff_tr(ROFF_ARGS);
 static  enum rofferr     roff_TE(ROFF_ARGS);  static  enum rofferr     roff_TE(ROFF_ARGS);
 static  enum rofferr     roff_TS(ROFF_ARGS);  static  enum rofferr     roff_TS(ROFF_ARGS);
 static  enum rofferr     roff_EQ(ROFF_ARGS);  static  enum rofferr     roff_EQ(ROFF_ARGS);
Line 172  static enum rofferr  roff_EN(ROFF_ARGS);
Line 199  static enum rofferr  roff_EN(ROFF_ARGS);
 static  enum rofferr     roff_T_(ROFF_ARGS);  static  enum rofferr     roff_T_(ROFF_ARGS);
 static  enum rofferr     roff_userdef(ROFF_ARGS);  static  enum rofferr     roff_userdef(ROFF_ARGS);
   
 /* See roff_hash_find() */  /* See roffhash_find() */
   
 #define ASCII_HI         126  #define ASCII_HI         126
 #define ASCII_LO         33  #define ASCII_LO         33
Line 203  static struct roffmac  roffs[ROFF_MAX] = {
Line 230  static struct roffmac  roffs[ROFF_MAX] = {
         { "rm", roff_rm, NULL, NULL, 0, NULL },          { "rm", roff_rm, NULL, NULL, 0, NULL },
         { "so", roff_so, NULL, NULL, 0, NULL },          { "so", roff_so, NULL, NULL, 0, NULL },
         { "ta", roff_line_ignore, NULL, NULL, 0, NULL },          { "ta", roff_line_ignore, NULL, NULL, 0, NULL },
         { "tr", roff_line_ignore, NULL, NULL, 0, NULL },          { "tr", roff_tr, NULL, NULL, 0, NULL },
         { "TS", roff_TS, NULL, NULL, 0, NULL },          { "TS", roff_TS, NULL, NULL, 0, NULL },
         { "TE", roff_TE, NULL, NULL, 0, NULL },          { "TE", roff_TE, NULL, NULL, 0, NULL },
         { "T&", roff_T_, NULL, NULL, 0, NULL },          { "T&", roff_T_, NULL, NULL, 0, NULL },
Line 220  static const struct predef predefs[PREDEFS_MAX] = {
Line 247  static const struct predef predefs[PREDEFS_MAX] = {
 #include "predefs.in"  #include "predefs.in"
 };  };
   
 static  void             roff_free1(struct roff *);  /* See roffhash_find() */
 static  enum rofft       roff_hash_find(const char *, size_t);  
 static  void             roff_hash_init(void);  
 static  void             roffnode_cleanscope(struct roff *);  
 static  void             roffnode_push(struct roff *, enum rofft,  
                                 const char *, int, int);  
 static  void             roffnode_pop(struct roff *);  
 static  enum rofft       roff_parse(struct roff *, const char *, int *);  
   
 /* See roff_hash_find() */  
 #define ROFF_HASH(p)    (p[0] - ASCII_LO)  #define ROFF_HASH(p)    (p[0] - ASCII_LO)
   
 static void  static void
 roff_hash_init(void)  roffhash_init(void)
 {  {
         struct roffmac   *n;          struct roffmac   *n;
         int               buc, i;          int               buc, i;
Line 258  roff_hash_init(void)
Line 276  roff_hash_init(void)
  * the nil-terminated string name could be found.   * the nil-terminated string name could be found.
  */   */
 static enum rofft  static enum rofft
 roff_hash_find(const char *p, size_t s)  roffhash_find(const char *p, size_t s)
 {  {
         int              buc;          int              buc;
         struct roffmac  *n;          struct roffmac  *n;
Line 332  roff_free1(struct roff *r)
Line 350  roff_free1(struct roff *r)
 {  {
         struct tbl_node *t;          struct tbl_node *t;
         struct eqn_node *e;          struct eqn_node *e;
           int              i;
   
         while (NULL != (t = r->first_tbl)) {          while (NULL != (t = r->first_tbl)) {
                 r->first_tbl = t->next;                  r->first_tbl = t->next;
Line 350  roff_free1(struct roff *r)
Line 369  roff_free1(struct roff *r)
         while (r->last)          while (r->last)
                 roffnode_pop(r);                  roffnode_pop(r);
   
         roff_freestr(r);          roff_freestr(r->strtab);
 }          roff_freestr(r->xmbtab);
   
           r->strtab = r->xmbtab = NULL;
   
           if (r->xtab)
                   for (i = 0; i < 128; i++)
                           free(r->xtab[i].p);
   
           free(r->xtab);
           r->xtab = NULL;
   }
   
 void  void
 roff_reset(struct roff *r)  roff_reset(struct roff *r)
 {  {
Line 387  roff_alloc(struct mparse *parse)
Line 415  roff_alloc(struct mparse *parse)
         r->parse = parse;          r->parse = parse;
         r->rstackpos = -1;          r->rstackpos = -1;
   
         roff_hash_init();          roffhash_init();
   
         for (i = 0; i < PREDEFS_MAX; i++)          for (i = 0; i < PREDEFS_MAX; i++)
                 roff_setstr(r, predefs[i].name, predefs[i].str, 0);                  roff_setstr(r, predefs[i].name, predefs[i].str, 0);
Line 494  again:
Line 522  again:
   
                 /* Replace the escape sequence by the string. */                  /* Replace the escape sequence by the string. */
   
                 pos += (stesc - *bufp);                  pos = stesc - *bufp;
   
                 nsz = *szp + strlen(res) + 1;                  nsz = *szp + strlen(res) + 1;
                 n = mandoc_malloc(nsz);                  n = mandoc_malloc(nsz);
Line 517  again:
Line 545  again:
 static enum rofferr  static enum rofferr
 roff_parsetext(char *p)  roff_parsetext(char *p)
 {  {
           char             l, r;
         size_t           sz;          size_t           sz;
         const char      *start;          const char      *start;
         enum mandoc_esc  esc;          enum mandoc_esc  esc;
Line 527  roff_parsetext(char *p)
Line 556  roff_parsetext(char *p)
                 sz = strcspn(p, "-\\");                  sz = strcspn(p, "-\\");
                 p += sz;                  p += sz;
   
                   if ('\0' == *p)
                           break;
   
                 if ('\\' == *p) {                  if ('\\' == *p) {
                         /* Skip over escapes. */                          /* Skip over escapes. */
                         p++;                          p++;
Line 534  roff_parsetext(char *p)
Line 566  roff_parsetext(char *p)
                                 ((const char **)&p, NULL, NULL);                                  ((const char **)&p, NULL, NULL);
                         if (ESCAPE_ERROR == esc)                          if (ESCAPE_ERROR == esc)
                                 break;                                  break;
                 } else if ('-' == *p) {                          continue;
                         if (mandoc_hyph(start, p))                  } else if (p == start) {
                                 *p = ASCII_HYPH;  
                         p++;                          p++;
                           continue;
                 }                  }
   
                   l = *(p - 1);
                   r = *(p + 1);
                   if ('\\' != l &&
                                   '\t' != r && '\t' != l &&
                                   ' ' != r && ' ' != l &&
                                   '-' != r && '-' != l &&
                                   ! isdigit((unsigned char)l) &&
                                   ! isdigit((unsigned char)r))
                           *p = ASCII_HYPH;
                   p++;
         }          }
   
         return(ROFF_CONT);          return(ROFF_CONT);
Line 668  roff_parse(struct roff *r, const char *buf, int *pos)
Line 711  roff_parse(struct roff *r, const char *buf, int *pos)
         maclen = strcspn(mac + 1, " \\\t\0") + 1;          maclen = strcspn(mac + 1, " \\\t\0") + 1;
   
         t = (r->current_string = roff_getstrn(r, mac, maclen))          t = (r->current_string = roff_getstrn(r, mac, maclen))
             ? ROFF_USERDEF : roff_hash_find(mac, maclen);              ? ROFF_USERDEF : roffhash_find(mac, maclen);
   
         *pos += (int)maclen;          *pos += (int)maclen;
   
Line 1247  roff_T_(ROFF_ARGS)
Line 1290  roff_T_(ROFF_ARGS)
         return(ROFF_IGN);          return(ROFF_IGN);
 }  }
   
 int  #if 0
   static int
 roff_closeeqn(struct roff *r)  roff_closeeqn(struct roff *r)
 {  {
   
         return(r->eqn && ROFF_EQN == eqn_end(&r->eqn) ? 1 : 0);          return(r->eqn && ROFF_EQN == eqn_end(&r->eqn) ? 1 : 0);
 }  }
   #endif
   
 void  static void
 roff_openeqn(struct roff *r, const char *name, int line,  roff_openeqn(struct roff *r, const char *name, int line,
                 int offs, const char *buf)                  int offs, const char *buf)
 {  {
Line 1319  roff_TS(ROFF_ARGS)
Line 1364  roff_TS(ROFF_ARGS)
   
 /* ARGSUSED */  /* ARGSUSED */
 static enum rofferr  static enum rofferr
   roff_tr(ROFF_ARGS)
   {
           const char      *p, *first, *second;
           size_t           fsz, ssz;
           enum mandoc_esc  esc;
   
           p = *bufp + pos;
   
           if ('\0' == *p) {
                   mandoc_msg(MANDOCERR_ARGCOUNT, r->parse, ln, ppos, NULL);
                   return(ROFF_IGN);
           }
   
           while ('\0' != *p) {
                   fsz = ssz = 1;
   
                   first = p++;
                   if ('\\' == *first) {
                           esc = mandoc_escape(&p, NULL, NULL);
                           if (ESCAPE_ERROR == esc) {
                                   mandoc_msg
                                           (MANDOCERR_BADESCAPE, r->parse,
                                            ln, (int)(p - *bufp), NULL);
                                   return(ROFF_IGN);
                           }
                           fsz = (size_t)(p - first);
                   }
   
                   second = p++;
                   if ('\\' == *second) {
                           esc = mandoc_escape(&p, NULL, NULL);
                           if (ESCAPE_ERROR == esc) {
                                   mandoc_msg
                                           (MANDOCERR_BADESCAPE, r->parse,
                                            ln, (int)(p - *bufp), NULL);
                                   return(ROFF_IGN);
                           }
                           ssz = (size_t)(p - second);
                   } else if ('\0' == *second) {
                           mandoc_msg(MANDOCERR_ARGCOUNT, r->parse,
                                           ln, (int)(p - *bufp), NULL);
                           second = " ";
                           p--;
                   }
   
                   if (fsz > 1) {
                           roff_setstrn(&r->xmbtab, first,
                                           fsz, second, ssz, 0);
                           continue;
                   }
   
                   if (NULL == r->xtab)
                           r->xtab = mandoc_calloc
                                   (128, sizeof(struct roffstr));
   
                   free(r->xtab[(int)*first].p);
                   r->xtab[(int)*first].p = mandoc_strndup(second, ssz);
                   r->xtab[(int)*first].sz = ssz;
           }
   
           return(ROFF_IGN);
   }
   
   /* ARGSUSED */
   static enum rofferr
 roff_so(ROFF_ARGS)  roff_so(ROFF_ARGS)
 {  {
         char *name;          char *name;
Line 1440  static void
Line 1550  static void
 roff_setstr(struct roff *r, const char *name, const char *string,  roff_setstr(struct roff *r, const char *name, const char *string,
         int multiline)          int multiline)
 {  {
         struct roffstr   *n;  
         char             *c;  
         size_t            oldch, newch;  
   
           roff_setstrn(&r->strtab, name, strlen(name), string,
                           string ? strlen(string) : 0, multiline);
   }
   
   static void
   roff_setstrn(struct roffkv **r, const char *name, size_t namesz,
                   const char *string, size_t stringsz, int multiline)
   {
           struct roffkv   *n;
           char            *c;
           int              i;
           size_t           oldch, newch;
   
         /* Search for an existing string with the same name. */          /* Search for an existing string with the same name. */
         n = r->first_string;          n = *r;
         while (n && strcmp(name, n->name))  
           while (n && strcmp(name, n->key.p))
                 n = n->next;                  n = n->next;
   
         if (NULL == n) {          if (NULL == n) {
                 /* Create a new string table entry. */                  /* Create a new string table entry. */
                 n = mandoc_malloc(sizeof(struct roffstr));                  n = mandoc_malloc(sizeof(struct roffkv));
                 n->name = mandoc_strdup(name);                  n->key.p = mandoc_strndup(name, namesz);
                 n->string = NULL;                  n->key.sz = namesz;
                 n->next = r->first_string;                  n->val.p = NULL;
                 r->first_string = n;                  n->val.sz = 0;
                   n->next = *r;
                   *r = n;
         } else if (0 == multiline) {          } else if (0 == multiline) {
                 /* In multiline mode, append; else replace. */                  /* In multiline mode, append; else replace. */
                 free(n->string);                  free(n->val.p);
                 n->string = NULL;                  n->val.p = NULL;
                   n->val.sz = 0;
         }          }
   
         if (NULL == string)          if (NULL == string)
Line 1469  roff_setstr(struct roff *r, const char *name, const ch
Line 1593  roff_setstr(struct roff *r, const char *name, const ch
          * One additional byte for the '\n' in multiline mode,           * One additional byte for the '\n' in multiline mode,
          * and one for the terminating '\0'.           * and one for the terminating '\0'.
          */           */
         newch = strlen(string) + (multiline ? 2u : 1u);          newch = stringsz + (multiline ? 2u : 1u);
         if (NULL == n->string) {  
                 n->string = mandoc_malloc(newch);          if (NULL == n->val.p) {
                 *n->string = '\0';                  n->val.p = mandoc_malloc(newch);
                   *n->val.p = '\0';
                 oldch = 0;                  oldch = 0;
         } else {          } else {
                 oldch = strlen(n->string);                  oldch = n->val.sz;
                 n->string = mandoc_realloc(n->string, oldch + newch);                  n->val.p = mandoc_realloc(n->val.p, oldch + newch);
         }          }
   
         /* Skip existing content in the destination buffer. */          /* Skip existing content in the destination buffer. */
         c = n->string + (int)oldch;          c = n->val.p + (int)oldch;
   
         /* Append new content to the destination buffer. */          /* Append new content to the destination buffer. */
         while (*string) {          i = 0;
           while (i < (int)stringsz) {
                 /*                  /*
                  * Rudimentary roff copy mode:                   * Rudimentary roff copy mode:
                  * Handle escaped backslashes.                   * Handle escaped backslashes.
                  */                   */
                 if ('\\' == *string && '\\' == *(string + 1))                  if ('\\' == string[i] && '\\' == string[i + 1])
                         string++;                          i++;
                 *c++ = *string++;                  *c++ = string[i++];
         }          }
   
         /* Append terminating bytes. */          /* Append terminating bytes. */
         if (multiline)          if (multiline)
                 *c++ = '\n';                  *c++ = '\n';
   
         *c = '\0';          *c = '\0';
           n->val.sz = (int)(c - n->val.p);
 }  }
   
 static const char *  static const char *
 roff_getstrn(const struct roff *r, const char *name, size_t len)  roff_getstrn(const struct roff *r, const char *name, size_t len)
 {  {
         const struct roffstr *n;          const struct roffkv *n;
   
         n = r->first_string;          for (n = r->strtab; n; n = n->next)
         while (n && (strncmp(name, n->name, len) || '\0' != n->name[(int)len]))                  if (0 == strncmp(name, n->key.p, len) &&
                 n = n->next;                                  '\0' == n->key.p[(int)len])
                           return(n->val.p);
   
         return(n ? n->string : NULL);          return(NULL);
 }  }
   
 static void  static void
 roff_freestr(struct roff *r)  roff_freestr(struct roffkv *r)
 {  {
         struct roffstr   *n, *nn;          struct roffkv    *n, *nn;
   
         for (n = r->first_string; n; n = nn) {          for (n = r; n; n = nn) {
                 free(n->name);                  free(n->key.p);
                 free(n->string);                  free(n->val.p);
                 nn = n->next;                  nn = n->next;
                 free(n);                  free(n);
         }          }
   
         r->first_string = NULL;  
 }  }
   
 const struct tbl_span *  const struct tbl_span *
Line 1545  roff_eqndelim(const struct roff *r)
Line 1672  roff_eqndelim(const struct roff *r)
 {  {
   
         return('\0');          return('\0');
   }
   
   /*
    * Duplicate an input string, making the appropriate character
    * conversations (as stipulated by `tr') along the way.
    * Returns a heap-allocated string with all the replacements made.
    */
   char *
   roff_strdup(const struct roff *r, const char *p)
   {
           const struct roffkv *cp;
           char            *res;
           const char      *pp;
           size_t           ssz, sz;
           enum mandoc_esc  esc;
   
           if (NULL == r->xmbtab && NULL == r->xtab)
                   return(mandoc_strdup(p));
           else if ('\0' == *p)
                   return(mandoc_strdup(""));
   
           /*
            * Step through each character looking for term matches
            * (remember that a `tr' can be invoked with an escape, which is
            * a glyph but the escape is multi-character).
            * We only do this if the character hash has been initialised
            * and the string is >0 length.
            */
   
           res = NULL;
           ssz = 0;
   
           while ('\0' != *p) {
                   if ('\\' != *p && r->xtab && r->xtab[(int)*p].p) {
                           sz = r->xtab[(int)*p].sz;
                           res = mandoc_realloc(res, ssz + sz + 1);
                           memcpy(res + ssz, r->xtab[(int)*p].p, sz);
                           ssz += sz;
                           p++;
                           continue;
                   } else if ('\\' != *p) {
                           res = mandoc_realloc(res, ssz + 2);
                           res[ssz++] = *p++;
                           continue;
                   }
   
                   /* Search for term matches. */
                   for (cp = r->xmbtab; cp; cp = cp->next)
                           if (0 == strncmp(p, cp->key.p, cp->key.sz))
                                   break;
   
                   if (NULL != cp) {
                           /*
                            * A match has been found.
                            * Append the match to the array and move
                            * forward by its keysize.
                            */
                           res = mandoc_realloc
                                   (res, ssz + cp->val.sz + 1);
                           memcpy(res + ssz, cp->val.p, cp->val.sz);
                           ssz += cp->val.sz;
                           p += (int)cp->key.sz;
                           continue;
                   }
   
                   /*
                    * Handle escapes carefully: we need to copy
                    * over just the escape itself, or else we might
                    * do replacements within the escape itself.
                    * Make sure to pass along the bogus string.
                    */
                   pp = p++;
                   esc = mandoc_escape(&p, NULL, NULL);
                   if (ESCAPE_ERROR == esc) {
                           sz = strlen(pp);
                           res = mandoc_realloc(res, ssz + sz + 1);
                           memcpy(res + ssz, pp, sz);
                           break;
                   }
                   /*
                    * We bail out on bad escapes.
                    * No need to warn: we already did so when
                    * roff_res() was called.
                    */
                   sz = (int)(p - pp);
                   res = mandoc_realloc(res, ssz + sz + 1);
                   memcpy(res + ssz, pp, sz);
                   ssz += sz;
           }
   
           res[(int)ssz] = '\0';
           return(res);
 }  }

Legend:
Removed from v.1.154  
changed lines
  Added in v.1.167

CVSweb