[BACK]Return to read.c CVS log [TXT][DIR] Up to [cvsweb.bsd.lv] / mandoc

Diff for /mandoc/read.c between version 1.94 and 1.99

version 1.94, 2014/10/28 17:36:19 version 1.99, 2014/11/27 23:40:19
Line 64  struct mparse {
Line 64  struct mparse {
         int               filenc; /* encoding of the current file */          int               filenc; /* encoding of the current file */
         int               reparse_count; /* finite interp. stack */          int               reparse_count; /* finite interp. stack */
         int               line; /* line number in the file */          int               line; /* line number in the file */
           pid_t             child; /* the gunzip(1) process */
 };  };
   
 static  void      choose_parser(struct mparse *);  static  void      choose_parser(struct mparse *);
 static  void      resize_buf(struct buf *, size_t);  static  void      resize_buf(struct buf *, size_t);
 static  void      mparse_buf_r(struct mparse *, struct buf, int);  static  void      mparse_buf_r(struct mparse *, struct buf, size_t, int);
 static  int       read_whole_file(struct mparse *, const char *, int,  static  int       read_whole_file(struct mparse *, const char *, int,
                                 struct buf *, int *);                                  struct buf *, int *);
 static  void      mparse_end(struct mparse *);  static  void      mparse_end(struct mparse *);
Line 201  static const char * const mandocerrs[MANDOCERR_MAX] = 
Line 202  static const char * const mandocerrs[MANDOCERR_MAX] = 
         /* related to request and macro arguments */          /* related to request and macro arguments */
         "escaped character not allowed in a name",          "escaped character not allowed in a name",
         "argument count wrong",          "argument count wrong",
           "NOT IMPLEMENTED: Bd -file",
         "missing list type, using -item",          "missing list type, using -item",
         "missing manual name, using \"\"",          "missing manual name, using \"\"",
         "uname(3) system call failed, using UNKNOWN",          "uname(3) system call failed, using UNKNOWN",
Line 213  static const char * const mandocerrs[MANDOCERR_MAX] = 
Line 215  static const char * const mandocerrs[MANDOCERR_MAX] = 
         "generic fatal error",          "generic fatal error",
   
         "input too large",          "input too large",
         "NOT IMPLEMENTED: Bd -file",  
         "NOT IMPLEMENTED: .so with absolute path or \"..\"",          "NOT IMPLEMENTED: .so with absolute path or \"..\"",
         ".so request failed",          ".so request failed",
   
Line 303  choose_parser(struct mparse *curp)
Line 304  choose_parser(struct mparse *curp)
 }  }
   
 /*  /*
  * Main parse routine for an opened file.  This is called for each   * Main parse routine for a buffer.
  * opened file and simply loops around the full input file, possibly   * It assumes encoding and line numbering are already set up.
  * nesting (i.e., with `so').   * It can recurse directly (for invocations of user-defined
    * macros, inline equations, and input line traps)
    * and indirectly (for .so file inclusion).
  */   */
 static void  static void
 mparse_buf_r(struct mparse *curp, struct buf blk, int start)  mparse_buf_r(struct mparse *curp, struct buf blk, size_t i, int start)
 {  {
         const struct tbl_span   *span;          const struct tbl_span   *span;
         struct buf       ln;          struct buf       ln;
           size_t           pos; /* byte number in the ln buffer */
         enum rofferr     rr;          enum rofferr     rr;
         int              i, of, rc;          int              of, rc;
         int              pos; /* byte number in the ln buffer */  
         int              lnn; /* line number in the real file */          int              lnn; /* line number in the real file */
         unsigned char    c;          unsigned char    c;
   
         memset(&ln, 0, sizeof(struct buf));          memset(&ln, 0, sizeof(ln));
   
         lnn = curp->line;          lnn = curp->line;
         pos = 0;          pos = 0;
   
         for (i = blk.offs; i < (int)blk.sz; ) {          while (i < blk.sz) {
                 if (0 == pos && '\0' == blk.buf[i])                  if (0 == pos && '\0' == blk.buf[i])
                         break;                          break;
   
Line 333  mparse_buf_r(struct mparse *curp, struct buf blk, int 
Line 336  mparse_buf_r(struct mparse *curp, struct buf blk, int 
   
                         if (lnn < 3 &&                          if (lnn < 3 &&
                             curp->filenc & MPARSE_UTF8 &&                              curp->filenc & MPARSE_UTF8 &&
                             curp->filenc & MPARSE_LATIN1) {                              curp->filenc & MPARSE_LATIN1)
                                 blk.offs = i;                                  curp->filenc = preconv_cue(&blk, i);
                                 curp->filenc = preconv_cue(&blk);  
                         }  
                 }                  }
   
                 while (i < (int)blk.sz && (start || '\0' != blk.buf[i])) {                  while (i < blk.sz && (start || blk.buf[i] != '\0')) {
   
                         /*                          /*
                          * When finding an unescaped newline character,                           * When finding an unescaped newline character,
Line 347  mparse_buf_r(struct mparse *curp, struct buf blk, int 
Line 348  mparse_buf_r(struct mparse *curp, struct buf blk, int 
                          * Skip a preceding carriage return, if any.                           * Skip a preceding carriage return, if any.
                          */                           */
   
                         if ('\r' == blk.buf[i] && i + 1 < (int)blk.sz &&                          if ('\r' == blk.buf[i] && i + 1 < blk.sz &&
                             '\n' == blk.buf[i + 1])                              '\n' == blk.buf[i + 1])
                                 ++i;                                  ++i;
                         if ('\n' == blk.buf[i]) {                          if ('\n' == blk.buf[i]) {
Line 361  mparse_buf_r(struct mparse *curp, struct buf blk, int 
Line 362  mparse_buf_r(struct mparse *curp, struct buf blk, int 
                          * case of 11 bytes: "\\[u10ffff]\0"                           * case of 11 bytes: "\\[u10ffff]\0"
                          */                           */
   
                         if (pos + 11 > (int)ln.sz)                          if (pos + 11 > ln.sz)
                                 resize_buf(&ln, 256);                                  resize_buf(&ln, 256);
   
                         /*                          /*
Line 370  mparse_buf_r(struct mparse *curp, struct buf blk, int 
Line 371  mparse_buf_r(struct mparse *curp, struct buf blk, int 
   
                         c = blk.buf[i];                          c = blk.buf[i];
                         if (c & 0x80) {                          if (c & 0x80) {
                                 blk.offs = i;                                  if ( ! (curp->filenc && preconv_encode(
                                 ln.offs = pos;                                      &blk, &i, &ln, &pos, &curp->filenc))) {
                                 if (curp->filenc && preconv_encode(  
                                     &blk, &ln, &curp->filenc)) {  
                                         pos = ln.offs;  
                                         i = blk.offs;  
                                 } else {  
                                         mandoc_vmsg(MANDOCERR_BADCHAR,                                          mandoc_vmsg(MANDOCERR_BADCHAR,
                                             curp, curp->line, pos,                                              curp, curp->line, pos,
                                             "0x%x", c);                                              "0x%x", c);
Line 400  mparse_buf_r(struct mparse *curp, struct buf blk, int 
Line 396  mparse_buf_r(struct mparse *curp, struct buf blk, int 
   
                         /* Trailing backslash = a plain char. */                          /* Trailing backslash = a plain char. */
   
                         if ('\\' != blk.buf[i] || i + 1 == (int)blk.sz) {                          if (blk.buf[i] != '\\' || i + 1 == blk.sz) {
                                 ln.buf[pos++] = blk.buf[i++];                                  ln.buf[pos++] = blk.buf[i++];
                                 continue;                                  continue;
                         }                          }
Line 412  mparse_buf_r(struct mparse *curp, struct buf blk, int 
Line 408  mparse_buf_r(struct mparse *curp, struct buf blk, int 
                          * skip that one as well.                           * skip that one as well.
                          */                           */
   
                         if ('\r' == blk.buf[i + 1] && i + 2 < (int)blk.sz &&                          if ('\r' == blk.buf[i + 1] && i + 2 < blk.sz &&
                             '\n' == blk.buf[i + 2])                              '\n' == blk.buf[i + 2])
                                 ++i;                                  ++i;
                         if ('\n' == blk.buf[i + 1]) {                          if ('\n' == blk.buf[i + 1]) {
Line 424  mparse_buf_r(struct mparse *curp, struct buf blk, int 
Line 420  mparse_buf_r(struct mparse *curp, struct buf blk, int 
                         if ('"' == blk.buf[i + 1] || '#' == blk.buf[i + 1]) {                          if ('"' == blk.buf[i + 1] || '#' == blk.buf[i + 1]) {
                                 i += 2;                                  i += 2;
                                 /* Comment, skip to end of line */                                  /* Comment, skip to end of line */
                                 for (; i < (int)blk.sz; ++i) {                                  for (; i < blk.sz; ++i) {
                                         if ('\n' == blk.buf[i]) {                                          if ('\n' == blk.buf[i]) {
                                                 ++i;                                                  ++i;
                                                 ++lnn;                                                  ++lnn;
Line 461  mparse_buf_r(struct mparse *curp, struct buf blk, int 
Line 457  mparse_buf_r(struct mparse *curp, struct buf blk, int 
                         ln.buf[pos++] = blk.buf[i++];                          ln.buf[pos++] = blk.buf[i++];
                 }                  }
   
                 if (pos >= (int)ln.sz)                  if (pos >= ln.sz)
                         resize_buf(&ln, 256);                          resize_buf(&ln, 256);
   
                 ln.buf[pos] = '\0';                  ln.buf[pos] = '\0';
Line 498  mparse_buf_r(struct mparse *curp, struct buf blk, int 
Line 494  mparse_buf_r(struct mparse *curp, struct buf blk, int 
                                 [curp->secondary->sz] = '\0';                                  [curp->secondary->sz] = '\0';
                 }                  }
 rerun:  rerun:
                 rr = roff_parseln(curp->roff, curp->line,                  rr = roff_parseln(curp->roff, curp->line, &ln, &of);
                     &ln.buf, &ln.sz, of, &of);  
   
                 switch (rr) {                  switch (rr) {
                 case ROFF_REPARSE:                  case ROFF_REPARSE:
                         if (REPARSE_LIMIT >= ++curp->reparse_count)                          if (REPARSE_LIMIT >= ++curp->reparse_count)
                                 mparse_buf_r(curp, ln, 0);                                  mparse_buf_r(curp, ln, of, 0);
                         else                          else
                                 mandoc_msg(MANDOCERR_ROFFLOOP, curp,                                  mandoc_msg(MANDOCERR_ROFFLOOP, curp,
                                     curp->line, pos, NULL);                                      curp->line, pos, NULL);
                         pos = 0;                          pos = 0;
                         continue;                          continue;
                 case ROFF_APPEND:                  case ROFF_APPEND:
                         pos = (int)strlen(ln.buf);                          pos = strlen(ln.buf);
                         continue;                          continue;
                 case ROFF_RERUN:                  case ROFF_RERUN:
                         goto rerun;                          goto rerun;
Line 522  rerun:
Line 517  rerun:
                         assert(MANDOCLEVEL_FATAL <= curp->file_status);                          assert(MANDOCLEVEL_FATAL <= curp->file_status);
                         break;                          break;
                 case ROFF_SO:                  case ROFF_SO:
                         if (0 == (MPARSE_SO & curp->options) &&                          if ( ! (curp->options & MPARSE_SO) &&
                             (i >= (int)blk.sz || '\0' == blk.buf[i])) {                              (i >= blk.sz || blk.buf[i] == '\0')) {
                                 curp->sodest = mandoc_strdup(ln.buf + of);                                  curp->sodest = mandoc_strdup(ln.buf + of);
                                 free(ln.buf);                                  free(ln.buf);
                                 return;                                  return;
Line 650  read_whole_file(struct mparse *curp, const char *file,
Line 645  read_whole_file(struct mparse *curp, const char *file,
                         return(0);                          return(0);
                 }                  }
                 *with_mmap = 1;                  *with_mmap = 1;
                 fb->offs = 0;  
                 fb->sz = (size_t)st.st_size;                  fb->sz = (size_t)st.st_size;
                 fb->buf = mmap(NULL, fb->sz, PROT_READ, MAP_SHARED, fd, 0);                  fb->buf = mmap(NULL, fb->sz, PROT_READ, MAP_SHARED, fd, 0);
                 if (fb->buf != MAP_FAILED)                  if (fb->buf != MAP_FAILED)
Line 682  read_whole_file(struct mparse *curp, const char *file,
Line 676  read_whole_file(struct mparse *curp, const char *file,
                 ssz = read(fd, fb->buf + (int)off, fb->sz - off);                  ssz = read(fd, fb->buf + (int)off, fb->sz - off);
                 if (ssz == 0) {                  if (ssz == 0) {
                         fb->sz = off;                          fb->sz = off;
                         fb->offs = 0;  
                         return(1);                          return(1);
                 }                  }
                 if (ssz == -1) {                  if (ssz == -1) {
Line 739  mparse_parse_buffer(struct mparse *curp, struct buf bl
Line 732  mparse_parse_buffer(struct mparse *curp, struct buf bl
 {  {
         struct buf      *svprimary;          struct buf      *svprimary;
         const char      *svfile;          const char      *svfile;
           size_t           offset;
         static int       recursion_depth;          static int       recursion_depth;
   
         if (64 < recursion_depth) {          if (64 < recursion_depth) {
Line 759  mparse_parse_buffer(struct mparse *curp, struct buf bl
Line 753  mparse_parse_buffer(struct mparse *curp, struct buf bl
             (unsigned char)blk.buf[0] == 0xef &&              (unsigned char)blk.buf[0] == 0xef &&
             (unsigned char)blk.buf[1] == 0xbb &&              (unsigned char)blk.buf[1] == 0xbb &&
             (unsigned char)blk.buf[2] == 0xbf) {              (unsigned char)blk.buf[2] == 0xbf) {
                 blk.offs = 3;                  offset = 3;
                 curp->filenc &= ~MPARSE_LATIN1;                  curp->filenc &= ~MPARSE_LATIN1;
         }          } else
                   offset = 0;
   
         mparse_buf_r(curp, blk, 1);          mparse_buf_r(curp, blk, offset, 1);
   
         if (0 == --recursion_depth && MANDOCLEVEL_FATAL > curp->file_status)          if (0 == --recursion_depth && MANDOCLEVEL_FATAL > curp->file_status)
                 mparse_end(curp);                  mparse_end(curp);
Line 780  mparse_readmem(struct mparse *curp, const void *buf, s
Line 775  mparse_readmem(struct mparse *curp, const void *buf, s
   
         blk.buf = UNCONST(buf);          blk.buf = UNCONST(buf);
         blk.sz = len;          blk.sz = len;
         blk.offs = 0;  
   
         mparse_parse_buffer(curp, blk, file);          mparse_parse_buffer(curp, blk, file);
         return(curp->file_status);          return(curp->file_status);
 }  }
   
   /*
    * If a file descriptor is given, use it and assume it points
    * to the named file.  Otherwise, open the named file.
    * Read the whole file into memory and call the parsers.
    * Called recursively when an .so request is encountered.
    */
 enum mandoclevel  enum mandoclevel
 mparse_readfd(struct mparse *curp, int fd, const char *file)  mparse_readfd(struct mparse *curp, int fd, const char *file)
 {  {
         struct buf       blk;          struct buf       blk;
         int              with_mmap;          int              with_mmap;
         int              save_filenc;          int              save_filenc;
           pid_t            save_child;
   
         if (-1 == fd && -1 == (fd = open(file, O_RDONLY, 0))) {          save_child = curp->child;
                 curp->file_status = MANDOCLEVEL_SYSERR;          if (fd != -1)
                 if (curp->mmsg)                  curp->child = 0;
                         (*curp->mmsg)(MANDOCERR_SYSOPEN,          else if (mparse_open(curp, &fd, file) >= MANDOCLEVEL_SYSERR)
                             curp->file_status,                  goto out;
                             file, 0, 0, strerror(errno));  
                 return(curp->file_status);  
         }  
   
         /*  
          * Run for each opened file; may be called more than once for  
          * each full parse sequence if the opened file is nested (i.e.,  
          * from `so').  Simply sucks in the whole file and moves into  
          * the parse phase for the file.  
          */  
   
         if (read_whole_file(curp, file, fd, &blk, &with_mmap)) {          if (read_whole_file(curp, file, fd, &blk, &with_mmap)) {
                 save_filenc = curp->filenc;                  save_filenc = curp->filenc;
                 curp->filenc = curp->options &                  curp->filenc = curp->options &
Line 823  mparse_readfd(struct mparse *curp, int fd, const char 
Line 814  mparse_readfd(struct mparse *curp, int fd, const char 
                         free(blk.buf);                          free(blk.buf);
         }          }
   
         if (STDIN_FILENO != fd && -1 == close(fd))          if (fd != STDIN_FILENO && close(fd) == -1)
                 perror(file);                  perror(file);
   
           mparse_wait(curp);
   out:
           curp->child = save_child;
         return(curp->file_status);          return(curp->file_status);
 }  }
   
 enum mandoclevel  enum mandoclevel
 mparse_open(struct mparse *curp, int *fd, const char *file,  mparse_open(struct mparse *curp, int *fd, const char *file)
         pid_t *child_pid)  
 {  {
         int               pfd[2];          int               pfd[2];
           int               save_errno;
         char             *cp;          char             *cp;
         enum mandocerr    err;          enum mandocerr    err;
   
         pfd[1] = -1;          pfd[1] = -1;
         curp->file = file;          curp->file = file;
   
           /* Unless zipped, try to just open the file. */
   
         if ((cp = strrchr(file, '.')) == NULL ||          if ((cp = strrchr(file, '.')) == NULL ||
             strcmp(cp + 1, "gz")) {              strcmp(cp + 1, "gz")) {
                 *child_pid = 0;                  curp->child = 0;
                 if ((*fd = open(file, O_RDONLY)) == -1) {                  if ((*fd = open(file, O_RDONLY)) != -1)
                         err = MANDOCERR_SYSOPEN;                          return(MANDOCLEVEL_OK);
                         goto out;  
                 }                  /* Open failed; try to append ".gz". */
                 return(MANDOCLEVEL_OK);  
                   mandoc_asprintf(&cp, "%s.gz", file);
                   file = cp;
           } else
                   cp = NULL;
   
           /* Before forking, make sure the file can be read. */
   
           save_errno = errno;
           if (access(file, R_OK) == -1) {
                   if (cp != NULL)
                           errno = save_errno;
                   err = MANDOCERR_SYSOPEN;
                   goto out;
         }          }
   
           /* Run gunzip(1). */
   
         if (pipe(pfd) == -1) {          if (pipe(pfd) == -1) {
                 err = MANDOCERR_SYSPIPE;                  err = MANDOCERR_SYSPIPE;
                 goto out;                  goto out;
         }          }
   
         switch (*child_pid = fork()) {          switch (curp->child = fork()) {
         case -1:          case -1:
                 err = MANDOCERR_SYSFORK;                  err = MANDOCERR_SYSFORK;
                 close(pfd[0]);                  close(pfd[0]);
Line 877  mparse_open(struct mparse *curp, int *fd, const char *
Line 889  mparse_open(struct mparse *curp, int *fd, const char *
         }          }
   
 out:  out:
           free(cp);
         *fd = -1;          *fd = -1;
         *child_pid = 0;          curp->child = 0;
         curp->file_status = MANDOCLEVEL_SYSERR;          curp->file_status = MANDOCLEVEL_SYSERR;
         if (curp->mmsg)          if (curp->mmsg)
                 (*curp->mmsg)(err, curp->file_status, file,                  (*curp->mmsg)(err, curp->file_status, curp->file,
                     0, 0, strerror(errno));                      0, 0, strerror(errno));
         if (pfd[1] != -1)          if (pfd[1] != -1)
                 exit(1);                  exit(1);
Line 889  out:
Line 902  out:
 }  }
   
 enum mandoclevel  enum mandoclevel
 mparse_wait(struct mparse *curp, pid_t child_pid)  mparse_wait(struct mparse *curp)
 {  {
         int       status;          int       status;
   
         if (waitpid(child_pid, &status, 0) == -1) {          if (curp->child == 0)
                   return(MANDOCLEVEL_OK);
   
           if (waitpid(curp->child, &status, 0) == -1) {
                 mandoc_msg(MANDOCERR_SYSWAIT, curp, 0, 0,                  mandoc_msg(MANDOCERR_SYSWAIT, curp, 0, 0,
                     strerror(errno));                      strerror(errno));
                 curp->file_status = MANDOCLEVEL_SYSERR;                  curp->file_status = MANDOCLEVEL_SYSERR;

Legend:
Removed from v.1.94  
changed lines
  Added in v.1.99

CVSweb