[BACK]Return to main.c CVS log [TXT][DIR] Up to [cvsweb.bsd.lv] / mandoc

Diff for /mandoc/main.c between version 1.9 and 1.76

version 1.9, 2009/03/22 19:10:48 version 1.76, 2010/05/16 10:59:36
Line 1 
Line 1 
 /* $Id$ */  /*      $Id$ */
 /*  /*
  * Copyright (c) 2008, 2009 Kristaps Dzonsons <kristaps@openbsd.org>   * Copyright (c) 2008, 2009 Kristaps Dzonsons <kristaps@kth.se>
  *   *
  * Permission to use, copy, modify, and distribute this software for any   * Permission to use, copy, modify, and distribute this software for any
  * purpose with or without fee is hereby granted, provided that the   * purpose with or without fee is hereby granted, provided that the above
  * above copyright notice and this permission notice appear in all   * copyright notice and this permission notice appear in all copies.
  * copies.  
  *   *
  * THE SOFTWARE IS PROVIDED "AS IS" AND THE AUTHOR DISCLAIMS ALL   * THE SOFTWARE IS PROVIDED "AS IS" AND THE AUTHOR DISCLAIMS ALL WARRANTIES
  * WARRANTIES WITH REGARD TO THIS SOFTWARE INCLUDING ALL IMPLIED   * WITH REGARD TO THIS SOFTWARE INCLUDING ALL IMPLIED WARRANTIES OF
  * WARRANTIES OF MERCHANTABILITY AND FITNESS. IN NO EVENT SHALL THE   * MERCHANTABILITY AND FITNESS. IN NO EVENT SHALL THE AUTHOR BE LIABLE FOR
  * AUTHOR BE LIABLE FOR ANY SPECIAL, DIRECT, INDIRECT, OR CONSEQUENTIAL   * ANY SPECIAL, DIRECT, INDIRECT, OR CONSEQUENTIAL DAMAGES OR ANY DAMAGES
  * DAMAGES OR ANY DAMAGES WHATSOEVER RESULTING FROM LOSS OF USE, DATA OR   * WHATSOEVER RESULTING FROM LOSS OF USE, DATA OR PROFITS, WHETHER IN AN
  * PROFITS, WHETHER IN AN ACTION OF CONTRACT, NEGLIGENCE OR OTHER   * ACTION OF CONTRACT, NEGLIGENCE OR OTHER TORTIOUS ACTION, ARISING OUT OF
  * TORTIOUS ACTION, ARISING OUT OF OR IN CONNECTION WITH THE USE OR   * OR IN CONNECTION WITH THE USE OR PERFORMANCE OF THIS SOFTWARE.
  * PERFORMANCE OF THIS SOFTWARE.  
  */   */
   #ifdef HAVE_CONFIG_H
   #include "config.h"
   #endif
   
   #include <sys/mman.h>
 #include <sys/stat.h>  #include <sys/stat.h>
   
 #include <assert.h>  #include <assert.h>
 #include <err.h>  
 #include <fcntl.h>  #include <fcntl.h>
 #include <stdio.h>  #include <stdio.h>
   #include <stdint.h>
 #include <stdlib.h>  #include <stdlib.h>
 #include <string.h>  #include <string.h>
 #include <unistd.h>  #include <unistd.h>
   
   #include "mandoc.h"
 #include "mdoc.h"  #include "mdoc.h"
   #include "man.h"
   #include "roff.h"
   #include "main.h"
   
 #ifdef __linux__  #define UNCONST(a)      ((void *)(uintptr_t)(const void *)(a))
 extern  int               getsubopt(char **, char * const *, char **);  
 # ifndef __dead  /* FIXME: Intel's compiler?  LLVM?  pcc?  */
 #  define __dead __attribute__((__noreturn__))  
   #if !defined(__GNUC__) || (__GNUC__ < 2)
   # if !defined(lint)
   #  define __attribute__(x)
 # endif  # endif
 #endif  #endif /* !defined(__GNUC__) || (__GNUC__ < 2) */
   
   typedef void            (*out_mdoc)(void *, const struct mdoc *);
   typedef void            (*out_man)(void *, const struct man *);
   typedef void            (*out_free)(void *);
   
 struct  buf {  struct  buf {
         char             *buf;          char             *buf;
         size_t            sz;          size_t            sz;
 };  };
   
 struct  curparse {  enum    intt {
         const char       *file;          INTT_AUTO,
         int               wflags;          INTT_MDOC,
 #define WARN_WALL         0x03          /* All-warnings mask. */          INTT_MAN
 #define WARN_WCOMPAT     (1 << 0)       /* Compatibility warnings. */  
 #define WARN_WSYNTAX     (1 << 1)       /* Syntax warnings. */  
 #define WARN_WERR        (1 << 2)       /* Warnings->errors. */  
 };  };
   
 enum outt {  enum    outt {
         OUTT_ASCII,          OUTT_ASCII = 0,
         OUTT_LATIN1,  
         OUTT_UTF8,  
         OUTT_TREE,          OUTT_TREE,
           OUTT_HTML,
           OUTT_XHTML,
         OUTT_LINT          OUTT_LINT
 };  };
   
 typedef int             (*out_run)(void *, const struct mdoc *);  struct  curparse {
 typedef void            (*out_free)(void *);          const char       *file;         /* Current parse. */
           int               fd;           /* Current parse. */
           int               wflags;
           /* FIXME: set by max error */
   #define WARN_WALL        (1 << 0)       /* All-warnings mask. */
   #define WARN_WERR        (1 << 2)       /* Warnings->errors. */
           int               fflags;
   #define FL_IGN_SCOPE     (1 << 0)       /* Ignore scope errors. */
   #define FL_NIGN_ESCAPE   (1 << 1)       /* Don't ignore bad escapes. */
   #define FL_NIGN_MACRO    (1 << 2)       /* Don't ignore bad macros. */
   #define FL_IGN_ERRORS    (1 << 4)       /* Ignore failed parse. */
   #define FL_STRICT         FL_NIGN_ESCAPE | \
                             FL_NIGN_MACRO
           enum intt         inttype;      /* Input parsers... */
           struct man       *man;
           struct mdoc      *mdoc;
           struct roff      *roff;
           enum outt         outtype;      /* Output devices... */
           out_mdoc          outmdoc;
           out_man           outman;
           out_free          outfree;
           void             *outdata;
           char              outopts[BUFSIZ];
   };
   
 extern  char             *__progname;  static  void              fdesc(struct curparse *);
   static  void              ffile(const char *, struct curparse *);
 extern  void             *ascii_alloc(void);  
 extern  void             *latin1_alloc(void);  
 extern  void             *utf8_alloc(void);  
 extern  int               terminal_run(void *, const struct mdoc *);  
 extern  int               tree_run(void *, const struct mdoc *);  
 extern  void              terminal_free(void *);  
   
 __dead  static void       version(void);  
 __dead  static void       usage(void);  
 static  int               foptions(int *, char *);  static  int               foptions(int *, char *);
 static  int               toptions(enum outt *, char *);  static  struct man       *man_init(struct curparse *);
   static  struct mdoc      *mdoc_init(struct curparse *);
   static  struct roff      *roff_init(struct curparse *);
   static  int               merr(void *, int, int, const char *); /* DEPRECATED */
   static  int               moptions(enum intt *, char *);
   static  int               mwarn(void *, int, int, const char *); /* DEPRECATED */
   static  int               mmsg(enum mandocerr, void *,
                                   int, int, const char *);
   static  int               pset(const char *, int, struct curparse *,
                                   struct man **, struct mdoc **);
   static  int               toptions(struct curparse *, char *);
   static  void              usage(void) __attribute__((noreturn));
   static  void              version(void) __attribute__((noreturn));
 static  int               woptions(int *, char *);  static  int               woptions(int *, char *);
 static  int               merr(void *, int, int, const char *);  
 static  int               mwarn(void *, int, int,  
                                 enum mdoc_warn, const char *);  
 static  int               file(struct buf *, struct buf *,  
                                 const char *, struct mdoc *);  
 static  int               fdesc(struct buf *, struct buf *,  
                                 const char *, int, struct mdoc *);  
   
   static  const char       *progname;
   static  int               with_error;
   static  int               with_warning;
   
 int  int
 main(int argc, char *argv[])  main(int argc, char *argv[])
 {  {
         int              c, rc, fflags;          int              c;
         struct mdoc_cb   cb;  
         struct mdoc     *mdoc;  
         void            *outdata;  
         enum outt        outtype;  
         struct buf       ln, blk;  
         out_run          outrun;  
         out_free         outfree;  
         struct curparse  curp;          struct curparse  curp;
   
         fflags = 0;          progname = strrchr(argv[0], '/');
         outtype = OUTT_ASCII;          if (progname == NULL)
                   progname = argv[0];
           else
                   ++progname;
   
         bzero(&curp, sizeof(struct curparse));          memset(&curp, 0, sizeof(struct curparse));
   
           curp.inttype = INTT_AUTO;
           curp.outtype = OUTT_ASCII;
   
         /* LINTED */          /* LINTED */
         while (-1 != (c = getopt(argc, argv, "f:VW:T:")))          while (-1 != (c = getopt(argc, argv, "f:m:O:T:VW:")))
                 switch (c) {                  switch (c) {
                 case ('f'):                  case ('f'):
                         if ( ! foptions(&fflags, optarg))                          if ( ! foptions(&curp.fflags, optarg))
                                 return(0);                                  return(EXIT_FAILURE);
                         break;                          break;
                   case ('m'):
                           if ( ! moptions(&curp.inttype, optarg))
                                   return(EXIT_FAILURE);
                           break;
                   case ('O'):
                           (void)strlcat(curp.outopts, optarg, BUFSIZ);
                           (void)strlcat(curp.outopts, ",", BUFSIZ);
                           break;
                 case ('T'):                  case ('T'):
                         if ( ! toptions(&outtype, optarg))                          if ( ! toptions(&curp, optarg))
                                 return(0);                                  return(EXIT_FAILURE);
                         break;                          break;
                 case ('W'):                  case ('W'):
                         if ( ! woptions(&curp.wflags, optarg))                          if ( ! woptions(&curp.wflags, optarg))
                                 return(0);                                  return(EXIT_FAILURE);
                         break;                          break;
                 case ('V'):                  case ('V'):
                         version();                          version();
Line 127  main(int argc, char *argv[])
Line 167  main(int argc, char *argv[])
         argc -= optind;          argc -= optind;
         argv += optind;          argv += optind;
   
         /*          if (NULL == *argv) {
          * Allocate the appropriate front-end.  Note that utf8, ascii                  curp.file = "<stdin>";
          * and latin1 all resolve to the terminal front-end with                  curp.fd = STDIN_FILENO;
          * different encodings (see terminal.c).  Not all frontends have  
          * cleanup or alloc routines.  
          */  
   
         switch (outtype) {                  fdesc(&curp);
         case (OUTT_LATIN1):  
                 outdata = latin1_alloc();  
                 outrun = terminal_run;  
                 outfree = terminal_free;  
                 break;  
         case (OUTT_UTF8):  
                 outdata = utf8_alloc();  
                 outrun = terminal_run;  
                 outfree = terminal_free;  
                 break;  
         case (OUTT_TREE):  
                 outdata = NULL;  
                 outrun = tree_run;  
                 outfree = NULL;  
                 break;  
         case (OUTT_LINT):  
                 outdata = NULL;  
                 outrun = NULL;  
                 outfree = NULL;  
                 break;  
         default:  
                 outdata = ascii_alloc();  
                 outrun = terminal_run;  
                 outfree = terminal_free;  
                 break;  
         }          }
   
         /*          while (*argv) {
          * All callbacks route into here, where we print them onto the                  ffile(*argv, &curp);
          * screen.  XXX - for now, no path for debugging messages.  
          */  
   
         cb.mdoc_msg = NULL;                  if (with_error && !(curp.fflags & FL_IGN_ERRORS))
         cb.mdoc_err = merr;                          break;
         cb.mdoc_warn = mwarn;                  ++argv;
           }
   
         bzero(&ln, sizeof(struct buf));          if (curp.outfree)
         bzero(&blk, sizeof(struct buf));                  (*curp.outfree)(curp.outdata);
           if (curp.mdoc)
                   mdoc_free(curp.mdoc);
           if (curp.man)
                   man_free(curp.man);
           if (curp.roff)
                   roff_free(curp.roff);
   
         mdoc = mdoc_alloc(&curp, fflags, &cb);          return((with_warning || with_error) ?
                           EXIT_FAILURE :  EXIT_SUCCESS);
   }
   
         /*  
          * Loop around available files.  
          */  
   
         if (NULL == *argv) {  static void
                 curp.file = "<stdin>";  version(void)
                 c = fdesc(&blk, &ln, "stdin", STDIN_FILENO, mdoc);  {
                 rc = 0;  
                 if (c && NULL == outrun)  
                         rc = 1;  
                 else if (c && outrun && (*outrun)(outdata, mdoc))  
                         rc = 1;  
         } else {  
                 while (*argv) {  
                         curp.file = *argv;  
                         c = file(&blk, &ln, *argv, mdoc);  
                         if ( ! c)  
                                 break;  
                         if (outrun && ! (*outrun)(outdata, mdoc))  
                                 break;  
                         /* Reset the parser for another file. */  
                         mdoc_reset(mdoc);  
                         argv++;  
                 }  
                 rc = NULL == *argv;  
         }  
   
         if (blk.buf)          (void)printf("%s %s\n", progname, VERSION);
                 free(blk.buf);          exit(EXIT_SUCCESS);
         if (ln.buf)  }
                 free(ln.buf);  
         if (outfree)  
                 (*outfree)(outdata);  
   
         mdoc_free(mdoc);  
   
         return(rc ? EXIT_SUCCESS : EXIT_FAILURE);  static void
   usage(void)
   {
   
           (void)fprintf(stderr, "usage: %s [-V] [-foption] "
                           "[-mformat] [-Ooption] [-Toutput] "
                           "[-Werr] [file...]\n", progname);
           exit(EXIT_FAILURE);
 }  }
   
   
 __dead static void  static struct man *
 version(void)  man_init(struct curparse *curp)
 {  {
           int              pflags;
           struct man_cb    mancb;
   
         (void)printf("%s %s\n", __progname, VERSION);          mancb.man_err = merr;
         exit(0);          mancb.man_warn = mwarn;
         /* NOTREACHED */  
           /* Defaults from mandoc.1. */
   
           pflags = MAN_IGN_MACRO | MAN_IGN_ESCAPE;
   
           if (curp->fflags & FL_NIGN_MACRO)
                   pflags &= ~MAN_IGN_MACRO;
           if (curp->fflags & FL_NIGN_ESCAPE)
                   pflags &= ~MAN_IGN_ESCAPE;
   
           return(man_alloc(curp, pflags, &mancb));
 }  }
   
   
 __dead static void  static struct roff *
 usage(void)  roff_init(struct curparse *curp)
 {  {
   
         (void)fprintf(stderr, "usage: %s\n", __progname);          return(roff_alloc(mmsg, curp));
         exit(1);  
         /* NOTREACHED */  
 }  }
   
   
 static int  static struct mdoc *
 file(struct buf *blk, struct buf *ln,  mdoc_init(struct curparse *curp)
                 const char *file, struct mdoc *mdoc)  
 {  {
         int              fd, c;          int              pflags;
           struct mdoc_cb   mdoccb;
   
         if (-1 == (fd = open(file, O_RDONLY, 0))) {          mdoccb.mdoc_err = merr;
                 warn("%s", file);          mdoccb.mdoc_warn = mwarn;
                 return(0);  
           /* Defaults from mandoc.1. */
   
           pflags = MDOC_IGN_MACRO | MDOC_IGN_ESCAPE;
   
           if (curp->fflags & FL_IGN_SCOPE)
                   pflags |= MDOC_IGN_SCOPE;
           if (curp->fflags & FL_NIGN_ESCAPE)
                   pflags &= ~MDOC_IGN_ESCAPE;
           if (curp->fflags & FL_NIGN_MACRO)
                   pflags &= ~MDOC_IGN_MACRO;
   
           return(mdoc_alloc(curp, pflags, &mdoccb));
   }
   
   
   static void
   ffile(const char *file, struct curparse *curp)
   {
   
           curp->file = file;
           if (-1 == (curp->fd = open(curp->file, O_RDONLY, 0))) {
                   perror(curp->file);
                   with_error = 1;
                   return;
         }          }
   
         c = fdesc(blk, ln, file, fd, mdoc);          fdesc(curp);
   
         if (-1 == close(fd))          if (-1 == close(curp->fd))
                 warn("%s", file);                  perror(curp->file);
   }
   
         return(c);  
   static int
   resize_buf(struct buf *buf, size_t initial)
   {
           void *tmp;
           size_t sz;
   
           if (buf->sz == 0)
                   sz = initial;
           else
                   sz = 2 * buf->sz;
           tmp = realloc(buf->buf, sz);
           if (NULL == tmp) {
                   perror(NULL);
                   return(0);
           }
           buf->buf = tmp;
           buf->sz = sz;
           return(1);
 }  }
   
   
 static int  static int
 fdesc(struct buf *blk, struct buf *ln,  read_whole_file(struct curparse *curp, struct buf *fb, int *with_mmap)
                 const char *f, int fd, struct mdoc *mdoc)  
 {  {
         size_t           sz;  
         ssize_t          ssz;  
         struct stat      st;          struct stat      st;
         int              j, i, pos, lnn;          size_t           off;
 #ifdef  STRIP_XO          ssize_t          ssz;
         int              macro, xo, xeoln;  
 #endif  
   
           if (-1 == fstat(curp->fd, &st)) {
                   perror(curp->file);
                   with_error = 1;
                   return(0);
           }
   
         /*          /*
          * Two buffers: ln and buf.  buf is the input buffer, optimised           * If we're a regular file, try just reading in the whole entry
          * for each file's block size.  ln is a line buffer.  Both           * via mmap().  This is faster than reading it into blocks, and
          * growable, hence passed in by ptr-ptr.           * since each file is only a few bytes to begin with, I'm not
            * concerned that this is going to tank any machines.
          */           */
   
         sz = BUFSIZ;          if (S_ISREG(st.st_mode)) {
                   if (st.st_size >= (1U << 31)) {
         if (-1 == fstat(fd, &st))                          fprintf(stderr, "%s: input too large\n",
                 warnx("%s", f);                                          curp->file);
         else if ((size_t)st.st_blksize > sz)                          with_error = 1;
                 sz = st.st_blksize;                          return(0);
                   }
         if (sz > blk->sz) {                  *with_mmap = 1;
                 blk->buf = realloc(blk->buf, sz);                  fb->sz = (size_t)st.st_size;
                 if (NULL == blk->buf)                  fb->buf = mmap(NULL, fb->sz, PROT_READ,
                         err(1, "realloc");                                  MAP_FILE, curp->fd, 0);
                 blk->sz = sz;                  if (fb->buf != MAP_FAILED)
                           return(1);
         }          }
   
         /*          /*
          * Fill buf with file blocksize and parse newlines into ln.           * If this isn't a regular file (like, say, stdin), then we must
            * go the old way and just read things in bit by bit.
          */           */
 #ifdef  STRIP_XO  
         macro = xo = xeoln = 0;  
 #endif  
   
         for (lnn = 1, pos = 0; ; ) {          *with_mmap = 0;
                 if (-1 == (ssz = read(fd, blk->buf, sz))) {          off = 0;
                         warn("%s", f);          fb->sz = 0;
                         return(0);          fb->buf = NULL;
                 } else if (0 == ssz)          for (;;) {
                   if (off == fb->sz) {
                           if (fb->sz == (1U << 31)) {
                                   fprintf(stderr, "%s: input too large\n",
                                                   curp->file);
                                   break;
                           }
                           if (! resize_buf(fb, 65536))
                                   break;
                   }
                   ssz = read(curp->fd, fb->buf + (int)off, fb->sz - off);
                   if (ssz == 0) {
                           fb->sz = off;
                           return(1);
                   }
                   if (ssz == -1) {
                           perror(curp->file);
                         break;                          break;
                   }
                   off += (size_t)ssz;
           }
   
                 for (i = 0; i < (int)ssz; i++) {          free(fb->buf);
                         if (pos >= (int)ln->sz) {          fb->buf = NULL;
                                 ln->sz += 256; /* Step-size. */          with_error = 1;
                                 ln->buf = realloc(ln->buf, ln->sz);          return(0);
                                 if (NULL == ln->buf)  }
                                         err(1, "realloc");  
                         }  
   
                         if ('\n' != blk->buf[i]) {  
                                 /*  
                                  * Ugly of uglies.  Here we handle the  
                                  * dreaded `Xo/Xc' scoping.  Cover the  
                                  * eyes of any nearby children.  This  
                                  * makes `Xo/Xc' enclosures look like  
                                  * one huge line.  
                                  */  
 #ifdef  STRIP_XO  
                                 /*  
                                  * First, note whether we're in a macro  
                                  * line.  
                                  */  
                                 if (0 == pos && '.' == blk->buf[i])  
                                         macro = 1;  
   
                                 /*  static void
                                  * If we're in an `Xo' context and just  fdesc(struct curparse *curp)
                                  * nixed a newline, remove the control  {
                                  * character for new macro lines:          struct buf       ln, blk;
                                  * they're going to show up as all part          int              i, pos, lnn, lnn_start, with_mmap, of;
                                  * of the same line.          enum rofferr     re;
                                  */          struct man      *man;
                                 if (xo && xeoln && '.' == blk->buf[i]) {          struct mdoc     *mdoc;
                                         xeoln = 0;          struct roff     *roff;
                                         continue;  
                                 }  
                                 xeoln = 0;  
   
                                 /*          man = NULL;
                                  * If we've parsed `Xo', enter an xo          mdoc = NULL;
                                  * context.  `Xo' must be in a parsable          roff = NULL;
                                  * state.  This is the ugly part.  IT IS          memset(&ln, 0, sizeof(struct buf));
                                  * NOT SMART ENOUGH TO HANDLE ESCAPED  
                                  * WHITESPACE.  
                                  */  
                                 if (macro && pos && 'o' == blk->buf[i]) {  
                                         if (xo && 'X' == ln->buf[pos - 1])  {  
                                                 if (' ' == ln->buf[pos - 2])  
                                                         xo++;  
                                         } else if ('X' == ln->buf[pos - 1]) {  
                                                 if (2 == pos && '.' == ln->buf[pos - 2])  
                                                         xo++;  
                                                 else if (' ' == ln->buf[pos - 2])  
                                                         xo++;  
                                         }  
                                 }  
   
                                 /*          /*
                                  * If we're parsed `Xc', leave an xo           * Two buffers: ln and buf.  buf is the input file and may be
                                  * context if one's already pending.           * memory mapped.  ln is a line buffer and grows on-demand.
                                  * `Xc' must be in a parsable state.           */
                                  * THIS IS NOT SMART ENOUGH TO HANDLE  
                                  * ESCAPED WHITESPACE.  
                                  */  
                                 if (macro && pos && 'c' == blk->buf[i])  
                                         if (xo && 'X' == ln->buf[pos - 1])  
                                                 if (' ' == ln->buf[pos - 2])  
                                                         xo--;  
 #endif  /* STRIP_XO */  
   
                                 ln->buf[pos++] = blk->buf[i];          if ( ! read_whole_file(curp, &blk, &with_mmap))
                                 continue;                  return;
                         }  
   
                         /* Check for CPP-escaped newline.  */          if (NULL == curp->roff)
                   curp->roff = roff_init(curp);
           if (NULL == (roff = curp->roff))
                   goto bailout;
   
                         if (pos > 0 && '\\' == ln->buf[pos - 1]) {          for (i = 0, lnn = 1; i < (int)blk.sz;) {
                                 for (j = pos - 1; j >= 0; j--)                  pos = 0;
                                         if ('\\' != ln->buf[j])                  lnn_start = lnn;
                   while (i < (int)blk.sz) {
                           if ('\n' == blk.buf[i]) {
                                   ++i;
                                   ++lnn;
                                   break;
                           }
                           /* Trailing backslash is like a plain character. */
                           if ('\\' != blk.buf[i] || i + 1 == (int)blk.sz) {
                                   if (pos >= (int)ln.sz)
                                           if (! resize_buf(&ln, 256))
                                                   goto bailout;
                                   ln.buf[pos++] = blk.buf[i++];
                                   continue;
                           }
                           /* Found an escape and at least one other character. */
                           if ('\n' == blk.buf[i + 1]) {
                                   /* Escaped newlines are skipped over */
                                   i += 2;
                                   ++lnn;
                                   continue;
                           }
                           if ('"' == blk.buf[i + 1]) {
                                   i += 2;
                                   /* Comment, skip to end of line */
                                   for (; i < (int)blk.sz; ++i) {
                                           if ('\n' == blk.buf[i]) {
                                                   ++i;
                                                   ++lnn;
                                                 break;                                                  break;
                                           }
                                 if ( ! ((pos - j) % 2)) {  
                                         pos--;  
                                         lnn++;  
                                         continue;  
                                 }                                  }
                                   /* Backout trailing whitespaces */
                                   for (; pos > 0; --pos) {
                                           if (ln.buf[pos - 1] != ' ')
                                                   break;
                                           if (pos > 2 && ln.buf[pos - 2] == '\\')
                                                   break;
                                   }
                                   break;
                         }                          }
                           /* Some other escape sequence, copy and continue. */
                           if (pos + 1 >= (int)ln.sz)
                                   if (! resize_buf(&ln, 256))
                                           goto bailout;
   
 #ifdef  STRIP_XO                          ln.buf[pos++] = blk.buf[i++];
                         /*                          ln.buf[pos++] = blk.buf[i++];
                          * If we're in an xo context, put a space in                  }
                          * place of the newline and continue parsing.  
                          * Mark that we just did a newline.  
                          */  
                         if (xo) {  
                                 xeoln = 1;  
                                 ln->buf[pos++] = ' ';  
                                 lnn++;  
                                 continue;  
                         }  
                         macro = 0;  
 #endif  /* STRIP_XO */  
   
                         ln->buf[pos] = 0;                  if (pos >= (int)ln.sz)
                         if ( ! mdoc_parseln(mdoc, lnn, ln->buf))                          if (! resize_buf(&ln, 256))
                                 return(0);                                  goto bailout;
                         lnn++;                  ln.buf[pos] = '\0';
                         pos = 0;  
                   /*
                    * A significant amount of complexity is contained by
                    * the roff preprocessor.  It's line-oriented but can be
                    * expressed on one line, so we need at times to
                    * readjust our starting point and re-run it.  The roff
                    * preprocessor can also readjust the buffers with new
                    * data, so we pass them in wholesale.
                    */
   
                   of = 0;
                   do {
                           re = roff_parseln(roff, lnn_start,
                                           &ln.buf, &ln.sz, of, &of);
                   } while (ROFF_RERUN == re);
   
                   if (ROFF_IGN == re)
                           continue;
                   else if (ROFF_ERR == re)
                           goto bailout;
   
                   /*
                    * If input parsers have not been allocated, do so now.
                    * We keep these instanced betwen parsers, but set them
                    * locally per parse routine since we can use different
                    * parsers with each one.
                    */
   
                   if ( ! (man || mdoc))
                           if ( ! pset(ln.buf + of, pos - of, curp, &man, &mdoc))
                                   goto bailout;
   
                   /* Lastly, push down into the parsers themselves. */
   
                   if (man && ! man_parseln(man, lnn_start, ln.buf, of))
                           goto bailout;
                   if (mdoc && ! mdoc_parseln(mdoc, lnn_start, ln.buf, of))
                           goto bailout;
           }
   
           /* NOTE a parser may not have been assigned, yet. */
   
           if ( ! (man || mdoc)) {
                   fprintf(stderr, "%s: Not a manual\n", curp->file);
                   goto bailout;
           }
   
           /* Clean up the parse routine ASTs. */
   
           if (mdoc && ! mdoc_endparse(mdoc))
                   goto bailout;
           if (man && ! man_endparse(man))
                   goto bailout;
           if (roff && ! roff_endparse(roff))
                   goto bailout;
   
           /* If unset, allocate output dev now (if applicable). */
   
           if ( ! (curp->outman && curp->outmdoc)) {
                   switch (curp->outtype) {
                   case (OUTT_XHTML):
                           curp->outdata = xhtml_alloc(curp->outopts);
                           curp->outman = html_man;
                           curp->outmdoc = html_mdoc;
                           curp->outfree = html_free;
                           break;
                   case (OUTT_HTML):
                           curp->outdata = html_alloc(curp->outopts);
                           curp->outman = html_man;
                           curp->outmdoc = html_mdoc;
                           curp->outfree = html_free;
                           break;
                   case (OUTT_TREE):
                           curp->outman = tree_man;
                           curp->outmdoc = tree_mdoc;
                           break;
                   case (OUTT_LINT):
                           break;
                   default:
                           curp->outdata = ascii_alloc(80);
                           curp->outman = terminal_man;
                           curp->outmdoc = terminal_mdoc;
                           curp->outfree = terminal_free;
                           break;
                 }                  }
         }          }
   
         return(mdoc_endparse(mdoc));          /* Execute the out device, if it exists. */
   
           if (man && curp->outman)
                   (*curp->outman)(curp->outdata, man);
           if (mdoc && curp->outmdoc)
                   (*curp->outmdoc)(curp->outdata, mdoc);
   
    cleanup:
           if (mdoc)
                   mdoc_reset(mdoc);
           if (man)
                   man_reset(man);
           if (roff)
                   roff_reset(roff);
           if (ln.buf)
                   free(ln.buf);
           if (with_mmap)
                   munmap(blk.buf, blk.sz);
           else
                   free(blk.buf);
   
           return;
   
    bailout:
           with_error = 1;
           goto cleanup;
 }  }
   
   
 static int  static int
 toptions(enum outt *tflags, char *arg)  pset(const char *buf, int pos, struct curparse *curp,
                   struct man **man, struct mdoc **mdoc)
 {  {
           int              i;
   
           /*
            * Try to intuit which kind of manual parser should be used.  If
            * passed in by command-line (-man, -mdoc), then use that
            * explicitly.  If passed as -mandoc, then try to guess from the
            * line: either skip dot-lines, use -mdoc when finding `.Dt', or
            * default to -man, which is more lenient.
            */
   
           if ('.' == buf[0] || '\'' == buf[0]) {
                   for (i = 1; buf[i]; i++)
                           if (' ' != buf[i] && '\t' != buf[i])
                                   break;
                   if (0 == buf[i])
                           return(1);
           }
   
           switch (curp->inttype) {
           case (INTT_MDOC):
                   if (NULL == curp->mdoc)
                           curp->mdoc = mdoc_init(curp);
                   if (NULL == (*mdoc = curp->mdoc))
                           return(0);
                   return(1);
           case (INTT_MAN):
                   if (NULL == curp->man)
                           curp->man = man_init(curp);
                   if (NULL == (*man = curp->man))
                           return(0);
                   return(1);
           default:
                   break;
           }
   
           if (pos >= 3 && 0 == memcmp(buf, ".Dd", 3))  {
                   if (NULL == curp->mdoc)
                           curp->mdoc = mdoc_init(curp);
                   if (NULL == (*mdoc = curp->mdoc))
                           return(0);
                   return(1);
           }
   
           if (NULL == curp->man)
                   curp->man = man_init(curp);
           if (NULL == (*man = curp->man))
                   return(0);
           return(1);
   }
   
   
   static int
   moptions(enum intt *tflags, char *arg)
   {
   
           if (0 == strcmp(arg, "doc"))
                   *tflags = INTT_MDOC;
           else if (0 == strcmp(arg, "andoc"))
                   *tflags = INTT_AUTO;
           else if (0 == strcmp(arg, "an"))
                   *tflags = INTT_MAN;
           else {
                   fprintf(stderr, "%s: Bad argument\n", arg);
                   return(0);
           }
   
           return(1);
   }
   
   
   static int
   toptions(struct curparse *curp, char *arg)
   {
   
         if (0 == strcmp(arg, "ascii"))          if (0 == strcmp(arg, "ascii"))
                 *tflags = OUTT_ASCII;                  curp->outtype = OUTT_ASCII;
         else if (0 == strcmp(arg, "latin1"))          else if (0 == strcmp(arg, "lint")) {
                 *tflags = OUTT_LATIN1;                  curp->outtype = OUTT_LINT;
         else if (0 == strcmp(arg, "utf8"))                  curp->wflags |= WARN_WALL;
                 *tflags = OUTT_UTF8;                  curp->fflags |= FL_STRICT;
         else if (0 == strcmp(arg, "lint"))          }
                 *tflags = OUTT_LINT;  
         else if (0 == strcmp(arg, "tree"))          else if (0 == strcmp(arg, "tree"))
                 *tflags = OUTT_TREE;                  curp->outtype = OUTT_TREE;
           else if (0 == strcmp(arg, "html"))
                   curp->outtype = OUTT_HTML;
           else if (0 == strcmp(arg, "xhtml"))
                   curp->outtype = OUTT_XHTML;
         else {          else {
                 warnx("bad argument: -T%s", arg);                  fprintf(stderr, "%s: Bad argument\n", arg);
                 return(0);                  return(0);
         }          }
   
Line 439  toptions(enum outt *tflags, char *arg)
Line 682  toptions(enum outt *tflags, char *arg)
 }  }
   
   
 /*  
  * Parse out the options for [-fopt...] setting compiler options.  These  
  * can be comma-delimited or called again.  
  */  
 static int  static int
 foptions(int *fflags, char *arg)  foptions(int *fflags, char *arg)
 {  {
         char            *v;          char            *v, *o;
         char            *toks[4];          const char      *toks[8];
   
         toks[0] = "ign-scope";          toks[0] = "ign-scope";
         toks[1] = "ign-escape";          toks[1] = "no-ign-escape";
         toks[2] = "ign-macro";          toks[2] = "no-ign-macro";
         toks[3] = NULL;          toks[3] = "ign-errors";
           toks[4] = "strict";
           toks[5] = "ign-escape";
           toks[6] = NULL;
   
         while (*arg)          while (*arg) {
                 switch (getsubopt(&arg, toks, &v)) {                  o = arg;
                   switch (getsubopt(&arg, UNCONST(toks), &v)) {
                 case (0):                  case (0):
                         *fflags |= MDOC_IGN_SCOPE;                          *fflags |= FL_IGN_SCOPE;
                         break;                          break;
                 case (1):                  case (1):
                         *fflags |= MDOC_IGN_ESCAPE;                          *fflags |= FL_NIGN_ESCAPE;
                         break;                          break;
                 case (2):                  case (2):
                         *fflags |= MDOC_IGN_MACRO;                          *fflags |= FL_NIGN_MACRO;
                         break;                          break;
                   case (3):
                           *fflags |= FL_IGN_ERRORS;
                           break;
                   case (4):
                           *fflags |= FL_STRICT;
                           break;
                   case (5):
                           *fflags &= ~FL_NIGN_ESCAPE;
                           break;
                 default:                  default:
                         warnx("bad argument: -f%s", arg);                          fprintf(stderr, "%s: Bad argument\n", o);
                         return(0);                          return(0);
                 }                  }
           }
   
         return(1);          return(1);
 }  }
   
   
 /*  
  * Parse out the options for [-Werr...], which sets warning modes.  
  * These can be comma-delimited or called again.  
  */  
 static int  static int
 woptions(int *wflags, char *arg)  woptions(int *wflags, char *arg)
 {  {
         char            *v;          char            *v, *o;
         char            *toks[5];          const char      *toks[3];
   
         toks[0] = "all";          toks[0] = "all";
         toks[1] = "compat";          toks[1] = "error";
         toks[2] = "syntax";          toks[2] = NULL;
         toks[3] = "error";  
         toks[4] = NULL;  
   
         while (*arg)          while (*arg) {
                 switch (getsubopt(&arg, toks, &v)) {                  o = arg;
                   switch (getsubopt(&arg, UNCONST(toks), &v)) {
                 case (0):                  case (0):
                         *wflags |= WARN_WALL;                          *wflags |= WARN_WALL;
                         break;                          break;
                 case (1):                  case (1):
                         *wflags |= WARN_WCOMPAT;  
                         break;  
                 case (2):  
                         *wflags |= WARN_WSYNTAX;  
                         break;  
                 case (3):  
                         *wflags |= WARN_WERR;                          *wflags |= WARN_WERR;
                         break;                          break;
                 default:                  default:
                         warnx("bad argument: -W%s", arg);                          fprintf(stderr, "%s: Bad argument\n", o);
                         return(0);                          return(0);
                 }                  }
           }
   
         return(1);          return(1);
 }  }
Line 521  merr(void *arg, int line, int col, const char *msg)
Line 764  merr(void *arg, int line, int col, const char *msg)
   
         curp = (struct curparse *)arg;          curp = (struct curparse *)arg;
   
         warnx("%s:%d: error: %s (column %d)",          (void)fprintf(stderr, "%s:%d:%d: error: %s\n",
                         curp->file, line, msg, col);                          curp->file, line, col + 1, msg);
   
           with_error = 1;
   
         return(0);          return(0);
 }  }
   
   
 static int  static int
 mwarn(void *arg, int line, int col,  mwarn(void *arg, int line, int col, const char *msg)
                 enum mdoc_warn type, const char *msg)  
 {  {
         struct curparse *curp;          struct curparse *curp;
         char            *wtype;  
   
         curp = (struct curparse *)arg;          curp = (struct curparse *)arg;
         wtype = NULL;  
   
         switch (type) {          if ( ! (curp->wflags & WARN_WALL))
         case (WARN_COMPAT):  
                 wtype = "compat";  
                 if (curp->wflags & WARN_WCOMPAT)  
                         break;  
                 return(1);                  return(1);
         case (WARN_SYNTAX):  
                 wtype = "syntax";  
                 if (curp->wflags & WARN_WSYNTAX)  
                         break;  
                 return(1);  
         }  
   
         assert(wtype);          (void)fprintf(stderr, "%s:%d:%d: warning: %s\n",
         warnx("%s:%d: %s warning: %s (column %d)",                          curp->file, line, col + 1, msg);
                         curp->file, line, wtype, msg, col);  
   
         if ( ! (curp->wflags & WARN_WERR))          with_warning = 1;
                 return(1);          if (curp->wflags & WARN_WERR) {
                   with_error = 1;
                   return(0);
           }
   
         warnx("%s: considering warnings as errors",          return(1);
                         __progname);  
         return(0);  
 }  }
   
   static  const char * const      mandocerrs[MANDOCERR_MAX] = {
           "ok",
           "multi-line scope open on exit",
           "request for scope closure when no matching scope is open",
           "line arguments will be lost",
           "memory exhausted"
   };
   
   /*
    * XXX: this is experimental code that will eventually become the
    * generic means of covering all warnings and errors!
    */
   /* ARGSUSED */
   static int
   mmsg(enum mandocerr t, void *arg, int ln, int col, const char *msg)
   {
   #if 0
           struct curparse *cp;
   
           cp = (struct curparse *)arg;
   
           fprintf(stderr, "%s:%d:%d: %s", cp->file,
                           ln, col + 1, mandocerrs[t]);
   
           if (msg)
                   fprintf(stderr, ": %s", msg);
   
           fputc('\n', stderr);
   #endif
           return(1);
   }

Legend:
Removed from v.1.9  
changed lines
  Added in v.1.76

CVSweb