[BACK]Return to pod2mdoc.c CVS log [TXT][DIR] Up to [cvsweb.bsd.lv] / pod2mdoc

Diff for /pod2mdoc/pod2mdoc.c between version 1.29 and 1.31

version 1.29, 2014/07/11 20:45:55 version 1.31, 2014/07/15 19:03:07
Line 53  enum sect {
Line 53  enum sect {
 };  };
   
 struct  state {  struct  state {
           const char      *fname; /* file being parsed */
         int              parsing; /* after =cut of before command */          int              parsing; /* after =cut of before command */
         int              paused; /* in =begin and before =end */          int              paused; /* in =begin and before =end */
         int              haspar; /* in paragraph: do we need Pp? */  
         enum sect        sect; /* which section are we in? */          enum sect        sect; /* which section are we in? */
         const char      *fname; /* file being parsed */  
 #define LIST_STACKSZ     128  #define LIST_STACKSZ     128
         enum list        lstack[LIST_STACKSZ]; /* open lists */          enum list        lstack[LIST_STACKSZ]; /* open lists */
         size_t           lpos; /* where in list stack */          size_t           lpos; /* where in list stack */
           int              haspar; /* in paragraph: do we need Pp? */
           int              hasnl; /* in text: just started a new line */
           char            *outbuf; /* text buffered for output */
           size_t           outbufsz; /* allocated size of outbuf */
           size_t           outbuflen; /* current length of outbuf */
 };  };
   
 enum    fmt {  enum    fmt {
Line 123  static const char fmts[FMT__MAX] = {
Line 127  static const char fmts[FMT__MAX] = {
   
 static  int     last;  static  int     last;
   
   
   static void
   outbuf_grow(struct state *st, size_t by)
   {
   
           st->outbufsz += (by / 128 + 1) * 128;
           st->outbuf = realloc(st->outbuf, st->outbufsz);
           if (NULL == st->outbuf) {
                   perror(NULL);
                   exit(EXIT_FAILURE);
           }
   }
   
   static void
   outbuf_addchar(struct state *st)
   {
   
           if (st->outbuflen + 2 >= st->outbufsz)
                   outbuf_grow(st, 1);
           st->outbuf[st->outbuflen++] = last;
           if ('\\' == last)
                   st->outbuf[st->outbuflen++] = 'e';
           st->outbuf[st->outbuflen] = '\0';
   }
   
   static void
   outbuf_addstr(struct state *st, const char *str)
   {
           size_t   slen;
   
           slen = strlen(str);
           if (st->outbuflen + slen >= st->outbufsz)
                   outbuf_grow(st, slen);
           memcpy(st->outbuf + st->outbuflen, str, slen+1);
           last = str[slen - 1];
   }
   
   static void
   outbuf_flush(struct state *st)
   {
   
           if (0 == st->outbuflen)
                   return;
   
           fputs(st->outbuf, stdout);
           *st->outbuf = '\0';
           st->outbuflen = 0;
           st->hasnl = 0;
   }
   
   static void
   outbuf_newln(struct state *st)
   {
   
           if ('\n' == last)
                   return;
           outbuf_flush(st);
           putchar('\n');
           last = '\n';
           st->hasnl = 1;
   }
   
 /*  /*
  * Given buf[*start] is at the start of an escape name, read til the end   * Given buf[*start] is at the start of an escape name, read til the end
  * of the escape ('>') then try to do something with it.   * of the escape ('>') then try to do something with it.
  * Sets start to be one after the '>'.   * Sets start to be one after the '>'.
  */   */
 static void  static void
 formatescape(const char *buf, size_t *start, size_t end)  formatescape(struct state *st, const char *buf, size_t *start, size_t end)
 {  {
         char             esc[16]; /* no more needed */          char             esc[16]; /* no more needed */
         size_t           i, max;          size_t           i, max;
Line 157  formatescape(const char *buf, size_t *start, size_t en
Line 223  formatescape(const char *buf, size_t *start, size_t en
          * Just let the rest of them go.           * Just let the rest of them go.
          */           */
         if (0 == strcmp(esc, "lt"))          if (0 == strcmp(esc, "lt"))
                 printf("\\(la");                  outbuf_addstr(st, "\\(la");
         else if (0 == strcmp(esc, "gt"))          else if (0 == strcmp(esc, "gt"))
                 printf("\\(ra");                  outbuf_addstr(st, "\\(ra");
         else if (0 == strcmp(esc, "vb"))          else if (0 == strcmp(esc, "vb"))
                 printf("\\(ba");                  outbuf_addstr(st, "\\(ba");
         else if (0 == strcmp(esc, "sol"))          else if (0 == strcmp(esc, "sol"))
                 printf("\\(sl");                  outbuf_addstr(st, "\\(sl");
         else  
                 return;  
   
         last = 'a';  
 }  }
   
 /*  /*
Line 391  formatcode(struct state *st, const char *buf, size_t *
Line 453  formatcode(struct state *st, const char *buf, size_t *
 {  {
         enum fmt         fmt;          enum fmt         fmt;
         size_t           i, j, dsz;          size_t           i, j, dsz;
           int              white;
   
         assert(*start + 1 < end);          assert(*start + 1 < end);
         assert('<' == buf[*start + 1]);          assert('<' == buf[*start + 1]);
   
         /*          /*
          * First, look up the format code.           * First, look up the format code.
          * If it's not valid, then exit immediately.           * If it's not valid, treat it as a NOOP.
          */           */
         for (fmt = 0; fmt < FMT__MAX; fmt++)          for (fmt = 0; fmt < FMT__MAX; fmt++)
                 if (buf[*start] == fmts[fmt])                  if (buf[*start] == fmts[fmt])
                         break;                          break;
   
         if (FMT__MAX == fmt) {  
                 putchar(last = buf[(*start)++]);  
                 if ('\\' == last)  
                         putchar('e');  
                 return(0);  
         }  
   
         /*          /*
          * Determine whether we're overriding our delimiter.           * Determine whether we're overriding our delimiter.
          * According to POD, if we have more than one '<' followed by a           * According to POD, if we have more than one '<' followed by a
Line 434  formatcode(struct state *st, const char *buf, size_t *
Line 490  formatcode(struct state *st, const char *buf, size_t *
          * processing for real macros.           * processing for real macros.
          */           */
         if (FMT_ESCAPE == fmt) {          if (FMT_ESCAPE == fmt) {
                 formatescape(buf, start, end);                  formatescape(st, buf, start, end);
                 return(0);                  return(0);
         } else if (FMT_NULL == fmt || FMT_INDEX == fmt) {          } else if (FMT_NULL == fmt || FMT_INDEX == fmt) {
                 /*                  /*
Line 472  formatcode(struct state *st, const char *buf, size_t *
Line 528  formatcode(struct state *st, const char *buf, size_t *
          * Check whether we're supposed to print macro stuff (this is           * Check whether we're supposed to print macro stuff (this is
          * suppressed in, e.g., "Nm" and "Sh" macros).           * suppressed in, e.g., "Nm" and "Sh" macros).
          */           */
         if ( ! nomacro) {          if (FMT__MAX != fmt && !nomacro) {
                   white = ' ' == last || '\n' == last ||
                           ' ' == buf[*start];
   
                 /*                  /*
                  * Print out the macro describing this format code.                   * If we are on a text line and there is no
                  * If we're not "reentrant" (not yet on a macro line)                   * whitespace before our content, we have to make
                  * then print a newline, if necessary, and the macro                   * the previous word a prefix to the macro line.
                  * indicator.  
                  * Otherwise, offset us with a space.  
                  */                   */
                 if ( ! reentrant) {  
                   if ( ! white && ! reentrant) {
                           if ( ! st->hasnl)
                                   putchar('\n');
                           printf(".Pf ");
                   }
   
                   outbuf_flush(st);
   
                   /* Whitespace is easier to suppress on macro lines. */
   
                   if ( ! white && reentrant)
                           printf(" Ns");
   
                   /* Unless we are on a macro line, start one. */
   
                   if (white && ! reentrant) {
                         if (last != '\n')                          if (last != '\n')
                                 putchar('\n');                                  putchar('\n');
                         putchar('.');                          putchar('.');
                 } else                  } else
                         putchar(' ');                          putchar(' ');
   
                 /*  
                  * If we don't have whitespace before us (and none after  
                  * the opening delimiter), then suppress macro  
                  * whitespace with Pf.  
                  */  
                 if (' ' != last && '\n' != last && ' ' != buf[*start])  
                         printf("Pf ");  
   
                   /* Print the macro corresponding to this format code. */
   
                 switch (fmt) {                  switch (fmt) {
                 case (FMT_ITALIC):                  case (FMT_ITALIC):
                         printf("Em ");                          printf("Em ");
Line 533  formatcode(struct state *st, const char *buf, size_t *
Line 600  formatcode(struct state *st, const char *buf, size_t *
                 default:                  default:
                         abort();                          abort();
                 }                  }
         }          } else
                   outbuf_flush(st);
   
         /*          /*
          * Process until we reach the end marker (e.g., '>') or until we           * Process until we reach the end marker (e.g., '>') or until we
Line 599  formatcode(struct state *st, const char *buf, size_t *
Line 667  formatcode(struct state *st, const char *buf, size_t *
                                 (*start)++;                                  (*start)++;
         }          }
   
           if (FMT__MAX == fmt)
                   return(0);
   
         if ( ! nomacro && FMT_CODE == fmt)          if ( ! nomacro && FMT_CODE == fmt)
                 printf(" Qc ");                  printf(" Qc ");
   
Line 734  command(struct state *st, const char *buf, size_t star
Line 805  command(struct state *st, const char *buf, size_t star
                                 st->sect = SECT_SYNOPSIS;                                  st->sect = SECT_SYNOPSIS;
                 }                  }
                 formatcodeln(st, buf, &start, end, 1);                  formatcodeln(st, buf, &start, end, 1);
                 putchar('\n');                  putchar(last = '\n');
                 st->haspar = 1;                  st->haspar = 1;
                 break;                  break;
         case (CMD_HEAD2):          case (CMD_HEAD2):
                 printf(".Ss ");                  printf(".Ss ");
                 formatcodeln(st, buf, &start, end, 1);                  formatcodeln(st, buf, &start, end, 1);
                 putchar('\n');                  putchar(last = '\n');
                 st->haspar = 1;                  st->haspar = 1;
                 break;                  break;
         case (CMD_HEAD3):          case (CMD_HEAD3):
                 puts(".Pp");                  puts(".Pp");
                 printf(".Em ");                  printf(".Em ");
                 formatcodeln(st, buf, &start, end, 0);                  formatcodeln(st, buf, &start, end, 0);
                 putchar('\n');                  putchar(last = '\n');
                 puts(".Pp");                  puts(".Pp");
                 st->haspar = 1;                  st->haspar = 1;
                 break;                  break;
Line 755  command(struct state *st, const char *buf, size_t star
Line 826  command(struct state *st, const char *buf, size_t star
                 puts(".Pp");                  puts(".Pp");
                 printf(".No ");                  printf(".No ");
                 formatcodeln(st, buf, &start, end, 0);                  formatcodeln(st, buf, &start, end, 0);
                 putchar('\n');                  putchar(last = '\n');
                 puts(".Pp");                  puts(".Pp");
                 st->haspar = 1;                  st->haspar = 1;
                 break;                  break;
Line 809  command(struct state *st, const char *buf, size_t star
Line 880  command(struct state *st, const char *buf, size_t star
                 case (LIST_TAG):                  case (LIST_TAG):
                         printf(".It ");                          printf(".It ");
                         formatcodeln(st, buf, &start, end, 0);                          formatcodeln(st, buf, &start, end, 0);
                         putchar('\n');                          putchar(last = '\n');
                         break;                          break;
                 case (LIST_ENUM):                  case (LIST_ENUM):
                         /* FALLTHROUGH */                          /* FALLTHROUGH */
Line 865  command(struct state *st, const char *buf, size_t star
Line 936  command(struct state *st, const char *buf, size_t star
 static void  static void
 verbatim(struct state *st, const char *buf, size_t start, size_t end)  verbatim(struct state *st, const char *buf, size_t start, size_t end)
 {  {
         int              last;  
         size_t           i;          size_t           i;
   
         if ( ! st->parsing || st->paused)          if ( ! st->parsing || st->paused)
Line 920  again:
Line 990  again:
                 if ('\\' == buf[start])                  if ('\\' == buf[start])
                         printf("e");                          printf("e");
         }          }
         putchar('\n');          putchar(last = '\n');
         puts(".Ed");          puts(".Ed");
 }  }
   
Line 950  hasmatch(const char *buf, size_t start, size_t end)
Line 1020  hasmatch(const char *buf, size_t start, size_t end)
  * If we're an ending bracket, see if we have a stack already.   * If we're an ending bracket, see if we have a stack already.
  */   */
 static int  static int
 dosynopsisop(const char *buf, int *last,  dosynopsisop(const char *buf, size_t *start, size_t end, size_t *opstack)
         size_t *start, size_t end, size_t *opstack)  
 {  {
   
         assert('[' == buf[*start] || ']' == buf[*start]);          assert('[' == buf[*start] || ']' == buf[*start]);
   
         if ('[' == buf[*start] && hasmatch(buf, *start + 1, end)) {          if ('[' == buf[*start] && hasmatch(buf, *start + 1, end)) {
                 if ('\n' != *last)                  if ('\n' != last)
                         putchar('\n');                          putchar('\n');
                 puts(".Oo");                  puts(".Oo");
                 (*opstack)++;                  (*opstack)++;
Line 965  dosynopsisop(const char *buf, int *last,
Line 1034  dosynopsisop(const char *buf, int *last,
                 return(0);                  return(0);
   
         if (']' == buf[*start] && *opstack > 0) {          if (']' == buf[*start] && *opstack > 0) {
                 if ('\n' != *last)                  if ('\n' != last)
                         putchar('\n');                          putchar('\n');
                 puts(".Oc");                  puts(".Oc");
                 (*opstack)--;                  (*opstack)--;
Line 973  dosynopsisop(const char *buf, int *last,
Line 1042  dosynopsisop(const char *buf, int *last,
                 return(0);                  return(0);
   
         (*start)++;          (*start)++;
         *last = '\n';          last = '\n';
         while (' ' == buf[*start])          while (' ' == buf[*start])
                 (*start)++;                  (*start)++;
         return(1);          return(1);
Line 1002  donamenm(struct state *st, const char *buf, size_t *st
Line 1071  donamenm(struct state *st, const char *buf, size_t *st
                                 break;                                  break;
                 formatcodeln(st, buf, start, word, 1);                  formatcodeln(st, buf, start, word, 1);
                 if (*start == end) {                  if (*start == end) {
                         putchar('\n');                          putchar(last = '\n');
                         continue;                          continue;
                 }                  }
                 assert(',' == buf[*start]);                  assert(',' == buf[*start]);
Line 1052  ordinary(struct state *st, const char *buf, size_t sta
Line 1121  ordinary(struct state *st, const char *buf, size_t sta
                                 start++;                                  start++;
                         fputs(".Nd ", stdout);                          fputs(".Nd ", stdout);
                         formatcodeln(st, buf, &start, end, 1);                          formatcodeln(st, buf, &start, end, 1);
                         putchar('\n');                          putchar(last = '\n');
                         return;                          return;
                 }                  }
         }          }
Line 1061  ordinary(struct state *st, const char *buf, size_t sta
Line 1130  ordinary(struct state *st, const char *buf, size_t sta
                 puts(".Pp");                  puts(".Pp");
   
         st->haspar = 0;          st->haspar = 0;
           st->hasnl = 1;
         last = '\n';          last = '\n';
         opstack = 0;          opstack = 0;
   
Line 1075  ordinary(struct state *st, const char *buf, size_t sta
Line 1145  ordinary(struct state *st, const char *buf, size_t sta
                         else if ('\n' == buf[start])                          else if ('\n' == buf[start])
                                 break;                                  break;
                         else if ('\n' == last && '.' == buf[start])                          else if ('\n' == last && '.' == buf[start])
                                 printf("\\&");                                  outbuf_addstr(st, "\\&");
                         else if ('\n' == last && '\'' == buf[start])                          else if ('\n' == last && '\'' == buf[start])
                                 printf("\\&");                                  outbuf_addstr(st, "\\&");
                         /*                          /*
                          * If we're in the SYNOPSIS, have square                           * If we're in the SYNOPSIS, have square
                          * brackets indicate that we're opening and                           * brackets indicate that we're opening and
Line 1086  ordinary(struct state *st, const char *buf, size_t sta
Line 1156  ordinary(struct state *st, const char *buf, size_t sta
                         if (SECT_SYNOPSIS == st->sect &&                          if (SECT_SYNOPSIS == st->sect &&
                                 ('[' == buf[start] ||                                  ('[' == buf[start] ||
                                  ']' == buf[start]) &&                                   ']' == buf[start]) &&
                                 dosynopsisop(buf, &last,                                  dosynopsisop(buf, &start, end, &opstack))
                                         &start, end, &opstack))  
                                 continue;                                  continue;
                         putchar(last = buf[start++]);                          last = buf[start++];
                         if ('\\' == last)                          if (' ' == last) {
                                 putchar('e');                                  outbuf_flush(st);
                                   putchar(' ');
                           } else
                                   outbuf_addchar(st);
                 }                  }
   
                 if (start < end - 1 && '<' == buf[start + 1]) {                  if (start < end - 1 && '<' == buf[start + 1]) {
                         /*  
                          * We've encountered a format code.  
                          * This is going to trigger a macro no matter  
                          * what, so print a newline now.  
                          * Then print the (possibly nested) macros and  
                          * following that, a newline.  
                          * Consume all whitespace so we don't  
                          * accidentally start an implicit literal line.  
                          * If the macro ends with a flush comma or  
                          * period, let mdoc(7) handle it for us.  
                          */  
                         if (formatcode(st, buf, &start, end, 0, 0, seq)) {                          if (formatcode(st, buf, &start, end, 0, 0, seq)) {
                                   /*
                                    * Let mdoc(7) handle trailing punctuation.
                                    * XXX Some punctuation characters
                                    *     are not handled yet.
                                    */
                                 if ((start == end - 1 ||                                  if ((start == end - 1 ||
                                         (start < end - 1 &&                                          (start < end - 1 &&
                                          (' ' == buf[start + 1] ||                                           (' ' == buf[start + 1] ||
Line 1116  ordinary(struct state *st, const char *buf, size_t sta
Line 1182  ordinary(struct state *st, const char *buf, size_t sta
                                         putchar(' ');                                          putchar(' ');
                                         putchar(buf[start++]);                                          putchar(buf[start++]);
                                 }                                  }
                                   /* End the macro line. */
                                 putchar(last = '\n');                                  putchar(last = '\n');
                                   st->hasnl = 1;
                                   /*
                                    * Consume all whitespace
                                    * so we don't accidentally start
                                    * an implicit literal line.
                                    */
                                 while (start < end && ' ' == buf[start])                                  while (start < end && ' ' == buf[start])
                                         start++;                                          start++;
                         }                          }
                 } else if (start < end && '\n' == buf[start]) {                  } else if (start < end && '\n' == buf[start]) {
                         /*                          outbuf_newln(st);
                          * Print the newline only if we haven't already  
                          * printed a newline.  
                          */  
                         if (last != '\n')  
                                 putchar(last = buf[start]);  
                         if (++start >= end)                          if (++start >= end)
                                 continue;                                  continue;
                         /*                          /*
Line 1137  ordinary(struct state *st, const char *buf, size_t sta
Line 1205  ordinary(struct state *st, const char *buf, size_t sta
                          * have a macro subsequent it, which may be                           * have a macro subsequent it, which may be
                          * possible if we have an escape next.                           * possible if we have an escape next.
                          */                           */
                         if (' ' == buf[start] || '\t' == buf[start]) {                          if (' ' == buf[start] || '\t' == buf[start])
                                 puts(".br");                                  puts(".br");
                                 last = '\n';  
                         }  
                         for ( ; start < end; start++)                          for ( ; start < end; start++)
                                 if (' ' != buf[start] && '\t' != buf[start])                                  if (' ' != buf[start] && '\t' != buf[start])
                                         break;                                          break;
                 }                  }
         }          }
           outbuf_newln(st);
         if (last != '\n')  
                 putchar('\n');  
 }  }
   
 /*  /*

Legend:
Removed from v.1.29  
changed lines
  Added in v.1.31

CVSweb