[BACK]Return to html.c CVS log [TXT][DIR] Up to [cvsweb.bsd.lv] / mandoc

Diff for /mandoc/html.c between version 1.227 and 1.272

version 1.227, 2018/05/21 00:30:23 version 1.272, 2021/05/16 18:11:20
Line 1 
Line 1 
 /*      $Id$ */  /* $Id$ */
 /*  /*
    * Copyright (c) 2011-2015, 2017-2020 Ingo Schwarze <schwarze@openbsd.org>
  * Copyright (c) 2008-2011, 2014 Kristaps Dzonsons <kristaps@bsd.lv>   * Copyright (c) 2008-2011, 2014 Kristaps Dzonsons <kristaps@bsd.lv>
  * Copyright (c) 2011-2015, 2017, 2018 Ingo Schwarze <schwarze@openbsd.org>  
  *   *
  * Permission to use, copy, modify, and distribute this software for any   * Permission to use, copy, modify, and distribute this software for any
  * purpose with or without fee is hereby granted, provided that the above   * purpose with or without fee is hereby granted, provided that the above
Line 14 
Line 14 
  * WHATSOEVER RESULTING FROM LOSS OF USE, DATA OR PROFITS, WHETHER IN AN   * WHATSOEVER RESULTING FROM LOSS OF USE, DATA OR PROFITS, WHETHER IN AN
  * ACTION OF CONTRACT, NEGLIGENCE OR OTHER TORTIOUS ACTION, ARISING OUT OF   * ACTION OF CONTRACT, NEGLIGENCE OR OTHER TORTIOUS ACTION, ARISING OUT OF
  * OR IN CONNECTION WITH THE USE OR PERFORMANCE OF THIS SOFTWARE.   * OR IN CONNECTION WITH THE USE OR PERFORMANCE OF THIS SOFTWARE.
    *
    * Common functions for mandoc(1) HTML formatters.
    * For use by individual formatters and by the main program.
  */   */
 #include "config.h"  #include "config.h"
   
 #include <sys/types.h>  #include <sys/types.h>
   #include <sys/stat.h>
   
 #include <assert.h>  #include <assert.h>
 #include <ctype.h>  #include <ctype.h>
 #include <stdarg.h>  #include <stdarg.h>
   #include <stddef.h>
 #include <stdio.h>  #include <stdio.h>
 #include <stdint.h>  #include <stdint.h>
 #include <stdlib.h>  #include <stdlib.h>
Line 29 
Line 34 
 #include <unistd.h>  #include <unistd.h>
   
 #include "mandoc_aux.h"  #include "mandoc_aux.h"
   #include "mandoc_ohash.h"
 #include "mandoc.h"  #include "mandoc.h"
 #include "roff.h"  #include "roff.h"
 #include "out.h"  #include "out.h"
Line 39 
Line 45 
 struct  htmldata {  struct  htmldata {
         const char       *name;          const char       *name;
         int               flags;          int               flags;
 #define HTML_NOSTACK     (1 << 0)  #define HTML_INPHRASE    (1 << 0)  /* Can appear in phrasing context. */
 #define HTML_AUTOCLOSE   (1 << 1)  #define HTML_TOPHRASE    (1 << 1)  /* Establishes phrasing context. */
 #define HTML_NLBEFORE    (1 << 2)  #define HTML_NOSTACK     (1 << 2)  /* Does not have an end tag. */
 #define HTML_NLBEGIN     (1 << 3)  #define HTML_NLBEFORE    (1 << 3)  /* Output line break before opening. */
 #define HTML_NLEND       (1 << 4)  #define HTML_NLBEGIN     (1 << 4)  /* Output line break after opening. */
 #define HTML_NLAFTER     (1 << 5)  #define HTML_NLEND       (1 << 5)  /* Output line break before closing. */
   #define HTML_NLAFTER     (1 << 6)  /* Output line break after closing. */
 #define HTML_NLAROUND    (HTML_NLBEFORE | HTML_NLAFTER)  #define HTML_NLAROUND    (HTML_NLBEFORE | HTML_NLAFTER)
 #define HTML_NLINSIDE    (HTML_NLBEGIN | HTML_NLEND)  #define HTML_NLINSIDE    (HTML_NLBEGIN | HTML_NLEND)
 #define HTML_NLALL       (HTML_NLAROUND | HTML_NLINSIDE)  #define HTML_NLALL       (HTML_NLAROUND | HTML_NLINSIDE)
 #define HTML_INDENT      (1 << 6)  #define HTML_INDENT      (1 << 7)  /* Indent content by two spaces. */
 #define HTML_NOINDENT    (1 << 7)  #define HTML_NOINDENT    (1 << 8)  /* Exception: never indent content. */
 };  };
   
 static  const struct htmldata htmltags[TAG_MAX] = {  static  const struct htmldata htmltags[TAG_MAX] = {
         {"html",        HTML_NLALL},          {"html",        HTML_NLALL},
         {"head",        HTML_NLALL | HTML_INDENT},          {"head",        HTML_NLALL | HTML_INDENT},
         {"body",        HTML_NLALL},          {"meta",        HTML_NOSTACK | HTML_NLALL},
         {"meta",        HTML_NOSTACK | HTML_AUTOCLOSE | HTML_NLALL},          {"link",        HTML_NOSTACK | HTML_NLALL},
           {"style",       HTML_NLALL | HTML_INDENT},
         {"title",       HTML_NLAROUND},          {"title",       HTML_NLAROUND},
           {"body",        HTML_NLALL},
         {"div",         HTML_NLAROUND},          {"div",         HTML_NLAROUND},
         {"div",         0},          {"section",     HTML_NLALL},
         {"h1",          HTML_NLAROUND},  
         {"h2",          HTML_NLAROUND},  
         {"span",        0},  
         {"link",        HTML_NOSTACK | HTML_AUTOCLOSE | HTML_NLALL},  
         {"br",          HTML_NOSTACK | HTML_AUTOCLOSE | HTML_NLALL},  
         {"a",           0},  
         {"table",       HTML_NLALL | HTML_INDENT},          {"table",       HTML_NLALL | HTML_INDENT},
         {"colgroup",    HTML_NLALL | HTML_INDENT},  
         {"col",         HTML_NOSTACK | HTML_AUTOCLOSE | HTML_NLALL},  
         {"tr",          HTML_NLALL | HTML_INDENT},          {"tr",          HTML_NLALL | HTML_INDENT},
         {"td",          HTML_NLAROUND},          {"td",          HTML_NLAROUND},
         {"li",          HTML_NLAROUND | HTML_INDENT},          {"li",          HTML_NLAROUND | HTML_INDENT},
Line 77  static const struct htmldata htmltags[TAG_MAX] = {
Line 78  static const struct htmldata htmltags[TAG_MAX] = {
         {"dl",          HTML_NLALL | HTML_INDENT},          {"dl",          HTML_NLALL | HTML_INDENT},
         {"dt",          HTML_NLAROUND},          {"dt",          HTML_NLAROUND},
         {"dd",          HTML_NLAROUND | HTML_INDENT},          {"dd",          HTML_NLAROUND | HTML_INDENT},
         {"pre",         HTML_NLALL | HTML_NOINDENT},          {"h1",          HTML_TOPHRASE | HTML_NLAROUND},
         {"var",         0},          {"h2",          HTML_TOPHRASE | HTML_NLAROUND},
         {"cite",        0},          {"p",           HTML_TOPHRASE | HTML_NLAROUND | HTML_INDENT},
         {"b",           0},          {"pre",         HTML_TOPHRASE | HTML_NLAROUND | HTML_NOINDENT},
         {"i",           0},          {"a",           HTML_INPHRASE | HTML_TOPHRASE},
         {"code",        0},          {"b",           HTML_INPHRASE | HTML_TOPHRASE},
         {"small",       0},          {"cite",        HTML_INPHRASE | HTML_TOPHRASE},
         {"style",       HTML_NLALL | HTML_INDENT},          {"code",        HTML_INPHRASE | HTML_TOPHRASE},
         {"math",        HTML_NLALL | HTML_INDENT},          {"i",           HTML_INPHRASE | HTML_TOPHRASE},
           {"small",       HTML_INPHRASE | HTML_TOPHRASE},
           {"span",        HTML_INPHRASE | HTML_TOPHRASE},
           {"var",         HTML_INPHRASE | HTML_TOPHRASE},
           {"br",          HTML_INPHRASE | HTML_NOSTACK | HTML_NLALL},
           {"mark",        HTML_INPHRASE },
           {"math",        HTML_INPHRASE | HTML_NLALL | HTML_INDENT},
         {"mrow",        0},          {"mrow",        0},
         {"mi",          0},          {"mi",          0},
         {"mn",          0},          {"mn",          0},
Line 104  static const struct htmldata htmltags[TAG_MAX] = {
Line 111  static const struct htmldata htmltags[TAG_MAX] = {
         {"mover",       0},          {"mover",       0},
 };  };
   
 static  const char      *const roffscales[SCALE_MAX] = {  /* Avoid duplicate HTML id= attributes. */
         "cm", /* SCALE_CM */  
         "in", /* SCALE_IN */  struct  id_entry {
         "pc", /* SCALE_PC */          int      ord;   /* Ordinal number of the latest occurrence. */
         "pt", /* SCALE_PT */          char     id[];  /* The id= attribute without any ordinal suffix. */
         "em", /* SCALE_EM */  
         "em", /* SCALE_MM */  
         "ex", /* SCALE_EN */  
         "ex", /* SCALE_BU */  
         "em", /* SCALE_VS */  
         "ex", /* SCALE_FS */  
 };  };
   static  struct ohash     id_unique;
   
 static  void     a2width(const char *, struct roffsu *);  static  void     html_reset_internal(struct html *);
 static  void     print_byte(struct html *, char);  static  void     print_byte(struct html *, char);
 static  void     print_endword(struct html *);  static  void     print_endword(struct html *);
 static  void     print_indent(struct html *);  static  void     print_indent(struct html *);
Line 127  static void  print_ctag(struct html *, struct tag *);
Line 129  static void  print_ctag(struct html *, struct tag *);
 static  int      print_escape(struct html *, char);  static  int      print_escape(struct html *, char);
 static  int      print_encode(struct html *, const char *, const char *, int);  static  int      print_encode(struct html *, const char *, const char *, int);
 static  void     print_href(struct html *, const char *, const char *, int);  static  void     print_href(struct html *, const char *, const char *, int);
 static  void     print_metaf(struct html *, enum mandoc_esc);  static  void     print_metaf(struct html *);
   
   
 void *  void *
Line 138  html_alloc(const struct manoutput *outopts)
Line 140  html_alloc(const struct manoutput *outopts)
         h = mandoc_calloc(1, sizeof(struct html));          h = mandoc_calloc(1, sizeof(struct html));
   
         h->tag = NULL;          h->tag = NULL;
           h->metac = h->metal = ESCAPE_FONTROMAN;
         h->style = outopts->style;          h->style = outopts->style;
         h->base_man = outopts->man;          if ((h->base_man1 = outopts->man) == NULL)
                   h->base_man2 = NULL;
           else if ((h->base_man2 = strchr(h->base_man1, ';')) != NULL)
                   *h->base_man2++ = '\0';
         h->base_includes = outopts->includes;          h->base_includes = outopts->includes;
         if (outopts->fragment)          if (outopts->fragment)
                 h->oflags |= HTML_FRAGMENT;                  h->oflags |= HTML_FRAGMENT;
           if (outopts->toc)
                   h->oflags |= HTML_TOC;
   
           mandoc_ohash_init(&id_unique, 4, offsetof(struct id_entry, id));
   
         return h;          return h;
 }  }
   
 void  static void
 html_free(void *p)  html_reset_internal(struct html *h)
 {  {
         struct tag      *tag;          struct tag      *tag;
         struct html     *h;          struct id_entry *entry;
           unsigned int     slot;
   
         h = (struct html *)p;  
   
         while ((tag = h->tag) != NULL) {          while ((tag = h->tag) != NULL) {
                 h->tag = tag->next;                  h->tag = tag->next;
                 free(tag);                  free(tag);
         }          }
           entry = ohash_first(&id_unique, &slot);
           while (entry != NULL) {
                   free(entry);
                   entry = ohash_next(&id_unique, &slot);
           }
           ohash_delete(&id_unique);
   }
   
         free(h);  void
   html_reset(void *p)
   {
           html_reset_internal(p);
           mandoc_ohash_init(&id_unique, 4, offsetof(struct id_entry, id));
 }  }
   
 void  void
   html_free(void *p)
   {
           html_reset_internal(p);
           free(p);
   }
   
   void
 print_gen_head(struct html *h)  print_gen_head(struct html *h)
 {  {
         struct tag      *t;          struct tag      *t;
Line 186  print_gen_head(struct html *h)
Line 213  print_gen_head(struct html *h)
         print_endline(h);          print_endline(h);
         print_text(h, "td.head-vol { text-align: center; }");          print_text(h, "td.head-vol { text-align: center; }");
         print_endline(h);          print_endline(h);
         print_text(h, "div.Pp { margin: 1ex 0ex; }");          print_text(h, ".Nd, .Bf, .Op { display: inline; }");
         print_endline(h);          print_endline(h);
         print_text(h, "div.Nd, div.Bf, div.Op { display: inline; }");          print_text(h, ".Pa, .Ad { font-style: italic; }");
         print_endline(h);          print_endline(h);
         print_text(h, "span.Pa, span.Ad { font-style: italic; }");          print_text(h, ".Ms { font-weight: bold; }");
         print_endline(h);          print_endline(h);
         print_text(h, "dl.Bl-diag ");          print_text(h, ".Bl-diag ");
         print_byte(h, '>');          print_byte(h, '>');
         print_text(h, " dt { font-weight: bold; }");          print_text(h, " dt { font-weight: bold; }");
         print_endline(h);          print_endline(h);
         print_text(h, "code.Nm, code.Fl, code.Cm, code.Ic, "          print_text(h, "code.Nm, .Fl, .Cm, .Ic, code.In, .Fd, .Fn, .Cd "
             "code.In, code.Fd, code.Fn,");              "{ font-weight: bold; font-family: inherit; }");
         print_endline(h);  
         print_text(h, "code.Cd { font-weight: bold; "  
             "font-family: inherit; }");  
         print_tagq(h, t);          print_tagq(h, t);
 }  }
   
 static void  int
 print_metaf(struct html *h, enum mandoc_esc deco)  html_setfont(struct html *h, enum mandoc_esc font)
 {  {
         enum htmlfont    font;          switch (font) {
   
         switch (deco) {  
         case ESCAPE_FONTPREV:          case ESCAPE_FONTPREV:
                 font = h->metal;                  font = h->metal;
                 break;                  break;
         case ESCAPE_FONTITALIC:          case ESCAPE_FONTITALIC:
                 font = HTMLFONT_ITALIC;  
                 break;  
         case ESCAPE_FONTBOLD:          case ESCAPE_FONTBOLD:
                 font = HTMLFONT_BOLD;  
                 break;  
         case ESCAPE_FONTBI:          case ESCAPE_FONTBI:
                 font = HTMLFONT_BI;          case ESCAPE_FONTCW:
           case ESCAPE_FONTROMAN:
                 break;                  break;
         case ESCAPE_FONT:          case ESCAPE_FONT:
         case ESCAPE_FONTROMAN:                  font = ESCAPE_FONTROMAN;
                 font = HTMLFONT_NONE;  
                 break;                  break;
         default:          default:
                 abort();                  return 0;
         }          }
           h->metal = h->metac;
           h->metac = font;
           return 1;
   }
   
   static void
   print_metaf(struct html *h)
   {
         if (h->metaf) {          if (h->metaf) {
                 print_tagq(h, h->metaf);                  print_tagq(h, h->metaf);
                 h->metaf = NULL;                  h->metaf = NULL;
         }          }
           switch (h->metac) {
         h->metal = h->metac;          case ESCAPE_FONTITALIC:
         h->metac = font;  
   
         switch (font) {  
         case HTMLFONT_ITALIC:  
                 h->metaf = print_otag(h, TAG_I, "");                  h->metaf = print_otag(h, TAG_I, "");
                 break;                  break;
         case HTMLFONT_BOLD:          case ESCAPE_FONTBOLD:
                 h->metaf = print_otag(h, TAG_B, "");                  h->metaf = print_otag(h, TAG_B, "");
                 break;                  break;
         case HTMLFONT_BI:          case ESCAPE_FONTBI:
                 h->metaf = print_otag(h, TAG_B, "");                  h->metaf = print_otag(h, TAG_B, "");
                 print_otag(h, TAG_I, "");                  print_otag(h, TAG_I, "");
                 break;                  break;
           case ESCAPE_FONTCW:
                   h->metaf = print_otag(h, TAG_SPAN, "c", "Li");
                   break;
         default:          default:
                 break;                  break;
         }          }
 }  }
   
 char *  void
 html_make_id(const struct roff_node *n)  html_close_paragraph(struct html *h)
 {  {
         const struct roff_node  *nch;          struct tag      *this, *next;
         char                    *buf, *cp;          int              flags;
   
         for (nch = n->child; nch != NULL; nch = nch->next)          this = h->tag;
                 if (nch->type != ROFFT_TEXT)          for (;;) {
                         return NULL;                  next = this->next;
                   flags = htmltags[this->tag].flags;
                   if (flags & (HTML_INPHRASE | HTML_TOPHRASE))
                           print_ctag(h, this);
                   if ((flags & HTML_INPHRASE) == 0)
                           break;
                   this = next;
           }
   }
   
         buf = NULL;  /*
         deroff(&buf, n);   * ROFF_nf switches to no-fill mode, ROFF_fi to fill mode.
         if (buf == NULL)   * TOKEN_NONE does not switch.  The old mode is returned.
                 return NULL;   */
   enum roff_tok
   html_fillmode(struct html *h, enum roff_tok want)
   {
           struct tag      *t;
           enum roff_tok    had;
   
         /* http://www.w3.org/TR/html5/dom.html#the-id-attribute */          for (t = h->tag; t != NULL; t = t->next)
                   if (t->tag == TAG_PRE)
                           break;
   
         for (cp = buf; *cp != '\0'; cp++)          had = t == NULL ? ROFF_fi : ROFF_nf;
                 if (*cp == ' ')  
                         *cp = '_';  
   
         return buf;          if (want != had) {
                   switch (want) {
                   case ROFF_fi:
                           print_tagq(h, t);
                           break;
                   case ROFF_nf:
                           html_close_paragraph(h);
                           print_otag(h, TAG_PRE, "");
                           break;
                   case TOKEN_NONE:
                           break;
                   default:
                           abort();
                   }
           }
           return had;
 }  }
   
 int  /*
 html_strlen(const char *cp)   * Allocate a string to be used for the "id=" attribute of an HTML
    * element and/or as a segment identifier for a URI in an <a> element.
    * The function may fail and return NULL if the node lacks text data
    * to create the attribute from.
    * The caller is responsible for free(3)ing the returned string.
    *
    * If the "unique" argument is non-zero, the "id_unique" ohash table
    * is used for de-duplication.  If the "unique" argument is 1,
    * it is the first time the function is called for this tag and
    * location, so if an ordinal suffix is needed, it is incremented.
    * If the "unique" argument is 2, it is the second time the function
    * is called for this tag and location, so the ordinal suffix
    * remains unchanged.
    */
   char *
   html_make_id(const struct roff_node *n, int unique)
 {  {
         size_t           rsz;          const struct roff_node  *nch;
         int              skip, sz;          struct id_entry         *entry;
           char                    *buf, *cp;
           size_t                   len;
           unsigned int             slot;
   
         /*          if (n->tag != NULL)
          * Account for escaped sequences within string length                  buf = mandoc_strdup(n->tag);
          * calculations.  This follows the logic in term_strlen() as we          else {
          * must calculate the width of produced strings.                  switch (n->tok) {
          * Assume that characters are always width of "1".  This is                  case MDOC_Sh:
          * hacky, but it gets the job done for approximation of widths.                  case MDOC_Ss:
          */                  case MDOC_Sx:
                   case MAN_SH:
         sz = 0;                  case MAN_SS:
         skip = 0;                          for (nch = n->child; nch != NULL; nch = nch->next)
         while (1) {                                  if (nch->type != ROFFT_TEXT)
                 rsz = strcspn(cp, "\\");                                          return NULL;
                 if (rsz) {                          buf = NULL;
                         cp += rsz;                          deroff(&buf, n);
                         if (skip) {                          if (buf == NULL)
                                 skip = 0;                                  return NULL;
                                 rsz--;  
                         }  
                         sz += rsz;  
                 }  
                 if ('\0' == *cp)  
                         break;                          break;
                 cp++;  
                 switch (mandoc_escape(&cp, NULL, NULL)) {  
                 case ESCAPE_ERROR:  
                         return sz;  
                 case ESCAPE_UNICODE:  
                 case ESCAPE_NUMBERED:  
                 case ESCAPE_SPECIAL:  
                 case ESCAPE_OVERSTRIKE:  
                         if (skip)  
                                 skip = 0;  
                         else  
                                 sz++;  
                         break;  
                 case ESCAPE_SKIPCHAR:  
                         skip = 1;  
                         break;  
                 default:                  default:
                           if (n->child == NULL || n->child->type != ROFFT_TEXT)
                                   return NULL;
                           buf = mandoc_strdup(n->child->string);
                         break;                          break;
                 }                  }
         }          }
         return sz;  
           /*
            * In ID attributes, only use ASCII characters that are
            * permitted in URL-fragment strings according to the
            * explicit list at:
            * https://url.spec.whatwg.org/#url-fragment-string
            * In addition, reserve '~' for ordinal suffixes.
            */
   
           for (cp = buf; *cp != '\0'; cp++)
                   if (isalnum((unsigned char)*cp) == 0 &&
                       strchr("!$&'()*+,-./:;=?@_", *cp) == NULL)
                           *cp = '_';
   
           if (unique == 0)
                   return buf;
   
           /* Avoid duplicate HTML id= attributes. */
   
           slot = ohash_qlookup(&id_unique, buf);
           if ((entry = ohash_find(&id_unique, slot)) == NULL) {
                   len = strlen(buf) + 1;
                   entry = mandoc_malloc(sizeof(*entry) + len);
                   entry->ord = 1;
                   memcpy(entry->id, buf, len);
                   ohash_insert(&id_unique, slot, entry);
           } else if (unique == 1)
                   entry->ord++;
   
           if (entry->ord > 1) {
                   cp = buf;
                   mandoc_asprintf(&buf, "%s~%d", cp, entry->ord);
                   free(cp);
           }
           return buf;
 }  }
   
 static int  static int
Line 364  static int
Line 450  static int
 print_encode(struct html *h, const char *p, const char *pend, int norecurse)  print_encode(struct html *h, const char *p, const char *pend, int norecurse)
 {  {
         char             numbuf[16];          char             numbuf[16];
         struct tag      *t;  
         const char      *seq;          const char      *seq;
         size_t           sz;          size_t           sz;
         int              c, len, breakline, nospace;          int              c, len, breakline, nospace;
Line 390  print_encode(struct html *h, const char *p, const char
Line 475  print_encode(struct html *h, const char *p, const char
   
                 if (breakline &&                  if (breakline &&
                     (p >= pend || *p == ' ' || *p == ASCII_NBRSP)) {                      (p >= pend || *p == ' ' || *p == ASCII_NBRSP)) {
                         t = print_otag(h, TAG_DIV, "");                          print_otag(h, TAG_BR, "");
                         print_text(h, "\\~");  
                         print_tagq(h, t);  
                         breakline = 0;                          breakline = 0;
                         while (p < pend && (*p == ' ' || *p == ASCII_NBRSP))                          while (p < pend && (*p == ' ' || *p == ASCII_NBRSP))
                                 p++;                                  p++;
Line 412  print_encode(struct html *h, const char *p, const char
Line 495  print_encode(struct html *h, const char *p, const char
                         continue;                          continue;
   
                 esc = mandoc_escape(&p, &seq, &len);                  esc = mandoc_escape(&p, &seq, &len);
                 if (ESCAPE_ERROR == esc)  
                         break;  
   
                 switch (esc) {                  switch (esc) {
                 case ESCAPE_FONT:                  case ESCAPE_FONT:
                 case ESCAPE_FONTPREV:                  case ESCAPE_FONTPREV:
                 case ESCAPE_FONTBOLD:                  case ESCAPE_FONTBOLD:
                 case ESCAPE_FONTITALIC:                  case ESCAPE_FONTITALIC:
                 case ESCAPE_FONTBI:                  case ESCAPE_FONTBI:
                   case ESCAPE_FONTCW:
                 case ESCAPE_FONTROMAN:                  case ESCAPE_FONTROMAN:
                         if (0 == norecurse)                          if (0 == norecurse) {
                                 print_metaf(h, esc);                                  h->flags |= HTML_NOSPACE;
                                   if (html_setfont(h, esc))
                                           print_metaf(h);
                                   h->flags &= ~HTML_NOSPACE;
                           }
                         continue;                          continue;
                 case ESCAPE_SKIPCHAR:                  case ESCAPE_SKIPCHAR:
                         h->flags |= HTML_SKIPCHAR;                          h->flags |= HTML_SKIPCHAR;
                         continue;                          continue;
                   case ESCAPE_ERROR:
                           continue;
                 default:                  default:
                         break;                          break;
                 }                  }
Line 452  print_encode(struct html *h, const char *p, const char
Line 539  print_encode(struct html *h, const char *p, const char
                         if (c <= 0)                          if (c <= 0)
                                 continue;                                  continue;
                         break;                          break;
                   case ESCAPE_UNDEF:
                           c = *seq;
                           break;
                   case ESCAPE_DEVICE:
                           print_word(h, "html");
                           continue;
                 case ESCAPE_BREAK:                  case ESCAPE_BREAK:
                         breakline = 1;                          breakline = 1;
                         continue;                          continue;
Line 483  print_encode(struct html *h, const char *p, const char
Line 576  print_encode(struct html *h, const char *p, const char
 static void  static void
 print_href(struct html *h, const char *name, const char *sec, int man)  print_href(struct html *h, const char *name, const char *sec, int man)
 {  {
           struct stat      sb;
         const char      *p, *pp;          const char      *p, *pp;
           char            *filename;
   
         pp = man ? h->base_man : h->base_includes;          if (man) {
                   pp = h->base_man1;
                   if (h->base_man2 != NULL) {
                           mandoc_asprintf(&filename, "%s.%s", name, sec);
                           if (stat(filename, &sb) == -1)
                                   pp = h->base_man2;
                           free(filename);
                   }
           } else
                   pp = h->base_includes;
   
         while ((p = strchr(pp, '%')) != NULL) {          while ((p = strchr(pp, '%')) != NULL) {
                 print_encode(h, pp, p, 1);                  print_encode(h, pp, p, 1);
                 if (man && p[1] == 'S') {                  if (man && p[1] == 'S') {
Line 508  struct tag *
Line 613  struct tag *
 print_otag(struct html *h, enum htmltag tag, const char *fmt, ...)  print_otag(struct html *h, enum htmltag tag, const char *fmt, ...)
 {  {
         va_list          ap;          va_list          ap;
         struct roffsu    mysu, *su;  
         char             numbuf[16];  
         struct tag      *t;          struct tag      *t;
         const char      *attr;          const char      *attr;
         char            *arg1, *arg2;          char            *arg1, *arg2;
         double           v;          int              style_written, tflags;
         int              i, have_style, tflags;  
   
         tflags = htmltags[tag].flags;          tflags = htmltags[tag].flags;
   
           /* Flow content is not allowed in phrasing context. */
   
           if ((tflags & HTML_INPHRASE) == 0) {
                   for (t = h->tag; t != NULL; t = t->next) {
                           if (t->closed)
                                   continue;
                           assert((htmltags[t->tag].flags & HTML_TOPHRASE) == 0);
                           break;
                   }
   
           /*
            * Always wrap phrasing elements in a paragraph
            * unless already contained in some flow container;
            * never put them directly into a section.
            */
   
           } else if (tflags & HTML_TOPHRASE && h->tag->tag == TAG_SECTION)
                   print_otag(h, TAG_P, "c", "Pp");
   
         /* Push this tag onto the stack of open scopes. */          /* Push this tag onto the stack of open scopes. */
   
         if ((tflags & HTML_NOSTACK) == 0) {          if ((tflags & HTML_NOSTACK) == 0) {
                 t = mandoc_malloc(sizeof(struct tag));                  t = mandoc_malloc(sizeof(struct tag));
                 t->tag = tag;                  t->tag = tag;
                 t->next = h->tag;                  t->next = h->tag;
                   t->refcnt = 0;
                   t->closed = 0;
                 h->tag = t;                  h->tag = t;
         } else          } else
                 t = NULL;                  t = NULL;
Line 554  print_otag(struct html *h, enum htmltag tag, const cha
Line 677  print_otag(struct html *h, enum htmltag tag, const cha
   
         va_start(ap, fmt);          va_start(ap, fmt);
   
         have_style = 0;          while (*fmt != '\0' && *fmt != 's') {
         while (*fmt != '\0') {  
                 if (*fmt == 's') {  
                         have_style = 1;  
                         fmt++;  
                         break;  
                 }  
   
                 /* Parse a non-style attribute and its arguments. */                  /* Parse attributes and arguments. */
   
                 arg1 = va_arg(ap, char *);                  arg1 = va_arg(ap, char *);
                   arg2 = NULL;
                 switch (*fmt++) {                  switch (*fmt++) {
                 case 'c':                  case 'c':
                         attr = "class";                          attr = "class";
Line 582  print_otag(struct html *h, enum htmltag tag, const cha
Line 700  print_otag(struct html *h, enum htmltag tag, const cha
                 default:                  default:
                         abort();                          abort();
                 }                  }
                 arg2 = NULL;  
                 if (*fmt == 'M')                  if (*fmt == 'M')
                         arg2 = va_arg(ap, char *);                          arg2 = va_arg(ap, char *);
                 if (arg1 == NULL)                  if (arg1 == NULL)
                         continue;                          continue;
   
                 /* Print the non-style attributes. */                  /* Print the attributes. */
   
                 print_byte(h, ' ');                  print_byte(h, ' ');
                 print_word(h, attr);                  print_word(h, attr);
Line 608  print_otag(struct html *h, enum htmltag tag, const cha
Line 725  print_otag(struct html *h, enum htmltag tag, const cha
                         print_encode(h, arg1, NULL, 1);                          print_encode(h, arg1, NULL, 1);
                         fmt++;                          fmt++;
                         break;                          break;
                 case 'T':  
                         print_encode(h, arg1, NULL, 1);  
                         print_word(h, "\" title=\"");  
                         print_encode(h, arg1, NULL, 1);  
                         fmt++;  
                         break;  
                 default:                  default:
                         print_encode(h, arg1, NULL, 1);                          print_encode(h, arg1, NULL, 1);
                         break;                          break;
Line 621  print_otag(struct html *h, enum htmltag tag, const cha
Line 732  print_otag(struct html *h, enum htmltag tag, const cha
                 print_byte(h, '"');                  print_byte(h, '"');
         }          }
   
         /* Print out styles. */          style_written = 0;
           while (*fmt++ == 's') {
         while (*fmt != '\0') {                  arg1 = va_arg(ap, char *);
                 arg1 = NULL;                  arg2 = va_arg(ap, char *);
                 su = NULL;                  if (arg2 == NULL)
   
                 /* First letter: input argument type. */  
   
                 switch (*fmt++) {  
                 case 'h':  
                         i = va_arg(ap, int);  
                         su = &mysu;  
                         SCALE_HS_INIT(su, i);  
                         break;  
                 case 's':  
                         arg1 = va_arg(ap, char *);  
                         break;  
                 case 'u':  
                         su = va_arg(ap, struct roffsu *);  
                         break;  
                 case 'w':  
                         if ((arg2 = va_arg(ap, char *)) != NULL) {  
                                 su = &mysu;  
                                 a2width(arg2, su);  
                         }  
                         if (*fmt == '*') {  
                                 if (su != NULL && su->unit == SCALE_EN &&  
                                     su->scale > 5.9 && su->scale < 6.1)  
                                         su = NULL;  
                                 fmt++;  
                         }  
                         if (*fmt == '+') {  
                                 if (su != NULL) {  
                                         /* Make even bold text fit. */  
                                         su->scale *= 1.2;  
                                         /* Add padding. */  
                                         su->scale += 3.0;  
                                 }  
                                 fmt++;  
                         }  
                         if (*fmt == '-') {  
                                 if (su != NULL)  
                                         su->scale *= -1.0;  
                                 fmt++;  
                         }  
                         break;  
                 default:  
                         abort();  
                 }  
   
                 /* Second letter: style name. */  
   
                 switch (*fmt++) {  
                 case 'h':  
                         attr = "height";  
                         break;  
                 case 'i':  
                         attr = "text-indent";  
                         break;  
                 case 'l':  
                         attr = "margin-left";  
                         break;  
                 case 'w':  
                         attr = "width";  
                         break;  
                 case 'W':  
                         attr = "min-width";  
                         break;  
                 case '?':  
                         attr = arg1;  
                         arg1 = va_arg(ap, char *);  
                         break;  
                 default:  
                         abort();  
                 }  
                 if (su == NULL && arg1 == NULL)  
                         continue;                          continue;
                   print_byte(h, ' ');
                 if (have_style == 1)                  if (style_written == 0) {
                         print_word(h, " style=\"");                          print_word(h, "style=\"");
                 else                          style_written = 1;
                         print_byte(h, ' ');                  }
                 print_word(h, attr);                  print_word(h, arg1);
                 print_byte(h, ':');                  print_byte(h, ':');
                 print_byte(h, ' ');                  print_byte(h, ' ');
                 if (su != NULL) {                  print_word(h, arg2);
                         v = su->scale;  
                         if (su->unit == SCALE_MM && (v /= 100.0) == 0.0)  
                                 v = 1.0;  
                         else if (su->unit == SCALE_BU)  
                                 v /= 24.0;  
                         (void)snprintf(numbuf, sizeof(numbuf), "%.2f", v);  
                         print_word(h, numbuf);  
                         print_word(h, roffscales[su->unit]);  
                 } else  
                         print_word(h, arg1);  
                 print_byte(h, ';');                  print_byte(h, ';');
                 have_style = 2;  
         }          }
         if (have_style == 2)          if (style_written)
                 print_byte(h, '"');                  print_byte(h, '"');
   
         va_end(ap);          va_end(ap);
   
         /* Accommodate for "well-formed" singleton escaping. */          /* Accommodate for "well-formed" singleton escaping. */
   
         if (HTML_AUTOCLOSE & htmltags[tag].flags)          if (htmltags[tag].flags & HTML_NOSTACK)
                 print_byte(h, '/');                  print_byte(h, '/');
   
         print_byte(h, '>');          print_byte(h, '>');
Line 745  print_otag(struct html *h, enum htmltag tag, const cha
Line 774  print_otag(struct html *h, enum htmltag tag, const cha
         return t;          return t;
 }  }
   
   /*
    * Print an element with an optional "id=" attribute.
    * If the element has phrasing content and an "id=" attribute,
    * also add a permalink: outside if it can be in phrasing context,
    * inside otherwise.
    */
   struct tag *
   print_otag_id(struct html *h, enum htmltag elemtype, const char *cattr,
       struct roff_node *n)
   {
           struct roff_node *nch;
           struct tag      *ret, *t;
           char            *id, *href;
   
           ret = NULL;
           id = href = NULL;
           if (n->flags & NODE_ID)
                   id = html_make_id(n, 1);
           if (n->flags & NODE_HREF)
                   href = id == NULL ? html_make_id(n, 2) : id;
           if (href != NULL && htmltags[elemtype].flags & HTML_INPHRASE)
                   ret = print_otag(h, TAG_A, "chR", "permalink", href);
           t = print_otag(h, elemtype, "ci", cattr, id);
           if (ret == NULL) {
                   ret = t;
                   if (href != NULL && (nch = n->child) != NULL) {
                           /* man(7) is safe, it tags phrasing content only. */
                           if (n->tok > MDOC_MAX ||
                               htmltags[elemtype].flags & HTML_TOPHRASE)
                                   nch = NULL;
                           else  /* For mdoc(7), beware of nested blocks. */
                                   while (nch != NULL && nch->type == ROFFT_TEXT)
                                           nch = nch->next;
                           if (nch == NULL)
                                   print_otag(h, TAG_A, "chR", "permalink", href);
                   }
           }
           free(id);
           if (id == NULL)
                   free(href);
           return ret;
   }
   
 static void  static void
 print_ctag(struct html *h, struct tag *tag)  print_ctag(struct html *h, struct tag *tag)
 {  {
         int      tflags;          int      tflags;
   
         /*          if (tag->closed == 0) {
          * Remember to close out and nullify the current                  tag->closed = 1;
          * meta-font and table, if applicable.                  if (tag == h->metaf)
          */                          h->metaf = NULL;
         if (tag == h->metaf)                  if (tag == h->tblt)
                 h->metaf = NULL;                          h->tblt = NULL;
         if (tag == h->tblt)  
                 h->tblt = NULL;  
   
         tflags = htmltags[tag->tag].flags;                  tflags = htmltags[tag->tag].flags;
                   if (tflags & HTML_INDENT)
         if (tflags & HTML_INDENT)                          h->indent--;
                 h->indent--;                  if (tflags & HTML_NOINDENT)
         if (tflags & HTML_NOINDENT)                          h->noindent--;
                 h->noindent--;                  if (tflags & HTML_NLEND)
         if (tflags & HTML_NLEND)                          print_endline(h);
                 print_endline(h);                  print_indent(h);
         print_indent(h);                  print_byte(h, '<');
         print_byte(h, '<');                  print_byte(h, '/');
         print_byte(h, '/');                  print_word(h, htmltags[tag->tag].name);
         print_word(h, htmltags[tag->tag].name);                  print_byte(h, '>');
         print_byte(h, '>');                  if (tflags & HTML_NLAFTER)
         if (tflags & HTML_NLAFTER)                          print_endline(h);
                 print_endline(h);          }
           if (tag->refcnt == 0) {
         h->tag = tag->next;                  h->tag = tag->next;
         free(tag);                  free(tag);
           }
 }  }
   
 void  void
Line 815  print_gen_comment(struct html *h, struct roff_node *n)
Line 886  print_gen_comment(struct html *h, struct roff_node *n)
 void  void
 print_text(struct html *h, const char *word)  print_text(struct html *h, const char *word)
 {  {
           print_tagged_text(h, word, NULL);
   }
   
   void
   print_tagged_text(struct html *h, const char *word, struct roff_node *n)
   {
           struct tag      *t;
           char            *href;
   
           /*
            * Always wrap text in a paragraph unless already contained in
            * some flow container; never put it directly into a section.
            */
   
           if (h->tag->tag == TAG_SECTION)
                   print_otag(h, TAG_P, "c", "Pp");
   
           /* Output whitespace before this text? */
   
         if (h->col && (h->flags & HTML_NOSPACE) == 0) {          if (h->col && (h->flags & HTML_NOSPACE) == 0) {
                 if ( ! (HTML_KEEP & h->flags)) {                  if ( ! (HTML_KEEP & h->flags)) {
                         if (HTML_PREKEEP & h->flags)                          if (HTML_PREKEEP & h->flags)
Line 824  print_text(struct html *h, const char *word)
Line 914  print_text(struct html *h, const char *word)
                         print_word(h, "&#x00A0;");                          print_word(h, "&#x00A0;");
         }          }
   
         assert(NULL == h->metaf);          /*
         switch (h->metac) {           * Optionally switch fonts, optionally write a permalink, then
         case HTMLFONT_ITALIC:           * print the text, optionally surrounded by HTML whitespace.
                 h->metaf = print_otag(h, TAG_I, "");           */
                 break;  
         case HTMLFONT_BOLD:  
                 h->metaf = print_otag(h, TAG_B, "");  
                 break;  
         case HTMLFONT_BI:  
                 h->metaf = print_otag(h, TAG_B, "");  
                 print_otag(h, TAG_I, "");  
                 break;  
         default:  
                 print_indent(h);  
                 break;  
         }  
   
         assert(word);          assert(h->metaf == NULL);
           print_metaf(h);
           print_indent(h);
   
           if (n != NULL && (href = html_make_id(n, 2)) != NULL) {
                   t = print_otag(h, TAG_A, "chR", "permalink", href);
                   free(href);
           } else
                   t = NULL;
   
         if ( ! print_encode(h, word, NULL, 0)) {          if ( ! print_encode(h, word, NULL, 0)) {
                 if ( ! (h->flags & HTML_NONOSPACE))                  if ( ! (h->flags & HTML_NONOSPACE))
                         h->flags &= ~HTML_NOSPACE;                          h->flags &= ~HTML_NOSPACE;
Line 849  print_text(struct html *h, const char *word)
Line 936  print_text(struct html *h, const char *word)
         } else          } else
                 h->flags |= HTML_NOSPACE | HTML_NONEWLINE;                  h->flags |= HTML_NOSPACE | HTML_NONEWLINE;
   
         if (h->metaf) {          if (h->metaf != NULL) {
                 print_tagq(h, h->metaf);                  print_tagq(h, h->metaf);
                 h->metaf = NULL;                  h->metaf = NULL;
         }          } else if (t != NULL)
                   print_tagq(h, t);
   
         h->flags &= ~HTML_IGNDELIM;          h->flags &= ~HTML_IGNDELIM;
 }  }
Line 860  print_text(struct html *h, const char *word)
Line 948  print_text(struct html *h, const char *word)
 void  void
 print_tagq(struct html *h, const struct tag *until)  print_tagq(struct html *h, const struct tag *until)
 {  {
         struct tag      *tag;          struct tag      *this, *next;
   
         while ((tag = h->tag) != NULL) {          for (this = h->tag; this != NULL; this = next) {
                 print_ctag(h, tag);                  next = this == until ? NULL : this->next;
                 if (until && tag == until)                  print_ctag(h, this);
                         return;  
         }          }
 }  }
   
   /*
    * Close out all open elements up to but excluding suntil.
    * Note that a paragraph just inside stays open together with it
    * because paragraphs include subsequent phrasing content.
    */
 void  void
 print_stagq(struct html *h, const struct tag *suntil)  print_stagq(struct html *h, const struct tag *suntil)
 {  {
         struct tag      *tag;          struct tag      *this, *next;
   
         while ((tag = h->tag) != NULL) {          for (this = h->tag; this != NULL; this = next) {
                 if (suntil && tag == suntil)                  next = this->next;
                         return;                  if (this == suntil || (next == suntil &&
                 print_ctag(h, tag);                      (this->tag == TAG_P || this->tag == TAG_PRE)))
                           break;
                   print_ctag(h, this);
         }          }
 }  }
   
 void  
 print_paragraph(struct html *h)  
 {  
         struct tag      *t;  
   
         t = print_otag(h, TAG_DIV, "c", "Pp");  
         print_tagq(h, t);  
 }  
   
   
 /***********************************************************************  /***********************************************************************
  * Low level output functions.   * Low level output functions.
  * They implement line breaking using a short static buffer.   * They implement line breaking using a short static buffer.
Line 982  print_indent(struct html *h)
Line 1067  print_indent(struct html *h)
 {  {
         size_t   i;          size_t   i;
   
         if (h->col)          if (h->col || h->noindent)
                 return;                  return;
   
         if (h->noindent == 0) {          h->col = h->indent * 2;
                 h->col = h->indent * 2;          for (i = 0; i < h->col; i++)
                 for (i = 0; i < h->col; i++)                  putchar(' ');
                         putchar(' ');  
         }  
         h->flags &= ~HTML_NOSPACE;  
 }  }
   
 /*  /*
Line 1002  print_word(struct html *h, const char *cp)
Line 1084  print_word(struct html *h, const char *cp)
 {  {
         while (*cp != '\0')          while (*cp != '\0')
                 print_byte(h, *cp++);                  print_byte(h, *cp++);
 }  
   
 /*  
  * Calculate the scaling unit passed in a `-width' argument.  This uses  
  * either a native scaling unit (e.g., 1i, 2m) or the string length of  
  * the value.  
  */  
 static void  
 a2width(const char *p, struct roffsu *su)  
 {  
         const char      *end;  
   
         end = a2roffsu(p, su, SCALE_MAX);  
         if (end == NULL || *end != '\0') {  
                 su->unit = SCALE_EN;  
                 su->scale = html_strlen(p);  
         } else if (su->scale < 0.0)  
                 su->scale = 0.0;  
 }  }

Legend:
Removed from v.1.227  
changed lines
  Added in v.1.272

CVSweb