[BACK]Return to html.c CVS log [TXT][DIR] Up to [cvsweb.bsd.lv] / mandoc

Diff for /mandoc/html.c between version 1.227 and 1.247

version 1.227, 2018/05/21 00:30:23 version 1.247, 2018/12/16 00:17:02
Line 18 
Line 18 
 #include "config.h"  #include "config.h"
   
 #include <sys/types.h>  #include <sys/types.h>
   #include <sys/stat.h>
   
 #include <assert.h>  #include <assert.h>
 #include <ctype.h>  #include <ctype.h>
 #include <stdarg.h>  #include <stdarg.h>
   #include <stddef.h>
 #include <stdio.h>  #include <stdio.h>
 #include <stdint.h>  #include <stdint.h>
 #include <stdlib.h>  #include <stdlib.h>
Line 29 
Line 31 
 #include <unistd.h>  #include <unistd.h>
   
 #include "mandoc_aux.h"  #include "mandoc_aux.h"
   #include "mandoc_ohash.h"
 #include "mandoc.h"  #include "mandoc.h"
 #include "roff.h"  #include "roff.h"
 #include "out.h"  #include "out.h"
Line 67  static const struct htmldata htmltags[TAG_MAX] = {
Line 70  static const struct htmldata htmltags[TAG_MAX] = {
         {"br",          HTML_NOSTACK | HTML_AUTOCLOSE | HTML_NLALL},          {"br",          HTML_NOSTACK | HTML_AUTOCLOSE | HTML_NLALL},
         {"a",           0},          {"a",           0},
         {"table",       HTML_NLALL | HTML_INDENT},          {"table",       HTML_NLALL | HTML_INDENT},
         {"colgroup",    HTML_NLALL | HTML_INDENT},  
         {"col",         HTML_NOSTACK | HTML_AUTOCLOSE | HTML_NLALL},  
         {"tr",          HTML_NLALL | HTML_INDENT},          {"tr",          HTML_NLALL | HTML_INDENT},
         {"td",          HTML_NLAROUND},          {"td",          HTML_NLAROUND},
         {"li",          HTML_NLAROUND | HTML_INDENT},          {"li",          HTML_NLAROUND | HTML_INDENT},
Line 104  static const struct htmldata htmltags[TAG_MAX] = {
Line 105  static const struct htmldata htmltags[TAG_MAX] = {
         {"mover",       0},          {"mover",       0},
 };  };
   
 static  const char      *const roffscales[SCALE_MAX] = {  /* Avoid duplicate HTML id= attributes. */
         "cm", /* SCALE_CM */  static  struct ohash     id_unique;
         "in", /* SCALE_IN */  
         "pc", /* SCALE_PC */  
         "pt", /* SCALE_PT */  
         "em", /* SCALE_EM */  
         "em", /* SCALE_MM */  
         "ex", /* SCALE_EN */  
         "ex", /* SCALE_BU */  
         "em", /* SCALE_VS */  
         "ex", /* SCALE_FS */  
 };  
   
 static  void     a2width(const char *, struct roffsu *);  
 static  void     print_byte(struct html *, char);  static  void     print_byte(struct html *, char);
 static  void     print_endword(struct html *);  static  void     print_endword(struct html *);
 static  void     print_indent(struct html *);  static  void     print_indent(struct html *);
Line 127  static void  print_ctag(struct html *, struct tag *);
Line 117  static void  print_ctag(struct html *, struct tag *);
 static  int      print_escape(struct html *, char);  static  int      print_escape(struct html *, char);
 static  int      print_encode(struct html *, const char *, const char *, int);  static  int      print_encode(struct html *, const char *, const char *, int);
 static  void     print_href(struct html *, const char *, const char *, int);  static  void     print_href(struct html *, const char *, const char *, int);
 static  void     print_metaf(struct html *, enum mandoc_esc);  
   
   
 void *  void *
Line 139  html_alloc(const struct manoutput *outopts)
Line 128  html_alloc(const struct manoutput *outopts)
   
         h->tag = NULL;          h->tag = NULL;
         h->style = outopts->style;          h->style = outopts->style;
         h->base_man = outopts->man;          if ((h->base_man1 = outopts->man) == NULL)
                   h->base_man2 = NULL;
           else if ((h->base_man2 = strchr(h->base_man1, ';')) != NULL)
                   *h->base_man2++ = '\0';
         h->base_includes = outopts->includes;          h->base_includes = outopts->includes;
         if (outopts->fragment)          if (outopts->fragment)
                 h->oflags |= HTML_FRAGMENT;                  h->oflags |= HTML_FRAGMENT;
           if (outopts->toc)
                   h->oflags |= HTML_TOC;
   
           mandoc_ohash_init(&id_unique, 4, 0);
   
         return h;          return h;
 }  }
   
Line 152  html_free(void *p)
Line 148  html_free(void *p)
 {  {
         struct tag      *tag;          struct tag      *tag;
         struct html     *h;          struct html     *h;
           char            *cp;
           unsigned int     slot;
   
         h = (struct html *)p;          h = (struct html *)p;
   
         while ((tag = h->tag) != NULL) {          while ((tag = h->tag) != NULL) {
                 h->tag = tag->next;                  h->tag = tag->next;
                 free(tag);                  free(tag);
         }          }
   
         free(h);          free(h);
   
           cp = ohash_first(&id_unique, &slot);
           while (cp != NULL) {
                   free(cp);
                   cp = ohash_next(&id_unique, &slot);
           }
           ohash_delete(&id_unique);
 }  }
   
 void  void
Line 192  print_gen_head(struct html *h)
Line 195  print_gen_head(struct html *h)
         print_endline(h);          print_endline(h);
         print_text(h, "span.Pa, span.Ad { font-style: italic; }");          print_text(h, "span.Pa, span.Ad { font-style: italic; }");
         print_endline(h);          print_endline(h);
           print_text(h, "span.Ms { font-weight: bold; }");
           print_endline(h);
         print_text(h, "dl.Bl-diag ");          print_text(h, "dl.Bl-diag ");
         print_byte(h, '>');          print_byte(h, '>');
         print_text(h, " dt { font-weight: bold; }");          print_text(h, " dt { font-weight: bold; }");
Line 204  print_gen_head(struct html *h)
Line 209  print_gen_head(struct html *h)
         print_tagq(h, t);          print_tagq(h, t);
 }  }
   
 static void  void
 print_metaf(struct html *h, enum mandoc_esc deco)  print_metaf(struct html *h, enum mandoc_esc deco)
 {  {
         enum htmlfont    font;          enum htmlfont    font;
Line 222  print_metaf(struct html *h, enum mandoc_esc deco)
Line 227  print_metaf(struct html *h, enum mandoc_esc deco)
         case ESCAPE_FONTBI:          case ESCAPE_FONTBI:
                 font = HTMLFONT_BI;                  font = HTMLFONT_BI;
                 break;                  break;
           case ESCAPE_FONTCW:
                   font = HTMLFONT_CW;
                   break;
         case ESCAPE_FONT:          case ESCAPE_FONT:
         case ESCAPE_FONTROMAN:          case ESCAPE_FONTROMAN:
                 font = HTMLFONT_NONE;                  font = HTMLFONT_NONE;
                 break;                  break;
         default:          default:
                 abort();                  return;
         }          }
   
         if (h->metaf) {          if (h->metaf) {
Line 249  print_metaf(struct html *h, enum mandoc_esc deco)
Line 257  print_metaf(struct html *h, enum mandoc_esc deco)
                 h->metaf = print_otag(h, TAG_B, "");                  h->metaf = print_otag(h, TAG_B, "");
                 print_otag(h, TAG_I, "");                  print_otag(h, TAG_I, "");
                 break;                  break;
           case HTMLFONT_CW:
                   h->metaf = print_otag(h, TAG_SPAN, "c", "Li");
                   break;
         default:          default:
                 break;                  break;
         }          }
 }  }
   
 char *  char *
 html_make_id(const struct roff_node *n)  html_make_id(const struct roff_node *n, int unique)
 {  {
         const struct roff_node  *nch;          const struct roff_node  *nch;
         char                    *buf, *cp;          char                    *buf, *bufs, *cp;
           unsigned int             slot;
           int                      suffix;
   
         for (nch = n->child; nch != NULL; nch = nch->next)          for (nch = n->child; nch != NULL; nch = nch->next)
                 if (nch->type != ROFFT_TEXT)                  if (nch->type != ROFFT_TEXT)
Line 269  html_make_id(const struct roff_node *n)
Line 282  html_make_id(const struct roff_node *n)
         if (buf == NULL)          if (buf == NULL)
                 return NULL;                  return NULL;
   
         /* http://www.w3.org/TR/html5/dom.html#the-id-attribute */          /*
            * In ID attributes, only use ASCII characters that are
            * permitted in URL-fragment strings according to the
            * explicit list at:
            * https://url.spec.whatwg.org/#url-fragment-string
            */
   
         for (cp = buf; *cp != '\0'; cp++)          for (cp = buf; *cp != '\0'; cp++)
                 if (*cp == ' ')                  if (isalnum((unsigned char)*cp) == 0 &&
                       strchr("!$&'()*+,-./:;=?@_~", *cp) == NULL)
                         *cp = '_';                          *cp = '_';
   
         return buf;          if (unique == 0)
 }                  return buf;
   
 int          /* Avoid duplicate HTML id= attributes. */
 html_strlen(const char *cp)  
 {  
         size_t           rsz;  
         int              skip, sz;  
   
         /*          bufs = NULL;
          * Account for escaped sequences within string length          suffix = 1;
          * calculations.  This follows the logic in term_strlen() as we          slot = ohash_qlookup(&id_unique, buf);
          * must calculate the width of produced strings.          cp = ohash_find(&id_unique, slot);
          * Assume that characters are always width of "1".  This is          if (cp != NULL) {
          * hacky, but it gets the job done for approximation of widths.                  while (cp != NULL) {
          */                          free(bufs);
                           if (++suffix > 127) {
         sz = 0;                                  free(buf);
         skip = 0;                                  return NULL;
         while (1) {  
                 rsz = strcspn(cp, "\\");  
                 if (rsz) {  
                         cp += rsz;  
                         if (skip) {  
                                 skip = 0;  
                                 rsz--;  
                         }                          }
                         sz += rsz;                          mandoc_asprintf(&bufs, "%s_%d", buf, suffix);
                           slot = ohash_qlookup(&id_unique, bufs);
                           cp = ohash_find(&id_unique, slot);
                 }                  }
                 if ('\0' == *cp)                  free(buf);
                         break;                  buf = bufs;
                 cp++;  
                 switch (mandoc_escape(&cp, NULL, NULL)) {  
                 case ESCAPE_ERROR:  
                         return sz;  
                 case ESCAPE_UNICODE:  
                 case ESCAPE_NUMBERED:  
                 case ESCAPE_SPECIAL:  
                 case ESCAPE_OVERSTRIKE:  
                         if (skip)  
                                 skip = 0;  
                         else  
                                 sz++;  
                         break;  
                 case ESCAPE_SKIPCHAR:  
                         skip = 1;  
                         break;  
                 default:  
                         break;  
                 }  
         }          }
         return sz;          ohash_insert(&id_unique, slot, buf);
           return buf;
 }  }
   
 static int  static int
Line 364  static int
Line 356  static int
 print_encode(struct html *h, const char *p, const char *pend, int norecurse)  print_encode(struct html *h, const char *p, const char *pend, int norecurse)
 {  {
         char             numbuf[16];          char             numbuf[16];
         struct tag      *t;  
         const char      *seq;          const char      *seq;
         size_t           sz;          size_t           sz;
         int              c, len, breakline, nospace;          int              c, len, breakline, nospace;
Line 390  print_encode(struct html *h, const char *p, const char
Line 381  print_encode(struct html *h, const char *p, const char
   
                 if (breakline &&                  if (breakline &&
                     (p >= pend || *p == ' ' || *p == ASCII_NBRSP)) {                      (p >= pend || *p == ' ' || *p == ASCII_NBRSP)) {
                         t = print_otag(h, TAG_DIV, "");                          print_otag(h, TAG_BR, "");
                         print_text(h, "\\~");  
                         print_tagq(h, t);  
                         breakline = 0;                          breakline = 0;
                         while (p < pend && (*p == ' ' || *p == ASCII_NBRSP))                          while (p < pend && (*p == ' ' || *p == ASCII_NBRSP))
                                 p++;                                  p++;
Line 412  print_encode(struct html *h, const char *p, const char
Line 401  print_encode(struct html *h, const char *p, const char
                         continue;                          continue;
   
                 esc = mandoc_escape(&p, &seq, &len);                  esc = mandoc_escape(&p, &seq, &len);
                 if (ESCAPE_ERROR == esc)  
                         break;  
   
                 switch (esc) {                  switch (esc) {
                 case ESCAPE_FONT:                  case ESCAPE_FONT:
                 case ESCAPE_FONTPREV:                  case ESCAPE_FONTPREV:
                 case ESCAPE_FONTBOLD:                  case ESCAPE_FONTBOLD:
                 case ESCAPE_FONTITALIC:                  case ESCAPE_FONTITALIC:
                 case ESCAPE_FONTBI:                  case ESCAPE_FONTBI:
                   case ESCAPE_FONTCW:
                 case ESCAPE_FONTROMAN:                  case ESCAPE_FONTROMAN:
                         if (0 == norecurse)                          if (0 == norecurse) {
                                   h->flags |= HTML_NOSPACE;
                                 print_metaf(h, esc);                                  print_metaf(h, esc);
                                   h->flags &= ~HTML_NOSPACE;
                           }
                         continue;                          continue;
                 case ESCAPE_SKIPCHAR:                  case ESCAPE_SKIPCHAR:
                         h->flags |= HTML_SKIPCHAR;                          h->flags |= HTML_SKIPCHAR;
                         continue;                          continue;
                   case ESCAPE_ERROR:
                           continue;
                 default:                  default:
                         break;                          break;
                 }                  }
Line 452  print_encode(struct html *h, const char *p, const char
Line 444  print_encode(struct html *h, const char *p, const char
                         if (c <= 0)                          if (c <= 0)
                                 continue;                                  continue;
                         break;                          break;
                   case ESCAPE_UNDEF:
                           c = *seq;
                           break;
                   case ESCAPE_DEVICE:
                           print_word(h, "html");
                           continue;
                 case ESCAPE_BREAK:                  case ESCAPE_BREAK:
                         breakline = 1;                          breakline = 1;
                         continue;                          continue;
Line 483  print_encode(struct html *h, const char *p, const char
Line 481  print_encode(struct html *h, const char *p, const char
 static void  static void
 print_href(struct html *h, const char *name, const char *sec, int man)  print_href(struct html *h, const char *name, const char *sec, int man)
 {  {
           struct stat      sb;
         const char      *p, *pp;          const char      *p, *pp;
           char            *filename;
   
         pp = man ? h->base_man : h->base_includes;          if (man) {
                   pp = h->base_man1;
                   if (h->base_man2 != NULL) {
                           mandoc_asprintf(&filename, "%s.%s", name, sec);
                           if (stat(filename, &sb) == -1)
                                   pp = h->base_man2;
                           free(filename);
                   }
           } else
                   pp = h->base_includes;
   
         while ((p = strchr(pp, '%')) != NULL) {          while ((p = strchr(pp, '%')) != NULL) {
                 print_encode(h, pp, p, 1);                  print_encode(h, pp, p, 1);
                 if (man && p[1] == 'S') {                  if (man && p[1] == 'S') {
Line 508  struct tag *
Line 518  struct tag *
 print_otag(struct html *h, enum htmltag tag, const char *fmt, ...)  print_otag(struct html *h, enum htmltag tag, const char *fmt, ...)
 {  {
         va_list          ap;          va_list          ap;
         struct roffsu    mysu, *su;  
         char             numbuf[16];  
         struct tag      *t;          struct tag      *t;
         const char      *attr;          const char      *attr;
         char            *arg1, *arg2;          char            *arg1, *arg2;
         double           v;          int              style_written, tflags;
         int              i, have_style, tflags;  
   
         tflags = htmltags[tag].flags;          tflags = htmltags[tag].flags;
   
Line 554  print_otag(struct html *h, enum htmltag tag, const cha
Line 561  print_otag(struct html *h, enum htmltag tag, const cha
   
         va_start(ap, fmt);          va_start(ap, fmt);
   
         have_style = 0;          while (*fmt != '\0' && *fmt != 's') {
         while (*fmt != '\0') {  
                 if (*fmt == 's') {  
                         have_style = 1;  
                         fmt++;  
                         break;  
                 }  
   
                 /* Parse a non-style attribute and its arguments. */                  /* Parse attributes and arguments. */
   
                 arg1 = va_arg(ap, char *);                  arg1 = va_arg(ap, char *);
                   arg2 = NULL;
                 switch (*fmt++) {                  switch (*fmt++) {
                 case 'c':                  case 'c':
                         attr = "class";                          attr = "class";
Line 582  print_otag(struct html *h, enum htmltag tag, const cha
Line 584  print_otag(struct html *h, enum htmltag tag, const cha
                 default:                  default:
                         abort();                          abort();
                 }                  }
                 arg2 = NULL;  
                 if (*fmt == 'M')                  if (*fmt == 'M')
                         arg2 = va_arg(ap, char *);                          arg2 = va_arg(ap, char *);
                 if (arg1 == NULL)                  if (arg1 == NULL)
                         continue;                          continue;
   
                 /* Print the non-style attributes. */                  /* Print the attributes. */
   
                 print_byte(h, ' ');                  print_byte(h, ' ');
                 print_word(h, attr);                  print_word(h, attr);
Line 621  print_otag(struct html *h, enum htmltag tag, const cha
Line 622  print_otag(struct html *h, enum htmltag tag, const cha
                 print_byte(h, '"');                  print_byte(h, '"');
         }          }
   
         /* Print out styles. */          style_written = 0;
           while (*fmt++ == 's') {
         while (*fmt != '\0') {                  arg1 = va_arg(ap, char *);
                 arg1 = NULL;                  arg2 = va_arg(ap, char *);
                 su = NULL;                  if (arg2 == NULL)
   
                 /* First letter: input argument type. */  
   
                 switch (*fmt++) {  
                 case 'h':  
                         i = va_arg(ap, int);  
                         su = &mysu;  
                         SCALE_HS_INIT(su, i);  
                         break;  
                 case 's':  
                         arg1 = va_arg(ap, char *);  
                         break;  
                 case 'u':  
                         su = va_arg(ap, struct roffsu *);  
                         break;  
                 case 'w':  
                         if ((arg2 = va_arg(ap, char *)) != NULL) {  
                                 su = &mysu;  
                                 a2width(arg2, su);  
                         }  
                         if (*fmt == '*') {  
                                 if (su != NULL && su->unit == SCALE_EN &&  
                                     su->scale > 5.9 && su->scale < 6.1)  
                                         su = NULL;  
                                 fmt++;  
                         }  
                         if (*fmt == '+') {  
                                 if (su != NULL) {  
                                         /* Make even bold text fit. */  
                                         su->scale *= 1.2;  
                                         /* Add padding. */  
                                         su->scale += 3.0;  
                                 }  
                                 fmt++;  
                         }  
                         if (*fmt == '-') {  
                                 if (su != NULL)  
                                         su->scale *= -1.0;  
                                 fmt++;  
                         }  
                         break;  
                 default:  
                         abort();  
                 }  
   
                 /* Second letter: style name. */  
   
                 switch (*fmt++) {  
                 case 'h':  
                         attr = "height";  
                         break;  
                 case 'i':  
                         attr = "text-indent";  
                         break;  
                 case 'l':  
                         attr = "margin-left";  
                         break;  
                 case 'w':  
                         attr = "width";  
                         break;  
                 case 'W':  
                         attr = "min-width";  
                         break;  
                 case '?':  
                         attr = arg1;  
                         arg1 = va_arg(ap, char *);  
                         break;  
                 default:  
                         abort();  
                 }  
                 if (su == NULL && arg1 == NULL)  
                         continue;                          continue;
                   print_byte(h, ' ');
                 if (have_style == 1)                  if (style_written == 0) {
                         print_word(h, " style=\"");                          print_word(h, "style=\"");
                 else                          style_written = 1;
                         print_byte(h, ' ');                  }
                 print_word(h, attr);                  print_word(h, arg1);
                 print_byte(h, ':');                  print_byte(h, ':');
                 print_byte(h, ' ');                  print_byte(h, ' ');
                 if (su != NULL) {                  print_word(h, arg2);
                         v = su->scale;  
                         if (su->unit == SCALE_MM && (v /= 100.0) == 0.0)  
                                 v = 1.0;  
                         else if (su->unit == SCALE_BU)  
                                 v /= 24.0;  
                         (void)snprintf(numbuf, sizeof(numbuf), "%.2f", v);  
                         print_word(h, numbuf);  
                         print_word(h, roffscales[su->unit]);  
                 } else  
                         print_word(h, arg1);  
                 print_byte(h, ';');                  print_byte(h, ';');
                 have_style = 2;  
         }          }
         if (have_style == 2)          if (style_written)
                 print_byte(h, '"');                  print_byte(h, '"');
   
         va_end(ap);          va_end(ap);
Line 836  print_text(struct html *h, const char *word)
Line 755  print_text(struct html *h, const char *word)
                 h->metaf = print_otag(h, TAG_B, "");                  h->metaf = print_otag(h, TAG_B, "");
                 print_otag(h, TAG_I, "");                  print_otag(h, TAG_I, "");
                 break;                  break;
           case HTMLFONT_CW:
                   h->metaf = print_otag(h, TAG_SPAN, "c", "Li");
                   break;
         default:          default:
                 print_indent(h);                  print_indent(h);
                 break;                  break;
Line 1002  print_word(struct html *h, const char *cp)
Line 924  print_word(struct html *h, const char *cp)
 {  {
         while (*cp != '\0')          while (*cp != '\0')
                 print_byte(h, *cp++);                  print_byte(h, *cp++);
 }  
   
 /*  
  * Calculate the scaling unit passed in a `-width' argument.  This uses  
  * either a native scaling unit (e.g., 1i, 2m) or the string length of  
  * the value.  
  */  
 static void  
 a2width(const char *p, struct roffsu *su)  
 {  
         const char      *end;  
   
         end = a2roffsu(p, su, SCALE_MAX);  
         if (end == NULL || *end != '\0') {  
                 su->unit = SCALE_EN;  
                 su->scale = html_strlen(p);  
         } else if (su->scale < 0.0)  
                 su->scale = 0.0;  
 }  }

Legend:
Removed from v.1.227  
changed lines
  Added in v.1.247

CVSweb