[BACK]Return to html.c CVS log [TXT][DIR] Up to [cvsweb.bsd.lv] / mandoc

Diff for /mandoc/html.c between version 1.117 and 1.138

version 1.117, 2010/12/17 08:17:40 version 1.138, 2011/05/14 16:28:23
Line 1 
Line 1 
 /*      $Id$ */  /*      $Id$ */
 /*  /*
  * Copyright (c) 2008, 2009, 2010 Kristaps Dzonsons <kristaps@bsd.lv>   * Copyright (c) 2008, 2009, 2010, 2011 Kristaps Dzonsons <kristaps@bsd.lv>
    * Copyright (c) 2011 Ingo Schwarze <schwarze@openbsd.org>
  *   *
  * Permission to use, copy, modify, and distribute this software for any   * Permission to use, copy, modify, and distribute this software for any
  * purpose with or without fee is hereby granted, provided that the above   * purpose with or without fee is hereby granted, provided that the above
Line 30 
Line 31 
 #include <unistd.h>  #include <unistd.h>
   
 #include "mandoc.h"  #include "mandoc.h"
   #include "libmandoc.h"
 #include "out.h"  #include "out.h"
 #include "chars.h"  
 #include "html.h"  #include "html.h"
 #include "main.h"  #include "main.h"
   
Line 69  static const struct htmldata htmltags[TAG_MAX] = {
Line 70  static const struct htmldata htmltags[TAG_MAX] = {
         {"dd",          HTML_CLRLINE}, /* TAG_DD */          {"dd",          HTML_CLRLINE}, /* TAG_DD */
         {"blockquote",  HTML_CLRLINE}, /* TAG_BLOCKQUOTE */          {"blockquote",  HTML_CLRLINE}, /* TAG_BLOCKQUOTE */
         {"p",           HTML_CLRLINE | HTML_NOSTACK | HTML_AUTOCLOSE}, /* TAG_P */          {"p",           HTML_CLRLINE | HTML_NOSTACK | HTML_AUTOCLOSE}, /* TAG_P */
           {"pre",         HTML_CLRLINE }, /* TAG_PRE */
           {"b",           0 }, /* TAG_B */
           {"i",           0 }, /* TAG_I */
           {"code",        0 }, /* TAG_CODE */
           {"small",       0 }, /* TAG_SMALL */
 };  };
   
 static  const char      *const htmlfonts[HTMLFONT_MAX] = {  
         "roman",  
         "bold",  
         "italic"  
 };  
   
 static  const char      *const htmlattrs[ATTR_MAX] = {  static  const char      *const htmlattrs[ATTR_MAX] = {
         "http-equiv",          "http-equiv", /* ATTR_HTTPEQUIV */
         "content",          "content", /* ATTR_CONTENT */
         "name",          "name", /* ATTR_NAME */
         "rel",          "rel", /* ATTR_REL */
         "href",          "href", /* ATTR_HREF */
         "type",          "type", /* ATTR_TYPE */
         "media",          "media", /* ATTR_MEDIA */
         "class",          "class", /* ATTR_CLASS */
         "style",          "style", /* ATTR_STYLE */
         "width",          "width", /* ATTR_WIDTH */
         "valign",          "id", /* ATTR_ID */
         "target",          "summary", /* ATTR_SUMMARY */
         "id",          "align", /* ATTR_ALIGN */
         "summary",          "colspan", /* ATTR_COLSPAN */
 };  };
   
 static  void              print_spec(struct html *, enum roffdeco,  static  void              print_num(struct html *, const char *, size_t);
                                 const char *, size_t);  static  void              print_spec(struct html *, const char *, size_t);
 static  void              print_res(struct html *, const char *, size_t);  static  void              print_res(struct html *, const char *, size_t);
 static  void              print_ctag(struct html *, enum htmltag);  static  void              print_ctag(struct html *, enum htmltag);
 static  void              print_doctype(struct html *);  static  void              print_doctype(struct html *);
 static  void              print_xmltype(struct html *);  static  void              print_xmltype(struct html *);
 static  int               print_encode(struct html *, const char *, int);  static  int               print_encode(struct html *, const char *, int);
 static  void              print_metaf(struct html *, enum roffdeco);  static  void              print_metaf(struct html *, enum mandoc_esc);
 static  void              print_attr(struct html *,  static  void              print_attr(struct html *,
                                 const char *, const char *);                                  const char *, const char *);
 static  void             *ml_alloc(char *, enum htmltype);  static  void             *ml_alloc(char *, enum htmltype);
Line 119  ml_alloc(char *outopts, enum htmltype type)
Line 119  ml_alloc(char *outopts, enum htmltype type)
         toks[2] = "includes";          toks[2] = "includes";
         toks[3] = NULL;          toks[3] = NULL;
   
         h = calloc(1, sizeof(struct html));          h = mandoc_calloc(1, sizeof(struct html));
         if (NULL == h) {  
                 perror(NULL);  
                 exit((int)MANDOCLEVEL_SYSERR);  
         }  
   
         h->type = type;          h->type = type;
         h->tags.head = NULL;          h->tags.head = NULL;
         h->symtab = chars_init(CHARS_HTML);          h->symtab = mchars_alloc();
   
         while (outopts && *outopts)          while (outopts && *outopts)
                 switch (getsubopt(&outopts, UNCONST(toks), &v)) {                  switch (getsubopt(&outopts, UNCONST(toks), &v)) {
Line 177  html_free(void *p)
Line 173  html_free(void *p)
         }          }
   
         if (h->symtab)          if (h->symtab)
                 chars_free(h->symtab);                  mchars_free(h->symtab);
   
         free(h);          free(h);
 }  }
Line 213  print_gen_head(struct html *h)
Line 209  print_gen_head(struct html *h)
         }          }
 }  }
   
   /* ARGSUSED */
   static void
   print_num(struct html *h, const char *p, size_t len)
   {
           char             c;
   
           if ('\0' != (c = mchars_num2char(p, len)))
                   putchar((int)c);
   }
   
 static void  static void
 print_spec(struct html *h, enum roffdeco d, const char *p, size_t len)  print_spec(struct html *h, const char *p, size_t len)
 {  {
         int              cp;          int              cp;
         const char      *rhs;          const char      *rhs;
         size_t           sz;          size_t           sz;
   
         if ((cp = chars_spec2cp(h->symtab, p, len)) > 0) {          if ((cp = mchars_spec2cp(h->symtab, p, len)) > 0) {
                 printf("&#%d;", cp);                  printf("&#%d;", cp);
                 return;                  return;
         } else if (-1 == cp && DECO_SSPECIAL == d) {          } else if (-1 == cp && 1 == len) {
                 fwrite(p, 1, len, stdout);                  fwrite(p, 1, len, stdout);
                 return;                  return;
         } else if (-1 == cp)          } else if (-1 == cp)
                 return;                  return;
   
         if (NULL != (rhs = chars_spec2str(h->symtab, p, len, &sz)))          if (NULL != (rhs = mchars_spec2str(h->symtab, p, len, &sz)))
                 fwrite(rhs, 1, sz, stdout);                  fwrite(rhs, 1, sz, stdout);
 }  }
   
Line 242  print_res(struct html *h, const char *p, size_t len)
Line 247  print_res(struct html *h, const char *p, size_t len)
         const char      *rhs;          const char      *rhs;
         size_t           sz;          size_t           sz;
   
         if ((cp = chars_res2cp(h->symtab, p, len)) > 0) {          if ((cp = mchars_res2cp(h->symtab, p, len)) > 0) {
                 printf("&#%d;", cp);                  printf("&#%d;", cp);
                 return;                  return;
         } else if (-1 == cp)          } else if (-1 == cp)
                 return;                  return;
   
         if (NULL != (rhs = chars_res2str(h->symtab, p, len, &sz)))          if (NULL != (rhs = mchars_res2str(h->symtab, p, len, &sz)))
                 fwrite(rhs, 1, sz, stdout);                  fwrite(rhs, 1, sz, stdout);
 }  }
   
   
 struct tag *  
 print_ofont(struct html *h, enum htmlfont font)  
 {  
         struct htmlpair  tag;  
   
         h->metal = h->metac;  
         h->metac = font;  
   
         /* FIXME: DECO_ROMAN should just close out preexisting. */  
   
         if (h->metaf && h->tags.head == h->metaf)  
                 print_tagq(h, h->metaf);  
   
         PAIR_CLASS_INIT(&tag, htmlfonts[font]);  
         h->metaf = print_otag(h, TAG_SPAN, 1, &tag);  
         return(h->metaf);  
 }  
   
   
 static void  static void
 print_metaf(struct html *h, enum roffdeco deco)  print_metaf(struct html *h, enum mandoc_esc deco)
 {  {
         enum htmlfont    font;          enum htmlfont    font;
   
         switch (deco) {          switch (deco) {
         case (DECO_PREVIOUS):          case (ESCAPE_FONTPREV):
                 font = h->metal;                  font = h->metal;
                 break;                  break;
         case (DECO_ITALIC):          case (ESCAPE_FONTITALIC):
                 font = HTMLFONT_ITALIC;                  font = HTMLFONT_ITALIC;
                 break;                  break;
         case (DECO_BOLD):          case (ESCAPE_FONTBOLD):
                 font = HTMLFONT_BOLD;                  font = HTMLFONT_BOLD;
                 break;                  break;
         case (DECO_ROMAN):          case (ESCAPE_FONTROMAN):
                 font = HTMLFONT_NONE;                  font = HTMLFONT_NONE;
                 break;                  break;
         default:          default:
Line 295  print_metaf(struct html *h, enum roffdeco deco)
Line 281  print_metaf(struct html *h, enum roffdeco deco)
                 /* NOTREACHED */                  /* NOTREACHED */
         }          }
   
         (void)print_ofont(h, font);          if (h->metaf) {
                   print_tagq(h, h->metaf);
                   h->metaf = NULL;
           }
   
           h->metal = h->metac;
           h->metac = font;
   
           if (HTMLFONT_NONE != font)
                   h->metaf = HTMLFONT_BOLD == font ?
                           print_otag(h, TAG_B, 0, NULL) :
                           print_otag(h, TAG_I, 0, NULL);
 }  }
   
   int
   html_strlen(const char *cp)
   {
           int              ssz, sz;
           const char      *seq, *p;
   
           /*
            * Account for escaped sequences within string length
            * calculations.  This follows the logic in term_strlen() as we
            * must calculate the width of produced strings.
            * Assume that characters are always width of "1".  This is
            * hacky, but it gets the job done for approximation of widths.
            */
   
           sz = 0;
           while (NULL != (p = strchr(cp, '\\'))) {
                   sz += (int)(p - cp);
                   ++cp;
                   switch (mandoc_escape(&cp, &seq, &ssz)) {
                   case (ESCAPE_ERROR):
                           return(sz);
                   case (ESCAPE_PREDEF):
                           sz++;
                           break;
                   case (ESCAPE_SPECIAL):
                           sz++;
                           break;
                   default:
                           break;
                   }
           }
   
           assert(sz >= 0);
           return(sz + strlen(cp));
   }
   
 static int  static int
 print_encode(struct html *h, const char *p, int norecurse)  print_encode(struct html *h, const char *p, int norecurse)
 {  {
         size_t           sz;          size_t           sz;
         int              len, nospace;          int              len, nospace;
         const char      *seq;          const char      *seq;
         enum roffdeco    deco;          enum mandoc_esc  esc;
         static const char rejs[6] = { '\\', '<', '>', '&', ASCII_HYPH, '\0' };          static const char rejs[6] = { '\\', '<', '>', '&', ASCII_HYPH, '\0' };
   
         nospace = 0;          nospace = 0;
   
         for (; *p; p++) {          while ('\0' != *p) {
                 sz = strcspn(p, rejs);                  sz = strcspn(p, rejs);
   
                 fwrite(p, 1, sz, stdout);                  fwrite(p, 1, sz, stdout);
                 p += /* LINTED */                  p += (int)sz;
                         sz;  
   
                 if ('<' == *p) {                  if ('\0' == *p)
                           break;
   
                   switch (*p++) {
                   case ('<'):
                         printf("&lt;");                          printf("&lt;");
                         continue;                          continue;
                 } else if ('>' == *p) {                  case ('>'):
                         printf("&gt;");                          printf("&gt;");
                         continue;                          continue;
                 } else if ('&' == *p) {                  case ('&'):
                         printf("&amp;");                          printf("&amp;");
                         continue;                          continue;
                 } else if (ASCII_HYPH == *p) {                  case (ASCII_HYPH):
                         /*  
                          * Note: "soft hyphens" aren't graphically  
                          * displayed when not breaking the text; we want  
                          * them to be displayed.  
                          */  
                         /*printf("&#173;");*/  
                         putchar('-');                          putchar('-');
                         continue;                          continue;
                 } else if ('\0' == *p)                  default:
                         break;                          break;
                   }
   
                 seq = ++p;                  esc = mandoc_escape(&p, &seq, &len);
                 len = a2roffdeco(&deco, &seq, &sz);                  if (ESCAPE_ERROR == esc)
                           break;
   
                 switch (deco) {                  switch (esc) {
                 case (DECO_RESERVED):                  case (ESCAPE_NUMBERED):
                         print_res(h, seq, sz);                          print_num(h, seq, len);
                         break;                          break;
                 case (DECO_SSPECIAL):                  case (ESCAPE_PREDEF):
                         /* FALLTHROUGH */                          print_res(h, seq, len);
                 case (DECO_SPECIAL):  
                         print_spec(h, deco, seq, sz);  
                         break;                          break;
                 case (DECO_PREVIOUS):                  case (ESCAPE_SPECIAL):
                           print_spec(h, seq, len);
                           break;
                   case (ESCAPE_FONTPREV):
                         /* FALLTHROUGH */                          /* FALLTHROUGH */
                 case (DECO_BOLD):                  case (ESCAPE_FONTBOLD):
                         /* FALLTHROUGH */                          /* FALLTHROUGH */
                 case (DECO_ITALIC):                  case (ESCAPE_FONTITALIC):
                         /* FALLTHROUGH */                          /* FALLTHROUGH */
                 case (DECO_ROMAN):                  case (ESCAPE_FONTROMAN):
                         if (norecurse)                          if (norecurse)
                                 break;                                  break;
                         print_metaf(h, deco);                          print_metaf(h, esc);
                         break;                          break;
                   case (ESCAPE_NOSPACE):
                           if ('\0' == *p)
                                   nospace = 1;
                           break;
                 default:                  default:
                         break;                          break;
                 }                  }
   
                 p += len - 1;  
   
                 if (DECO_NOSPACE == deco && '\0' == *(p + 1))  
                         nospace = 1;  
         }          }
   
         return(nospace);          return(nospace);
Line 394  print_otag(struct html *h, enum htmltag tag, 
Line 425  print_otag(struct html *h, enum htmltag tag, 
         /* Push this tags onto the stack of open scopes. */          /* Push this tags onto the stack of open scopes. */
   
         if ( ! (HTML_NOSTACK & htmltags[tag].flags)) {          if ( ! (HTML_NOSTACK & htmltags[tag].flags)) {
                 t = malloc(sizeof(struct tag));                  t = mandoc_malloc(sizeof(struct tag));
                 if (NULL == t) {  
                         perror(NULL);  
                         exit((int)MANDOCLEVEL_SYSERR);  
                 }  
                 t->tag = tag;                  t->tag = tag;
                 t->next = h->tags.head;                  t->next = h->tags.head;
                 h->tags.head = t;                  h->tags.head = t;
Line 435  print_otag(struct html *h, enum htmltag tag, 
Line 462  print_otag(struct html *h, enum htmltag tag, 
                 print_attr(h, "lang", "en");                  print_attr(h, "lang", "en");
         }          }
   
         /* Accomodate for XML "well-formed" singleton escaping. */          /* Accommodate for XML "well-formed" singleton escaping. */
   
         if (HTML_AUTOCLOSE & htmltags[tag].flags)          if (HTML_AUTOCLOSE & htmltags[tag].flags)
                 switch (h->type) {                  switch (h->type) {
Line 483  print_xmltype(struct html *h)
Line 510  print_xmltype(struct html *h)
 {  {
   
         if (HTML_XHTML_1_0_STRICT == h->type)          if (HTML_XHTML_1_0_STRICT == h->type)
                 printf("<?xml version=\"1.0\" encoding=\"UTF-8\"?>");                  puts("<?xml version=\"1.0\" encoding=\"UTF-8\"?>");
 }  }
   
   
Line 511  print_doctype(struct html *h)
Line 538  print_doctype(struct html *h)
                         name, doctype, dtd);                          name, doctype, dtd);
 }  }
   
   
 void  void
 print_text(struct html *h, const char *word)  print_text(struct html *h, const char *word)
 {  {
   
         if (word[0] && '\0' == word[1])  
                 switch (word[0]) {  
                 case('.'):  
                         /* FALLTHROUGH */  
                 case(','):  
                         /* FALLTHROUGH */  
                 case(';'):  
                         /* FALLTHROUGH */  
                 case(':'):  
                         /* FALLTHROUGH */  
                 case('?'):  
                         /* FALLTHROUGH */  
                 case('!'):  
                         /* FALLTHROUGH */  
                 case(')'):  
                         /* FALLTHROUGH */  
                 case(']'):  
                         if ( ! (HTML_IGNDELIM & h->flags))  
                                 h->flags |= HTML_NOSPACE;  
                         break;  
                 default:  
                         break;  
                 }  
   
         if ( ! (HTML_NOSPACE & h->flags)) {          if ( ! (HTML_NOSPACE & h->flags)) {
                 /* Manage keeps! */                  /* Manage keeps! */
                 if ( ! (HTML_KEEP & h->flags)) {                  if ( ! (HTML_KEEP & h->flags)) {
Line 550  print_text(struct html *h, const char *word)
Line 552  print_text(struct html *h, const char *word)
                         printf("&#160;");                          printf("&#160;");
         }          }
   
           assert(NULL == h->metaf);
           if (HTMLFONT_NONE != h->metac)
                   h->metaf = HTMLFONT_BOLD == h->metac ?
                           print_otag(h, TAG_B, 0, NULL) :
                           print_otag(h, TAG_I, 0, NULL);
   
         assert(word);          assert(word);
         if ( ! print_encode(h, word, 0))          if ( ! print_encode(h, word, 0))
                 if ( ! (h->flags & HTML_NONOSPACE))                  if ( ! (h->flags & HTML_NONOSPACE))
                         h->flags &= ~HTML_NOSPACE;                          h->flags &= ~HTML_NOSPACE;
   
         h->flags &= ~HTML_IGNDELIM;          if (h->metaf) {
                   print_tagq(h, h->metaf);
                   h->metaf = NULL;
           }
   
         /*          h->flags &= ~HTML_IGNDELIM;
          * Note that we don't process the pipe: the parser sees it as  
          * punctuation, but we don't in terms of typography.  
          */  
         if (word[0] && '\0' == word[1])  
                 switch (word[0]) {  
                 case('('):  
                         /* FALLTHROUGH */  
                 case('['):  
                         h->flags |= HTML_NOSPACE;  
                         break;  
                 default:  
                         break;  
                 }  
 }  }
   
   
Line 580  print_tagq(struct html *h, const struct tag *until)
Line 578  print_tagq(struct html *h, const struct tag *until)
         struct tag      *tag;          struct tag      *tag;
   
         while ((tag = h->tags.head) != NULL) {          while ((tag = h->tags.head) != NULL) {
                   /*
                    * Remember to close out and nullify the current
                    * meta-font and table, if applicable.
                    */
                 if (tag == h->metaf)                  if (tag == h->metaf)
                         h->metaf = NULL;                          h->metaf = NULL;
                   if (tag == h->tblt)
                           h->tblt = NULL;
                 print_ctag(h, tag->tag);                  print_ctag(h, tag->tag);
                 h->tags.head = tag->next;                  h->tags.head = tag->next;
                 free(tag);                  free(tag);
Line 599  print_stagq(struct html *h, const struct tag *suntil)
Line 603  print_stagq(struct html *h, const struct tag *suntil)
         while ((tag = h->tags.head) != NULL) {          while ((tag = h->tags.head) != NULL) {
                 if (suntil && tag == suntil)                  if (suntil && tag == suntil)
                         return;                          return;
                   /*
                    * Remember to close out and nullify the current
                    * meta-font and table, if applicable.
                    */
                 if (tag == h->metaf)                  if (tag == h->metaf)
                         h->metaf = NULL;                          h->metaf = NULL;
                   if (tag == h->tblt)
                           h->tblt = NULL;
                 print_ctag(h, tag->tag);                  print_ctag(h, tag->tag);
                 h->tags.head = tag->next;                  h->tags.head = tag->next;
                 free(tag);                  free(tag);
Line 770  html_idcat(char *dst, const char *src, int sz)
Line 780  html_idcat(char *dst, const char *src, int sz)
 {  {
         int              ssz;          int              ssz;
   
         assert(sz);          assert(sz > 2);
   
         /* Cf. <http://www.w3.org/TR/html4/types.html#h-6.2>. */          /* Cf. <http://www.w3.org/TR/html4/types.html#h-6.2>. */
   
         for ( ; *dst != '\0' && sz; dst++, sz--)  
                 /* Jump to end. */ ;  
   
         assert(sz > 2);  
   
         /* We can't start with a number (bah). */          /* We can't start with a number (bah). */
   
         *dst++ = 'x';          if ('#' == *dst) {
         *dst = '\0';                  dst++;
         sz--;                  sz--;
           }
           if ('\0' == *dst) {
                   *dst++ = 'x';
                   *dst = '\0';
                   sz--;
           }
   
           for ( ; *dst != '\0' && sz; dst++, sz--)
                   /* Jump to end. */ ;
   
         for ( ; *src != '\0' && sz > 1; src++) {          for ( ; *src != '\0' && sz > 1; src++) {
                 ssz = snprintf(dst, (size_t)sz, "%.2x", *src);                  ssz = snprintf(dst, (size_t)sz, "%.2x", *src);

Legend:
Removed from v.1.117  
changed lines
  Added in v.1.138

CVSweb