[BACK]Return to html.c CVS log [TXT][DIR] Up to [cvsweb.bsd.lv] / mandoc

Diff for /mandoc/html.c between version 1.114 and 1.135

version 1.114, 2010/12/15 14:52:16 version 1.135, 2011/04/30 22:14:02
Line 1 
Line 1 
 /*      $Id$ */  /*      $Id$ */
 /*  /*
  * Copyright (c) 2008, 2009, 2010 Kristaps Dzonsons <kristaps@bsd.lv>   * Copyright (c) 2008, 2009, 2010, 2011 Kristaps Dzonsons <kristaps@bsd.lv>
    * Copyright (c) 2011 Ingo Schwarze <schwarze@openbsd.org>
  *   *
  * Permission to use, copy, modify, and distribute this software for any   * Permission to use, copy, modify, and distribute this software for any
  * purpose with or without fee is hereby granted, provided that the above   * purpose with or without fee is hereby granted, provided that the above
Line 31 
Line 32 
   
 #include "mandoc.h"  #include "mandoc.h"
 #include "out.h"  #include "out.h"
 #include "chars.h"  
 #include "html.h"  #include "html.h"
 #include "main.h"  #include "main.h"
   
Line 67  static const struct htmldata htmltags[TAG_MAX] = {
Line 67  static const struct htmldata htmltags[TAG_MAX] = {
         {"dl",          HTML_CLRLINE}, /* TAG_DL */          {"dl",          HTML_CLRLINE}, /* TAG_DL */
         {"dt",          HTML_CLRLINE}, /* TAG_DT */          {"dt",          HTML_CLRLINE}, /* TAG_DT */
         {"dd",          HTML_CLRLINE}, /* TAG_DD */          {"dd",          HTML_CLRLINE}, /* TAG_DD */
           {"blockquote",  HTML_CLRLINE}, /* TAG_BLOCKQUOTE */
           {"p",           HTML_CLRLINE | HTML_NOSTACK | HTML_AUTOCLOSE}, /* TAG_P */
           {"pre",         HTML_CLRLINE }, /* TAG_PRE */
           {"b",           0 }, /* TAG_B */
           {"i",           0 }, /* TAG_I */
           {"code",        0 }, /* TAG_CODE */
           {"small",       0 }, /* TAG_SMALL */
 };  };
   
 static  const char      *const htmlfonts[HTMLFONT_MAX] = {  
         "roman",  
         "bold",  
         "italic"  
 };  
   
 static  const char      *const htmlattrs[ATTR_MAX] = {  static  const char      *const htmlattrs[ATTR_MAX] = {
         "http-equiv",          "http-equiv", /* ATTR_HTTPEQUIV */
         "content",          "content", /* ATTR_CONTENT */
         "name",          "name", /* ATTR_NAME */
         "rel",          "rel", /* ATTR_REL */
         "href",          "href", /* ATTR_HREF */
         "type",          "type", /* ATTR_TYPE */
         "media",          "media", /* ATTR_MEDIA */
         "class",          "class", /* ATTR_CLASS */
         "style",          "style", /* ATTR_STYLE */
         "width",          "width", /* ATTR_WIDTH */
         "valign",          "id", /* ATTR_ID */
         "target",          "summary", /* ATTR_SUMMARY */
         "id",          "align", /* ATTR_ALIGN */
         "summary",          "colspan", /* ATTR_COLSPAN */
 };  };
   
 static  void              print_spec(struct html *, enum roffdeco,  static  void              print_num(struct html *, const char *, size_t);
                                 const char *, size_t);  static  void              print_spec(struct html *, const char *, size_t);
 static  void              print_res(struct html *, const char *, size_t);  static  void              print_res(struct html *, const char *, size_t);
 static  void              print_ctag(struct html *, enum htmltag);  static  void              print_ctag(struct html *, enum htmltag);
 static  void              print_doctype(struct html *);  static  void              print_doctype(struct html *);
 static  void              print_xmltype(struct html *);  static  void              print_xmltype(struct html *);
 static  int               print_encode(struct html *, const char *, int);  static  int               print_encode(struct html *, const char *, int);
 static  void              print_metaf(struct html *, enum roffdeco);  static  void              print_metaf(struct html *, enum mandoc_esc);
 static  void              print_attr(struct html *,  static  void              print_attr(struct html *,
                                 const char *, const char *);                                  const char *, const char *);
 static  void             *ml_alloc(char *, enum htmltype);  static  void             *ml_alloc(char *, enum htmltype);
Line 117  ml_alloc(char *outopts, enum htmltype type)
Line 118  ml_alloc(char *outopts, enum htmltype type)
         toks[2] = "includes";          toks[2] = "includes";
         toks[3] = NULL;          toks[3] = NULL;
   
         h = calloc(1, sizeof(struct html));          h = mandoc_calloc(1, sizeof(struct html));
         if (NULL == h) {  
                 perror(NULL);  
                 exit((int)MANDOCLEVEL_SYSERR);  
         }  
   
         h->type = type;          h->type = type;
         h->tags.head = NULL;          h->tags.head = NULL;
         h->symtab = chars_init(CHARS_HTML);          h->symtab = mchars_init();
   
         while (outopts && *outopts)          while (outopts && *outopts)
                 switch (getsubopt(&outopts, UNCONST(toks), &v)) {                  switch (getsubopt(&outopts, UNCONST(toks), &v)) {
Line 175  html_free(void *p)
Line 172  html_free(void *p)
         }          }
   
         if (h->symtab)          if (h->symtab)
                 chars_free(h->symtab);                  mchars_free(h->symtab);
   
         free(h);          free(h);
 }  }
Line 211  print_gen_head(struct html *h)
Line 208  print_gen_head(struct html *h)
         }          }
 }  }
   
   /* ARGSUSED */
   static void
   print_num(struct html *h, const char *p, size_t len)
   {
           const char      *rhs;
   
           rhs = mchars_num2char(p, len);
           if (rhs)
                   putchar((int)*rhs);
   }
   
 static void  static void
 print_spec(struct html *h, enum roffdeco d, const char *p, size_t len)  print_spec(struct html *h, const char *p, size_t len)
 {  {
         int              cp;          int              cp;
         const char      *rhs;          const char      *rhs;
         size_t           sz;          size_t           sz;
   
         if ((cp = chars_spec2cp(h->symtab, p, len)) > 0) {          if ((cp = mchars_spec2cp(h->symtab, p, len)) > 0) {
                 printf("&#%d;", cp);                  printf("&#%d;", cp);
                 return;                  return;
         } else if (-1 == cp && DECO_SSPECIAL == d) {          } else if (-1 == cp && 1 == len) {
                 fwrite(p, 1, len, stdout);                  fwrite(p, 1, len, stdout);
                 return;                  return;
         } else if (-1 == cp)          } else if (-1 == cp)
                 return;                  return;
   
         if (NULL != (rhs = chars_spec2str(h->symtab, p, len, &sz)))          if (NULL != (rhs = mchars_spec2str(h->symtab, p, len, &sz)))
                 fwrite(rhs, 1, sz, stdout);                  fwrite(rhs, 1, sz, stdout);
 }  }
   
Line 240  print_res(struct html *h, const char *p, size_t len)
Line 247  print_res(struct html *h, const char *p, size_t len)
         const char      *rhs;          const char      *rhs;
         size_t           sz;          size_t           sz;
   
         if ((cp = chars_res2cp(h->symtab, p, len)) > 0) {          if ((cp = mchars_res2cp(h->symtab, p, len)) > 0) {
                 printf("&#%d;", cp);                  printf("&#%d;", cp);
                 return;                  return;
         } else if (-1 == cp)          } else if (-1 == cp)
                 return;                  return;
   
         if (NULL != (rhs = chars_res2str(h->symtab, p, len, &sz)))          if (NULL != (rhs = mchars_res2str(h->symtab, p, len, &sz)))
                 fwrite(rhs, 1, sz, stdout);                  fwrite(rhs, 1, sz, stdout);
 }  }
   
   
 struct tag *  
 print_ofont(struct html *h, enum htmlfont font)  
 {  
         struct htmlpair  tag;  
   
         h->metal = h->metac;  
         h->metac = font;  
   
         /* FIXME: DECO_ROMAN should just close out preexisting. */  
   
         if (h->metaf && h->tags.head == h->metaf)  
                 print_tagq(h, h->metaf);  
   
         PAIR_CLASS_INIT(&tag, htmlfonts[font]);  
         h->metaf = print_otag(h, TAG_SPAN, 1, &tag);  
         return(h->metaf);  
 }  
   
   
 static void  static void
 print_metaf(struct html *h, enum roffdeco deco)  print_metaf(struct html *h, enum mandoc_esc deco)
 {  {
         enum htmlfont    font;          enum htmlfont    font;
   
         switch (deco) {          switch (deco) {
         case (DECO_PREVIOUS):          case (ESCAPE_FONTPREV):
                 font = h->metal;                  font = h->metal;
                 break;                  break;
         case (DECO_ITALIC):          case (ESCAPE_FONTITALIC):
                 font = HTMLFONT_ITALIC;                  font = HTMLFONT_ITALIC;
                 break;                  break;
         case (DECO_BOLD):          case (ESCAPE_FONTBOLD):
                 font = HTMLFONT_BOLD;                  font = HTMLFONT_BOLD;
                 break;                  break;
         case (DECO_ROMAN):          case (ESCAPE_FONTROMAN):
                 font = HTMLFONT_NONE;                  font = HTMLFONT_NONE;
                 break;                  break;
         default:          default:
Line 293  print_metaf(struct html *h, enum roffdeco deco)
Line 281  print_metaf(struct html *h, enum roffdeco deco)
                 /* NOTREACHED */                  /* NOTREACHED */
         }          }
   
         (void)print_ofont(h, font);          if (h->metaf) {
                   print_tagq(h, h->metaf);
                   h->metaf = NULL;
           }
   
           h->metal = h->metac;
           h->metac = font;
   
           if (HTMLFONT_NONE != font)
                   h->metaf = HTMLFONT_BOLD == font ?
                           print_otag(h, TAG_B, 0, NULL) :
                           print_otag(h, TAG_I, 0, NULL);
 }  }
   
   
Line 303  print_encode(struct html *h, const char *p, int norecu
Line 302  print_encode(struct html *h, const char *p, int norecu
         size_t           sz;          size_t           sz;
         int              len, nospace;          int              len, nospace;
         const char      *seq;          const char      *seq;
         enum roffdeco    deco;          enum mandoc_esc  esc;
         static const char rejs[6] = { '\\', '<', '>', '&', ASCII_HYPH, '\0' };          static const char rejs[6] = { '\\', '<', '>', '&', ASCII_HYPH, '\0' };
   
         nospace = 0;          nospace = 0;
   
         for (; *p; p++) {          while ('\0' != *p) {
                 sz = strcspn(p, rejs);                  sz = strcspn(p, rejs);
   
                 fwrite(p, 1, sz, stdout);                  fwrite(p, 1, sz, stdout);
                 p += /* LINTED */                  p += (int)sz;
                         sz;  
   
                 if ('<' == *p) {                  if ('\0' == *p)
                           break;
   
                   switch (*p++) {
                   case ('<'):
                         printf("&lt;");                          printf("&lt;");
                         continue;                          continue;
                 } else if ('>' == *p) {                  case ('>'):
                         printf("&gt;");                          printf("&gt;");
                         continue;                          continue;
                 } else if ('&' == *p) {                  case ('&'):
                         printf("&amp;");                          printf("&amp;");
                         continue;                          continue;
                 } else if (ASCII_HYPH == *p) {                  case (ASCII_HYPH):
                         /*  
                          * Note: "soft hyphens" aren't graphically  
                          * displayed when not breaking the text; we want  
                          * them to be displayed.  
                          */  
                         /*printf("&#173;");*/  
                         putchar('-');                          putchar('-');
                         continue;                          continue;
                 } else if ('\0' == *p)                  default:
                         break;                          break;
                   }
   
                 seq = ++p;                  esc = mandoc_escape(&p, &seq, &len);
                 len = a2roffdeco(&deco, &seq, &sz);                  if (ESCAPE_ERROR == esc)
                           break;
   
                 switch (deco) {                  switch (esc) {
                 case (DECO_RESERVED):                  case (ESCAPE_NUMBERED):
                         print_res(h, seq, sz);                          print_num(h, seq, len);
                         break;                          break;
                 case (DECO_SSPECIAL):                  case (ESCAPE_PREDEF):
                         /* FALLTHROUGH */                          print_res(h, seq, len);
                 case (DECO_SPECIAL):  
                         print_spec(h, deco, seq, sz);  
                         break;                          break;
                 case (DECO_PREVIOUS):                  case (ESCAPE_SPECIAL):
                           print_spec(h, seq, len);
                           break;
                   case (ESCAPE_FONTPREV):
                         /* FALLTHROUGH */                          /* FALLTHROUGH */
                 case (DECO_BOLD):                  case (ESCAPE_FONTBOLD):
                         /* FALLTHROUGH */                          /* FALLTHROUGH */
                 case (DECO_ITALIC):                  case (ESCAPE_FONTITALIC):
                         /* FALLTHROUGH */                          /* FALLTHROUGH */
                 case (DECO_ROMAN):                  case (ESCAPE_FONTROMAN):
                         if (norecurse)                          if (norecurse)
                                 break;                                  break;
                         print_metaf(h, deco);                          print_metaf(h, esc);
                         break;                          break;
                   case (ESCAPE_NOSPACE):
                           if ('\0' == *p)
                                   nospace = 1;
                           break;
                 default:                  default:
                         break;                          break;
                 }                  }
   
                 p += len - 1;  
   
                 if (DECO_NOSPACE == deco && '\0' == *(p + 1))  
                         nospace = 1;  
         }          }
   
         return(nospace);          return(nospace);
Line 392  print_otag(struct html *h, enum htmltag tag, 
Line 390  print_otag(struct html *h, enum htmltag tag, 
         /* Push this tags onto the stack of open scopes. */          /* Push this tags onto the stack of open scopes. */
   
         if ( ! (HTML_NOSTACK & htmltags[tag].flags)) {          if ( ! (HTML_NOSTACK & htmltags[tag].flags)) {
                 t = malloc(sizeof(struct tag));                  t = mandoc_malloc(sizeof(struct tag));
                 if (NULL == t) {  
                         perror(NULL);  
                         exit((int)MANDOCLEVEL_SYSERR);  
                 }  
                 t->tag = tag;                  t->tag = tag;
                 t->next = h->tags.head;                  t->next = h->tags.head;
                 h->tags.head = t;                  h->tags.head = t;
Line 433  print_otag(struct html *h, enum htmltag tag, 
Line 427  print_otag(struct html *h, enum htmltag tag, 
                 print_attr(h, "lang", "en");                  print_attr(h, "lang", "en");
         }          }
   
         /* Accomodate for XML "well-formed" singleton escaping. */          /* Accommodate for XML "well-formed" singleton escaping. */
   
         if (HTML_AUTOCLOSE & htmltags[tag].flags)          if (HTML_AUTOCLOSE & htmltags[tag].flags)
                 switch (h->type) {                  switch (h->type) {
Line 447  print_otag(struct html *h, enum htmltag tag, 
Line 441  print_otag(struct html *h, enum htmltag tag, 
         putchar('>');          putchar('>');
   
         h->flags |= HTML_NOSPACE;          h->flags |= HTML_NOSPACE;
   
           if ((HTML_AUTOCLOSE | HTML_CLRLINE) & htmltags[tag].flags)
                   putchar('\n');
   
         return(t);          return(t);
 }  }
   
Line 477  print_xmltype(struct html *h)
Line 475  print_xmltype(struct html *h)
 {  {
   
         if (HTML_XHTML_1_0_STRICT == h->type)          if (HTML_XHTML_1_0_STRICT == h->type)
                 printf("<?xml version=\"1.0\" encoding=\"UTF-8\"?>");                  puts("<?xml version=\"1.0\" encoding=\"UTF-8\"?>");
 }  }
   
   
Line 505  print_doctype(struct html *h)
Line 503  print_doctype(struct html *h)
                         name, doctype, dtd);                          name, doctype, dtd);
 }  }
   
   
 void  void
 print_text(struct html *h, const char *word)  print_text(struct html *h, const char *word)
 {  {
   
         if (word[0] && '\0' == word[1])  
                 switch (word[0]) {  
                 case('.'):  
                         /* FALLTHROUGH */  
                 case(','):  
                         /* FALLTHROUGH */  
                 case(';'):  
                         /* FALLTHROUGH */  
                 case(':'):  
                         /* FALLTHROUGH */  
                 case('?'):  
                         /* FALLTHROUGH */  
                 case('!'):  
                         /* FALLTHROUGH */  
                 case(')'):  
                         /* FALLTHROUGH */  
                 case(']'):  
                         if ( ! (HTML_IGNDELIM & h->flags))  
                                 h->flags |= HTML_NOSPACE;  
                         break;  
                 default:  
                         break;  
                 }  
   
         if ( ! (HTML_NOSPACE & h->flags)) {          if ( ! (HTML_NOSPACE & h->flags)) {
                 /* Manage keeps! */                  /* Manage keeps! */
                 if ( ! (HTML_KEEP & h->flags)) {                  if ( ! (HTML_KEEP & h->flags)) {
Line 544  print_text(struct html *h, const char *word)
Line 517  print_text(struct html *h, const char *word)
                         printf("&#160;");                          printf("&#160;");
         }          }
   
           assert(NULL == h->metaf);
           if (HTMLFONT_NONE != h->metac)
                   h->metaf = HTMLFONT_BOLD == h->metac ?
                           print_otag(h, TAG_B, 0, NULL) :
                           print_otag(h, TAG_I, 0, NULL);
   
         assert(word);          assert(word);
         if ( ! print_encode(h, word, 0))          if ( ! print_encode(h, word, 0))
                 if ( ! (h->flags & HTML_NONOSPACE))                  if ( ! (h->flags & HTML_NONOSPACE))
                         h->flags &= ~HTML_NOSPACE;                          h->flags &= ~HTML_NOSPACE;
   
         h->flags &= ~HTML_IGNDELIM;          if (h->metaf) {
                   print_tagq(h, h->metaf);
                   h->metaf = NULL;
           }
   
         /*          h->flags &= ~HTML_IGNDELIM;
          * Note that we don't process the pipe: the parser sees it as  
          * punctuation, but we don't in terms of typography.  
          */  
         if (word[0] && '\0' == word[1])  
                 switch (word[0]) {  
                 case('('):  
                         /* FALLTHROUGH */  
                 case('['):  
                         h->flags |= HTML_NOSPACE;  
                         break;  
                 default:  
                         break;  
                 }  
 }  }
   
   
Line 574  print_tagq(struct html *h, const struct tag *until)
Line 543  print_tagq(struct html *h, const struct tag *until)
         struct tag      *tag;          struct tag      *tag;
   
         while ((tag = h->tags.head) != NULL) {          while ((tag = h->tags.head) != NULL) {
                   /*
                    * Remember to close out and nullify the current
                    * meta-font and table, if applicable.
                    */
                 if (tag == h->metaf)                  if (tag == h->metaf)
                         h->metaf = NULL;                          h->metaf = NULL;
                   if (tag == h->tblt)
                           h->tblt = NULL;
                 print_ctag(h, tag->tag);                  print_ctag(h, tag->tag);
                 h->tags.head = tag->next;                  h->tags.head = tag->next;
                 free(tag);                  free(tag);
Line 593  print_stagq(struct html *h, const struct tag *suntil)
Line 568  print_stagq(struct html *h, const struct tag *suntil)
         while ((tag = h->tags.head) != NULL) {          while ((tag = h->tags.head) != NULL) {
                 if (suntil && tag == suntil)                  if (suntil && tag == suntil)
                         return;                          return;
                   /*
                    * Remember to close out and nullify the current
                    * meta-font and table, if applicable.
                    */
                 if (tag == h->metaf)                  if (tag == h->metaf)
                         h->metaf = NULL;                          h->metaf = NULL;
                   if (tag == h->tblt)
                           h->tblt = NULL;
                 print_ctag(h, tag->tag);                  print_ctag(h, tag->tag);
                 h->tags.head = tag->next;                  h->tags.head = tag->next;
                 free(tag);                  free(tag);
Line 764  html_idcat(char *dst, const char *src, int sz)
Line 745  html_idcat(char *dst, const char *src, int sz)
 {  {
         int              ssz;          int              ssz;
   
         assert(sz);          assert(sz > 2);
   
         /* Cf. <http://www.w3.org/TR/html4/types.html#h-6.2>. */          /* Cf. <http://www.w3.org/TR/html4/types.html#h-6.2>. */
   
         for ( ; *dst != '\0' && sz; dst++, sz--)  
                 /* Jump to end. */ ;  
   
         assert(sz > 2);  
   
         /* We can't start with a number (bah). */          /* We can't start with a number (bah). */
   
         *dst++ = 'x';          if ('#' == *dst) {
         *dst = '\0';                  dst++;
         sz--;                  sz--;
           }
           if ('\0' == *dst) {
                   *dst++ = 'x';
                   *dst = '\0';
                   sz--;
           }
   
           for ( ; *dst != '\0' && sz; dst++, sz--)
                   /* Jump to end. */ ;
   
         for ( ; *src != '\0' && sz > 1; src++) {          for ( ; *src != '\0' && sz > 1; src++) {
                 ssz = snprintf(dst, (size_t)sz, "%.2x", *src);                  ssz = snprintf(dst, (size_t)sz, "%.2x", *src);

Legend:
Removed from v.1.114  
changed lines
  Added in v.1.135

CVSweb