[BACK]Return to html.c CVS log [TXT][DIR] Up to [cvsweb.bsd.lv] / mandoc

Diff for /mandoc/html.c between version 1.12 and 1.138

version 1.12, 2008/12/06 19:41:41 version 1.138, 2011/05/14 16:28:23
Line 1 
Line 1 
 /* $Id$ */  /*      $Id$ */
 /*  /*
  * Copyright (c) 2008 Kristaps Dzonsons <kristaps@kth.se>   * Copyright (c) 2008, 2009, 2010, 2011 Kristaps Dzonsons <kristaps@bsd.lv>
    * Copyright (c) 2011 Ingo Schwarze <schwarze@openbsd.org>
  *   *
  * Permission to use, copy, modify, and distribute this software for any   * Permission to use, copy, modify, and distribute this software for any
  * purpose with or without fee is hereby granted, provided that the   * purpose with or without fee is hereby granted, provided that the above
  * above copyright notice and this permission notice appear in all   * copyright notice and this permission notice appear in all copies.
  * copies.  
  *   *
  * THE SOFTWARE IS PROVIDED "AS IS" AND THE AUTHOR DISCLAIMS ALL   * THE SOFTWARE IS PROVIDED "AS IS" AND THE AUTHOR DISCLAIMS ALL WARRANTIES
  * WARRANTIES WITH REGARD TO THIS SOFTWARE INCLUDING ALL IMPLIED   * WITH REGARD TO THIS SOFTWARE INCLUDING ALL IMPLIED WARRANTIES OF
  * WARRANTIES OF MERCHANTABILITY AND FITNESS. IN NO EVENT SHALL THE   * MERCHANTABILITY AND FITNESS. IN NO EVENT SHALL THE AUTHOR BE LIABLE FOR
  * AUTHOR BE LIABLE FOR ANY SPECIAL, DIRECT, INDIRECT, OR CONSEQUENTIAL   * ANY SPECIAL, DIRECT, INDIRECT, OR CONSEQUENTIAL DAMAGES OR ANY DAMAGES
  * DAMAGES OR ANY DAMAGES WHATSOEVER RESULTING FROM LOSS OF USE, DATA OR   * WHATSOEVER RESULTING FROM LOSS OF USE, DATA OR PROFITS, WHETHER IN AN
  * PROFITS, WHETHER IN AN ACTION OF CONTRACT, NEGLIGENCE OR OTHER   * ACTION OF CONTRACT, NEGLIGENCE OR OTHER TORTIOUS ACTION, ARISING OUT OF
  * TORTIOUS ACTION, ARISING OUT OF OR IN CONNECTION WITH THE USE OR   * OR IN CONNECTION WITH THE USE OR PERFORMANCE OF THIS SOFTWARE.
  * PERFORMANCE OF THIS SOFTWARE.  
  */   */
 #include <sys/param.h>  #ifdef HAVE_CONFIG_H
 #include <sys/stat.h>  #include "config.h"
   #endif
   
   #include <sys/types.h>
   
 #include <assert.h>  #include <assert.h>
 #include <err.h>  #include <ctype.h>
 #include <fcntl.h>  #include <stdarg.h>
 #include <stdlib.h>  
 #include <stdio.h>  #include <stdio.h>
   #include <stdint.h>
   #include <stdlib.h>
 #include <string.h>  #include <string.h>
 #include <unistd.h>  #include <unistd.h>
   
 #include "libmdocml.h"  #include "mandoc.h"
 #include "private.h"  #include "libmandoc.h"
 #include "ml.h"  #include "out.h"
   #include "html.h"
   #include "main.h"
   
   struct  htmldata {
           const char       *name;
           int               flags;
   #define HTML_CLRLINE     (1 << 0)
   #define HTML_NOSTACK     (1 << 1)
   #define HTML_AUTOCLOSE   (1 << 2) /* Tag has auto-closure. */
   };
   
 /* TODO: allow head/tail-less invocations (just "div" start). */  static  const struct htmldata htmltags[TAG_MAX] = {
           {"html",        HTML_CLRLINE}, /* TAG_HTML */
 struct  htmlnode {          {"head",        HTML_CLRLINE}, /* TAG_HEAD */
         int              tok;          {"body",        HTML_CLRLINE}, /* TAG_BODY */
         enum md_ns       ns;          {"meta",        HTML_CLRLINE | HTML_NOSTACK | HTML_AUTOCLOSE}, /* TAG_META */
         int              argc[ROFF_MAXLINEARG];          {"title",       HTML_CLRLINE}, /* TAG_TITLE */
         char            *argv[ROFF_MAXLINEARG];          {"div",         HTML_CLRLINE}, /* TAG_DIV */
         struct htmlnode *parent;          {"h1",          0}, /* TAG_H1 */
           {"h2",          0}, /* TAG_H2 */
           {"span",        0}, /* TAG_SPAN */
           {"link",        HTML_CLRLINE | HTML_NOSTACK | HTML_AUTOCLOSE}, /* TAG_LINK */
           {"br",          HTML_CLRLINE | HTML_NOSTACK | HTML_AUTOCLOSE}, /* TAG_BR */
           {"a",           0}, /* TAG_A */
           {"table",       HTML_CLRLINE}, /* TAG_TABLE */
           {"tbody",       HTML_CLRLINE}, /* TAG_TBODY */
           {"col",         HTML_CLRLINE | HTML_NOSTACK | HTML_AUTOCLOSE}, /* TAG_COL */
           {"tr",          HTML_CLRLINE}, /* TAG_TR */
           {"td",          HTML_CLRLINE}, /* TAG_TD */
           {"li",          HTML_CLRLINE}, /* TAG_LI */
           {"ul",          HTML_CLRLINE}, /* TAG_UL */
           {"ol",          HTML_CLRLINE}, /* TAG_OL */
           {"dl",          HTML_CLRLINE}, /* TAG_DL */
           {"dt",          HTML_CLRLINE}, /* TAG_DT */
           {"dd",          HTML_CLRLINE}, /* TAG_DD */
           {"blockquote",  HTML_CLRLINE}, /* TAG_BLOCKQUOTE */
           {"p",           HTML_CLRLINE | HTML_NOSTACK | HTML_AUTOCLOSE}, /* TAG_P */
           {"pre",         HTML_CLRLINE }, /* TAG_PRE */
           {"b",           0 }, /* TAG_B */
           {"i",           0 }, /* TAG_I */
           {"code",        0 }, /* TAG_CODE */
           {"small",       0 }, /* TAG_SMALL */
 };  };
   
   static  const char      *const htmlattrs[ATTR_MAX] = {
 struct  htmlq {          "http-equiv", /* ATTR_HTTPEQUIV */
         struct htmlnode *last;          "content", /* ATTR_CONTENT */
           "name", /* ATTR_NAME */
           "rel", /* ATTR_REL */
           "href", /* ATTR_HREF */
           "type", /* ATTR_TYPE */
           "media", /* ATTR_MEDIA */
           "class", /* ATTR_CLASS */
           "style", /* ATTR_STYLE */
           "width", /* ATTR_WIDTH */
           "id", /* ATTR_ID */
           "summary", /* ATTR_SUMMARY */
           "align", /* ATTR_ALIGN */
           "colspan", /* ATTR_COLSPAN */
 };  };
   
   static  void              print_num(struct html *, const char *, size_t);
 static  int             html_loadcss(struct md_mbuf *, const char *);  static  void              print_spec(struct html *, const char *, size_t);
   static  void              print_res(struct html *, const char *, size_t);
 static  int             html_alloc(void **);  static  void              print_ctag(struct html *, enum htmltag);
 static  void            html_free(void *);  static  void              print_doctype(struct html *);
 static  ssize_t         html_endtag(struct md_mbuf *, void *,  static  void              print_xmltype(struct html *);
                                 const struct md_args *,  static  int               print_encode(struct html *, const char *, int);
                                 enum md_ns, int);  static  void              print_metaf(struct html *, enum mandoc_esc);
 static  ssize_t         html_begintag(struct md_mbuf *, void *,  static  void              print_attr(struct html *,
                                 const struct md_args *,  
                                 enum md_ns, int,  
                                 const int *, const char **);  
 static  int             html_begin(struct md_mbuf *,  
                                 const struct md_args *,  
                                 const struct tm *,  
                                 const char *, const char *,  
                                 const char *, const char *);                                  const char *, const char *);
 static  int             html_printargs(struct md_mbuf *, int,  static  void             *ml_alloc(char *, enum htmltype);
                                 const char *, const int *,  
                                 const char **, size_t *);  
 static  int             html_end(struct md_mbuf *,  
                                 const struct md_args *);  
 static  int             html_blocktagname(struct md_mbuf *,  
                                 const struct md_args *, int,  
                                 struct htmlq *, const int *,  
                                 const char **, size_t *);  
 static  int             html_blocktagargs(struct md_mbuf *,  
                                 const struct md_args *, int,  
                                 const int *, const char **, size_t *);  
 static  int             html_headtagname(struct md_mbuf *,  
                                 const struct md_args *, int,  
                                 struct htmlq *, const int *,  
                                 const char **, size_t *);  
 static  int             html_headtagargs(struct md_mbuf *,  
                                 const struct md_args *, int,  
                                 const int *, const char **, size_t *);  
 static  int             html_bodytagname(struct md_mbuf *,  
                                 const struct md_args *,  
                                 int, struct htmlq *, const int *,  
                                 const char **, size_t *);  
 static  int             html_bodytagargs(struct md_mbuf *,  
                                 const struct md_args *, int,  
                                 const int *, const char **, size_t *);  
 static  int             html_inlinetagname(struct md_mbuf *,  
                                 const struct md_args *, int, size_t *);  
 static  int             html_inlinetagargs(struct md_mbuf *,  
                                 const struct md_args *, int,  
                                 const int *, const char **, size_t *);  
 static  int             html_Bl_bodytagname(struct md_mbuf *,  
                                 struct htmlq *, const int *,  
                                 const char **, size_t *);  
 static  int             html_It_blocktagname(struct md_mbuf *,  
                                 struct htmlq *, const int *,  
                                 const char **, size_t *);  
 static  int             html_It_headtagname(struct md_mbuf *,  
                                 struct htmlq *, const int *,  
                                 const char **, size_t *);  
 static  int             html_It_bodytagname(struct md_mbuf *,  
                                 struct htmlq *, const int *,  
                                 const char **, size_t *);  
   
   
 /* ARGSUSED */  static void *
 static int  ml_alloc(char *outopts, enum htmltype type)
 html_It_headtagname(struct md_mbuf *mbuf, struct htmlq *q,  
                 const int *argc, const char **argv, size_t *res)  
 {  {
         struct htmlnode *n;          struct html     *h;
         int              i;          const char      *toks[4];
           char            *v;
   
         for (n = q->last; n; n = n->parent)          toks[0] = "style";
                 if (n->tok == ROFF_Bl)          toks[1] = "man";
                         break;          toks[2] = "includes";
           toks[3] = NULL;
   
         assert(n);          h = mandoc_calloc(1, sizeof(struct html));
         for (i = 0; ROFF_ARGMAX != n->argc[i] &&  
                         i < ROFF_MAXLINEARG; i++) {          h->type = type;
                 switch (n->argc[i]) {          h->tags.head = NULL;
                 case (ROFF_Tag):          h->symtab = mchars_alloc();
                         /* FALLTHROUGH */  
                 case (ROFF_Column):          while (outopts && *outopts)
                         return(ml_nputs(mbuf, "td", 2, res));                  switch (getsubopt(&outopts, UNCONST(toks), &v)) {
                   case (0):
                           h->style = v;
                           break;
                   case (1):
                           h->base_man = v;
                           break;
                   case (2):
                           h->base_includes = v;
                           break;
                 default:                  default:
                         break;                          break;
                 }                  }
         }  
   
         assert(i != ROFF_MAXLINEARG);          return(h);
         abort();  }
         /* NOTREACHED */  
   
         return(1);  void *
   html_alloc(char *outopts)
   {
   
           return(ml_alloc(outopts, HTML_HTML_4_01_STRICT));
 }  }
   
   
 /* ARGSUSED */  void *
 static int  xhtml_alloc(char *outopts)
 html_It_bodytagname(struct md_mbuf *mbuf, struct htmlq *q,  
                 const int *argc, const char **argv, size_t *res)  
 {  {
         struct htmlnode *n;  
         int              i;  
   
         for (n = q->last; n; n = n->parent)          return(ml_alloc(outopts, HTML_XHTML_1_0_STRICT));
                 if (n->tok == ROFF_Bl)  }
                         break;  
   
         assert(n);  
         for (i = 0; ROFF_ARGMAX != n->argc[i] &&  
                         i < ROFF_MAXLINEARG; i++) {  
                 switch (n->argc[i]) {  
                 case (ROFF_Enum):  
                         /* FALLTHROUGH */  
                 case (ROFF_Bullet):  
                         /* FALLTHROUGH */  
                 case (ROFF_Dash):  
                         /* FALLTHROUGH */  
                 case (ROFF_Hyphen):  
                         /* FALLTHROUGH */  
                 case (ROFF_Item):  
                         /* FALLTHROUGH */  
                 case (ROFF_Diag):  
                         /* FALLTHROUGH */  
                 case (ROFF_Hang):  
                         /* FALLTHROUGH */  
                 case (ROFF_Ohang):  
                         /* FALLTHROUGH */  
                 case (ROFF_Inset):  
                         return(ml_nputs(mbuf, "div", 3, res));  
                 case (ROFF_Tag):  
                         /* FALLTHROUGH */  
                 case (ROFF_Column):  
                         return(ml_nputs(mbuf, "td", 2, res));  
                 default:  
                         break;  
                 }  
         }  
   
         assert(i != ROFF_MAXLINEARG);  void
         abort();  html_free(void *p)
         /* NOTREACHED */  {
           struct tag      *tag;
           struct html     *h;
   
         return(1);          h = (struct html *)p;
   
           while ((tag = h->tags.head) != NULL) {
                   h->tags.head = tag->next;
                   free(tag);
           }
   
           if (h->symtab)
                   mchars_free(h->symtab);
   
           free(h);
 }  }
   
   
   void
   print_gen_head(struct html *h)
   {
           struct htmlpair  tag[4];
   
           tag[0].key = ATTR_HTTPEQUIV;
           tag[0].val = "Content-Type";
           tag[1].key = ATTR_CONTENT;
           tag[1].val = "text/html; charset=utf-8";
           print_otag(h, TAG_META, 2, tag);
   
           tag[0].key = ATTR_NAME;
           tag[0].val = "resource-type";
           tag[1].key = ATTR_CONTENT;
           tag[1].val = "document";
           print_otag(h, TAG_META, 2, tag);
   
           if (h->style) {
                   tag[0].key = ATTR_REL;
                   tag[0].val = "stylesheet";
                   tag[1].key = ATTR_HREF;
                   tag[1].val = h->style;
                   tag[2].key = ATTR_TYPE;
                   tag[2].val = "text/css";
                   tag[3].key = ATTR_MEDIA;
                   tag[3].val = "all";
                   print_otag(h, TAG_LINK, 4, tag);
           }
   }
   
 /* ARGSUSED */  /* ARGSUSED */
 static int  static void
 html_Bl_bodytagname(struct md_mbuf *mbuf, struct htmlq *q,  print_num(struct html *h, const char *p, size_t len)
                 const int *argc, const char **argv, size_t *res)  
 {  {
         int              i;          char             c;
   
         for (i = 0; ROFF_ARGMAX != argc[i]          if ('\0' != (c = mchars_num2char(p, len)))
                         && i < ROFF_MAXLINEARG; i++) {                  putchar((int)c);
                 switch (argc[i]) {  }
                 case (ROFF_Enum):  
                         return(ml_nputs(mbuf, "ol", 2, res));  static void
                 case (ROFF_Bullet):  print_spec(struct html *h, const char *p, size_t len)
                         /* FALLTHROUGH */  {
                 case (ROFF_Dash):          int              cp;
                         /* FALLTHROUGH */          const char      *rhs;
                 case (ROFF_Hyphen):          size_t           sz;
                         /* FALLTHROUGH */  
                 case (ROFF_Item):          if ((cp = mchars_spec2cp(h->symtab, p, len)) > 0) {
                         /* FALLTHROUGH */                  printf("&#%d;", cp);
                 case (ROFF_Diag):                  return;
                         /* FALLTHROUGH */          } else if (-1 == cp && 1 == len) {
                 case (ROFF_Hang):                  fwrite(p, 1, len, stdout);
                         /* FALLTHROUGH */                  return;
                 case (ROFF_Ohang):          } else if (-1 == cp)
                         /* FALLTHROUGH */                  return;
                 case (ROFF_Inset):  
                         return(ml_nputs(mbuf, "ul", 2, res));          if (NULL != (rhs = mchars_spec2str(h->symtab, p, len, &sz)))
                 case (ROFF_Tag):                  fwrite(rhs, 1, sz, stdout);
                         /* FALLTHROUGH */  }
                 case (ROFF_Column):  
                         return(ml_nputs(mbuf, "table", 5, res));  
   static void
   print_res(struct html *h, const char *p, size_t len)
   {
           int              cp;
           const char      *rhs;
           size_t           sz;
   
           if ((cp = mchars_res2cp(h->symtab, p, len)) > 0) {
                   printf("&#%d;", cp);
                   return;
           } else if (-1 == cp)
                   return;
   
           if (NULL != (rhs = mchars_res2str(h->symtab, p, len, &sz)))
                   fwrite(rhs, 1, sz, stdout);
   }
   
   
   static void
   print_metaf(struct html *h, enum mandoc_esc deco)
   {
           enum htmlfont    font;
   
           switch (deco) {
           case (ESCAPE_FONTPREV):
                   font = h->metal;
                   break;
           case (ESCAPE_FONTITALIC):
                   font = HTMLFONT_ITALIC;
                   break;
           case (ESCAPE_FONTBOLD):
                   font = HTMLFONT_BOLD;
                   break;
           case (ESCAPE_FONTROMAN):
                   font = HTMLFONT_NONE;
                   break;
           default:
                   abort();
                   /* NOTREACHED */
           }
   
           if (h->metaf) {
                   print_tagq(h, h->metaf);
                   h->metaf = NULL;
           }
   
           h->metal = h->metac;
           h->metac = font;
   
           if (HTMLFONT_NONE != font)
                   h->metaf = HTMLFONT_BOLD == font ?
                           print_otag(h, TAG_B, 0, NULL) :
                           print_otag(h, TAG_I, 0, NULL);
   }
   
   int
   html_strlen(const char *cp)
   {
           int              ssz, sz;
           const char      *seq, *p;
   
           /*
            * Account for escaped sequences within string length
            * calculations.  This follows the logic in term_strlen() as we
            * must calculate the width of produced strings.
            * Assume that characters are always width of "1".  This is
            * hacky, but it gets the job done for approximation of widths.
            */
   
           sz = 0;
           while (NULL != (p = strchr(cp, '\\'))) {
                   sz += (int)(p - cp);
                   ++cp;
                   switch (mandoc_escape(&cp, &seq, &ssz)) {
                   case (ESCAPE_ERROR):
                           return(sz);
                   case (ESCAPE_PREDEF):
                           sz++;
                           break;
                   case (ESCAPE_SPECIAL):
                           sz++;
                           break;
                 default:                  default:
                         break;                          break;
                 }                  }
         }          }
   
         assert(i != ROFF_MAXLINEARG);          assert(sz >= 0);
         abort();          return(sz + strlen(cp));
         /* NOTREACHED */  
 }  }
   
   
 /* ARGSUSED */  
 static int  static int
 html_It_blocktagname(struct md_mbuf *mbuf, struct htmlq *q,  print_encode(struct html *h, const char *p, int norecurse)
                 const int *argc, const char **argv, size_t *res)  
 {  {
         struct htmlnode *n;          size_t           sz;
         int              i;          int              len, nospace;
           const char      *seq;
           enum mandoc_esc  esc;
           static const char rejs[6] = { '\\', '<', '>', '&', ASCII_HYPH, '\0' };
   
         for (n = q->last; n; n = n->parent)          nospace = 0;
                 if (n->tok == ROFF_Bl)  
           while ('\0' != *p) {
                   sz = strcspn(p, rejs);
   
                   fwrite(p, 1, sz, stdout);
                   p += (int)sz;
   
                   if ('\0' == *p)
                         break;                          break;
   
         assert(n);                  switch (*p++) {
         for (i = 0; ROFF_ARGMAX != n->argc[i] &&                  case ('<'):
                         i < ROFF_MAXLINEARG; i++) {                          printf("&lt;");
                 switch (n->argc[i]) {                          continue;
                 case (ROFF_Enum):                  case ('>'):
                           printf("&gt;");
                           continue;
                   case ('&'):
                           printf("&amp;");
                           continue;
                   case (ASCII_HYPH):
                           putchar('-');
                           continue;
                   default:
                           break;
                   }
   
                   esc = mandoc_escape(&p, &seq, &len);
                   if (ESCAPE_ERROR == esc)
                           break;
   
                   switch (esc) {
                   case (ESCAPE_NUMBERED):
                           print_num(h, seq, len);
                           break;
                   case (ESCAPE_PREDEF):
                           print_res(h, seq, len);
                           break;
                   case (ESCAPE_SPECIAL):
                           print_spec(h, seq, len);
                           break;
                   case (ESCAPE_FONTPREV):
                         /* FALLTHROUGH */                          /* FALLTHROUGH */
                 case (ROFF_Bullet):                  case (ESCAPE_FONTBOLD):
                         /* FALLTHROUGH */                          /* FALLTHROUGH */
                 case (ROFF_Dash):                  case (ESCAPE_FONTITALIC):
                         /* FALLTHROUGH */                          /* FALLTHROUGH */
                 case (ROFF_Hyphen):                  case (ESCAPE_FONTROMAN):
                         /* FALLTHROUGH */                          if (norecurse)
                 case (ROFF_Item):                                  break;
                         /* FALLTHROUGH */                          print_metaf(h, esc);
                 case (ROFF_Diag):                          break;
                         /* FALLTHROUGH */                  case (ESCAPE_NOSPACE):
                 case (ROFF_Hang):                          if ('\0' == *p)
                         /* FALLTHROUGH */                                  nospace = 1;
                 case (ROFF_Ohang):                          break;
                         /* FALLTHROUGH */  
                 case (ROFF_Inset):  
                         return(ml_nputs(mbuf, "li", 2, res));  
                 case (ROFF_Tag):  
                         /* FALLTHROUGH */  
                 case (ROFF_Column):  
                         return(ml_nputs(mbuf, "tr", 2, res));  
                 default:                  default:
                         break;                          break;
                 }                  }
         }          }
   
         assert(i != ROFF_MAXLINEARG);          return(nospace);
         abort();  
         /* NOTREACHED */  
 }  }
   
   
 static int  static void
 html_loadcss(struct md_mbuf *mbuf, const char *css)  print_attr(struct html *h, const char *key, const char *val)
 {  {
         size_t           res, bufsz;          printf(" %s=\"", key);
         char            *buf;          (void)print_encode(h, val, 1);
         struct stat      st;          putchar('\"');
         int              fd, c;  }
         ssize_t          ssz;  
   
         c = 0;  
         res = 0;  
         buf = NULL;  
   
         if (-1 == (fd = open(css, O_RDONLY, 0))) {  struct tag *
                 warn("%s", css);  print_otag(struct html *h, enum htmltag tag,
                 return(0);                  int sz, const struct htmlpair *p)
         }  {
           int              i;
         if (-1 == fstat(fd, &st)) {          struct tag      *t;
                 warn("%s", css);  
                 goto out;  
         }  
   
         bufsz = MAX(st.st_blksize, BUFSIZ);          /* Push this tags onto the stack of open scopes. */
         if (NULL == (buf = malloc(bufsz))) {  
                 warn("malloc");  
                 goto out;  
         }  
   
         for (;;) {          if ( ! (HTML_NOSTACK & htmltags[tag].flags)) {
                 if (-1 == (ssz = read(fd, buf, bufsz))) {                  t = mandoc_malloc(sizeof(struct tag));
                         warn("%s", css);                  t->tag = tag;
                         goto out;                  t->next = h->tags.head;
                 } else if (0 == ssz)                  h->tags.head = t;
                         break;          } else
                 if ( ! ml_nputs(mbuf, buf, (size_t)ssz, &res))                  t = NULL;
                         goto out;  
         }  
   
         c = 1;          if ( ! (HTML_NOSPACE & h->flags))
                   if ( ! (HTML_CLRLINE & htmltags[tag].flags)) {
                           /* Manage keeps! */
                           if ( ! (HTML_KEEP & h->flags)) {
                                   if (HTML_PREKEEP & h->flags)
                                           h->flags |= HTML_KEEP;
                                   putchar(' ');
                           } else
                                   printf("&#160;");
                   }
   
 out:          if ( ! (h->flags & HTML_NONOSPACE))
         if (-1 == close(fd)) {                  h->flags &= ~HTML_NOSPACE;
                 warn("%s", css);          else
                 c = 0;                  h->flags |= HTML_NOSPACE;
         }  
   
         if (buf)          /* Print out the tag name and attributes. */
                 free(buf);  
   
         return(c);          printf("<%s", htmltags[tag].name);
 }          for (i = 0; i < sz; i++)
                   print_attr(h, htmlattrs[p[i].key], p[i].val);
   
           /* Add non-overridable attributes. */
   
 /* ARGSUSED */          if (TAG_HTML == tag && HTML_XHTML_1_0_STRICT == h->type) {
 static int                  print_attr(h, "xmlns", "http://www.w3.org/1999/xhtml");
 html_begin(struct md_mbuf *mbuf, const struct md_args *args,                  print_attr(h, "xml:lang", "en");
                 const struct tm *tm, const char *os,                  print_attr(h, "lang", "en");
                 const char *title, const char *section,          }
                 const char *vol)  
 {  
         const char      *preamble, *css, *trail;  
         char             buf[512];  
         size_t           res;  
   
         preamble =          /* Accommodate for XML "well-formed" singleton escaping. */
         "<!DOCTYPE HTML PUBLIC \"-//W3C//DTD HTML 4.01//EN\"\n"  
         "    \"http://www.w3.org/TR/html4/strict.dtd\">\n"  
         "<html>\n"  
         "<head>\n"  
         "    <meta http-equiv=\"Content-Type\"\n"  
         "         content=\"text/html;charset=utf-8\">\n"  
         "    <meta name=\"resource-type\" content=\"document\">\n"  
         "    <title>Manual Page for %s(%s)</title>\n";  
   
         css =          if (HTML_AUTOCLOSE & htmltags[tag].flags)
         "    <link rel=\"stylesheet\" type=\"text/css\"\n"                  switch (h->type) {
         "         href=\"%s\">\n";                  case (HTML_XHTML_1_0_STRICT):
         trail =                          putchar('/');
         "</head>\n"                          break;
         "<body>\n"                  default:
         "<div class=\"mdoc\">";                          break;
                   }
   
         res = 0;          putchar('>');
   
         (void)snprintf(buf, sizeof(buf) - 1,          h->flags |= HTML_NOSPACE;
                         preamble, title, section);  
   
         if ( ! ml_puts(mbuf, buf, &res))          if ((HTML_AUTOCLOSE | HTML_CLRLINE) & htmltags[tag].flags)
                 return(0);                  putchar('\n');
   
         assert(args->params.html.css);          return(t);
         if (HTML_CSS_EMBED & args->params.html.flags) {  }
                 if ( ! ml_puts(mbuf, "    <style type=\"text/css\"><!--\n", &res))  
                         return(0);  
                 if ( ! html_loadcss(mbuf, args->params.html.css))  
                         return(0);  
                 if ( ! ml_puts(mbuf, "    --!></style>\n", &res))  
                         return(0);  
         } else {  
                 (void)snprintf(buf, sizeof(buf) - 1, css,  
                                 args->params.html.css);  
                 if ( ! ml_puts(mbuf, buf, &res))  
                         return(0);  
         }  
   
         if ( ! ml_puts(mbuf, trail, &res))  
                 return(0);  
   
         return(1);  static void
   print_ctag(struct html *h, enum htmltag tag)
   {
   
           printf("</%s>", htmltags[tag].name);
           if (HTML_CLRLINE & htmltags[tag].flags) {
                   h->flags |= HTML_NOSPACE;
                   putchar('\n');
           }
 }  }
   
   
 /* ARGSUSED */  void
 static int  print_gen_decls(struct html *h)
 html_end(struct md_mbuf *mbuf, const struct md_args *args)  
 {  {
   
         return(ml_puts(mbuf, "</div></body>\n</html>", NULL));          print_xmltype(h);
           print_doctype(h);
 }  }
   
   
 /* ARGSUSED */  static void
 static int  print_xmltype(struct html *h)
 html_bodytagname(struct md_mbuf *mbuf,  
                 const struct md_args *args, int tok, struct htmlq *q,  
                 const int *argc, const char **argv, size_t *res)  
 {  {
   
         switch (tok) {          if (HTML_XHTML_1_0_STRICT == h->type)
         case (ROFF_Bl):                  puts("<?xml version=\"1.0\" encoding=\"UTF-8\"?>");
                 return(html_Bl_bodytagname(mbuf, q, argc, argv, res));  
         case (ROFF_Fo):  
                 return(ml_nputs(mbuf, "span", 4, res));  
         case (ROFF_It):  
                 return(html_It_bodytagname(mbuf, q, argc, argv, res));  
         case (ROFF_Oo):  
                 return(ml_nputs(mbuf, "span", 4, res));  
         default:  
                 break;  
         }  
   
         return(ml_puts(mbuf, "div", res));  
 }  }
   
   
 /* ARGSUSED */  static void
 static int  print_doctype(struct html *h)
 html_headtagname(struct md_mbuf *mbuf,  
                 const struct md_args *args, int tok, struct htmlq *q,  
                 const int *argc, const char **argv, size_t *res)  
 {  {
           const char      *doctype;
           const char      *dtd;
           const char      *name;
   
         switch (tok) {          switch (h->type) {
         case (ROFF_It):          case (HTML_HTML_4_01_STRICT):
                 return(html_It_headtagname(mbuf, q, argc, argv, res));                  name = "HTML";
         case (ROFF_Fo):                  doctype = "-//W3C//DTD HTML 4.01//EN";
                 return(ml_nputs(mbuf, "span", 4, res));                  dtd = "http://www.w3.org/TR/html4/strict.dtd";
         case (ROFF_Oo):                  break;
                 return(ml_nputs(mbuf, "span", 4, res));  
         case (ROFF_Sh):  
                 return(ml_nputs(mbuf, "h1", 2, res));  
         case (ROFF_Ss):  
                 return(ml_nputs(mbuf, "h2", 2, res));  
         default:          default:
                   name = "html";
                   doctype = "-//W3C//DTD XHTML 1.0 Strict//EN";
                   dtd = "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd";
                 break;                  break;
         }          }
   
         return(ml_nputs(mbuf, "div", 3, res));          printf("<!DOCTYPE %s PUBLIC \"%s\" \"%s\">\n",
                           name, doctype, dtd);
 }  }
   
   void
 /* ARGSUSED */  print_text(struct html *h, const char *word)
 static int  
 html_blocktagname(struct md_mbuf *mbuf, const struct md_args *args,  
                 int tok, struct htmlq *q, const int *argc,  
                 const char **argv, size_t *res)  
 {  {
   
         switch (tok) {          if ( ! (HTML_NOSPACE & h->flags)) {
         case (ROFF_Fo):                  /* Manage keeps! */
                 return(ml_nputs(mbuf, "span", 4, res));                  if ( ! (HTML_KEEP & h->flags)) {
         case (ROFF_Oo):                          if (HTML_PREKEEP & h->flags)
                 return(ml_nputs(mbuf, "span", 4, res));                                  h->flags |= HTML_KEEP;
         case (ROFF_It):                          putchar(' ');
                 return(html_It_blocktagname(mbuf, q, argc, argv, res));                  } else
         default:                          printf("&#160;");
                 break;  
         }          }
   
         return(ml_puts(mbuf, "div", res));          assert(NULL == h->metaf);
           if (HTMLFONT_NONE != h->metac)
                   h->metaf = HTMLFONT_BOLD == h->metac ?
                           print_otag(h, TAG_B, 0, NULL) :
                           print_otag(h, TAG_I, 0, NULL);
   
           assert(word);
           if ( ! print_encode(h, word, 0))
                   if ( ! (h->flags & HTML_NONOSPACE))
                           h->flags &= ~HTML_NOSPACE;
   
           if (h->metaf) {
                   print_tagq(h, h->metaf);
                   h->metaf = NULL;
           }
   
           h->flags &= ~HTML_IGNDELIM;
 }  }
   
   
 /* ARGSUSED */  void
 static int  print_tagq(struct html *h, const struct tag *until)
 html_printargs(struct md_mbuf *mbuf, int tok, const char *ns,  
                 const int *argc, const char **argv, size_t *res)  
 {  {
           struct tag      *tag;
   
         if ( ! ml_puts(mbuf, " class=\"", res))          while ((tag = h->tags.head) != NULL) {
                 return(0);                  /*
         if ( ! ml_puts(mbuf, ns, res))                   * Remember to close out and nullify the current
                 return(0);                   * meta-font and table, if applicable.
         if ( ! ml_puts(mbuf, "-", res))                   */
                 return(0);                  if (tag == h->metaf)
         if ( ! ml_puts(mbuf, toknames[tok], res))                          h->metaf = NULL;
                 return(0);                  if (tag == h->tblt)
         return(ml_puts(mbuf, "\"", res));                          h->tblt = NULL;
                   print_ctag(h, tag->tag);
                   h->tags.head = tag->next;
                   free(tag);
                   if (until && tag == until)
                           return;
           }
 }  }
   
   
 /* ARGSUSED */  void
 static int  print_stagq(struct html *h, const struct tag *suntil)
 html_headtagargs(struct md_mbuf *mbuf,  
                 const struct md_args *args, int tok,  
                 const int *argc, const char **argv, size_t *res)  
 {  {
           struct tag      *tag;
   
         return(html_printargs(mbuf, tok, "head", argc, argv, res));          while ((tag = h->tags.head) != NULL) {
                   if (suntil && tag == suntil)
                           return;
                   /*
                    * Remember to close out and nullify the current
                    * meta-font and table, if applicable.
                    */
                   if (tag == h->metaf)
                           h->metaf = NULL;
                   if (tag == h->tblt)
                           h->tblt = NULL;
                   print_ctag(h, tag->tag);
                   h->tags.head = tag->next;
                   free(tag);
           }
 }  }
   
   
 /* ARGSUSED */  void
 static int  bufinit(struct html *h)
 html_bodytagargs(struct md_mbuf *mbuf,  
                 const struct md_args *args, int tok,  
                 const int *argc, const char **argv, size_t *res)  
 {  {
   
         return(html_printargs(mbuf, tok, "body", argc, argv, res));          h->buf[0] = '\0';
           h->buflen = 0;
 }  }
   
   
 /* ARGSUSED */  void
 static int  bufcat_style(struct html *h, const char *key, const char *val)
 html_blocktagargs(struct md_mbuf *mbuf,  
                 const struct md_args *args, int tok,  
                 const int *argc, const char **argv, size_t *res)  
 {  {
   
         return(html_printargs(mbuf, tok, "block", argc, argv, res));          bufcat(h, key);
           bufncat(h, ":", 1);
           bufcat(h, val);
           bufncat(h, ";", 1);
 }  }
   
   
 /* ARGSUSED */  void
 static int  bufcat(struct html *h, const char *p)
 html_inlinetagargs(struct md_mbuf *mbuf,  
                 const struct md_args *args, int tok,  
                 const int *argc, const char **argv, size_t *res)  
 {  {
   
         if ( ! html_printargs(mbuf, tok, "inline", argc, argv, res))          bufncat(h, p, strlen(p));
                 return(0);  
   
         switch (tok) {  
         case (ROFF_Sx):  
                 assert(*argv);  
                 if ( ! ml_nputs(mbuf, " href=\"#", 8, res))  
                         return(0);  
                 if ( ! ml_putstring(mbuf, *argv, res))  
                         return(0);  
                 if ( ! ml_nputs(mbuf, "\"", 1, res))  
                         return(0);  
         default:  
                 break;  
         }  
   
         return(1);  
 }  }
   
   
 /* ARGSUSED */  void
 static int  buffmt(struct html *h, const char *fmt, ...)
 html_inlinetagname(struct md_mbuf *mbuf,  
                 const struct md_args *args, int tok, size_t *res)  
 {  {
           va_list          ap;
   
         switch (tok) {          va_start(ap, fmt);
         case (ROFF_Pp):          (void)vsnprintf(h->buf + (int)h->buflen,
                 return(ml_nputs(mbuf, "div", 3, res));                          BUFSIZ - h->buflen - 1, fmt, ap);
         case (ROFF_Sx):          va_end(ap);
                 return(ml_nputs(mbuf, "a", 1, res));          h->buflen = strlen(h->buf);
         default:  
                 break;  
         }  
   
         return(ml_puts(mbuf, "span", res));  
 }  }
   
   
 static ssize_t  void
 html_begintag(struct md_mbuf *mbuf, void *data,  bufncat(struct html *h, const char *p, size_t sz)
                 const struct md_args *args, enum md_ns ns,  
                 int tok, const int *argc, const char **argv)  
 {  {
         size_t           res;  
         struct htmlq    *q;  
         struct htmlnode *node;  
         int              i;  
   
         assert(ns != MD_NS_DEFAULT);          if (h->buflen + sz > BUFSIZ - 1)
         res = 0;                  sz = BUFSIZ - 1 - h->buflen;
   
         assert(data);          (void)strncat(h->buf, p, sz);
         q = (struct htmlq *)data;          h->buflen += sz;
   }
   
         if (NULL == (node = calloc(1, sizeof(struct htmlnode)))) {  
                 warn("calloc");  
                 return(-1);  
         }  
   
         node->parent = q->last;  void
         node->tok = tok;  buffmt_includes(struct html *h, const char *name)
         node->ns = ns;  {
           const char      *p, *pp;
   
         if (argc)  {          pp = h->base_includes;
                 /* TODO: argv. */  
           while (NULL != (p = strchr(pp, '%'))) {
                   bufncat(h, pp, (size_t)(p - pp));
                   switch (*(p + 1)) {
                   case('I'):
                           bufcat(h, name);
                           break;
                   default:
                           bufncat(h, p, 2);
                           break;
                   }
                   pp = p + 2;
           }
           if (pp)
                   bufcat(h, pp);
   }
   
                 assert(argv);  
                 for (i = 0; ROFF_ARGMAX != argc[i]  
                                 && i < ROFF_MAXLINEARG; i++)  
                         node->argc[i] = argc[i];  
                 assert(i != ROFF_MAXLINEARG);  
         }  
   
   void
   buffmt_man(struct html *h,
                   const char *name, const char *sec)
   {
           const char      *p, *pp;
   
         q->last = node;          pp = h->base_man;
   
         switch (ns) {          /* LINTED */
         case (MD_NS_BLOCK):          while (NULL != (p = strchr(pp, '%'))) {
                 if ( ! html_blocktagname(mbuf, args, tok,                  bufncat(h, pp, (size_t)(p - pp));
                                         q, argc, argv, &res))                  switch (*(p + 1)) {
                         return(-1);                  case('S'):
                 if ( ! html_blocktagargs(mbuf, args, tok,                          bufcat(h, sec ? sec : "1");
                                         argc, argv, &res))                          break;
                         return(-1);                  case('N'):
                 break;                          buffmt(h, name);
         case (MD_NS_BODY):                          break;
                 if ( ! html_bodytagname(mbuf, args, tok,                  default:
                                         q, argc, argv, &res))                          bufncat(h, p, 2);
                         return(-1);                          break;
                 if ( ! html_bodytagargs(mbuf, args, tok,                  }
                                         argc, argv, &res))                  pp = p + 2;
                         return(-1);  
                 break;  
         case (MD_NS_HEAD):  
                 if ( ! html_headtagname(mbuf, args, tok, q,  
                                         argc, argv, &res))  
                         return(-1);  
                 if ( ! html_headtagargs(mbuf, args, tok,  
                                         argc, argv, &res))  
                         return(-1);  
                 break;  
         default:  
                 if ( ! html_inlinetagname(mbuf, args, tok, &res))  
                         return(-1);  
                 if ( ! html_inlinetagargs(mbuf, args, tok,  
                                         argc, argv, &res))  
                         return(-1);  
                 break;  
         }          }
           if (pp)
         return((ssize_t)res);                  bufcat(h, pp);
 }  }
   
   
 static ssize_t  void
 html_endtag(struct md_mbuf *mbuf, void *data,  bufcat_su(struct html *h, const char *p, const struct roffsu *su)
                 const struct md_args *args, enum md_ns ns, int tok)  
 {  {
         size_t           res;          double           v;
         struct htmlq    *q;          const char      *u;
         struct htmlnode *node;  
   
         assert(ns != MD_NS_DEFAULT);          v = su->scale;
         res = 0;  
   
         assert(data);          switch (su->unit) {
         q = (struct htmlq *)data;          case (SCALE_CM):
         node = q->last;                  u = "cm";
   
         switch (ns) {  
         case (MD_NS_BLOCK):  
                 if ( ! html_blocktagname(mbuf, args, tok,  
                                         q, node->argc,  
                                         (const char **)node->argv, &res))  
                         return(-1);  
                 break;                  break;
         case (MD_NS_BODY):          case (SCALE_IN):
                 if ( ! html_bodytagname(mbuf, args, tok,                  u = "in";
                                         q, node->argc,  
                                         (const char **)node->argv, &res))  
                         return(-1);  
                 break;                  break;
         case (MD_NS_HEAD):          case (SCALE_PC):
                 if ( ! html_headtagname(mbuf, args, tok,                  u = "pc";
                                         q, node->argc,  
                                         (const char **)node->argv, &res))  
                         return(-1);  
                 break;                  break;
           case (SCALE_PT):
                   u = "pt";
                   break;
           case (SCALE_EM):
                   u = "em";
                   break;
           case (SCALE_MM):
                   if (0 == (v /= 100))
                           v = 1;
                   u = "em";
                   break;
           case (SCALE_EN):
                   u = "ex";
                   break;
           case (SCALE_BU):
                   u = "ex";
                   break;
           case (SCALE_VS):
                   u = "em";
                   break;
         default:          default:
                 if ( ! html_inlinetagname(mbuf, args, tok, &res))                  u = "ex";
                         return(-1);  
                 break;                  break;
         }          }
   
         q->last = node->parent;          /*
            * XXX: the CSS spec isn't clear as to which types accept
         free(node);           * integer or real numbers, so we just make them all decimals.
            */
         return((ssize_t)res);          buffmt(h, "%s: %.2f%s;", p, v, u);
 }  }
   
   
 static int  void
 html_alloc(void **p)  html_idcat(char *dst, const char *src, int sz)
 {  {
           int              ssz;
   
         if (NULL == (*p = calloc(1, sizeof(struct htmlq)))) {          assert(sz > 2);
                 warn("calloc");  
                 return(0);  
         }  
         return(1);  
 }  
   
           /* Cf. <http://www.w3.org/TR/html4/types.html#h-6.2>. */
   
 static void          /* We can't start with a number (bah). */
 html_free(void *p)  
 {  
         struct htmlq    *q;  
         struct htmlnode *n;  
   
         assert(p);          if ('#' == *dst) {
         q = (struct htmlq *)p;                  dst++;
                   sz--;
         while ((n = q->last)) {  
                 q->last = n->parent;  
                 free(n);  
         }          }
           if ('\0' == *dst) {
                   *dst++ = 'x';
                   *dst = '\0';
                   sz--;
           }
   
         free(q);          for ( ; *dst != '\0' && sz; dst++, sz--)
 }                  /* Jump to end. */ ;
   
           for ( ; *src != '\0' && sz > 1; src++) {
 int                  ssz = snprintf(dst, (size_t)sz, "%.2x", *src);
 md_line_html(void *data, char *buf)                  sz -= ssz;
 {                  dst += ssz;
           }
         return(mlg_line((struct md_mlg *)data, buf));  
 }  }
   
   
 int  
 md_exit_html(void *data, int flush)  
 {  
   
         return(mlg_exit((struct md_mlg *)data, flush));  
 }  
   
   
 void *  
 md_init_html(const struct md_args *args,  
                 struct md_mbuf *mbuf, const struct md_rbuf *rbuf)  
 {  
         struct ml_cbs    cbs;  
   
         cbs.ml_alloc = html_alloc;  
         cbs.ml_free = html_free;  
         cbs.ml_begintag = html_begintag;  
         cbs.ml_endtag = html_endtag;  
         cbs.ml_begin = html_begin;  
         cbs.ml_end = html_end;  
   
         return(mlg_alloc(args, rbuf, mbuf, &cbs));  
 }  
   

Legend:
Removed from v.1.12  
changed lines
  Added in v.1.138

CVSweb