[BACK]Return to html.c CVS log [TXT][DIR] Up to [cvsweb.bsd.lv] / mandoc

Diff for /mandoc/html.c between version 1.18 and 1.110

version 1.18, 2008/12/09 19:57:26 version 1.110, 2010/07/26 22:26:05
Line 1 
Line 1 
 /* $Id$ */  /*      $Id$ */
 /*  /*
  * Copyright (c) 2008 Kristaps Dzonsons <kristaps@kth.se>   * Copyright (c) 2008, 2009, 2010 Kristaps Dzonsons <kristaps@bsd.lv>
  *   *
  * Permission to use, copy, modify, and distribute this software for any   * Permission to use, copy, modify, and distribute this software for any
  * purpose with or without fee is hereby granted, provided that the   * purpose with or without fee is hereby granted, provided that the above
  * above copyright notice and this permission notice appear in all   * copyright notice and this permission notice appear in all copies.
  * copies.  
  *   *
  * THE SOFTWARE IS PROVIDED "AS IS" AND THE AUTHOR DISCLAIMS ALL   * THE SOFTWARE IS PROVIDED "AS IS" AND THE AUTHOR DISCLAIMS ALL WARRANTIES
  * WARRANTIES WITH REGARD TO THIS SOFTWARE INCLUDING ALL IMPLIED   * WITH REGARD TO THIS SOFTWARE INCLUDING ALL IMPLIED WARRANTIES OF
  * WARRANTIES OF MERCHANTABILITY AND FITNESS. IN NO EVENT SHALL THE   * MERCHANTABILITY AND FITNESS. IN NO EVENT SHALL THE AUTHOR BE LIABLE FOR
  * AUTHOR BE LIABLE FOR ANY SPECIAL, DIRECT, INDIRECT, OR CONSEQUENTIAL   * ANY SPECIAL, DIRECT, INDIRECT, OR CONSEQUENTIAL DAMAGES OR ANY DAMAGES
  * DAMAGES OR ANY DAMAGES WHATSOEVER RESULTING FROM LOSS OF USE, DATA OR   * WHATSOEVER RESULTING FROM LOSS OF USE, DATA OR PROFITS, WHETHER IN AN
  * PROFITS, WHETHER IN AN ACTION OF CONTRACT, NEGLIGENCE OR OTHER   * ACTION OF CONTRACT, NEGLIGENCE OR OTHER TORTIOUS ACTION, ARISING OUT OF
  * TORTIOUS ACTION, ARISING OUT OF OR IN CONNECTION WITH THE USE OR   * OR IN CONNECTION WITH THE USE OR PERFORMANCE OF THIS SOFTWARE.
  * PERFORMANCE OF THIS SOFTWARE.  
  */   */
 #include <sys/param.h>  #ifdef HAVE_CONFIG_H
 #include <sys/stat.h>  #include "config.h"
   #endif
   
   #include <sys/types.h>
   
 #include <assert.h>  #include <assert.h>
 #include <err.h>  #include <ctype.h>
 #include <fcntl.h>  #include <stdarg.h>
 #include <stdlib.h>  
 #include <stdio.h>  #include <stdio.h>
   #include <stdint.h>
   #include <stdlib.h>
 #include <string.h>  #include <string.h>
 #include <unistd.h>  #include <unistd.h>
   
 #include "private.h"  #include "mandoc.h"
 #include "ml.h"  #include "out.h"
   #include "chars.h"
   #include "html.h"
   #include "main.h"
   
 #define TAG_HTML        "<html>"  struct  htmldata {
 #define TAG_HTML_END    "</html>"          const char       *name;
 #define TAG_BODY        "<body>"          int               flags;
 #define TAG_BODY_END    "</body>"  #define HTML_CLRLINE     (1 << 0)
 #define TAG_DIV_MDOC    "<div class=\"mdoc\">"  #define HTML_NOSTACK     (1 << 1)
 #define TAG_DIV_END     "</div>"  #define HTML_AUTOCLOSE   (1 << 2) /* Tag has auto-closure. */
 #define TAG_STYLE_CSS   "<style type=\"text/css\"><!--"  };
 #define TAG_STYLE_END   "--></style>"  
 #define TAG_HEAD        "<head>"  
 #define TAG_HEAD_END    "</head>"  
 #define TAG_TITLE       "<title>"  
 #define TAG_TITLE_END   "</title>"  
 #define TAG_LINK_CSS    "<link rel=\"stylesheet\" " \  
                         "type=\"text/css\" href=\"%s\">"  
 #define TAG_DOCTYPE     "<!DOCTYPE HTML PUBLIC " \  
                         "\"-//W3C//DTD HTML 4.01//EN\" " \  
                         "\"http://www.w3.org/TR/html4/strict.dtd\">"  
 #define TAG_RESTYPE     "<meta name=\"resource-type\" " \  
                         "content=\"document\">"  
 #define TAG_CONTTYPE    "<meta http-equiv=\"Content-Type\" " \  
                         "content=\"text/html;charset=utf-8\">"  
   
 /* TODO: allow head/tail-less invocations (just "div" start). */  static  const struct htmldata htmltags[TAG_MAX] = {
           {"html",        HTML_CLRLINE}, /* TAG_HTML */
           {"head",        HTML_CLRLINE}, /* TAG_HEAD */
           {"body",        HTML_CLRLINE}, /* TAG_BODY */
           {"meta",        HTML_CLRLINE | HTML_NOSTACK | HTML_AUTOCLOSE}, /* TAG_META */
           {"title",       HTML_CLRLINE}, /* TAG_TITLE */
           {"div",         HTML_CLRLINE}, /* TAG_DIV */
           {"h1",          0}, /* TAG_H1 */
           {"h2",          0}, /* TAG_H2 */
           {"span",        0}, /* TAG_SPAN */
           {"link",        HTML_CLRLINE | HTML_NOSTACK | HTML_AUTOCLOSE}, /* TAG_LINK */
           {"br",          HTML_CLRLINE | HTML_NOSTACK | HTML_AUTOCLOSE}, /* TAG_BR */
           {"a",           0}, /* TAG_A */
           {"table",       HTML_CLRLINE}, /* TAG_TABLE */
           {"col",         HTML_CLRLINE | HTML_NOSTACK | HTML_AUTOCLOSE}, /* TAG_COL */
           {"tr",          HTML_CLRLINE}, /* TAG_TR */
           {"td",          HTML_CLRLINE}, /* TAG_TD */
           {"li",          HTML_CLRLINE}, /* TAG_LI */
           {"ul",          HTML_CLRLINE}, /* TAG_UL */
           {"ol",          HTML_CLRLINE}, /* TAG_OL */
   };
   
 struct  htmlnode {  static  const char      *const htmlfonts[HTMLFONT_MAX] = {
         int              tok;          "roman",
         enum md_ns       ns;          "bold",
         int              argc[ROFF_MAXLINEARG];          "italic"
         char            *argv[ROFF_MAXLINEARG];  
         struct htmlnode *parent;  
 };  };
   
   static  const char      *const htmlattrs[ATTR_MAX] = {
 struct  htmlq {          "http-equiv",
         struct htmlnode *last;          "content",
           "name",
           "rel",
           "href",
           "type",
           "media",
           "class",
           "style",
           "width",
           "valign",
           "target",
           "id",
           "summary",
 };  };
   
   static  void              print_spec(struct html *, enum roffdeco,
 static  int             html_loadcss(struct md_mbuf *, const char *);  
   
 static  int             html_alloc(void **);  
 static  void            html_free(void *);  
 static  ssize_t         html_endtag(struct md_mbuf *, void *,  
                                 const struct md_args *,  
                                 enum md_ns, int);  
 static  ssize_t         html_beginstring(struct md_mbuf *,  
                                 const struct md_args *,  
                                 const char *, size_t);                                  const char *, size_t);
 static  ssize_t         html_beginhttp(struct md_mbuf *,  static  void              print_res(struct html *, const char *, size_t);
                                 const struct md_args *,  static  void              print_ctag(struct html *, enum htmltag);
                                 const char *, size_t);  static  void              print_doctype(struct html *);
 static  ssize_t         html_endstring(struct md_mbuf *,  static  void              print_xmltype(struct html *);
                                 const struct md_args *,  static  int               print_encode(struct html *, const char *, int);
                                 const char *, size_t);  static  void              print_metaf(struct html *, enum roffdeco);
 static  ssize_t         html_endhttp(struct md_mbuf *,  static  void              print_attr(struct html *,
                                 const struct md_args *,                                  const char *, const char *);
                                 const char *, size_t);  static  void             *ml_alloc(char *, enum htmltype);
 static  ssize_t         html_begintag(struct md_mbuf *, void *,  
                                 const struct md_args *,  
                                 enum md_ns, int,  
                                 const int *, const char **);  
 static  int             html_begin(struct md_mbuf *,  
                                 const struct md_args *,  
                                 const struct tm *,  
                                 const char *, const char *,  
                                 enum roffmsec, const char *);  
 static  int             html_printargs(struct md_mbuf *, int,  
                                 const char *, const int *,  
                                 const char **, size_t *);  
 static  int             html_end(struct md_mbuf *,  
                                 const struct md_args *);  
 static  int             html_blocktagname(struct md_mbuf *,  
                                 const struct md_args *, int,  
                                 struct htmlq *, const int *,  
                                 const char **, size_t *);  
 static  int             html_blocktagargs(struct md_mbuf *,  
                                 const struct md_args *, int,  
                                 const int *, const char **, size_t *);  
 static  int             html_headtagname(struct md_mbuf *,  
                                 const struct md_args *, int,  
                                 struct htmlq *, const int *,  
                                 const char **, size_t *);  
 static  int             html_headtagargs(struct md_mbuf *,  
                                 const struct md_args *, int,  
                                 const int *, const char **, size_t *);  
 static  int             html_bodytagname(struct md_mbuf *,  
                                 const struct md_args *,  
                                 int, struct htmlq *, const int *,  
                                 const char **, size_t *);  
 static  int             html_bodytagargs(struct md_mbuf *,  
                                 const struct md_args *, int,  
                                 const int *, const char **, size_t *);  
 static  int             html_inlinetagname(struct md_mbuf *,  
                                 const struct md_args *, int, size_t *);  
 static  int             html_inlinetagargs(struct md_mbuf *,  
                                 const struct md_args *, int,  
                                 const int *, const char **, size_t *);  
 static  int             html_Bl_bodytagname(struct md_mbuf *,  
                                 struct htmlq *, const int *,  
                                 const char **, size_t *);  
 static  int             html_It_blocktagname(struct md_mbuf *,  
                                 struct htmlq *, const int *,  
                                 const char **, size_t *);  
 static  int             html_It_headtagname(struct md_mbuf *,  
                                 struct htmlq *, const int *,  
                                 const char **, size_t *);  
 static  int             html_It_bodytagname(struct md_mbuf *,  
                                 struct htmlq *, const int *,  
                                 const char **, size_t *);  
   
   
 /* ARGSUSED */  static void *
 static int  ml_alloc(char *outopts, enum htmltype type)
 html_It_headtagname(struct md_mbuf *mbuf, struct htmlq *q,  
                 const int *argc, const char **argv, size_t *res)  
 {  {
         struct htmlnode *n;          struct html     *h;
         int              i;          const char      *toks[4];
           char            *v;
   
         for (n = q->last; n; n = n->parent)          toks[0] = "style";
                 if (n->tok == ROFF_Bl)          toks[1] = "man";
                         break;          toks[2] = "includes";
           toks[3] = NULL;
   
         assert(n);          h = calloc(1, sizeof(struct html));
           if (NULL == h) {
         /* LINTED */                  perror(NULL);
         for (i = 0; ROFF_ARGMAX != n->argc[i] &&                  exit(EXIT_FAILURE);
                         i < ROFF_MAXLINEARG; i++) {  
                 switch (n->argc[i]) {  
                 case (ROFF_Ohang):  
                         return(ml_nputs(mbuf, "div", 3, res));  
                 case (ROFF_Tag):  
                         /* FALLTHROUGH */  
                 case (ROFF_Column):  
                         return(ml_nputs(mbuf, "td", 2, res));  
                 default:  
                         break;  
                 }  
         }          }
   
         return(0);          h->type = type;
 }          h->tags.head = NULL;
           h->ords.head = NULL;
           h->symtab = chars_init(CHARS_HTML);
   
           while (outopts && *outopts)
 /* ARGSUSED */                  switch (getsubopt(&outopts, UNCONST(toks), &v)) {
 static int                  case (0):
 html_It_bodytagname(struct md_mbuf *mbuf, struct htmlq *q,                          h->style = v;
                 const int *argc, const char **argv, size_t *res)  
 {  
         struct htmlnode *n;  
         int              i;  
   
         for (n = q->last; n; n = n->parent)  
                 if (n->tok == ROFF_Bl)  
                         break;                          break;
                   case (1):
         assert(n);                          h->base_man = v;
                           break;
         /* LINTED */                  case (2):
         for (i = 0; ROFF_ARGMAX != n->argc[i] &&                          h->base_includes = v;
                         i < ROFF_MAXLINEARG; i++) {                          break;
                 switch (n->argc[i]) {  
                 case (ROFF_Enum):  
                         /* FALLTHROUGH */  
                 case (ROFF_Bullet):  
                         /* FALLTHROUGH */  
                 case (ROFF_Dash):  
                         /* FALLTHROUGH */  
                 case (ROFF_Hyphen):  
                         /* FALLTHROUGH */  
                 case (ROFF_Item):  
                         /* FALLTHROUGH */  
                 case (ROFF_Diag):  
                         /* FALLTHROUGH */  
                 case (ROFF_Hang):  
                         /* FALLTHROUGH */  
                 case (ROFF_Ohang):  
                         /* FALLTHROUGH */  
                 case (ROFF_Inset):  
                         return(ml_nputs(mbuf, "div", 3, res));  
                 case (ROFF_Tag):  
                         /* FALLTHROUGH */  
                 case (ROFF_Column):  
                         return(ml_nputs(mbuf, "td", 2, res));  
                 default:                  default:
                         break;                          break;
                 }                  }
         }  
   
         assert(i != ROFF_MAXLINEARG);          return(h);
         return(0);  
 }  }
   
   void *
 /* ARGSUSED */  html_alloc(char *outopts)
 static int  
 html_Bl_bodytagname(struct md_mbuf *mbuf, struct htmlq *q,  
                 const int *argc, const char **argv, size_t *res)  
 {  {
         int              i;  
   
         for (i = 0; ROFF_ARGMAX != argc[i]          return(ml_alloc(outopts, HTML_HTML_4_01_STRICT));
                         && i < ROFF_MAXLINEARG; i++) {  
                 switch (argc[i]) {  
                 case (ROFF_Enum):  
                         return(ml_nputs(mbuf, "ol", 2, res));  
                 case (ROFF_Bullet):  
                         /* FALLTHROUGH */  
                 case (ROFF_Dash):  
                         /* FALLTHROUGH */  
                 case (ROFF_Hyphen):  
                         /* FALLTHROUGH */  
                 case (ROFF_Item):  
                         /* FALLTHROUGH */  
                 case (ROFF_Diag):  
                         /* FALLTHROUGH */  
                 case (ROFF_Hang):  
                         /* FALLTHROUGH */  
                 case (ROFF_Ohang):  
                         /* FALLTHROUGH */  
                 case (ROFF_Inset):  
                         return(ml_nputs(mbuf, "ul", 2, res));  
                 case (ROFF_Tag):  
                         /* FALLTHROUGH */  
                 case (ROFF_Column):  
                         return(ml_nputs(mbuf, "table", 5, res));  
                 default:  
                         break;  
                 }  
         }  
   
         assert(i != ROFF_MAXLINEARG);  
         return(0);  
 }  }
   
   
 /* ARGSUSED */  void *
 static int  xhtml_alloc(char *outopts)
 html_It_blocktagname(struct md_mbuf *mbuf, struct htmlq *q,  
                 const int *argc, const char **argv, size_t *res)  
 {  {
         struct htmlnode *n;  
         int              i;  
   
         for (n = q->last; n; n = n->parent)          return(ml_alloc(outopts, HTML_XHTML_1_0_STRICT));
                 if (n->tok == ROFF_Bl)  
                         break;  
   
         assert(n);  
   
         /* LINTED */  
         for (i = 0; ROFF_ARGMAX != n->argc[i] &&  
                         i < ROFF_MAXLINEARG; i++) {  
                 switch (n->argc[i]) {  
                 case (ROFF_Enum):  
                         /* FALLTHROUGH */  
                 case (ROFF_Bullet):  
                         /* FALLTHROUGH */  
                 case (ROFF_Dash):  
                         /* FALLTHROUGH */  
                 case (ROFF_Hyphen):  
                         /* FALLTHROUGH */  
                 case (ROFF_Item):  
                         /* FALLTHROUGH */  
                 case (ROFF_Diag):  
                         /* FALLTHROUGH */  
                 case (ROFF_Hang):  
                         /* FALLTHROUGH */  
                 case (ROFF_Ohang):  
                         /* FALLTHROUGH */  
                 case (ROFF_Inset):  
                         return(ml_nputs(mbuf, "li", 2, res));  
                 case (ROFF_Tag):  
                         /* FALLTHROUGH */  
                 case (ROFF_Column):  
                         return(ml_nputs(mbuf, "tr", 2, res));  
                 default:  
                         break;  
                 }  
         }  
   
         assert(i != ROFF_MAXLINEARG);  
         return(0);  
 }  }
   
   
 static int  void
 html_loadcss(struct md_mbuf *mbuf, const char *css)  html_free(void *p)
 {  {
         size_t           res, bufsz;          struct tag      *tag;
         char            *buf;          struct ord      *ord;
         struct stat      st;          struct html     *h;
         int              fd, c;  
         ssize_t          ssz;  
   
         c = 0;          h = (struct html *)p;
         res = 0;  
         buf = NULL;  
   
         if (-1 == (fd = open(css, O_RDONLY, 0))) {          while ((ord = h->ords.head) != NULL) {
                 warn("%s", css);                  h->ords.head = ord->next;
                 return(0);                  free(ord);
         }  
   
         if (-1 == fstat(fd, &st)) {  
                 warn("%s", css);  
                 goto out;  
         }          }
   
         bufsz = MAX(st.st_blksize, BUFSIZ);          while ((tag = h->tags.head) != NULL) {
         if (NULL == (buf = malloc(bufsz))) {                  h->tags.head = tag->next;
                 warn("malloc");                  free(tag);
                 goto out;  
         }          }
   
           if (h->symtab)
                   chars_free(h->symtab);
   
         for (;;) {          free(h);
                 if (-1 == (ssz = read(fd, buf, bufsz))) {  }
                         warn("%s", css);  
                         goto out;  
                 } else if (0 == ssz)  
                         break;  
                 if ( ! ml_nputs(mbuf, buf, (size_t)ssz, &res))  
                         goto out;  
         }  
   
         c = 1;  
   
 out:  void
         if (-1 == close(fd)) {  print_gen_head(struct html *h)
                 warn("%s", css);  {
                 c = 0;          struct htmlpair  tag[4];
         }  
   
         if (buf)          tag[0].key = ATTR_HTTPEQUIV;
                 free(buf);          tag[0].val = "Content-Type";
           tag[1].key = ATTR_CONTENT;
           tag[1].val = "text/html; charset=utf-8";
           print_otag(h, TAG_META, 2, tag);
   
         return(c);          tag[0].key = ATTR_NAME;
           tag[0].val = "resource-type";
           tag[1].key = ATTR_CONTENT;
           tag[1].val = "document";
           print_otag(h, TAG_META, 2, tag);
   
           if (h->style) {
                   tag[0].key = ATTR_REL;
                   tag[0].val = "stylesheet";
                   tag[1].key = ATTR_HREF;
                   tag[1].val = h->style;
                   tag[2].key = ATTR_TYPE;
                   tag[2].val = "text/css";
                   tag[3].key = ATTR_MEDIA;
                   tag[3].val = "all";
                   print_otag(h, TAG_LINK, 4, tag);
           }
 }  }
   
   
 static int  static void
 html_putline(struct md_mbuf *mbuf, size_t indent,  print_spec(struct html *h, enum roffdeco d, const char *p, size_t len)
                 const char *p, size_t *res)  
 {  {
           int              cp;
           const char      *rhs;
           size_t           sz;
   
         /* FIXME: use INDENT macro for this. */          if ((cp = chars_spec2cp(h->symtab, p, len)) > 0) {
         if ( ! ml_putchars(mbuf, ' ', indent * 4, res))                  printf("&#%d;", cp);
                 return(0);                  return;
         if ( ! ml_puts(mbuf, p, res))          } else if (-1 == cp && DECO_SSPECIAL == d) {
                 return(0);                  fwrite(p, 1, len, stdout);
         return(ml_nputs(mbuf, "\n", 1, res));                  return;
           } else if (-1 == cp)
                   return;
   
           if (NULL != (rhs = chars_spec2str(h->symtab, p, len, &sz)))
                   fwrite(rhs, 1, sz, stdout);
 }  }
   
   
 static int  static void
 html_putlinestart(struct md_mbuf *mbuf, size_t indent,  print_res(struct html *h, const char *p, size_t len)
                 const char *p, size_t *res)  
 {  {
           int              cp;
           const char      *rhs;
           size_t           sz;
   
         if ( ! ml_putchars(mbuf, ' ', indent * 4, res))          if ((cp = chars_res2cp(h->symtab, p, len)) > 0) {
                 return(0);                  printf("&#%d;", cp);
         return(ml_puts(mbuf, p, res));                  return;
           } else if (-1 == cp)
                   return;
   
           if (NULL != (rhs = chars_res2str(h->symtab, p, len, &sz)))
                   fwrite(rhs, 1, sz, stdout);
 }  }
   
   
 /* ARGSUSED */  struct tag *
 static int  print_ofont(struct html *h, enum htmlfont font)
 html_begin(struct md_mbuf *mbuf, const struct md_args *args,  
                 const struct tm *tm, const char *os,  
                 const char *title, enum roffmsec section,  
                 const char *vol)  
 {  {
         char             mtitle[128], css[128];          struct htmlpair  tag;
         size_t           i;  
   
         (void)snprintf(mtitle, sizeof(mtitle),          h->metal = h->metac;
                         "Manual Page for %s(%s)",          h->metac = font;
                         title, roff_msecname(section));  
         (void)snprintf(css, sizeof(css),  
                         TAG_LINK_CSS, args->params.html.css);  
   
         i = 0;          /* FIXME: DECO_ROMAN should just close out preexisting. */
   
         if ( ! html_putline(mbuf, i, TAG_DOCTYPE, NULL))          if (h->metaf && h->tags.head == h->metaf)
                 return(0);                  print_tagq(h, h->metaf);
         if ( ! html_putline(mbuf, i, TAG_HTML, NULL))  
                 return(0);  
         if ( ! html_putline(mbuf, i++, TAG_HEAD, NULL))  
                 return(0);  
         if ( ! html_putline(mbuf, i, TAG_CONTTYPE, NULL))  
                 return(0);  
         if ( ! html_putline(mbuf, i, TAG_RESTYPE, NULL))  
                 return(0);  
         if ( ! html_putlinestart(mbuf, i, TAG_TITLE, NULL))  
                 return(0);  
         if ( ! ml_putstring(mbuf, mtitle, NULL))  
                 return(0);  
         if ( ! html_putline(mbuf, i, TAG_TITLE_END, NULL))  
                 return(0);  
   
         if (HTML_CSS_EMBED & args->params.html.flags) {          PAIR_CLASS_INIT(&tag, htmlfonts[font]);
                 if ( ! html_putline(mbuf, i, TAG_STYLE_CSS, NULL))          h->metaf = print_otag(h, TAG_SPAN, 1, &tag);
                         return(0);          return(h->metaf);
                 if ( ! html_loadcss(mbuf, args->params.html.css))  
                         return(0);  
                 if ( ! html_putline(mbuf, i, TAG_STYLE_END, NULL))  
                         return(0);  
         } else if ( ! html_putline(mbuf, i, css, NULL))  
                 return(0);  
   
         if ( ! html_putline(mbuf, --i, TAG_HEAD_END, NULL))  
                 return(0);  
         if ( ! html_putline(mbuf, i, TAG_BODY, NULL))  
                 return(0);  
         if ( ! html_putline(mbuf, i, TAG_DIV_MDOC, NULL))  
                 return(0);  
         if ( ! html_putline(mbuf, i++, "<table width=\"100%\">", NULL))  
                 return(0);  
         if ( ! html_putline(mbuf, i++, "<tr>", NULL))  
                 return(0);  
         if ( ! html_putline(mbuf, i++, "<td align=\"left\">", NULL))  
                 return(0);  
         if ( ! ml_putstring(mbuf, title, NULL))  
                 return(0);  
         if ( ! html_putline(mbuf, --i, "</td>", NULL))  
                 return(0);  
         if ( ! html_putline(mbuf, i++, "<td align=\"center\">", NULL))  
                 return(0);  
         if ( ! ml_putstring(mbuf, "Hello, world.", NULL))  
                 return(0);  
         if ( ! html_putline(mbuf, --i, "</td>", NULL))  
                 return(0);  
         if ( ! html_putline(mbuf, i++, "<td align=\"right\">", NULL))  
                 return(0);  
         if ( ! ml_putstring(mbuf, title, NULL))  
                 return(0);  
         if ( ! html_putline(mbuf, --i, "</td>", NULL))  
                 return(0);  
         if ( ! html_putline(mbuf, --i, "</tr>", NULL))  
                 return(0);  
         if ( ! html_putline(mbuf, --i, "</table>", NULL))  
                 return(0);  
         return(1);  
 }  }
   
   
 /* ARGSUSED */  static void
 static int  print_metaf(struct html *h, enum roffdeco deco)
 html_end(struct md_mbuf *mbuf, const struct md_args *args)  
 {  {
           enum htmlfont    font;
   
         if ( ! html_putline(mbuf, 0, TAG_DIV_END, NULL))          switch (deco) {
                 return(0);          case (DECO_PREVIOUS):
         if ( ! html_putline(mbuf, 0, TAG_BODY_END, NULL))                  font = h->metal;
                 return(0);  
         return(html_putline(mbuf, 0, TAG_HTML_END, NULL));  
 }  
   
   
 /* ARGSUSED */  
 static int  
 html_bodytagname(struct md_mbuf *mbuf,  
                 const struct md_args *args, int tok, struct htmlq *q,  
                 const int *argc, const char **argv, size_t *res)  
 {  
   
         switch (tok) {  
         case (ROFF_Bl):  
                 return(html_Bl_bodytagname(mbuf, q, argc, argv, res));  
         case (ROFF_Fo):  
                 return(ml_nputs(mbuf, "span", 4, res));  
         case (ROFF_It):  
                 return(html_It_bodytagname(mbuf, q, argc, argv, res));  
         case (ROFF_Oo):  
                 return(ml_nputs(mbuf, "span", 4, res));  
         default:  
                 break;                  break;
           case (DECO_ITALIC):
                   font = HTMLFONT_ITALIC;
                   break;
           case (DECO_BOLD):
                   font = HTMLFONT_BOLD;
                   break;
           case (DECO_ROMAN):
                   font = HTMLFONT_NONE;
                   break;
           default:
                   abort();
                   /* NOTREACHED */
         }          }
   
         return(ml_puts(mbuf, "div", res));          (void)print_ofont(h, font);
 }  }
   
   
 /* ARGSUSED */  
 static int  static int
 html_headtagname(struct md_mbuf *mbuf,  print_encode(struct html *h, const char *p, int norecurse)
                 const struct md_args *args, int tok, struct htmlq *q,  
                 const int *argc, const char **argv, size_t *res)  
 {  {
           size_t           sz;
           int              len, nospace;
           const char      *seq;
           enum roffdeco    deco;
           static const char rejs[6] = { '\\', '<', '>', '&', ASCII_HYPH, '\0' };
   
         switch (tok) {          nospace = 0;
         case (ROFF_It):  
                 return(html_It_headtagname(mbuf, q, argc, argv, res));  
         case (ROFF_Fo):  
                 return(ml_nputs(mbuf, "span", 4, res));  
         case (ROFF_Oo):  
                 return(ml_nputs(mbuf, "span", 4, res));  
         case (ROFF_Sh):  
                 return(ml_nputs(mbuf, "h1", 2, res));  
         case (ROFF_Ss):  
                 return(ml_nputs(mbuf, "h2", 2, res));  
         default:  
                 break;  
         }  
   
         return(ml_nputs(mbuf, "div", 3, res));          for (; *p; p++) {
 }                  sz = strcspn(p, rejs);
   
                   fwrite(p, 1, sz, stdout);
                   p += /* LINTED */
                           sz;
   
 /* ARGSUSED */                  if ('<' == *p) {
 static int                          printf("&lt;");
 html_blocktagname(struct md_mbuf *mbuf, const struct md_args *args,                          continue;
                 int tok, struct htmlq *q, const int *argc,                  } else if ('>' == *p) {
                 const char **argv, size_t *res)                          printf("&gt;");
 {                          continue;
                   } else if ('&' == *p) {
                           printf("&amp;");
                           continue;
                   } else if (ASCII_HYPH == *p) {
                           /*
                            * Note: "soft hyphens" aren't graphically
                            * displayed when not breaking the text; we want
                            * them to be displayed.
                            */
                           /*printf("&#173;");*/
                           putchar('-');
                           continue;
                   } else if ('\0' == *p)
                           break;
   
         switch (tok) {                  seq = ++p;
         case (ROFF_Fo):                  len = a2roffdeco(&deco, &seq, &sz);
                 return(ml_nputs(mbuf, "span", 4, res));  
         case (ROFF_Oo):  
                 return(ml_nputs(mbuf, "span", 4, res));  
         case (ROFF_It):  
                 return(html_It_blocktagname(mbuf, q, argc, argv, res));  
         default:  
                 break;  
         }  
   
         return(ml_puts(mbuf, "div", res));                  switch (deco) {
 }                  case (DECO_RESERVED):
                           print_res(h, seq, sz);
                           break;
                   case (DECO_SSPECIAL):
                           /* FALLTHROUGH */
                   case (DECO_SPECIAL):
                           print_spec(h, deco, seq, sz);
                           break;
                   case (DECO_PREVIOUS):
                           /* FALLTHROUGH */
                   case (DECO_BOLD):
                           /* FALLTHROUGH */
                   case (DECO_ITALIC):
                           /* FALLTHROUGH */
                   case (DECO_ROMAN):
                           if (norecurse)
                                   break;
                           print_metaf(h, deco);
                           break;
                   default:
                           break;
                   }
   
                   p += len - 1;
   
 /* ARGSUSED */                  if (DECO_NOSPACE == deco && '\0' == *(p + 1))
 static int                          nospace = 1;
 html_printargs(struct md_mbuf *mbuf, int tok, const char *ns,          }
                 const int *argc, const char **argv, size_t *res)  
 {  
   
         if ( ! ml_puts(mbuf, " class=\"", res))          return(nospace);
                 return(0);  
         if ( ! ml_puts(mbuf, ns, res))  
                 return(0);  
         if ( ! ml_puts(mbuf, "-", res))  
                 return(0);  
         if ( ! ml_puts(mbuf, toknames[tok], res))  
                 return(0);  
         return(ml_puts(mbuf, "\"", res));  
 }  }
   
   
 /* ARGSUSED */  static void
 static int  print_attr(struct html *h, const char *key, const char *val)
 html_headtagargs(struct md_mbuf *mbuf,  
                 const struct md_args *args, int tok,  
                 const int *argc, const char **argv, size_t *res)  
 {  {
           printf(" %s=\"", key);
         return(html_printargs(mbuf, tok, "head", argc, argv, res));          (void)print_encode(h, val, 1);
           putchar('\"');
 }  }
   
   
 /* ARGSUSED */  struct tag *
 static int  print_otag(struct html *h, enum htmltag tag,
 html_bodytagargs(struct md_mbuf *mbuf,                  int sz, const struct htmlpair *p)
                 const struct md_args *args, int tok,  
                 const int *argc, const char **argv, size_t *res)  
 {  {
           int              i;
           struct tag      *t;
   
         return(html_printargs(mbuf, tok, "body", argc, argv, res));          /* Push this tags onto the stack of open scopes. */
 }  
   
           if ( ! (HTML_NOSTACK & htmltags[tag].flags)) {
                   t = malloc(sizeof(struct tag));
                   if (NULL == t) {
                           perror(NULL);
                           exit(EXIT_FAILURE);
                   }
                   t->tag = tag;
                   t->next = h->tags.head;
                   h->tags.head = t;
           } else
                   t = NULL;
   
 /* ARGSUSED */          if ( ! (HTML_NOSPACE & h->flags))
 static int                  if ( ! (HTML_CLRLINE & htmltags[tag].flags)) {
 html_blocktagargs(struct md_mbuf *mbuf,                          /* Manage keeps! */
                 const struct md_args *args, int tok,                          if ( ! (HTML_KEEP & h->flags)) {
                 const int *argc, const char **argv, size_t *res)                                  if (HTML_PREKEEP & h->flags)
 {                                          h->flags |= HTML_KEEP;
                                   putchar(' ');
                           } else
                                   printf("&#160;");
                   }
   
         return(html_printargs(mbuf, tok, "block", argc, argv, res));          if ( ! (h->flags & HTML_NONOSPACE))
 }                  h->flags &= ~HTML_NOSPACE;
           else
                   h->flags |= HTML_NOSPACE;
   
           /* Print out the tag name and attributes. */
   
 /* ARGSUSED */          printf("<%s", htmltags[tag].name);
 static int          for (i = 0; i < sz; i++)
 html_inlinetagargs(struct md_mbuf *mbuf,                  print_attr(h, htmlattrs[p[i].key], p[i].val);
                 const struct md_args *args, int tok,  
                 const int *argc, const char **argv, size_t *res)  
 {  
   
         if ( ! html_printargs(mbuf, tok, "inline", argc, argv, res))          /* Add non-overridable attributes. */
                 return(0);  
   
         switch (tok) {          if (TAG_HTML == tag && HTML_XHTML_1_0_STRICT == h->type) {
         case (ROFF_Sx):                  print_attr(h, "xmlns", "http://www.w3.org/1999/xhtml");
                 assert(*argv);                  print_attr(h, "xml:lang", "en");
                 if ( ! ml_nputs(mbuf, " href=\"#", 8, res))                  print_attr(h, "lang", "en");
                         return(0);  
                 if ( ! ml_putstring(mbuf, *argv, res))  
                         return(0);  
                 if ( ! ml_nputs(mbuf, "\"", 1, res))  
                         return(0);  
                 break;  
         default:  
                 break;  
         }          }
   
         return(1);  
 }  
   
           /* Accomodate for XML "well-formed" singleton escaping. */
   
 /* ARGSUSED */          if (HTML_AUTOCLOSE & htmltags[tag].flags)
 static int                  switch (h->type) {
 html_inlinetagname(struct md_mbuf *mbuf,                  case (HTML_XHTML_1_0_STRICT):
                 const struct md_args *args, int tok, size_t *res)                          putchar('/');
 {                          break;
                   default:
                           break;
                   }
   
         switch (tok) {          putchar('>');
         case (ROFF_Pp):  
                 return(ml_nputs(mbuf, "div", 3, res));  
         case (ROFF_Sx):  
                 return(ml_nputs(mbuf, "a", 1, res));  
         default:  
                 break;  
         }  
   
         return(ml_puts(mbuf, "span", res));          h->flags |= HTML_NOSPACE;
           return(t);
 }  }
   
   
 static ssize_t  static void
 html_begintag(struct md_mbuf *mbuf, void *data,  print_ctag(struct html *h, enum htmltag tag)
                 const struct md_args *args, enum md_ns ns,  
                 int tok, const int *argc, const char **argv)  
 {  {
         size_t           res;  
         struct htmlq    *q;          printf("</%s>", htmltags[tag].name);
         struct htmlnode *node;          if (HTML_CLRLINE & htmltags[tag].flags) {
         int              i;                  h->flags |= HTML_NOSPACE;
                   putchar('\n');
           }
   }
   
         assert(ns != MD_NS_DEFAULT);  
         res = 0;  
   
         assert(data);  void
         q = (struct htmlq *)data;  print_gen_decls(struct html *h)
   {
   
         if (NULL == (node = calloc(1, sizeof(struct htmlnode)))) {          print_xmltype(h);
                 warn("calloc");          print_doctype(h);
                 return(-1);  }
         }  
   
         node->parent = q->last;  
         node->tok = tok;  
         node->ns = ns;  
   
         if (argc)  {  static void
                 /* TODO: argv. */  print_xmltype(struct html *h)
   {
   
                 assert(argv);          if (HTML_XHTML_1_0_STRICT == h->type)
                 /* LINTED */                  printf("<?xml version=\"1.0\" encoding=\"UTF-8\"?>");
                 for (i = 0; ROFF_ARGMAX != argc[i]  }
                                 && i < ROFF_MAXLINEARG; i++)  
                         node->argc[i] = argc[i];  
                 assert(i != ROFF_MAXLINEARG);  
         }  
   
   
         q->last = node;  static void
   print_doctype(struct html *h)
   {
           const char      *doctype;
           const char      *dtd;
           const char      *name;
   
         switch (ns) {          switch (h->type) {
         case (MD_NS_BLOCK):          case (HTML_HTML_4_01_STRICT):
                 if ( ! html_blocktagname(mbuf, args, tok,                  name = "HTML";
                                         q, argc, argv, &res))                  doctype = "-//W3C//DTD HTML 4.01//EN";
                         return(-1);                  dtd = "http://www.w3.org/TR/html4/strict.dtd";
                 if ( ! html_blocktagargs(mbuf, args, tok,  
                                         argc, argv, &res))  
                         return(-1);  
                 break;                  break;
         case (MD_NS_BODY):  
                 if ( ! html_bodytagname(mbuf, args, tok,  
                                         q, argc, argv, &res))  
                         return(-1);  
                 if ( ! html_bodytagargs(mbuf, args, tok,  
                                         argc, argv, &res))  
                         return(-1);  
                 break;  
         case (MD_NS_HEAD):  
                 if ( ! html_headtagname(mbuf, args, tok, q,  
                                         argc, argv, &res))  
                         return(-1);  
                 if ( ! html_headtagargs(mbuf, args, tok,  
                                         argc, argv, &res))  
                         return(-1);  
                 break;  
         default:          default:
                 if ( ! html_inlinetagname(mbuf, args, tok, &res))                  name = "html";
                         return(-1);                  doctype = "-//W3C//DTD XHTML 1.0 Strict//EN";
                 if ( ! html_inlinetagargs(mbuf, args, tok,                  dtd = "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd";
                                         argc, argv, &res))  
                         return(-1);  
                 break;                  break;
         }          }
   
         return((ssize_t)res);          printf("<!DOCTYPE %s PUBLIC \"%s\" \"%s\">\n",
                           name, doctype, dtd);
 }  }
   
   
 static ssize_t  void
 html_endtag(struct md_mbuf *mbuf, void *data,  print_text(struct html *h, const char *word)
                 const struct md_args *args, enum md_ns ns, int tok)  
 {  {
         size_t           res;  
         struct htmlq    *q;  
         struct htmlnode *node;  
   
         assert(ns != MD_NS_DEFAULT);          if (word[0] && '\0' == word[1])
         res = 0;                  switch (word[0]) {
                   case('.'):
                           /* FALLTHROUGH */
                   case(','):
                           /* FALLTHROUGH */
                   case(';'):
                           /* FALLTHROUGH */
                   case(':'):
                           /* FALLTHROUGH */
                   case('?'):
                           /* FALLTHROUGH */
                   case('!'):
                           /* FALLTHROUGH */
                   case(')'):
                           /* FALLTHROUGH */
                   case(']'):
                           if ( ! (HTML_IGNDELIM & h->flags))
                                   h->flags |= HTML_NOSPACE;
                           break;
                   default:
                           break;
                   }
   
         assert(data);          if ( ! (HTML_NOSPACE & h->flags)) {
         q = (struct htmlq *)data;                  /* Manage keeps! */
         node = q->last;                  if ( ! (HTML_KEEP & h->flags)) {
                           if (HTML_PREKEEP & h->flags)
         switch (ns) {                                  h->flags |= HTML_KEEP;
         case (MD_NS_BLOCK):                          putchar(' ');
                 if ( ! html_blocktagname(mbuf, args, tok,                  } else
                                         q, node->argc,                          printf("&#160;");
                                         (const char **)node->argv, &res))  
                         return(-1);  
                 break;  
         case (MD_NS_BODY):  
                 if ( ! html_bodytagname(mbuf, args, tok,  
                                         q, node->argc,  
                                         (const char **)node->argv, &res))  
                         return(-1);  
                 break;  
         case (MD_NS_HEAD):  
                 if ( ! html_headtagname(mbuf, args, tok,  
                                         q, node->argc,  
                                         (const char **)node->argv, &res))  
                         return(-1);  
                 break;  
         default:  
                 if ( ! html_inlinetagname(mbuf, args, tok, &res))  
                         return(-1);  
                 break;  
         }          }
   
         q->last = node->parent;          assert(word);
           if ( ! print_encode(h, word, 0))
                   if ( ! (h->flags & HTML_NONOSPACE))
                           h->flags &= ~HTML_NOSPACE;
   
         free(node);          /*
            * Note that we don't process the pipe: the parser sees it as
         return((ssize_t)res);           * punctuation, but we don't in terms of typography.
            */
           if (word[0] && '\0' == word[1])
                   switch (word[0]) {
                   case('('):
                           /* FALLTHROUGH */
                   case('['):
                           h->flags |= HTML_NOSPACE;
                           break;
                   default:
                           break;
                   }
 }  }
   
   
 static int  void
 html_alloc(void **p)  print_tagq(struct html *h, const struct tag *until)
 {  {
           struct tag      *tag;
   
         if (NULL == (*p = calloc(1, sizeof(struct htmlq)))) {          while ((tag = h->tags.head) != NULL) {
                 warn("calloc");                  if (tag == h->metaf)
                 return(0);                          h->metaf = NULL;
                   print_ctag(h, tag->tag);
                   h->tags.head = tag->next;
                   free(tag);
                   if (until && tag == until)
                           return;
         }          }
         return(1);  
 }  }
   
   
 static void  void
 html_free(void *p)  print_stagq(struct html *h, const struct tag *suntil)
 {  {
         struct htmlq    *q;          struct tag      *tag;
         struct htmlnode *n;  
   
         assert(p);          while ((tag = h->tags.head) != NULL) {
         q = (struct htmlq *)p;                  if (suntil && tag == suntil)
                           return;
         /* LINTED */                  if (tag == h->metaf)
         while ((n = q->last)) {                          h->metaf = NULL;
                 q->last = n->parent;                  print_ctag(h, tag->tag);
                 free(n);                  h->tags.head = tag->next;
                   free(tag);
         }          }
   
         free(q);  
 }  }
   
   
 static ssize_t  void
 html_beginhttp(struct md_mbuf *mbuf,  bufinit(struct html *h)
                 const struct md_args *args,  
                 const char *buf, size_t sz)  
 {  {
         size_t           res;  
   
         res = 0;          h->buf[0] = '\0';
           h->buflen = 0;
   }
   
         if ( ! ml_puts(mbuf, "<a href=\"", &res))  
                 return(-1);  
         if (1 != ml_nputstring(mbuf, buf, sz, &res))  
                 return(-1);  
         if ( ! ml_puts(mbuf, "\">", &res))  
                 return(-1);  
   
         return((ssize_t)res);  void
   bufcat_style(struct html *h, const char *key, const char *val)
   {
   
           bufcat(h, key);
           bufncat(h, ":", 1);
           bufcat(h, val);
           bufncat(h, ";", 1);
 }  }
   
   
 static ssize_t  void
 html_endhttp(struct md_mbuf *mbuf,  bufcat(struct html *h, const char *p)
                 const struct md_args *args,  
                 const char *buf, size_t sz)  
 {  {
         size_t           res;  
   
         res = 0;          bufncat(h, p, strlen(p));
   }
   
         if ( ! ml_puts(mbuf, "</a>", &res))  
                 return(-1);  
   
         return((ssize_t)res);  void
   buffmt(struct html *h, const char *fmt, ...)
   {
           va_list          ap;
   
           va_start(ap, fmt);
           (void)vsnprintf(h->buf + (int)h->buflen,
                           BUFSIZ - h->buflen - 1, fmt, ap);
           va_end(ap);
           h->buflen = strlen(h->buf);
 }  }
   
   
 /* ARGSUSED */  void
 static ssize_t  bufncat(struct html *h, const char *p, size_t sz)
 html_beginstring(struct md_mbuf *mbuf,  
                 const struct md_args *args,  
                 const char *buf, size_t sz)  
 {  {
   
         if (0 == strncmp(buf, "http://", 7))          if (h->buflen + sz > BUFSIZ - 1)
                 return(html_beginhttp(mbuf, args, buf, sz));                  sz = BUFSIZ - 1 - h->buflen;
   
         return(0);          (void)strncat(h->buf, p, sz);
           h->buflen += sz;
 }  }
   
   
 /* ARGSUSED */  void
 static ssize_t  buffmt_includes(struct html *h, const char *name)
 html_endstring(struct md_mbuf *mbuf,  
                 const struct md_args *args,  
                 const char *buf, size_t sz)  
 {  {
           const char      *p, *pp;
         if (0 == strncmp(buf, "http://", 7))  
                 return(html_endhttp(mbuf, args, buf, sz));  
   
         return(0);          pp = h->base_includes;
   
           while (NULL != (p = strchr(pp, '%'))) {
                   bufncat(h, pp, (size_t)(p - pp));
                   switch (*(p + 1)) {
                   case('I'):
                           bufcat(h, name);
                           break;
                   default:
                           bufncat(h, p, 2);
                           break;
                   }
                   pp = p + 2;
           }
           if (pp)
                   bufcat(h, pp);
 }  }
   
   
 int  void
 md_line_html(void *data, char *buf)  buffmt_man(struct html *h,
                   const char *name, const char *sec)
 {  {
           const char      *p, *pp;
   
         return(mlg_line((struct md_mlg *)data, buf));          pp = h->base_man;
   
           /* LINTED */
           while (NULL != (p = strchr(pp, '%'))) {
                   bufncat(h, pp, (size_t)(p - pp));
                   switch (*(p + 1)) {
                   case('S'):
                           bufcat(h, sec ? sec : "1");
                           break;
                   case('N'):
                           buffmt(h, name);
                           break;
                   default:
                           bufncat(h, p, 2);
                           break;
                   }
                   pp = p + 2;
           }
           if (pp)
                   bufcat(h, pp);
 }  }
   
   
 int  void
 md_exit_html(void *data, int flush)  bufcat_su(struct html *h, const char *p, const struct roffsu *su)
 {  {
           double           v;
           const char      *u;
   
         return(mlg_exit((struct md_mlg *)data, flush));          v = su->scale;
   
           switch (su->unit) {
           case (SCALE_CM):
                   u = "cm";
                   break;
           case (SCALE_IN):
                   u = "in";
                   break;
           case (SCALE_PC):
                   u = "pc";
                   break;
           case (SCALE_PT):
                   u = "pt";
                   break;
           case (SCALE_EM):
                   u = "em";
                   break;
           case (SCALE_MM):
                   if (0 == (v /= 100))
                           v = 1;
                   u = "em";
                   break;
           case (SCALE_EN):
                   u = "ex";
                   break;
           case (SCALE_BU):
                   u = "ex";
                   break;
           case (SCALE_VS):
                   u = "em";
                   break;
           default:
                   u = "ex";
                   break;
           }
   
           /*
            * XXX: the CSS spec isn't clear as to which types accept
            * integer or real numbers, so we just make them all decimals.
            */
           buffmt(h, "%s: %.2f%s;", p, v, u);
 }  }
   
   
 void *  void
 md_init_html(const struct md_args *args,  html_idcat(char *dst, const char *src, int sz)
                 struct md_mbuf *mbuf, const struct md_rbuf *rbuf)  
 {  {
         struct ml_cbs    cbs;          int              ssz;
   
         cbs.ml_alloc = html_alloc;          assert(sz);
         cbs.ml_free = html_free;  
         cbs.ml_begintag = html_begintag;  
         cbs.ml_endtag = html_endtag;  
         cbs.ml_begin = html_begin;  
         cbs.ml_end = html_end;  
         cbs.ml_beginstring = html_beginstring;  
         cbs.ml_endstring = html_endstring;  
   
         return(mlg_alloc(args, rbuf, mbuf, &cbs));          /* Cf. <http://www.w3.org/TR/html4/types.html#h-6.2>. */
   
           for ( ; *dst != '\0' && sz; dst++, sz--)
                   /* Jump to end. */ ;
   
           assert(sz > 2);
   
           /* We can't start with a number (bah). */
   
           *dst++ = 'x';
           *dst = '\0';
           sz--;
   
           for ( ; *src != '\0' && sz > 1; src++) {
                   ssz = snprintf(dst, (size_t)sz, "%.2x", *src);
                   sz -= ssz;
                   dst += ssz;
           }
 }  }

Legend:
Removed from v.1.18  
changed lines
  Added in v.1.110

CVSweb