[BACK]Return to parse.c CVS log [TXT][DIR] Up to [cvsweb.bsd.lv] / docbook2mdoc

Diff for /docbook2mdoc/parse.c between version 1.29 and 1.44

version 1.29, 2019/04/09 15:23:51 version 1.44, 2019/04/14 22:37:56
Line 63  struct parse {
Line 63  struct parse {
 #define PFLAG_EEND       (1 << 3)  /* This element is self-closing. */  #define PFLAG_EEND       (1 << 3)  /* This element is self-closing. */
 };  };
   
 struct  element {  struct  alias {
         const char      *name;   /* DocBook element name. */          const char      *name;   /* DocBook element name. */
         enum nodeid      node;   /* Node type to generate. */          enum nodeid      node;   /* Node type to generate. */
 };  };
   
 static  const struct element elements[] = {  static  const struct alias aliases[] = {
         { "acronym",            NODE_IGNORE },          { "acronym",            NODE_IGNORE },
         { "affiliation",        NODE_AFFILIATION },          { "affiliation",        NODE_IGNORE },
         { "anchor",             NODE_DELETE },          { "anchor",             NODE_DELETE },
         { "appendix",           NODE_APPENDIX },          { "application",        NODE_COMMAND },
         { "application",        NODE_APPLICATION },  
         { "arg",                NODE_ARG },  
         { "article",            NODE_SECTION },          { "article",            NODE_SECTION },
         { "author",             NODE_AUTHOR },          { "articleinfo",        NODE_BOOKINFO },
         { "authorgroup",        NODE_AUTHORGROUP },  
         { "blockquote",         NODE_BLOCKQUOTE },  
         { "book",               NODE_SECTION },          { "book",               NODE_SECTION },
         { "bookinfo",           NODE_BOOKINFO },  
         { "caution",            NODE_CAUTION },  
         { "chapter",            NODE_SECTION },          { "chapter",            NODE_SECTION },
         { "citerefentry",       NODE_CITEREFENTRY },          { "caption",            NODE_IGNORE },
         { "citetitle",          NODE_CITETITLE },  
         { "cmdsynopsis",        NODE_CMDSYNOPSIS },  
         { "code",               NODE_LITERAL },          { "code",               NODE_LITERAL },
         { "colspec",            NODE_COLSPEC },          { "computeroutput",     NODE_LITERAL },
         { "command",            NODE_COMMAND },  
         { "constant",           NODE_CONSTANT },  
         { "contrib",            NODE_CONTRIB },  
         { "copyright",          NODE_COPYRIGHT },  
         { "date",               NODE_DATE },  
         { "!doctype",           NODE_DOCTYPE },          { "!doctype",           NODE_DOCTYPE },
         { "!DOCTYPE",           NODE_DOCTYPE },          { "figure",             NODE_IGNORE },
         { "editor",             NODE_EDITOR },  
         { "email",              NODE_EMAIL },  
         { "emphasis",           NODE_EMPHASIS },  
         { "!ENTITY",            NODE_ENTITY },  
         { "entry",              NODE_ENTRY },  
         { "envar",              NODE_ENVAR },  
         { "errorname",          NODE_ERRORNAME },  
         { "fieldsynopsis",      NODE_FIELDSYNOPSIS },  
         { "filename",           NODE_FILENAME },  
         { "firstname",          NODE_PERSONNAME },          { "firstname",          NODE_PERSONNAME },
         { "firstterm",          NODE_FIRSTTERM },  
         { "footnote",           NODE_FOOTNOTE },  
         { "funcdef",            NODE_FUNCDEF },  
         { "funcprototype",      NODE_FUNCPROTOTYPE },  
         { "funcsynopsis",       NODE_FUNCSYNOPSIS },  
         { "funcsynopsisinfo",   NODE_FUNCSYNOPSISINFO },  
         { "function",           NODE_FUNCTION },  
         { "glossary",           NODE_VARIABLELIST },          { "glossary",           NODE_VARIABLELIST },
         { "glossdef",           NODE_IGNORE },          { "glossdef",           NODE_IGNORE },
         { "glossdiv",           NODE_IGNORE },          { "glossdiv",           NODE_IGNORE },
         { "glossentry",         NODE_VARLISTENTRY },          { "glossentry",         NODE_VARLISTENTRY },
         { "glosslist",          NODE_VARIABLELIST },          { "glosslist",          NODE_VARIABLELIST },
         { "glossterm",          NODE_GLOSSTERM },          { "holder",             NODE_IGNORE },
         { "group",              NODE_GROUP },          { "imageobject",        NODE_IGNORE },
         { "holder",             NODE_HOLDER },  
         { "index",              NODE_INDEX },  
         { "indexterm",          NODE_DELETE },          { "indexterm",          NODE_DELETE },
         { "info",               NODE_INFO },  
         { "informalequation",   NODE_INFORMALEQUATION },  
         { "informaltable",      NODE_TABLE },          { "informaltable",      NODE_TABLE },
         { "inlineequation",     NODE_INLINEEQUATION },          { "keycap",             NODE_KEYSYM },
         { "itemizedlist",       NODE_ITEMIZEDLIST },          { "keycode",            NODE_IGNORE },
         { "keysym",             NODE_KEYSYM },          { "mediaobject",        NODE_BLOCKQUOTE },
         { "legalnotice",        NODE_LEGALNOTICE },          { "orgname",            NODE_IGNORE },
         { "link",               NODE_LINK },          { "othercredit",        NODE_AUTHOR },
         { "listitem",           NODE_LISTITEM },  
         { "literal",            NODE_LITERAL },  
         { "literallayout",      NODE_LITERALLAYOUT },  
         { "manvolnum",          NODE_MANVOLNUM },  
         { "member",             NODE_MEMBER },  
         { "mml:math",           NODE_MML_MATH },  
         { "mml:mfenced",        NODE_MML_MFENCED },  
         { "mml:mfrac",          NODE_MML_MFRAC },  
         { "mml:mi",             NODE_MML_MI },  
         { "mml:mn",             NODE_MML_MN },  
         { "mml:mo",             NODE_MML_MO },  
         { "mml:mrow",           NODE_MML_MROW },  
         { "mml:msub",           NODE_MML_MSUB },  
         { "mml:msup",           NODE_MML_MSUP },  
         { "modifier",           NODE_MODIFIER },  
         { "note",               NODE_NOTE },  
         { "option",             NODE_OPTION },  
         { "orderedlist",        NODE_ORDEREDLIST },  
         { "orgname",            NODE_ORGNAME },  
         { "othername",          NODE_PERSONNAME },          { "othername",          NODE_PERSONNAME },
         { "para",               NODE_PARA },  
         { "paramdef",           NODE_PARAMDEF },  
         { "parameter",          NODE_PARAMETER },  
         { "part",               NODE_SECTION },          { "part",               NODE_SECTION },
         { "personname",         NODE_PERSONNAME },  
         { "phrase",             NODE_IGNORE },          { "phrase",             NODE_IGNORE },
         { "preface",            NODE_PREFACE },  
         { "primary",            NODE_DELETE },          { "primary",            NODE_DELETE },
         { "programlisting",     NODE_PROGRAMLISTING },          { "property",           NODE_PARAMETER },
         { "prompt",             NODE_PROMPT },  
         { "quote",              NODE_QUOTE },  
         { "refclass",           NODE_REFCLASS },  
         { "refdescriptor",      NODE_REFDESCRIPTOR },  
         { "refentry",           NODE_REFENTRY },  
         { "refentryinfo",       NODE_REFENTRYINFO },  
         { "refentrytitle",      NODE_REFENTRYTITLE },  
         { "refmeta",            NODE_REFMETA },  
         { "refmetainfo",        NODE_REFMETAINFO },  
         { "refmiscinfo",        NODE_REFMISCINFO },  
         { "refname",            NODE_REFNAME },  
         { "refnamediv",         NODE_REFNAMEDIV },  
         { "refpurpose",         NODE_REFPURPOSE },  
         { "refsect1",           NODE_SECTION },          { "refsect1",           NODE_SECTION },
         { "refsect2",           NODE_SECTION },          { "refsect2",           NODE_SECTION },
         { "refsect3",           NODE_SECTION },          { "refsect3",           NODE_SECTION },
         { "refsection",         NODE_SECTION },          { "refsection",         NODE_SECTION },
         { "refsynopsisdiv",     NODE_REFSYNOPSISDIV },          { "releaseinfo",        NODE_IGNORE },
         { "releaseinfo",        NODE_RELEASEINFO },          { "returnvalue",        NODE_IGNORE },
         { "replaceable",        NODE_REPLACEABLE },  
         { "row",                NODE_ROW },  
         { "sbr",                NODE_SBR },  
         { "screen",             NODE_SCREEN },  
         { "secondary",          NODE_DELETE },          { "secondary",          NODE_DELETE },
         { "sect1",              NODE_SECTION },          { "sect1",              NODE_SECTION },
         { "sect2",              NODE_SECTION },          { "sect2",              NODE_SECTION },
         { "section",            NODE_SECTION },          { "sgmltag",            NODE_MARKUP },
         { "sgmltag",            NODE_SGMLTAG },  
         { "simpara",            NODE_PARA },          { "simpara",            NODE_PARA },
         { "simplelist",         NODE_SIMPLELIST },  
         { "spanspec",           NODE_SPANSPEC },  
         { "structfield",        NODE_PARAMETER },          { "structfield",        NODE_PARAMETER },
         { "structname",         NODE_TYPE },          { "structname",         NODE_TYPE },
         { "subtitle",           NODE_SUBTITLE },  
         { "surname",            NODE_PERSONNAME },          { "surname",            NODE_PERSONNAME },
         { "symbol",             NODE_CONSTANT },          { "symbol",             NODE_CONSTANT },
         { "synopsis",           NODE_SYNOPSIS },  
         { "table",              NODE_TABLE },  
         { "tbody",              NODE_TBODY },  
         { "term",               NODE_TERM },  
         { "tfoot",              NODE_TFOOT },  
         { "tgroup",             NODE_TGROUP },  
         { "thead",              NODE_THEAD },  
         { "tip",                NODE_TIP },  
         { "title",              NODE_TITLE },  
         { "trademark",          NODE_IGNORE },          { "trademark",          NODE_IGNORE },
         { "type",               NODE_TYPE },  
         { "ulink",              NODE_LINK },          { "ulink",              NODE_LINK },
         { "userinput",          NODE_LITERAL },          { "userinput",          NODE_LITERAL },
         { "variablelist",       NODE_VARIABLELIST },          { "year",               NODE_IGNORE },
         { "varlistentry",       NODE_VARLISTENTRY },  
         { "varname",            NODE_VARNAME },  
         { "warning",            NODE_WARNING },  
         { "wordasword",         NODE_WORDASWORD },  
         { "xi:include",         NODE_INCLUDE },  
         { "year",               NODE_YEAR },  
         { NULL,                 NODE_IGNORE }          { NULL,                 NODE_IGNORE }
 };  };
   
Line 322  warn_msg(struct parse *p, const char *fmt, ...)
Line 228  warn_msg(struct parse *p, const char *fmt, ...)
  * Otherwise, create a new one as a child of the current node.   * Otherwise, create a new one as a child of the current node.
  */   */
 static void  static void
 xml_char(struct parse *ps, const char *p, int sz)  xml_text(struct parse *p, const char *word, int sz)
 {  {
         struct pnode    *dat;          struct pnode    *n, *np;
         size_t           newsz;          size_t           oldsz, newsz;
           int              i;
   
         if (ps->del > 0)          assert(sz > 0);
           if (p->del > 0)
                 return;                  return;
   
         if (ps->cur == NULL) {          if ((n = p->cur) == NULL) {
                 error_msg(ps, "discarding text before document: %.*s", sz, p);                  error_msg(p, "discarding text before document: %.*s",
                       sz, word);
                 return;                  return;
         }          }
   
         if (ps->cur->node != NODE_TEXT) {          /* Append to the current text node, if one is open. */
                 if ((dat = calloc(1, sizeof(*dat))) == NULL)  
                         fatal(ps);          if (n->node == NODE_TEXT) {
                 dat->node = NODE_TEXT;                  oldsz = strlen(n->b);
                 dat->spc = (ps->flags & PFLAG_SPC) != 0;                  newsz = oldsz + sz;
                 dat->parent = ps->cur;                  if (oldsz && (p->flags & PFLAG_SPC))
                 TAILQ_INIT(&dat->childq);                          newsz++;
                 TAILQ_INIT(&dat->attrq);                  if ((n->b = realloc(n->b, newsz + 1)) == NULL)
                 TAILQ_INSERT_TAIL(&ps->cur->childq, dat, child);                          fatal(p);
                 ps->cur = dat;                  if (oldsz && (p->flags & PFLAG_SPC))
                           n->b[oldsz++] = ' ';
                   memcpy(n->b + oldsz, word, sz);
                   n->b[newsz] = '\0';
                   p->flags &= ~PFLAG_SPC;
                   return;
         }          }
   
         if (ps->tree->flags & TREE_CLOSED &&          if (p->tree->flags & TREE_CLOSED && n == p->tree->root)
             ps->cur->parent == ps->tree->root)                  warn_msg(p, "text after end of document: %.*s", sz, word);
                 warn_msg(ps, "text after end of document: %.*s", sz, p);  
   
         /* Append to the current text node. */          /* Create a new text node. */
   
         assert(sz >= 0);          if ((n = pnode_alloc(p->cur)) == NULL)
         newsz = ps->cur->bsz + (ps->cur->bsz && (ps->flags & PFLAG_SPC)) + sz;                  fatal(p);
         if ((ps->cur->b = realloc(ps->cur->b, newsz + 1)) == NULL)          n->node = NODE_TEXT;
                 fatal(ps);          n->spc = (p->flags & PFLAG_SPC) != 0;
         if (ps->cur->bsz && (ps->flags & PFLAG_SPC))          p->flags &= ~PFLAG_SPC;
                 ps->cur->b[ps->cur->bsz++] = ' ';  
         memcpy(ps->cur->b + ps->cur->bsz, p, sz);          /*
         ps->cur->b[ps->cur->bsz = newsz] = '\0';           * If this node follows an in-line macro without intervening
         ps->cur->real = ps->cur->b;           * whitespace, keep the text in it as short as possible,
         ps->flags &= ~PFLAG_SPC;           * and do not keep it open.
            */
   
           np = n->spc ? NULL : TAILQ_PREV(n, pnodeq, child);
           while (np != NULL) {
                   switch (pnode_class(np->node)) {
                   case CLASS_VOID:
                   case CLASS_TEXT:
                   case CLASS_BLOCK:
                           np = NULL;
                           break;
                   case CLASS_TRANS:
                           np = TAILQ_LAST(&np->childq, pnodeq);
                           continue;
                   case CLASS_LINE:
                   case CLASS_ENCL:
                           break;
                   }
                   break;
           }
           if (np != NULL) {
                   i = 0;
                   while (i < sz && !isspace((unsigned char)word[i]))
                           i++;
                   if ((n->b = strndup(word, i)) == NULL)
                           fatal(p);
                   if (i == sz)
                           return;
                   while (i < sz && isspace((unsigned char)word[i]))
                           i++;
                   if (i == sz) {
                           p->flags |= PFLAG_SPC;
                           return;
                   }
   
                   /* Put any remaining text into a second node. */
   
                   if ((n = pnode_alloc(p->cur)) == NULL)
                           fatal(p);
                   n->node = NODE_TEXT;
                   n->spc = 1;
                   word += i;
                   sz -= i;
           }
           if ((n->b = strndup(word, sz)) == NULL)
                   fatal(p);
   
           /* The new node remains open for later pnode_closetext(). */
   
           p->cur = n;
 }  }
   
 /*  /*
  * Close out the text node and strip trailing whitespace, if one is open.   * Close out the text node and strip trailing whitespace, if one is open.
  */   */
 static void  static void
 pnode_closetext(struct parse *p)  pnode_closetext(struct parse *p, int check_last_word)
 {  {
         struct pnode    *n;          struct pnode    *n;
           char            *cp, *last_word;
   
         if ((n = p->cur) == NULL || n->node != NODE_TEXT)          if ((n = p->cur) == NULL || n->node != NODE_TEXT)
                 return;                  return;
         p->cur = n->parent;          p->cur = n->parent;
         while (n->bsz > 0 && isspace((unsigned char)n->b[n->bsz - 1])) {          for (cp = strchr(n->b, '\0');
                 n->b[--n->bsz] = '\0';              cp > n->b && isspace((unsigned char)cp[-1]);
               *--cp = '\0')
                 p->flags |= PFLAG_SPC;                  p->flags |= PFLAG_SPC;
         }  
           if (p->flags & PFLAG_SPC || !check_last_word)
                   return;
   
           /*
            * Find the beginning of the last word
            * and delete whitespace before it.
            */
   
           while (cp > n->b && !isspace((unsigned char)cp[-1]))
                   cp--;
           if (cp == n->b)
                   return;
   
           last_word = cp;
           while (cp > n->b && isspace((unsigned char)cp[-1]))
               *--cp = '\0';
   
           /* Move the last word into its own node, for use with .Pf. */
   
           if ((n = pnode_alloc(p->cur)) == NULL)
                   fatal(p);
           n->node = NODE_TEXT;
           n->spc = 1;
           if ((n->b = strdup(last_word)) == NULL)
                   fatal(p);
 }  }
   
 static void  static void
 xml_entity(struct parse *p, const char *name)  xml_entity(struct parse *p, const char *name)
 {  {
         const struct entity     *entity;          const struct entity     *entity;
         struct pnode            *dat;          struct pnode            *n;
         const char              *ccp;          const char              *ccp;
         char                    *cp;          char                    *cp;
         enum pstate              pstate;          enum pstate              pstate;
Line 399  xml_entity(struct parse *p, const char *name)
Line 388  xml_entity(struct parse *p, const char *name)
                 return;                  return;
         }          }
   
         pnode_closetext(p);          pnode_closetext(p, 0);
   
         if (p->tree->flags & TREE_CLOSED && p->cur == p->tree->root)          if (p->tree->flags & TREE_CLOSED && p->cur == p->tree->root)
                 warn_msg(p, "entity after end of document: &%s;", name);                  warn_msg(p, "entity after end of document: &%s;", name);
Line 410  xml_entity(struct parse *p, const char *name)
Line 399  xml_entity(struct parse *p, const char *name)
   
         if (entity->roff == NULL) {          if (entity->roff == NULL) {
                 if (p->doctype != NULL) {                  if (p->doctype != NULL) {
                         TAILQ_FOREACH(dat, &p->doctype->childq, child) {                          TAILQ_FOREACH(n, &p->doctype->childq, child) {
                                 if ((ccp = pnode_getattr_raw(dat,                                  if ((ccp = pnode_getattr_raw(n,
                                      ATTRKEY_NAME, NULL)) == NULL ||                                       ATTRKEY_NAME, NULL)) == NULL ||
                                     strcmp(ccp, name) != 0)                                      strcmp(ccp, name) != 0)
                                         continue;                                          continue;
                                 if ((ccp = pnode_getattr_raw(dat,                                  if ((ccp = pnode_getattr_raw(n,
                                     ATTRKEY_SYSTEM, NULL)) != NULL) {                                      ATTRKEY_SYSTEM, NULL)) != NULL) {
                                         parse_file(p, -1, ccp);                                          parse_file(p, -1, ccp);
                                         p->flags &= ~PFLAG_SPC;                                          p->flags &= ~PFLAG_SPC;
                                         return;                                          return;
                                 }                                  }
                                 if ((ccp = pnode_getattr_raw(dat,                                  if ((ccp = pnode_getattr_raw(n,
                                      ATTRKEY_DEFINITION, NULL)) == NULL)                                       ATTRKEY_DEFINITION, NULL)) == NULL)
                                         continue;                                          continue;
                                 if ((cp = strdup(ccp)) == NULL)                                  if ((cp = strdup(ccp)) == NULL)
Line 438  xml_entity(struct parse *p, const char *name)
Line 427  xml_entity(struct parse *p, const char *name)
         }          }
   
         /* Create, append, and close out an entity node. */          /* Create, append, and close out an entity node. */
         if ((dat = calloc(1, sizeof(*dat))) == NULL ||          if ((n = pnode_alloc(p->cur)) == NULL ||
             (dat->b = dat->real = strdup(entity->roff)) == NULL)              (n->b = strdup(entity->roff)) == NULL)
                 fatal(p);                  fatal(p);
         dat->node = NODE_ESCAPE;          n->node = NODE_ESCAPE;
         dat->bsz = strlen(dat->b);          n->spc = (p->flags & PFLAG_SPC) != 0;
         dat->spc = (p->flags & PFLAG_SPC) != 0;  
         dat->parent = p->cur;  
         TAILQ_INIT(&dat->childq);  
         TAILQ_INIT(&dat->attrq);  
         TAILQ_INSERT_TAIL(&p->cur->childq, dat, child);  
         p->flags &= ~PFLAG_SPC;          p->flags &= ~PFLAG_SPC;
 }  }
   
 /*  /*
    * Parse an element name.
    */
   static enum nodeid
   xml_name2node(struct parse *p, const char *name)
   {
           const struct alias      *alias;
           enum nodeid              node;
   
           if ((node = pnode_parse(name)) < NODE_UNKNOWN)
                   return node;
   
           for (alias = aliases; alias->name != NULL; alias++)
                   if (strcmp(alias->name, name) == 0)
                           return alias->node;
   
           return NODE_UNKNOWN;
   }
   
   /*
  * Begin an element.   * Begin an element.
  */   */
 static void  static void
 xml_elem_start(struct parse *ps, const char *name)  xml_elem_start(struct parse *p, const char *name)
 {  {
         const struct element    *elem;          struct pnode            *n;
         struct pnode            *dat;  
   
         /*          /*
          * An ancestor is excluded from the tree;           * An ancestor is excluded from the tree;
          * keep track of the number of levels excluded.           * keep track of the number of levels excluded.
          */           */
         if (ps->del > 0) {          if (p->del > 0) {
                 if (*name != '!' && *name != '?')                  if (*name != '!' && *name != '?')
                         ps->del++;                          p->del++;
                 return;                  return;
         }          }
   
         pnode_closetext(ps);          switch (p->ncur = xml_name2node(p, name)) {
   
         for (elem = elements; elem->name != NULL; elem++)  
                 if (strcmp(elem->name, name) == 0)  
                         break;  
   
         if (elem->name == NULL) {  
                 if (*name == '!' || *name == '?')  
                         return;  
                 error_msg(ps, "unknown element <%s>", name);  
         }  
   
         ps->ncur = elem->node;  
   
         switch (ps->ncur) {  
         case NODE_DELETE_WARN:          case NODE_DELETE_WARN:
                 warn_msg(ps, "skipping element <%s>", name);                  warn_msg(p, "skipping element <%s>", name);
                 /* FALLTHROUGH */                  /* FALLTHROUGH */
         case NODE_DELETE:          case NODE_DELETE:
                 ps->del = 1;                  p->del = 1;
                 /* FALLTHROUGH */                  /* FALLTHROUGH */
         case NODE_IGNORE:          case NODE_IGNORE:
                 return;                  return;
         case NODE_INLINEEQUATION:          case NODE_UNKNOWN:
                 ps->tree->flags |= TREE_EQN;                  if (*name != '!' && *name != '?')
                 break;                          error_msg(p, "unknown element <%s>", name);
                   return;
         default:          default:
                 break;                  break;
         }          }
   
         if (ps->tree->flags & TREE_CLOSED && ps->cur->parent == NULL)          if (p->tree->flags & TREE_CLOSED && p->cur->parent == NULL)
                 warn_msg(ps, "element after end of document: <%s>", name);                  warn_msg(p, "element after end of document: <%s>", name);
   
         if ((dat = calloc(1, sizeof(*dat))) == NULL)          switch (pnode_class(p->ncur)) {
                 fatal(ps);          case CLASS_LINE:
           case CLASS_ENCL:
                   pnode_closetext(p, 1);
                   break;
           default:
                   pnode_closetext(p, 0);
                   break;
           }
   
           if ((n = pnode_alloc(p->cur)) == NULL)
                   fatal(p);
   
         /*          /*
            * Some elements are self-closing.
          * Nodes that begin a new macro or request line or start by           * Nodes that begin a new macro or request line or start by
          * printing text always want whitespace before themselves.           * printing text always want whitespace before themselves.
          */           */
   
         switch (dat->node = elem->node) {          switch (n->node = p->ncur) {
         case NODE_DOCTYPE:          case NODE_DOCTYPE:
         case NODE_ENTITY:          case NODE_ENTITY:
         case NODE_SBR:          case NODE_SBR:
                 ps->flags |= PFLAG_EEND;                  p->flags |= PFLAG_EEND;
                 /* FALLTHROUGH */  
         case NODE_APPENDIX:  
         case NODE_AUTHORGROUP:  
         case NODE_BLOCKQUOTE:  
         case NODE_BOOKINFO:  
         case NODE_CAUTION:  
         case NODE_EDITOR:  
         case NODE_ENTRY:  
         case NODE_FUNCDEF:  
         case NODE_FUNCPROTOTYPE:  
         case NODE_INFORMALEQUATION:  
         case NODE_INLINEEQUATION:  
         case NODE_ITEMIZEDLIST:  
         case NODE_LEGALNOTICE:  
         case NODE_LITERALLAYOUT:  
         case NODE_NOTE:  
         case NODE_ORDEREDLIST:  
         case NODE_PARA:  
         case NODE_PREFACE:  
         case NODE_PROGRAMLISTING:  
         case NODE_REFMETA:  
         case NODE_REFNAMEDIV:  
         case NODE_REFSYNOPSISDIV:  
         case NODE_ROW:  
         case NODE_SCREEN:  
         case NODE_SECTION:  
         case NODE_SYNOPSIS:  
         case NODE_TGROUP:  
         case NODE_TIP:  
         case NODE_TITLE:  
         case NODE_VARIABLELIST:  
         case NODE_VARLISTENTRY:  
         case NODE_WARNING:  
                 dat->spc = 1;  
                 break;                  break;
         default:          default:
                 dat->spc = (ps->flags & PFLAG_SPC) != 0;  
                 break;                  break;
         }          }
         dat->parent = ps->cur;          switch (pnode_class(p->ncur)) {
         TAILQ_INIT(&dat->childq);          case CLASS_LINE:
         TAILQ_INIT(&dat->attrq);          case CLASS_ENCL:
                   n->spc = (p->flags & PFLAG_SPC) != 0;
         if (ps->cur != NULL)                  break;
                 TAILQ_INSERT_TAIL(&ps->cur->childq, dat, child);          default:
                   n->spc = 1;
         ps->cur = dat;                  break;
         if (dat->node == NODE_DOCTYPE) {          }
                 if (ps->doctype == NULL)          p->cur = n;
                         ps->doctype = dat;          if (n->node == NODE_DOCTYPE) {
                   if (p->doctype == NULL)
                           p->doctype = n;
                 else                  else
                         error_msg(ps, "duplicate doctype");                          error_msg(p, "duplicate doctype");
         } else if (dat->parent == NULL && ps->tree->root == NULL)          } else if (n->parent == NULL && p->tree->root == NULL)
                 ps->tree->root = dat;                  p->tree->root = n;
 }  }
   
 static void  static void
 xml_attrkey(struct parse *ps, const char *name)  xml_attrkey(struct parse *p, const char *name)
 {  {
         struct pattr    *attr;          struct pattr    *a;
         const char      *value;          const char      *value;
         enum attrkey     key;          enum attrkey     key;
   
         if (ps->del > 0 || ps->ncur == NODE_IGNORE || *name == '\0')          if (p->del > 0 || p->ncur == NODE_IGNORE || *name == '\0')
                 return;                  return;
   
         if ((ps->ncur == NODE_DOCTYPE || ps->ncur == NODE_ENTITY) &&          if ((p->ncur == NODE_DOCTYPE || p->ncur == NODE_ENTITY) &&
             TAILQ_FIRST(&ps->cur->attrq) == NULL) {              TAILQ_FIRST(&p->cur->attrq) == NULL) {
                 value = name;                  value = name;
                 name = "NAME";                  name = "NAME";
         } else          } else
                 value = NULL;                  value = NULL;
   
         if ((key = attrkey_parse(name)) == ATTRKEY__MAX) {          if ((key = attrkey_parse(name)) == ATTRKEY__MAX) {
                 ps->flags &= ~PFLAG_ATTR;                  p->flags &= ~PFLAG_ATTR;
                 return;                  return;
         }          }
         if ((attr = calloc(1, sizeof(*attr))) == NULL)          if ((a = calloc(1, sizeof(*a))) == NULL)
                 fatal(ps);                  fatal(p);
   
         attr->key = key;          a->key = key;
         attr->val = ATTRVAL__MAX;          a->val = ATTRVAL__MAX;
         if (value == NULL) {          if (value == NULL) {
                 attr->rawval = NULL;                  a->rawval = NULL;
                 ps->flags |= PFLAG_ATTR;                  p->flags |= PFLAG_ATTR;
         } else {          } else {
                 if ((attr->rawval = strdup(value)) == NULL)                  if ((a->rawval = strdup(value)) == NULL)
                         fatal(ps);                          fatal(p);
                 ps->flags &= ~PFLAG_ATTR;                  p->flags &= ~PFLAG_ATTR;
         }          }
         TAILQ_INSERT_TAIL(&ps->cur->attrq, attr, child);          TAILQ_INSERT_TAIL(&p->cur->attrq, a, child);
         if (ps->ncur == NODE_ENTITY && key == ATTRKEY_NAME)          if (p->ncur == NODE_ENTITY && key == ATTRKEY_NAME)
                 xml_attrkey(ps, "DEFINITION");                  xml_attrkey(p, "DEFINITION");
 }  }
   
 static void  static void
 xml_attrval(struct parse *ps, const char *name)  xml_attrval(struct parse *p, const char *name)
 {  {
         struct pattr    *attr;          struct pattr    *a;
   
         if (ps->del > 0 || ps->ncur == NODE_IGNORE ||          if (p->del > 0 || p->ncur == NODE_IGNORE ||
             (ps->flags & PFLAG_ATTR) == 0)              (p->flags & PFLAG_ATTR) == 0)
                 return;                  return;
         if ((attr = TAILQ_LAST(&ps->cur->attrq, pattrq)) == NULL)          if ((a = TAILQ_LAST(&p->cur->attrq, pattrq)) == NULL)
                 return;                  return;
         if ((attr->val = attrval_parse(name)) == ATTRVAL__MAX &&          if ((a->val = attrval_parse(name)) == ATTRVAL__MAX &&
             (attr->rawval = strdup(name)) == NULL)              (a->rawval = strdup(name)) == NULL)
                 fatal(ps);                  fatal(p);
         ps->flags &= ~PFLAG_ATTR;          p->flags &= ~PFLAG_ATTR;
 }  }
   
 /*  /*
Line 632  xml_attrval(struct parse *ps, const char *name)
Line 599  xml_attrval(struct parse *ps, const char *name)
  * If we're at a text node, roll that one up first.   * If we're at a text node, roll that one up first.
  */   */
 static void  static void
 xml_elem_end(struct parse *ps, const char *name)  xml_elem_end(struct parse *p, const char *name)
 {  {
         const struct element    *elem;  
         struct pnode            *n;          struct pnode            *n;
         const char              *cp;          const char              *cp;
         enum nodeid              node;          enum nodeid              node;
Line 643  xml_elem_end(struct parse *ps, const char *name)
Line 609  xml_elem_end(struct parse *ps, const char *name)
          * An ancestor is excluded from the tree;           * An ancestor is excluded from the tree;
          * keep track of the number of levels excluded.           * keep track of the number of levels excluded.
          */           */
         if (ps->del > 1) {          if (p->del > 1) {
                 ps->del--;                  p->del--;
                 return;                  return;
         }          }
   
         if (ps->del == 0)          if (p->del == 0)
                 pnode_closetext(ps);                  pnode_closetext(p, 0);
   
         if (name != NULL) {          node = name == NULL ? p->ncur : xml_name2node(p, name);
                 for (elem = elements; elem->name != NULL; elem++)  
                         if (strcmp(elem->name, name) == 0)  
                                 break;  
                 node = elem->node;  
         } else  
                 node = ps->ncur;  
   
         switch (node) {          switch (node) {
         case NODE_DELETE_WARN:          case NODE_DELETE_WARN:
         case NODE_DELETE:          case NODE_DELETE:
                 if (ps->del > 0)                  if (p->del > 0)
                         ps->del--;                          p->del--;
                 break;                  break;
         case NODE_IGNORE:          case NODE_IGNORE:
           case NODE_UNKNOWN:
                 break;                  break;
         case NODE_INCLUDE:          case NODE_INCLUDE:
                 n = ps->cur;                  n = p->cur;
                 ps->cur = ps->cur->parent;                  p->cur = p->cur->parent;
                 cp = pnode_getattr_raw(n, ATTRKEY_HREF, NULL);                  cp = pnode_getattr_raw(n, ATTRKEY_HREF, NULL);
                 if (cp == NULL)                  if (cp == NULL)
                         error_msg(ps, "<xi:include> element "                          error_msg(p, "<xi:include> element "
                             "without href attribute");                              "without href attribute");
                 else                  else
                         parse_file(ps, -1, cp);                          parse_file(p, -1, cp);
                 pnode_unlink(n);                  pnode_unlink(n);
                 ps->flags &= ~PFLAG_SPC;                  p->flags &= ~PFLAG_SPC;
                 break;                  break;
         case NODE_DOCTYPE:          case NODE_DOCTYPE:
                 ps->flags &= ~PFLAG_EEND;          case NODE_SBR:
                   p->flags &= ~PFLAG_EEND;
                 /* FALLTHROUGH */                  /* FALLTHROUGH */
         default:          default:
                 if (ps->cur == NULL || node != ps->cur->node) {                  if (p->cur == NULL || node != p->cur->node) {
                         warn_msg(ps, "element not open: </%s>", name);                          warn_msg(p, "element not open: </%s>", name);
                         break;                          break;
                 }                  }
   
Line 695  xml_elem_end(struct parse *ps, const char *name)
Line 657  xml_elem_end(struct parse *ps, const char *name)
                  * obviously better than discarding it or crashing.                   * obviously better than discarding it or crashing.
                  */                   */
   
                 if (ps->cur->parent != NULL || node == NODE_DOCTYPE) {                  if (p->cur->parent != NULL || node == NODE_DOCTYPE) {
                         ps->cur = ps->cur->parent;                          p->cur = p->cur->parent;
                         if (ps->cur != NULL)                          if (p->cur != NULL)
                                 ps->ncur = ps->cur->node;                                  p->ncur = p->cur->node;
                 } else                  } else
                         ps->tree->flags |= TREE_CLOSED;                          p->tree->flags |= TREE_CLOSED;
                 ps->flags &= ~PFLAG_SPC;                  p->flags &= ~PFLAG_SPC;
                 break;                  break;
         }          }
         assert(ps->del == 0);          assert(p->del == 0);
 }  }
   
 struct parse *  struct parse *
Line 970  parse_string(struct parse *p, char *b, size_t rlen,
Line 932  parse_string(struct parse *p, char *b, size_t rlen,
   
                 } else {                  } else {
                         advance(p, b, rlen, &pend,                          advance(p, b, rlen, &pend,
                             p->ncur == NODE_DOCTYPE ? "<&]" : "<&",                              p->ncur == NODE_DOCTYPE ? "<&]\n" : "<&\n",
                             refill);                              refill);
                         xml_char(p, b + poff, pend - poff);                          xml_text(p, b + poff, pend - poff);
                           if (b[pend] == '\n')
                                   pnode_closetext(p, 0);
                 }                  }
         }          }
         return poff;          return poff;
Line 1057  parse_file(struct parse *p, int fd, const char *fname)
Line 1021  parse_file(struct parse *p, int fd, const char *fname)
         /* On the top level, finalize the parse tree. */          /* On the top level, finalize the parse tree. */
   
         if (save_fname == NULL) {          if (save_fname == NULL) {
                 pnode_closetext(p);                  pnode_closetext(p, 0);
                 if (p->tree->root == NULL)                  if (p->tree->root == NULL)
                         error_msg(p, "empty document");                          error_msg(p, "empty document");
                 else if ((p->tree->flags & TREE_CLOSED) == 0)                  else if ((p->tree->flags & TREE_CLOSED) == 0)

Legend:
Removed from v.1.29  
changed lines
  Added in v.1.44

CVSweb