[BACK]Return to mandocdb.c CVS log [TXT][DIR] Up to [cvsweb.bsd.lv] / mandoc

Diff for /mandoc/mandocdb.c between version 1.123 and 1.145

version 1.123, 2014/03/26 20:53:36 version 1.145, 2014/04/25 12:13:15
Line 55  extern const char *const mansearch_keynames[];
Line 55  extern const char *const mansearch_keynames[];
   
 #define SQL_EXEC(_v) \  #define SQL_EXEC(_v) \
         if (SQLITE_OK != sqlite3_exec(db, (_v), NULL, NULL, NULL)) \          if (SQLITE_OK != sqlite3_exec(db, (_v), NULL, NULL, NULL)) \
                 fprintf(stderr, "%s\n", sqlite3_errmsg(db))                  say("", "%s: %s", (_v), sqlite3_errmsg(db))
 #define SQL_BIND_TEXT(_s, _i, _v) \  #define SQL_BIND_TEXT(_s, _i, _v) \
         if (SQLITE_OK != sqlite3_bind_text \          if (SQLITE_OK != sqlite3_bind_text \
                 ((_s), (_i)++, (_v), -1, SQLITE_STATIC)) \                  ((_s), (_i)++, (_v), -1, SQLITE_STATIC)) \
                 fprintf(stderr, "%s\n", sqlite3_errmsg(db))                  say(mlink->file, "%s", sqlite3_errmsg(db))
 #define SQL_BIND_INT(_s, _i, _v) \  #define SQL_BIND_INT(_s, _i, _v) \
         if (SQLITE_OK != sqlite3_bind_int \          if (SQLITE_OK != sqlite3_bind_int \
                 ((_s), (_i)++, (_v))) \                  ((_s), (_i)++, (_v))) \
                 fprintf(stderr, "%s\n", sqlite3_errmsg(db))                  say(mlink->file, "%s", sqlite3_errmsg(db))
 #define SQL_BIND_INT64(_s, _i, _v) \  #define SQL_BIND_INT64(_s, _i, _v) \
         if (SQLITE_OK != sqlite3_bind_int64 \          if (SQLITE_OK != sqlite3_bind_int64 \
                 ((_s), (_i)++, (_v))) \                  ((_s), (_i)++, (_v))) \
                 fprintf(stderr, "%s\n", sqlite3_errmsg(db))                  say(mlink->file, "%s", sqlite3_errmsg(db))
 #define SQL_STEP(_s) \  #define SQL_STEP(_s) \
         if (SQLITE_DONE != sqlite3_step((_s))) \          if (SQLITE_DONE != sqlite3_step((_s))) \
                 fprintf(stderr, "%s\n", sqlite3_errmsg(db))                  say(mlink->file, "%s", sqlite3_errmsg(db))
   
 enum    op {  enum    op {
         OP_DEFAULT = 0, /* new dbs from dir list or default config */          OP_DEFAULT = 0, /* new dbs from dir list or default config */
Line 100  struct inodev {
Line 100  struct inodev {
   
 struct  mpage {  struct  mpage {
         struct inodev    inodev;  /* used for hashing routine */          struct inodev    inodev;  /* used for hashing routine */
         int64_t          recno;   /* id in mpages SQL table */          int64_t          pageid;  /* pageid in mpages SQL table */
         enum form        form;    /* format from file content */          enum form        form;    /* format from file content */
         char            *sec;     /* section from file content */          char            *sec;     /* section from file content */
         char            *arch;    /* architecture from file content */          char            *arch;    /* architecture from file content */
Line 119  struct mlink {
Line 119  struct mlink {
         char            *fsec;    /* section from file name suffix */          char            *fsec;    /* section from file name suffix */
         struct mlink    *next;    /* singly linked list */          struct mlink    *next;    /* singly linked list */
         struct mpage    *mpage;   /* parent */          struct mpage    *mpage;   /* parent */
           int              gzip;    /* filename has a .gz suffix */
 };  };
   
 enum    stmt {  enum    stmt {
         STMT_DELETE_PAGE = 0,   /* delete mpage */          STMT_DELETE_PAGE = 0,   /* delete mpage */
         STMT_INSERT_PAGE,       /* insert mpage */          STMT_INSERT_PAGE,       /* insert mpage */
         STMT_INSERT_LINK,       /* insert mlink */          STMT_INSERT_LINK,       /* insert mlink */
           STMT_INSERT_NAME,       /* insert name */
         STMT_INSERT_KEY,        /* insert parsed key */          STMT_INSERT_KEY,        /* insert parsed key */
         STMT__MAX          STMT__MAX
 };  };
Line 146  static void *hash_alloc(size_t, void *);
Line 148  static void *hash_alloc(size_t, void *);
 static  void     hash_free(void *, size_t, void *);  static  void     hash_free(void *, size_t, void *);
 static  void    *hash_halloc(size_t, void *);  static  void    *hash_halloc(size_t, void *);
 static  void     mlink_add(struct mlink *, const struct stat *);  static  void     mlink_add(struct mlink *, const struct stat *);
 static  int      mlink_check(struct mpage *, struct mlink *);  static  void     mlink_check(struct mpage *, struct mlink *);
 static  void     mlink_free(struct mlink *);  static  void     mlink_free(struct mlink *);
 static  void     mlinks_undupe(struct mpage *);  static  void     mlinks_undupe(struct mpage *);
 static  void     mpages_free(void);  static  void     mpages_free(void);
 static  void     mpages_merge(struct mchars *, struct mparse *);  static  void     mpages_merge(struct mchars *, struct mparse *);
 static  void     parse_cat(struct mpage *);  static  void     names_check(void);
   static  void     parse_cat(struct mpage *, int);
 static  void     parse_man(struct mpage *, const struct man_node *);  static  void     parse_man(struct mpage *, const struct man_node *);
 static  void     parse_mdoc(struct mpage *, const struct mdoc_node *);  static  void     parse_mdoc(struct mpage *, const struct mdoc_node *);
 static  int      parse_mdoc_body(struct mpage *, const struct mdoc_node *);  static  int      parse_mdoc_body(struct mpage *, const struct mdoc_node *);
Line 177  static char   tempfilename[32];
Line 180  static char   tempfilename[32];
 static  char            *progname;  static  char            *progname;
 static  int              nodb; /* no database changes */  static  int              nodb; /* no database changes */
 static  int              mparse_options; /* abort the parse early */  static  int              mparse_options; /* abort the parse early */
 static  int              use_all; /* use all found files */  static  int              use_all; /* use all found files */
 static  int              verb; /* print what we're doing */  static  int              debug; /* print what we're doing */
 static  int              warnings; /* warn about crap */  static  int              warnings; /* warn about crap */
 static  int              write_utf8; /* write UTF-8 output; else ASCII */  static  int              write_utf8; /* write UTF-8 output; else ASCII */
 static  int              exitcode; /* to be returned by main */  static  int              exitcode; /* to be returned by main */
 static  enum op          op; /* operational mode */  static  enum op          op; /* operational mode */
 static  char             basedir[PATH_MAX]; /* current base directory */  static  char             basedir[PATH_MAX]; /* current base directory */
 static  struct ohash     mpages; /* table of distinct manual pages */  static  struct ohash     mpages; /* table of distinct manual pages */
 static  struct ohash     mlinks; /* table of directory entries */  static  struct ohash     mlinks; /* table of directory entries */
   static  struct ohash     names; /* table of all names */
 static  struct ohash     strings; /* table of all strings */  static  struct ohash     strings; /* table of all strings */
 static  sqlite3         *db = NULL; /* current database */  static  sqlite3         *db = NULL; /* current database */
 static  sqlite3_stmt    *stmts[STMT__MAX]; /* current statements */  static  sqlite3_stmt    *stmts[STMT__MAX]; /* current statements */
   static  uint64_t         name_mask;
   
 static  const struct mdoc_handler mdocs[MDOC_MAX] = {  static  const struct mdoc_handler mdocs[MDOC_MAX] = {
         { NULL, 0 },  /* Ap */          { NULL, 0 },  /* Ap */
Line 222  static const struct mdoc_handler mdocs[MDOC_MAX] = {
Line 227  static const struct mdoc_handler mdocs[MDOC_MAX] = {
         { NULL, TYPE_Ic },  /* Ic */          { NULL, TYPE_Ic },  /* Ic */
         { NULL, TYPE_In },  /* In */          { NULL, TYPE_In },  /* In */
         { NULL, TYPE_Li },  /* Li */          { NULL, TYPE_Li },  /* Li */
         { parse_mdoc_Nd, TYPE_Nd },  /* Nd */          { parse_mdoc_Nd, 0 },  /* Nd */
         { parse_mdoc_Nm, TYPE_Nm },  /* Nm */          { parse_mdoc_Nm, 0 },  /* Nm */
         { NULL, 0 },  /* Op */          { NULL, 0 },  /* Op */
         { NULL, 0 },  /* Ot */          { NULL, 0 },  /* Ot */
         { NULL, TYPE_Pa },  /* Pa */          { NULL, TYPE_Pa },  /* Pa */
Line 315  static const struct mdoc_handler mdocs[MDOC_MAX] = {
Line 320  static const struct mdoc_handler mdocs[MDOC_MAX] = {
         { NULL, 0 },  /* Ta */          { NULL, 0 },  /* Ta */
 };  };
   
   
 int  int
 main(int argc, char *argv[])  main(int argc, char *argv[])
 {  {
Line 343  main(int argc, char *argv[])
Line 349  main(int argc, char *argv[])
                 ++progname;                  ++progname;
   
         /*          /*
          * We accept a few different invocations.           * We accept a few different invocations.
          * The CHECKOP macro makes sure that invocation styles don't           * The CHECKOP macro makes sure that invocation styles don't
          * clobber each other.           * clobber each other.
          */           */
Line 356  main(int argc, char *argv[])
Line 362  main(int argc, char *argv[])
         path_arg = NULL;          path_arg = NULL;
         op = OP_DEFAULT;          op = OP_DEFAULT;
   
         while (-1 != (ch = getopt(argc, argv, "aC:d:nQT:tu:vW")))          while (-1 != (ch = getopt(argc, argv, "aC:Dd:npQT:tu:v")))
                 switch (ch) {                  switch (ch) {
                 case ('a'):                  case 'a':
                         use_all = 1;                          use_all = 1;
                         break;                          break;
                 case ('C'):                  case 'C':
                         CHECKOP(op, ch);                          CHECKOP(op, ch);
                         path_arg = optarg;                          path_arg = optarg;
                         op = OP_CONFFILE;                          op = OP_CONFFILE;
                         break;                          break;
                 case ('d'):                  case 'D':
                           debug++;
                           break;
                   case 'd':
                         CHECKOP(op, ch);                          CHECKOP(op, ch);
                         path_arg = optarg;                          path_arg = optarg;
                         op = OP_UPDATE;                          op = OP_UPDATE;
                         break;                          break;
                 case ('n'):                  case 'n':
                         nodb = 1;                          nodb = 1;
                         break;                          break;
                 case ('Q'):                  case 'p':
                           warnings = 1;
                           break;
                   case 'Q':
                         mparse_options |= MPARSE_QUICK;                          mparse_options |= MPARSE_QUICK;
                         break;                          break;
                 case ('T'):                  case 'T':
                         if (strcmp(optarg, "utf8")) {                          if (strcmp(optarg, "utf8")) {
                                 fprintf(stderr, "-T%s: Unsupported "                                  fprintf(stderr, "-T%s: Unsupported "
                                     "output format\n", optarg);                                      "output format\n", optarg);
Line 385  main(int argc, char *argv[])
Line 397  main(int argc, char *argv[])
                         }                          }
                         write_utf8 = 1;                          write_utf8 = 1;
                         break;                          break;
                 case ('t'):                  case 't':
                         CHECKOP(op, ch);                          CHECKOP(op, ch);
                         dup2(STDOUT_FILENO, STDERR_FILENO);                          dup2(STDOUT_FILENO, STDERR_FILENO);
                         op = OP_TEST;                          op = OP_TEST;
                         nodb = warnings = 1;                          nodb = warnings = 1;
                         break;                          break;
                 case ('u'):                  case 'u':
                         CHECKOP(op, ch);                          CHECKOP(op, ch);
                         path_arg = optarg;                          path_arg = optarg;
                         op = OP_DELETE;                          op = OP_DELETE;
                         break;                          break;
                 case ('v'):                  case 'v':
                         verb++;                          /* Compatibility with espie@'s makewhatis. */
                         break;                          break;
                 case ('W'):  
                         warnings = 1;  
                         break;  
                 default:                  default:
                         goto usage;                          goto usage;
                 }                  }
Line 422  main(int argc, char *argv[])
Line 431  main(int argc, char *argv[])
         ohash_init(&mlinks, 6, &mlinks_info);          ohash_init(&mlinks, 6, &mlinks_info);
   
         if (OP_UPDATE == op || OP_DELETE == op || OP_TEST == op) {          if (OP_UPDATE == op || OP_DELETE == op || OP_TEST == op) {
                 /*  
                  * Force processing all files.  
                  */  
                 use_all = 1;  
   
                 /*                  /*
                  * All of these deal with a specific directory.                   * All of these deal with a specific directory.
                  * Jump into that directory then collect files specified                   * Jump into that directory first.
                  * on the command-line.  
                  */                   */
                 if (0 == set_basedir(path_arg))                  if (0 == set_basedir(path_arg))
                         goto out;                          goto out;
                 for (i = 0; i < argc; i++)  
                         filescan(argv[i]);                  if (dbopen(1)) {
                 if (0 == dbopen(1))                          /*
                         goto out;                           * The existing database is usable.  Process
                 if (OP_TEST != op)                           * all files specified on the command-line.
                         dbprune();                           */
                           use_all = 1;
                           for (i = 0; i < argc; i++)
                                   filescan(argv[i]);
                           if (OP_TEST != op)
                                   dbprune();
                   } else {
                           /*
                            * Database missing or corrupt.
                            * Recreate from scratch.
                            */
                           exitcode = (int)MANDOCLEVEL_OK;
                           op = OP_DEFAULT;
                           if (0 == treescan())
                                   goto out;
                           if (0 == dbopen(0))
                                   goto out;
                   }
                 if (OP_DELETE != op)                  if (OP_DELETE != op)
                         mpages_merge(mc, mp);                          mpages_merge(mc, mp);
                 dbclose(1);                  dbclose(OP_DEFAULT == op ? 0 : 1);
         } else {          } else {
                 /*                  /*
                  * If we have arguments, use them as our manpaths.                   * If we have arguments, use them as our manpaths.
Line 450  main(int argc, char *argv[])
Line 471  main(int argc, char *argv[])
                  * manpath_parse() wants to do it.                   * manpath_parse() wants to do it.
                  */                   */
                 if (argc > 0) {                  if (argc > 0) {
                         dirs.paths = mandoc_calloc                          dirs.paths = mandoc_reallocarray(NULL,
                                 (argc, sizeof(char *));                              argc, sizeof(char *));
                         dirs.sz = (size_t)argc;                          dirs.sz = (size_t)argc;
                         for (i = 0; i < argc; i++)                          for (i = 0; i < argc; i++)
                                 dirs.paths[i] = mandoc_strdup(argv[i]);                                  dirs.paths[i] = mandoc_strdup(argv[i]);
                 } else                  } else
                         manpath_parse(&dirs, path_arg, NULL, NULL);                          manpath_parse(&dirs, path_arg, NULL, NULL);
   
                   if (0 == dirs.sz) {
                           exitcode = (int)MANDOCLEVEL_BADARG;
                           say("", "Empty manpath");
                   }
   
                 /*                  /*
                  * First scan the tree rooted at a base directory, then                   * First scan the tree rooted at a base directory, then
                  * build a new database and finally move it into place.                   * build a new database and finally move it into place.
Line 486  main(int argc, char *argv[])
Line 512  main(int argc, char *argv[])
                                 goto out;                                  goto out;
   
                         mpages_merge(mc, mp);                          mpages_merge(mc, mp);
                           if (warnings &&
                               ! (MPARSE_QUICK & mparse_options))
                                   names_check();
                         dbclose(0);                          dbclose(0);
   
                         if (j + 1 < dirs.sz) {                          if (j + 1 < dirs.sz) {
Line 505  out:
Line 534  out:
         ohash_delete(&mlinks);          ohash_delete(&mlinks);
         return(exitcode);          return(exitcode);
 usage:  usage:
         fprintf(stderr, "usage: %s [-anQvW] [-C file] [-Tutf8]\n"          fprintf(stderr, "usage: %s [-aDnpQ] [-C file] [-Tutf8]\n"
                         "       %s [-anQvW] [-Tutf8] dir ...\n"                          "       %s [-aDnpQ] [-Tutf8] dir ...\n"
                         "       %s [-nQvW] [-Tutf8] -d dir [file ...]\n"                          "       %s [-DnpQ] [-Tutf8] -d dir [file ...]\n"
                         "       %s [-nvW] -u dir [file ...]\n"                          "       %s [-Dnp] -u dir [file ...]\n"
                         "       %s [-Q] -t file ...\n",                          "       %s [-Q] -t file ...\n",
                        progname, progname, progname,                         progname, progname, progname,
                        progname, progname);                         progname, progname);
   
         return((int)MANDOCLEVEL_BADARG);          return((int)MANDOCLEVEL_BADARG);
Line 524  usage:
Line 553  usage:
  * If use_all has been specified, grok all files.   * If use_all has been specified, grok all files.
  * If not, sanitise paths to the following:   * If not, sanitise paths to the following:
  *   *
  *   [./]man*[/<arch>]/<name>.<section>   *   [./]man*[/<arch>]/<name>.<section>
  *   or   *   or
  *   [./]cat<section>[/<arch>]/<name>.0   *   [./]cat<section>[/<arch>]/<name>.0
  *   *
Line 533  usage:
Line 562  usage:
 static int  static int
 treescan(void)  treescan(void)
 {  {
           char             buf[PATH_MAX];
         FTS             *f;          FTS             *f;
         FTSENT          *ff;          FTSENT          *ff;
         struct mlink    *mlink;          struct mlink    *mlink;
         int              dform;          int              dform, gzip;
         char            *dsec, *arch, *fsec, *cp;          char            *dsec, *arch, *fsec, *cp;
         const char      *path;          const char      *path;
         const char      *argv[2];          const char      *argv[2];
Line 544  treescan(void)
Line 574  treescan(void)
         argv[0] = ".";          argv[0] = ".";
         argv[1] = (char *)NULL;          argv[1] = (char *)NULL;
   
         /*          f = fts_open((char * const *)argv,
          * Walk through all components under the directory, using the              FTS_PHYSICAL | FTS_NOCHDIR, NULL);
          * logical descent of files.  
          */  
         f = fts_open((char * const *)argv, FTS_LOGICAL, NULL);  
         if (NULL == f) {          if (NULL == f) {
                 exitcode = (int)MANDOCLEVEL_SYSERR;                  exitcode = (int)MANDOCLEVEL_SYSERR;
                 say("", "&fts_open");                  say("", "&fts_open");
Line 560  treescan(void)
Line 587  treescan(void)
   
         while (NULL != (ff = fts_read(f))) {          while (NULL != (ff = fts_read(f))) {
                 path = ff->fts_path + 2;                  path = ff->fts_path + 2;
                   switch (ff->fts_info) {
   
                 /*                  /*
                    * Symbolic links require various sanity checks,
                    * then get handled just like regular files.
                    */
                   case FTS_SL:
                           if (NULL == realpath(path, buf)) {
                                   if (warnings)
                                           say(path, "&realpath");
                                   continue;
                           }
                           if (strstr(buf, basedir) != buf) {
                                   if (warnings) say("",
                                       "%s: outside base directory", buf);
                                   continue;
                           }
                           /* Use logical inode to avoid mpages dupe. */
                           if (-1 == stat(path, ff->fts_statp)) {
                                   if (warnings)
                                           say(path, "&stat");
                                   continue;
                           }
                           /* FALLTHROUGH */
   
                   /*
                  * If we're a regular file, add an mlink by using the                   * If we're a regular file, add an mlink by using the
                  * stored directory data and handling the filename.                   * stored directory data and handling the filename.
                  */                   */
                 if (FTS_F == ff->fts_info) {                  case FTS_F:
                         if (0 == strcmp(path, MANDOC_DB))                          if (0 == strcmp(path, MANDOC_DB))
                                 continue;                                  continue;
                         if ( ! use_all && ff->fts_level < 2) {                          if ( ! use_all && ff->fts_level < 2) {
                                 if (warnings)                                  if (warnings)
                                         say(path, "Extraneous file");                                          say(path, "Extraneous file");
                                 continue;                                  continue;
                         } else if (NULL == (fsec =                          }
                                         strrchr(ff->fts_name, '.'))) {                          gzip = 0;
                           fsec = NULL;
                           while (NULL == fsec) {
                                   fsec = strrchr(ff->fts_name, '.');
                                   if (NULL == fsec || strcmp(fsec+1, "gz"))
                                           break;
                                   gzip = 1;
                                   *fsec = '\0';
                                   fsec = NULL;
                           }
                           if (NULL == fsec) {
                                 if ( ! use_all) {                                  if ( ! use_all) {
                                         if (warnings)                                          if (warnings)
                                                 say(path,                                                  say(path,
Line 583  treescan(void)
Line 645  treescan(void)
                                 if (warnings)                                  if (warnings)
                                         say(path, "Skip html");                                          say(path, "Skip html");
                                 continue;                                  continue;
                         } else if (0 == strcmp(fsec, "gz")) {  
                                 if (warnings)  
                                         say(path, "Skip gz");  
                                 continue;  
                         } else if (0 == strcmp(fsec, "ps")) {                          } else if (0 == strcmp(fsec, "ps")) {
                                 if (warnings)                                  if (warnings)
                                         say(path, "Skip ps");                                          say(path, "Skip ps");
Line 605  treescan(void)
Line 663  treescan(void)
                                 fsec[-1] = '\0';                                  fsec[-1] = '\0';
   
                         mlink = mandoc_calloc(1, sizeof(struct mlink));                          mlink = mandoc_calloc(1, sizeof(struct mlink));
                         strlcpy(mlink->file, path, sizeof(mlink->file));                          if (strlcpy(mlink->file, path,
                               sizeof(mlink->file)) >=
                               sizeof(mlink->file)) {
                                   say(path, "Filename too long");
                                   free(mlink);
                                   continue;
                           }
                         mlink->dform = dform;                          mlink->dform = dform;
                         mlink->dsec = dsec;                          mlink->dsec = dsec;
                         mlink->arch = arch;                          mlink->arch = arch;
                         mlink->name = ff->fts_name;                          mlink->name = ff->fts_name;
                         mlink->fsec = fsec;                          mlink->fsec = fsec;
                           mlink->gzip = gzip;
                         mlink_add(mlink, ff->fts_statp);                          mlink_add(mlink, ff->fts_statp);
                         continue;                          continue;
                 } else if (FTS_D != ff->fts_info &&  
                                 FTS_DP != ff->fts_info) {                  case FTS_D:
                           /* FALLTHROUGH */
                   case FTS_DP:
                           break;
   
                   default:
                         if (warnings)                          if (warnings)
                                 say(path, "Not a regular file");                                  say(path, "Not a regular file");
                         continue;                          continue;
                 }                  }
   
                 switch (ff->fts_level) {                  switch (ff->fts_level) {
                 case (0):                  case 0:
                         /* Ignore the root directory. */                          /* Ignore the root directory. */
                         break;                          break;
                 case (1):                  case 1:
                         /*                          /*
                          * This might contain manX/ or catX/.                           * This might contain manX/ or catX/.
                          * Try to infer this from the name.                           * Try to infer this from the name.
Line 645  treescan(void)
Line 715  treescan(void)
                                 dsec = NULL;                                  dsec = NULL;
                         }                          }
   
                         if (NULL != dsec || use_all)                          if (NULL != dsec || use_all)
                                 break;                                  break;
   
                         if (warnings)                          if (warnings)
                                 say(path, "Unknown directory part");                                  say(path, "Unknown directory part");
                         fts_set(f, ff, FTS_SKIP);                          fts_set(f, ff, FTS_SKIP);
                         break;                          break;
                 case (2):                  case 2:
                         /*                          /*
                          * Possibly our architecture.                           * Possibly our architecture.
                          * If we're descending, keep tabs on it.                           * If we're descending, keep tabs on it.
Line 684  treescan(void)
Line 754  treescan(void)
  * Try to infer the manual section, architecture, and page name from the   * Try to infer the manual section, architecture, and page name from the
  * path, assuming it looks like   * path, assuming it looks like
  *   *
  *   [./]man*[/<arch>]/<name>.<section>   *   [./]man*[/<arch>]/<name>.<section>
  *   or   *   or
  *   [./]cat<section>[/<arch>]/<name>.0   *   [./]cat<section>[/<arch>]/<name>.0
  *   *
Line 703  filescan(const char *file)
Line 773  filescan(const char *file)
         if (0 == strncmp(file, "./", 2))          if (0 == strncmp(file, "./", 2))
                 file += 2;                  file += 2;
   
           /*
            * We have to do lstat(2) before realpath(3) loses
            * the information whether this is a symbolic link.
            * We need to know that because for symbolic links,
            * we want to use the orginal file name, while for
            * regular files, we want to use the real path.
            */
           if (-1 == lstat(file, &st)) {
                   exitcode = (int)MANDOCLEVEL_BADARG;
                   say(file, "&lstat");
                   return;
           } else if (0 == ((S_IFREG | S_IFLNK) & st.st_mode)) {
                   exitcode = (int)MANDOCLEVEL_BADARG;
                   say(file, "Not a regular file");
                   return;
           }
   
           /*
            * We have to resolve the file name to the real path
            * in any case for the base directory check.
            */
         if (NULL == realpath(file, buf)) {          if (NULL == realpath(file, buf)) {
                 exitcode = (int)MANDOCLEVEL_BADARG;                  exitcode = (int)MANDOCLEVEL_BADARG;
                 say(file, "&realpath");                  say(file, "&realpath");
Line 719  filescan(const char *file)
Line 810  filescan(const char *file)
                 return;                  return;
         }          }
   
         if (-1 == stat(buf, &st)) {          /*
                 exitcode = (int)MANDOCLEVEL_BADARG;           * Now we are sure the file is inside our tree.
                 say(file, "&stat");           * If it is a symbolic link, ignore the real path
                 return;           * and use the original name.
         } else if ( ! (S_IFREG & st.st_mode)) {           * This implies passing stuff like "cat1/../man1/foo.1"
                 exitcode = (int)MANDOCLEVEL_BADARG;           * on the command line won't work.  So don't do that.
                 say(file, "Not a regular file");           * Note the stat(2) can still fail if the link target
                 return;           * doesn't exist.
            */
           if (S_IFLNK & st.st_mode) {
                   if (-1 == stat(buf, &st)) {
                           exitcode = (int)MANDOCLEVEL_BADARG;
                           say(file, "&stat");
                           return;
                   }
                   if (strlcpy(buf, file, sizeof(buf)) >= sizeof(buf)) {
                           say(file, "Filename too long");
                           return;
                   }
                   start = strstr(buf, basedir) == buf ?
                       buf + strlen(basedir) + 1 : buf;
         }          }
   
         mlink = mandoc_calloc(1, sizeof(struct mlink));          mlink = mandoc_calloc(1, sizeof(struct mlink));
         strlcpy(mlink->file, start, sizeof(mlink->file));          if (strlcpy(mlink->file, start, sizeof(mlink->file)) >=
               sizeof(mlink->file)) {
                   say(start, "Filename too long");
                   return;
           }
   
         /*          /*
          * First try to guess our directory structure.           * First try to guess our directory structure.
Line 878  mlinks_undupe(struct mpage *mpage)
Line 986  mlinks_undupe(struct mpage *mpage)
                         mpage->form = FORM_NONE;                          mpage->form = FORM_NONE;
                         goto nextlink;                          goto nextlink;
                 }                  }
                 if (strlcpy(buf, mlink->file, PATH_MAX) >= PATH_MAX) {                  (void)strlcpy(buf, mlink->file, sizeof(buf));
                         if (warnings)  
                                 say(mlink->file, "Filename too long");  
                         goto nextlink;  
                 }  
                 bufp = strstr(buf, "cat");                  bufp = strstr(buf, "cat");
                 assert(NULL != bufp);                  assert(NULL != bufp);
                 memcpy(bufp, "man", 3);                  memcpy(bufp, "man", 3);
                 if (NULL != (bufp = strrchr(buf, '.')))                  if (NULL != (bufp = strrchr(buf, '.')))
                         *++bufp = '\0';                          *++bufp = '\0';
                 strlcat(buf, mlink->dsec, PATH_MAX);                  (void)strlcat(buf, mlink->dsec, sizeof(buf));
                 if (NULL == ohash_find(&mlinks,                  if (NULL == ohash_find(&mlinks,
                                 ohash_qlookup(&mlinks, buf)))                      ohash_qlookup(&mlinks, buf)))
                         goto nextlink;                          goto nextlink;
                 if (warnings)                  if (warnings)
                         say(mlink->file, "Man source exists: %s", buf);                          say(mlink->file, "Man source exists: %s", buf);
Line 904  nextlink:
Line 1008  nextlink:
         }          }
 }  }
   
 static int  static void
 mlink_check(struct mpage *mpage, struct mlink *mlink)  mlink_check(struct mpage *mpage, struct mlink *mlink)
 {  {
         int      match;          struct str      *str;
           unsigned int     slot;
   
         match = 1;  
   
         /*          /*
          * Check whether the manual section given in a file           * Check whether the manual section given in a file
          * agrees with the directory where the file is located.           * agrees with the directory where the file is located.
Line 921  mlink_check(struct mpage *mpage, struct mlink *mlink)
Line 1024  mlink_check(struct mpage *mpage, struct mlink *mlink)
          */           */
   
         if (FORM_SRC == mpage->form &&          if (FORM_SRC == mpage->form &&
             strcasecmp(mpage->sec, mlink->dsec)) {              strcasecmp(mpage->sec, mlink->dsec))
                 match = 0;  
                 say(mlink->file, "Section \"%s\" manual in %s directory",                  say(mlink->file, "Section \"%s\" manual in %s directory",
                     mpage->sec, mlink->dsec);                      mpage->sec, mlink->dsec);
         }  
   
         /*          /*
          * Manual page directories exist for each kernel           * Manual page directories exist for each kernel
Line 940  mlink_check(struct mpage *mpage, struct mlink *mlink)
Line 1041  mlink_check(struct mpage *mpage, struct mlink *mlink)
          * on amd64, i386, sparc, and sparc64.           * on amd64, i386, sparc, and sparc64.
          */           */
   
         if (strcasecmp(mpage->arch, mlink->arch)) {          if (strcasecmp(mpage->arch, mlink->arch))
                 match = 0;  
                 say(mlink->file, "Architecture \"%s\" manual in "                  say(mlink->file, "Architecture \"%s\" manual in "
                     "\"%s\" directory", mpage->arch, mlink->arch);                      "\"%s\" directory", mpage->arch, mlink->arch);
         }  
   
         if (strcasecmp(mpage->title, mlink->name))          /*
                 match = 0;           * XXX
            * parse_cat() doesn't set NAME_TITLE yet.
            */
   
         return(match);          if (FORM_CAT == mpage->form)
                   return;
   
           /*
            * Check whether this mlink
            * appears as a name in the NAME section.
            */
   
           slot = ohash_qlookup(&names, mlink->name);
           str = ohash_find(&names, slot);
           assert(NULL != str);
           if ( ! (NAME_TITLE & str->mask))
                   say(mlink->file, "Name missing in NAME section");
 }  }
   
 /*  /*
Line 964  mpages_merge(struct mchars *mc, struct mparse *mp)
Line 1077  mpages_merge(struct mchars *mc, struct mparse *mp)
 {  {
         char                     any[] = "any";          char                     any[] = "any";
         struct ohash_info        str_info;          struct ohash_info        str_info;
           int                      fd[2];
         struct mpage            *mpage, *mpage_dest;          struct mpage            *mpage, *mpage_dest;
         struct mlink            *mlink, *mlink_dest;          struct mlink            *mlink, *mlink_dest;
         struct mdoc             *mdoc;          struct mdoc             *mdoc;
         struct man              *man;          struct man              *man;
         char                    *sodest;          char                    *sodest;
         char                    *cp;          char                    *cp;
         int                      match;          pid_t                    child_pid;
           int                      status;
         unsigned int             pslot;          unsigned int             pslot;
         enum mandoclevel         lvl;          enum mandoclevel         lvl;
   
Line 990  mpages_merge(struct mchars *mc, struct mparse *mp)
Line 1105  mpages_merge(struct mchars *mc, struct mparse *mp)
                         continue;                          continue;
                 }                  }
   
                   name_mask = NAME_MASK;
                   ohash_init(&names, 4, &str_info);
                 ohash_init(&strings, 6, &str_info);                  ohash_init(&strings, 6, &str_info);
                 mparse_reset(mp);                  mparse_reset(mp);
                 mdoc = NULL;                  mdoc = NULL;
                 man = NULL;                  man = NULL;
                   sodest = NULL;
                   child_pid = 0;
                   fd[0] = -1;
                   fd[1] = -1;
   
                   if (mpage->mlinks->gzip) {
                           if (-1 == pipe(fd)) {
                                   exitcode = (int)MANDOCLEVEL_SYSERR;
                                   say(mpage->mlinks->file, "&pipe gunzip");
                                   goto nextpage;
                           }
                           switch (child_pid = fork()) {
                           case -1:
                                   exitcode = (int)MANDOCLEVEL_SYSERR;
                                   say(mpage->mlinks->file, "&fork gunzip");
                                   child_pid = 0;
                                   close(fd[1]);
                                   close(fd[0]);
                                   goto nextpage;
                           case 0:
                                   close(fd[0]);
                                   if (-1 == dup2(fd[1], STDOUT_FILENO)) {
                                           say(mpage->mlinks->file,
                                               "&dup gunzip");
                                           exit(1);
                                   }
                                   execlp("gunzip", "gunzip", "-c",
                                       mpage->mlinks->file, NULL);
                                   say(mpage->mlinks->file, "&exec gunzip");
                                   exit(1);
                           default:
                                   close(fd[1]);
                                   break;
                           }
                   }
   
                 /*                  /*
                  * Try interpreting the file as mdoc(7) or man(7)                   * Try interpreting the file as mdoc(7) or man(7)
                  * source code, unless it is already known to be                   * source code, unless it is already known to be
Line 1002  mpages_merge(struct mchars *mc, struct mparse *mp)
Line 1154  mpages_merge(struct mchars *mc, struct mparse *mp)
                  */                   */
                 if (FORM_CAT != mpage->mlinks->dform ||                  if (FORM_CAT != mpage->mlinks->dform ||
                     FORM_CAT != mpage->mlinks->fform) {                      FORM_CAT != mpage->mlinks->fform) {
                         lvl = mparse_readfd(mp, -1, mpage->mlinks->file);                          lvl = mparse_readfd(mp, fd[0], mpage->mlinks->file);
                         if (lvl < MANDOCLEVEL_FATAL)                          if (lvl < MANDOCLEVEL_FATAL)
                                 mparse_result(mp, &mdoc, &man, &sodest);                                  mparse_result(mp, &mdoc, &man, &sodest);
                 }                  }
Line 1028  mpages_merge(struct mchars *mc, struct mparse *mp)
Line 1180  mpages_merge(struct mchars *mc, struct mparse *mp)
                                          * to the target.                                           * to the target.
                                          */                                           */
   
                                         if (mpage_dest->recno)                                          if (mpage_dest->pageid)
                                                 dbadd_mlink(mlink);                                                  dbadd_mlink(mlink);
   
                                         if (NULL == mlink->next)                                          if (NULL == mlink->next)
Line 1042  mpages_merge(struct mchars *mc, struct mparse *mp)
Line 1194  mpages_merge(struct mchars *mc, struct mparse *mp)
                                 mlink_dest->next = mpage->mlinks;                                  mlink_dest->next = mpage->mlinks;
                                 mpage->mlinks = NULL;                                  mpage->mlinks = NULL;
                         }                          }
                         ohash_delete(&strings);                          goto nextpage;
                         mpage = ohash_next(&mpages, &pslot);  
                         continue;  
                 } else if (NULL != mdoc) {                  } else if (NULL != mdoc) {
                         mpage->form = FORM_SRC;                          mpage->form = FORM_SRC;
                         mpage->sec =                          mpage->sec =
Line 1082  mpages_merge(struct mchars *mc, struct mparse *mp)
Line 1232  mpages_merge(struct mchars *mc, struct mparse *mp)
                                 putkey(mpage, mlink->fsec, TYPE_sec);                                  putkey(mpage, mlink->fsec, TYPE_sec);
                         putkey(mpage, '\0' == *mlink->arch ?                          putkey(mpage, '\0' == *mlink->arch ?
                             any : mlink->arch, TYPE_arch);                              any : mlink->arch, TYPE_arch);
                         putkey(mpage, mlink->name, TYPE_Nm);                          putkey(mpage, mlink->name, NAME_FILE);
                 }                  }
   
                 if (warnings && !use_all) {                  assert(NULL == mpage->desc);
                         match = 0;  
                         for (mlink = mpage->mlinks; mlink;  
                              mlink = mlink->next)  
                                 if (mlink_check(mpage, mlink))  
                                         match = 1;  
                 } else  
                         match = 1;  
   
                 if (NULL != mdoc) {                  if (NULL != mdoc) {
                         if (NULL != (cp = mdoc_meta(mdoc)->name))                          if (NULL != (cp = mdoc_meta(mdoc)->name))
                                 putkey(mpage, cp, TYPE_Nm);                                  putkey(mpage, cp, NAME_HEAD);
                         assert(NULL == mpage->desc);  
                         parse_mdoc(mpage, mdoc_node(mdoc));                          parse_mdoc(mpage, mdoc_node(mdoc));
                         putkey(mpage, NULL != mpage->desc ?  
                             mpage->desc : mpage->mlinks->name, TYPE_Nd);  
                 } else if (NULL != man)                  } else if (NULL != man)
                         parse_man(mpage, man_node(man));                          parse_man(mpage, man_node(man));
                 else                  else
                         parse_cat(mpage);                          parse_cat(mpage, fd[0]);
                   if (NULL == mpage->desc)
                           mpage->desc = mandoc_strdup(mpage->mlinks->name);
   
                   if (warnings && !use_all)
                           for (mlink = mpage->mlinks; mlink;
                                mlink = mlink->next)
                                   mlink_check(mpage, mlink);
   
                 dbadd(mpage, mc);                  dbadd(mpage, mc);
   
   nextpage:
                   if (child_pid) {
                           if (-1 == waitpid(child_pid, &status, 0)) {
                                   exitcode = (int)MANDOCLEVEL_SYSERR;
                                   say(mpage->mlinks->file, "&wait gunzip");
                           } else if (WIFSIGNALED(status)) {
                                   exitcode = (int)MANDOCLEVEL_SYSERR;
                                   say(mpage->mlinks->file,
                                       "gunzip died from signal %d",
                                       WTERMSIG(status));
                           } else if (WEXITSTATUS(status)) {
                                   exitcode = (int)MANDOCLEVEL_SYSERR;
                                   say(mpage->mlinks->file,
                                       "gunzip failed with code %d",
                                       WEXITSTATUS(status));
                           }
                   }
                 ohash_delete(&strings);                  ohash_delete(&strings);
                   ohash_delete(&names);
                 mpage = ohash_next(&mpages, &pslot);                  mpage = ohash_next(&mpages, &pslot);
         }          }
   
Line 1116  mpages_merge(struct mchars *mc, struct mparse *mp)
Line 1281  mpages_merge(struct mchars *mc, struct mparse *mp)
 }  }
   
 static void  static void
 parse_cat(struct mpage *mpage)  names_check(void)
 {  {
           sqlite3_stmt    *stmt;
           const char      *name, *sec, *arch, *key;
           int              irc;
   
           sqlite3_prepare_v2(db,
             "SELECT name, sec, arch, key FROM ("
               "SELECT name AS key, pageid FROM names "
               "WHERE bits & ? AND NOT EXISTS ("
                 "SELECT pageid FROM mlinks "
                 "WHERE mlinks.pageid == names.pageid "
                 "AND mlinks.name == names.name"
               ")"
             ") JOIN ("
               "SELECT sec, arch, name, pageid FROM mlinks "
               "GROUP BY pageid"
             ") USING (pageid);",
             -1, &stmt, NULL);
   
           if (SQLITE_OK != sqlite3_bind_int64(stmt, 1, NAME_TITLE))
                   say("", "%s", sqlite3_errmsg(db));
   
           while (SQLITE_ROW == (irc = sqlite3_step(stmt))) {
                   name = sqlite3_column_text(stmt, 0);
                   sec  = sqlite3_column_text(stmt, 1);
                   arch = sqlite3_column_text(stmt, 2);
                   key  = sqlite3_column_text(stmt, 3);
                   say("", "%s(%s%s%s) lacks mlink \"%s\"", name, sec,
                       '\0' == *arch ? "" : "/",
                       '\0' == *arch ? "" : arch, key);
           }
           sqlite3_finalize(stmt);
   }
   
   static void
   parse_cat(struct mpage *mpage, int fd)
   {
         FILE            *stream;          FILE            *stream;
         char            *line, *p, *title;          char            *line, *p, *title;
         size_t           len, plen, titlesz;          size_t           len, plen, titlesz;
   
         if (NULL == (stream = fopen(mpage->mlinks->file, "r"))) {          stream = (-1 == fd) ?
               fopen(mpage->mlinks->file, "r") :
               fdopen(fd, "r");
           if (NULL == stream) {
                 if (warnings)                  if (warnings)
                         say(mpage->mlinks->file, "&fopen");                          say(mpage->mlinks->file, "&fopen");
                 return;                  return;
Line 1142  parse_cat(struct mpage *mpage)
Line 1346  parse_cat(struct mpage *mpage)
         while (NULL != (line = fgetln(stream, &len)))          while (NULL != (line = fgetln(stream, &len)))
                 if ('\n' != *line && ' ' != *line)                  if ('\n' != *line && ' ' != *line)
                         break;                          break;
   
         /*          /*
          * Read up until the next section into a buffer.           * Read up until the next section into a buffer.
          * Strip the leading and trailing newline from each read line,           * Strip the leading and trailing newline from each read line,
Line 1179  parse_cat(struct mpage *mpage)
Line 1383  parse_cat(struct mpage *mpage)
                 if (warnings)                  if (warnings)
                         say(mpage->mlinks->file,                          say(mpage->mlinks->file,
                             "Cannot find NAME section");                              "Cannot find NAME section");
                 assert(NULL == mpage->desc);  
                 mpage->desc = mandoc_strdup(mpage->mlinks->name);  
                 putkey(mpage, mpage->mlinks->name, TYPE_Nd);  
                 fclose(stream);                  fclose(stream);
                 free(title);                  free(title);
                 return;                  return;
Line 1215  parse_cat(struct mpage *mpage)
Line 1416  parse_cat(struct mpage *mpage)
                 if (0 == len) {                  if (0 == len) {
                         memmove(line, line + 1, plen--);                          memmove(line, line + 1, plen--);
                         continue;                          continue;
                 }                  }
                 memmove(line - 1, line + 1, plen - len);                  memmove(line - 1, line + 1, plen - len);
                 plen -= 2;                  plen -= 2;
         }          }
   
         assert(NULL == mpage->desc);  
         mpage->desc = mandoc_strdup(p);          mpage->desc = mandoc_strdup(p);
         putkey(mpage, mpage->desc, TYPE_Nd);  
         fclose(stream);          fclose(stream);
         free(title);          free(title);
 }  }
Line 1281  parse_man(struct mpage *mpage, const struct man_node *
Line 1480  parse_man(struct mpage *mpage, const struct man_node *
                 body = n;                  body = n;
                 assert(body->parent);                  assert(body->parent);
                 if (NULL != (head = body->parent->head) &&                  if (NULL != (head = body->parent->head) &&
                                 1 == head->nchild &&                      1 == head->nchild &&
                                 NULL != (head = (head->child)) &&                      NULL != (head = (head->child)) &&
                                 MAN_TEXT == head->type &&                      MAN_TEXT == head->type &&
                                 0 == strcmp(head->string, "NAME") &&                      0 == strcmp(head->string, "NAME") &&
                                 NULL != body->child) {                      NULL != body->child) {
   
                         /*                          /*
                          * Suck the entire NAME section into memory.                           * Suck the entire NAME section into memory.
Line 1299  parse_man(struct mpage *mpage, const struct man_node *
Line 1498  parse_man(struct mpage *mpage, const struct man_node *
                         if (NULL == title)                          if (NULL == title)
                                 return;                                  return;
   
                         /*                          /*
                          * Go through a special heuristic dance here.                           * Go through a special heuristic dance here.
                          * Conventionally, one or more manual names are                           * Conventionally, one or more manual names are
                          * comma-specified prior to a whitespace, then a                           * comma-specified prior to a whitespace, then a
Line 1325  parse_man(struct mpage *mpage, const struct man_node *
Line 1524  parse_man(struct mpage *mpage, const struct man_node *
                                     ('\\' == start[0] && '-' == start[1]))                                      ('\\' == start[0] && '-' == start[1]))
                                         break;                                          break;
   
                                 putkey(mpage, start, TYPE_Nm);                                  putkey(mpage, start, NAME_TITLE);
   
                                 if (' ' == byte) {                                  if (' ' == byte) {
                                         start += sz + 1;                                          start += sz + 1;
Line 1339  parse_man(struct mpage *mpage, const struct man_node *
Line 1538  parse_man(struct mpage *mpage, const struct man_node *
                         }                          }
   
                         if (start == title) {                          if (start == title) {
                                 putkey(mpage, start, TYPE_Nm);                                  putkey(mpage, start, NAME_TITLE);
                                 free(title);                                  free(title);
                                 return;                                  return;
                         }                          }
Line 1361  parse_man(struct mpage *mpage, const struct man_node *
Line 1560  parse_man(struct mpage *mpage, const struct man_node *
                         while (' ' == *start)                          while (' ' == *start)
                                 start++;                                  start++;
   
                         assert(NULL == mpage->desc);  
                         mpage->desc = mandoc_strdup(start);                          mpage->desc = mandoc_strdup(start);
                         putkey(mpage, mpage->desc, TYPE_Nd);  
                         free(title);                          free(title);
                         return;                          return;
                 }                  }
Line 1383  parse_mdoc(struct mpage *mpage, const struct mdoc_node
Line 1580  parse_mdoc(struct mpage *mpage, const struct mdoc_node
         assert(NULL != n);          assert(NULL != n);
         for (n = n->child; NULL != n; n = n->next) {          for (n = n->child; NULL != n; n = n->next) {
                 switch (n->type) {                  switch (n->type) {
                 case (MDOC_ELEM):                  case MDOC_ELEM:
                         /* FALLTHROUGH */                          /* FALLTHROUGH */
                 case (MDOC_BLOCK):                  case MDOC_BLOCK:
                         /* FALLTHROUGH */                          /* FALLTHROUGH */
                 case (MDOC_HEAD):                  case MDOC_HEAD:
                         /* FALLTHROUGH */                          /* FALLTHROUGH */
                 case (MDOC_BODY):                  case MDOC_BODY:
                         /* FALLTHROUGH */                          /* FALLTHROUGH */
                 case (MDOC_TAIL):                  case MDOC_TAIL:
                         if (NULL != mdocs[n->tok].fp)                          if (NULL != mdocs[n->tok].fp)
                                if (0 == (*mdocs[n->tok].fp)(mpage, n))                                 if (0 == (*mdocs[n->tok].fp)(mpage, n))
                                        break;                                         break;
Line 1415  parse_mdoc_Fd(struct mpage *mpage, const struct mdoc_n
Line 1612  parse_mdoc_Fd(struct mpage *mpage, const struct mdoc_n
         size_t           sz;          size_t           sz;
   
         if (SEC_SYNOPSIS != n->sec ||          if (SEC_SYNOPSIS != n->sec ||
                         NULL == (n = n->child) ||              NULL == (n = n->child) ||
                         MDOC_TEXT != n->type)              MDOC_TEXT != n->type)
                 return(0);                  return(0);
   
         /*          /*
Line 1459  parse_mdoc_Fn(struct mpage *mpage, const struct mdoc_n
Line 1656  parse_mdoc_Fn(struct mpage *mpage, const struct mdoc_n
         if (NULL == (n = n->child) || MDOC_TEXT != n->type)          if (NULL == (n = n->child) || MDOC_TEXT != n->type)
                 return(0);                  return(0);
   
         /*          /*
          * Parse: .Fn "struct type *name" "char *arg".           * Parse: .Fn "struct type *name" "char *arg".
          * First strip away pointer symbol.           * First strip away pointer symbol.
          * Then store the function name, then type.           * Then store the function name, then type.
          * Finally, store the arguments.           * Finally, store the arguments.
          */           */
   
         if (NULL == (cp = strrchr(n->string, ' ')))          if (NULL == (cp = strrchr(n->string, ' ')))
Line 1516  static int
Line 1713  static int
 parse_mdoc_Nm(struct mpage *mpage, const struct mdoc_node *n)  parse_mdoc_Nm(struct mpage *mpage, const struct mdoc_node *n)
 {  {
   
         return(SEC_NAME == n->sec ||          if (SEC_NAME == n->sec)
             (SEC_SYNOPSIS == n->sec && MDOC_HEAD == n->type));                  putmdockey(mpage, n->child, NAME_TITLE);
           else if (SEC_SYNOPSIS == n->sec && MDOC_HEAD == n->type)
                   putmdockey(mpage, n->child, NAME_SYN);
           return(0);
 }  }
   
 static int  static int
Line 1550  static void
Line 1750  static void
 putkeys(const struct mpage *mpage,  putkeys(const struct mpage *mpage,
         const char *cp, size_t sz, uint64_t v)          const char *cp, size_t sz, uint64_t v)
 {  {
           struct ohash    *htab;
         struct str      *s;          struct str      *s;
         const char      *end;          const char      *end;
         uint64_t         mask;  
         unsigned int     slot;          unsigned int     slot;
         int              i;          int              i;
   
         if (0 == sz)          if (0 == sz)
                 return;                  return;
   
         if (verb > 1) {          if (TYPE_Nm & v) {
                 for (i = 0, mask = 1;                  htab = &names;
                      i < mansearch_keymax;                  v &= name_mask;
                      i++, mask <<= 1)                  name_mask &= ~NAME_FIRST;
                         if (mask & v)                  if (debug > 1)
                                 break;                          say(mpage->mlinks->file,
                 say(mpage->mlinks->file, "Adding key %s=%*s",                              "Adding name %*s", sz, cp);
                     mansearch_keynames[i], sz, cp);          } else {
                   htab = &strings;
                   if (debug > 1)
                       for (i = 0; i < mansearch_keymax; i++)
                           if (1 << i & v)
                               say(mpage->mlinks->file,
                                   "Adding key %s=%*s",
                                   mansearch_keynames[i], sz, cp);
         }          }
   
         end = cp + sz;          end = cp + sz;
         slot = ohash_qlookupi(&strings, cp, &end);          slot = ohash_qlookupi(htab, cp, &end);
         s = ohash_find(&strings, slot);          s = ohash_find(htab, slot);
   
         if (NULL != s && mpage == s->mpage) {          if (NULL != s && mpage == s->mpage) {
                 s->mask |= v;                  s->mask |= v;
                 return;                  return;
         } else if (NULL == s) {          } else if (NULL == s) {
                 s = mandoc_calloc(sizeof(struct str) + sz + 1, 1);                  s = mandoc_calloc(1, sizeof(struct str) + sz + 1);
                 memcpy(s->key, cp, sz);                  memcpy(s->key, cp, sz);
                 ohash_insert(&strings, slot, s);                  ohash_insert(htab, slot, s);
         }          }
         s->mpage = mpage;          s->mpage = mpage;
         s->mask = v;          s->mask = v;
Line 1670  render_key(struct mchars *mc, struct str *key)
Line 1877  render_key(struct mchars *mc, struct str *key)
         if (strcspn(val, res) == bsz) {          if (strcspn(val, res) == bsz) {
                 key->rendered = key->key;                  key->rendered = key->key;
                 return;                  return;
         }          }
   
         /* Pre-allocate by the length of the input */          /* Pre-allocate by the length of the input */
   
Line 1690  render_key(struct mchars *mc, struct str *key)
Line 1897  render_key(struct mchars *mc, struct str *key)
                 }                  }
   
                 switch (*val) {                  switch (*val) {
                 case (ASCII_HYPH):                  case ASCII_HYPH:
                         buf[pos++] = '-';                          buf[pos++] = '-';
                         val++;                          val++;
                         continue;                          continue;
                 case ('\t'):                  case '\t':
                         /* FALLTHROUGH */                          /* FALLTHROUGH */
                 case (ASCII_NBRSP):                  case ASCII_NBRSP:
                         buf[pos++] = ' ';                          buf[pos++] = ' ';
                         val++;                          val++;
                         /* FALLTHROUGH */                          /* FALLTHROUGH */
                 case (ASCII_BREAK):                  case ASCII_BREAK:
                         continue;                          continue;
                 default:                  default:
                         break;                          break;
Line 1717  render_key(struct mchars *mc, struct str *key)
Line 1924  render_key(struct mchars *mc, struct str *key)
                  * predefined character or special character.                   * predefined character or special character.
                  */                   */
   
                 esc = mandoc_escape                  esc = mandoc_escape((const char **)&val,
                         ((const char **)&val, &seq, &len);                      &seq, &len);
                 if (ESCAPE_ERROR == esc)                  if (ESCAPE_ERROR == esc)
                         break;                          break;
                 if (ESCAPE_SPECIAL != esc)                  if (ESCAPE_SPECIAL != esc)
Line 1767  dbadd_mlink(const struct mlink *mlink)
Line 1974  dbadd_mlink(const struct mlink *mlink)
         SQL_BIND_TEXT(stmts[STMT_INSERT_LINK], i, mlink->dsec);          SQL_BIND_TEXT(stmts[STMT_INSERT_LINK], i, mlink->dsec);
         SQL_BIND_TEXT(stmts[STMT_INSERT_LINK], i, mlink->arch);          SQL_BIND_TEXT(stmts[STMT_INSERT_LINK], i, mlink->arch);
         SQL_BIND_TEXT(stmts[STMT_INSERT_LINK], i, mlink->name);          SQL_BIND_TEXT(stmts[STMT_INSERT_LINK], i, mlink->name);
         SQL_BIND_INT64(stmts[STMT_INSERT_LINK], i, mlink->mpage->recno);          SQL_BIND_INT64(stmts[STMT_INSERT_LINK], i, mlink->mpage->pageid);
         SQL_STEP(stmts[STMT_INSERT_LINK]);          SQL_STEP(stmts[STMT_INSERT_LINK]);
         sqlite3_reset(stmts[STMT_INSERT_LINK]);          sqlite3_reset(stmts[STMT_INSERT_LINK]);
 }  }
Line 1786  dbadd(struct mpage *mpage, struct mchars *mc)
Line 1993  dbadd(struct mpage *mpage, struct mchars *mc)
         size_t           i;          size_t           i;
         unsigned int     slot;          unsigned int     slot;
   
         if (verb)          mlink = mpage->mlinks;
                 say(mpage->mlinks->file, "Adding to database");  
   
         if (nodb)          if (nodb) {
                   if (0 == debug)
                           return;
                   while (NULL != mlink) {
                           fputs(mlink->name, stdout);
                           if (NULL == mlink->next ||
                               strcmp(mlink->dsec, mlink->next->dsec) ||
                               strcmp(mlink->fsec, mlink->next->fsec) ||
                               strcmp(mlink->arch, mlink->next->arch)) {
                                   putchar('(');
                                   if ('\0' == *mlink->dsec)
                                           fputs(mlink->fsec, stdout);
                                   else
                                           fputs(mlink->dsec, stdout);
                                   if ('\0' != *mlink->arch)
                                           printf("/%s", mlink->arch);
                                   putchar(')');
                           }
                           mlink = mlink->next;
                           if (NULL != mlink)
                                   fputs(", ", stdout);
                   }
                   printf(" - %s\n", mpage->desc);
                 return;                  return;
           }
   
           if (debug)
                   say(mlink->file, "Adding to database");
   
         i = 1;          i = 1;
           SQL_BIND_TEXT(stmts[STMT_INSERT_PAGE], i, mpage->desc);
         SQL_BIND_INT(stmts[STMT_INSERT_PAGE], i, FORM_SRC == mpage->form);          SQL_BIND_INT(stmts[STMT_INSERT_PAGE], i, FORM_SRC == mpage->form);
         SQL_STEP(stmts[STMT_INSERT_PAGE]);          SQL_STEP(stmts[STMT_INSERT_PAGE]);
         mpage->recno = sqlite3_last_insert_rowid(db);          mpage->pageid = sqlite3_last_insert_rowid(db);
         sqlite3_reset(stmts[STMT_INSERT_PAGE]);          sqlite3_reset(stmts[STMT_INSERT_PAGE]);
   
         for (mlink = mpage->mlinks; mlink; mlink = mlink->next)          while (NULL != mlink) {
                 dbadd_mlink(mlink);                  dbadd_mlink(mlink);
                   mlink = mlink->next;
           }
           mlink = mpage->mlinks;
   
           for (key = ohash_first(&names, &slot); NULL != key;
                key = ohash_next(&names, &slot)) {
                   assert(key->mpage == mpage);
                   if (NULL == key->rendered)
                           render_key(mc, key);
                   i = 1;
                   SQL_BIND_INT64(stmts[STMT_INSERT_NAME], i, key->mask);
                   SQL_BIND_TEXT(stmts[STMT_INSERT_NAME], i, key->rendered);
                   SQL_BIND_INT64(stmts[STMT_INSERT_NAME], i, mpage->pageid);
                   SQL_STEP(stmts[STMT_INSERT_NAME]);
                   sqlite3_reset(stmts[STMT_INSERT_NAME]);
                   if (key->rendered != key->key)
                           free(key->rendered);
                   free(key);
           }
         for (key = ohash_first(&strings, &slot); NULL != key;          for (key = ohash_first(&strings, &slot); NULL != key;
              key = ohash_next(&strings, &slot)) {               key = ohash_next(&strings, &slot)) {
                 assert(key->mpage == mpage);                  assert(key->mpage == mpage);
Line 1809  dbadd(struct mpage *mpage, struct mchars *mc)
Line 2060  dbadd(struct mpage *mpage, struct mchars *mc)
                 i = 1;                  i = 1;
                 SQL_BIND_INT64(stmts[STMT_INSERT_KEY], i, key->mask);                  SQL_BIND_INT64(stmts[STMT_INSERT_KEY], i, key->mask);
                 SQL_BIND_TEXT(stmts[STMT_INSERT_KEY], i, key->rendered);                  SQL_BIND_TEXT(stmts[STMT_INSERT_KEY], i, key->rendered);
                 SQL_BIND_INT64(stmts[STMT_INSERT_KEY], i, mpage->recno);                  SQL_BIND_INT64(stmts[STMT_INSERT_KEY], i, mpage->pageid);
                 SQL_STEP(stmts[STMT_INSERT_KEY]);                  SQL_STEP(stmts[STMT_INSERT_KEY]);
                 sqlite3_reset(stmts[STMT_INSERT_KEY]);                  sqlite3_reset(stmts[STMT_INSERT_KEY]);
                 if (key->rendered != key->key)                  if (key->rendered != key->key)
Line 1832  dbprune(void)
Line 2083  dbprune(void)
         for (mpage = ohash_first(&mpages, &slot); NULL != mpage;          for (mpage = ohash_first(&mpages, &slot); NULL != mpage;
              mpage = ohash_next(&mpages, &slot)) {               mpage = ohash_next(&mpages, &slot)) {
                 mlink = mpage->mlinks;                  mlink = mpage->mlinks;
                 if (verb)                  if (debug)
                         say(mlink->file, "Deleting from database");                          say(mlink->file, "Deleting from database");
                 if (nodb)                  if (nodb)
                         continue;                          continue;
Line 1887  dbclose(int real)
Line 2138  dbclose(int real)
         }          }
   
         switch (child = fork()) {          switch (child = fork()) {
         case (-1):          case -1:
                 exitcode = (int)MANDOCLEVEL_SYSERR;                  exitcode = (int)MANDOCLEVEL_SYSERR;
                 say("", "&fork cmp");                  say("", "&fork cmp");
                 return;                  return;
         case (0):          case 0:
                 execlp("cmp", "cmp", "-s",                  execlp("cmp", "cmp", "-s",
                     tempfilename, MANDOC_DB, NULL);                      tempfilename, MANDOC_DB, NULL);
                 say("", "&exec cmp");                  say("", "&exec cmp");
Line 1913  dbclose(int real)
Line 2164  dbclose(int real)
   
         *strrchr(tempfilename, '/') = '\0';          *strrchr(tempfilename, '/') = '\0';
         switch (child = fork()) {          switch (child = fork()) {
         case (-1):          case -1:
                 exitcode = (int)MANDOCLEVEL_SYSERR;                  exitcode = (int)MANDOCLEVEL_SYSERR;
                 say("", "&fork rm");                  say("", "&fork rm");
                 return;                  return;
         case (0):          case 0:
                 execlp("rm", "rm", "-rf", tempfilename, NULL);                  execlp("rm", "rm", "-rf", tempfilename, NULL);
                 say("", "&exec rm");                  say("", "&exec rm");
                 exit((int)MANDOCLEVEL_SYSERR);                  exit((int)MANDOCLEVEL_SYSERR);
Line 1948  dbopen(int real)
Line 2199  dbopen(int real)
         const char      *sql;          const char      *sql;
         int              rc, ofl;          int              rc, ofl;
   
         if (nodb)          if (nodb)
                 return(1);                  return(1);
   
         *tempfilename = '\0';          *tempfilename = '\0';
Line 1968  dbopen(int real)
Line 2219  dbopen(int real)
   
         remove(MANDOC_DB "~");          remove(MANDOC_DB "~");
         rc = sqlite3_open_v2(MANDOC_DB "~", &db, ofl, NULL);          rc = sqlite3_open_v2(MANDOC_DB "~", &db, ofl, NULL);
         if (SQLITE_OK == rc)          if (SQLITE_OK == rc)
                 goto create_tables;                  goto create_tables;
         if (MPARSE_QUICK & mparse_options) {          if (MPARSE_QUICK & mparse_options) {
                 exitcode = (int)MANDOCLEVEL_SYSERR;                  exitcode = (int)MANDOCLEVEL_SYSERR;
Line 1976  dbopen(int real)
Line 2227  dbopen(int real)
                 return(0);                  return(0);
         }          }
   
         if (strlcpy(tempfilename, "/tmp/mandocdb.XXXXXX",          (void)strlcpy(tempfilename, "/tmp/mandocdb.XXXXXX",
             sizeof(tempfilename)) >= sizeof(tempfilename)) {              sizeof(tempfilename));
                 exitcode = (int)MANDOCLEVEL_SYSERR;  
                 say("", "/tmp/mandocdb.XXXXXX: Filename too long");  
                 return(0);  
         }  
         if (NULL == mkdtemp(tempfilename)) {          if (NULL == mkdtemp(tempfilename)) {
                 exitcode = (int)MANDOCLEVEL_SYSERR;                  exitcode = (int)MANDOCLEVEL_SYSERR;
                 say("", "&%s", tempfilename);                  say("", "&%s", tempfilename);
                 return(0);                  return(0);
         }          }
         if (strlcat(tempfilename, "/" MANDOC_DB,          (void)strlcat(tempfilename, "/" MANDOC_DB,
             sizeof(tempfilename)) >= sizeof(tempfilename)) {              sizeof(tempfilename));
                 exitcode = (int)MANDOCLEVEL_SYSERR;  
                 say("", "%s/" MANDOC_DB ": Filename too long",  
                     tempfilename);  
                 return(0);  
         }  
         rc = sqlite3_open_v2(tempfilename, &db, ofl, NULL);          rc = sqlite3_open_v2(tempfilename, &db, ofl, NULL);
         if (SQLITE_OK != rc) {          if (SQLITE_OK != rc) {
                 exitcode = (int)MANDOCLEVEL_SYSERR;                  exitcode = (int)MANDOCLEVEL_SYSERR;
Line 2003  dbopen(int real)
Line 2245  dbopen(int real)
   
 create_tables:  create_tables:
         sql = "CREATE TABLE \"mpages\" (\n"          sql = "CREATE TABLE \"mpages\" (\n"
                 " \"desc\" TEXT NOT NULL,\n"
               " \"form\" INTEGER NOT NULL,\n"                " \"form\" INTEGER NOT NULL,\n"
               " \"id\" INTEGER PRIMARY KEY AUTOINCREMENT NOT NULL\n"                " \"pageid\" INTEGER PRIMARY KEY AUTOINCREMENT NOT NULL\n"
               ");\n"                ");\n"
               "\n"                "\n"
               "CREATE TABLE \"mlinks\" (\n"                "CREATE TABLE \"mlinks\" (\n"
               " \"sec\" TEXT NOT NULL,\n"                " \"sec\" TEXT NOT NULL,\n"
               " \"arch\" TEXT NOT NULL,\n"                " \"arch\" TEXT NOT NULL,\n"
               " \"name\" TEXT NOT NULL,\n"                " \"name\" TEXT NOT NULL,\n"
               " \"pageid\" INTEGER NOT NULL REFERENCES mpages(id) "                " \"pageid\" INTEGER NOT NULL REFERENCES mpages(pageid) "
                 "ON DELETE CASCADE\n"                  "ON DELETE CASCADE\n"
               ");\n"                ");\n"
                 "CREATE INDEX mlinks_pageid_idx ON mlinks (pageid);\n"
               "\n"                "\n"
                 "CREATE TABLE \"names\" (\n"
                 " \"bits\" INTEGER NOT NULL,\n"
                 " \"name\" TEXT NOT NULL,\n"
                 " \"pageid\" INTEGER NOT NULL REFERENCES mpages(pageid) "
                   "ON DELETE CASCADE\n"
                 ");\n"
                 "\n"
               "CREATE TABLE \"keys\" (\n"                "CREATE TABLE \"keys\" (\n"
               " \"bits\" INTEGER NOT NULL,\n"                " \"bits\" INTEGER NOT NULL,\n"
               " \"key\" TEXT NOT NULL,\n"                " \"key\" TEXT NOT NULL,\n"
               " \"pageid\" INTEGER NOT NULL REFERENCES mpages(id) "                " \"pageid\" INTEGER NOT NULL REFERENCES mpages(pageid) "
                 "ON DELETE CASCADE\n"                  "ON DELETE CASCADE\n"
               ");\n";                ");\n"
                 "CREATE INDEX keys_pageid_idx ON keys (pageid);\n";
   
         if (SQLITE_OK != sqlite3_exec(db, sql, NULL, NULL, NULL)) {          if (SQLITE_OK != sqlite3_exec(db, sql, NULL, NULL, NULL)) {
                 exitcode = (int)MANDOCLEVEL_SYSERR;                  exitcode = (int)MANDOCLEVEL_SYSERR;
Line 2030  create_tables:
Line 2282  create_tables:
   
 prepare_statements:  prepare_statements:
         SQL_EXEC("PRAGMA foreign_keys = ON");          SQL_EXEC("PRAGMA foreign_keys = ON");
         sql = "DELETE FROM mpages WHERE id IN "          sql = "DELETE FROM mpages WHERE pageid IN "
                 "(SELECT pageid FROM mlinks WHERE "                  "(SELECT pageid FROM mlinks WHERE "
                 "sec=? AND arch=? AND name=?)";                  "sec=? AND arch=? AND name=?)";
         sqlite3_prepare_v2(db, sql, -1, &stmts[STMT_DELETE_PAGE], NULL);          sqlite3_prepare_v2(db, sql, -1, &stmts[STMT_DELETE_PAGE], NULL);
         sql = "INSERT INTO mpages "          sql = "INSERT INTO mpages "
                 "(form) VALUES (?)";                  "(desc,form) VALUES (?,?)";
         sqlite3_prepare_v2(db, sql, -1, &stmts[STMT_INSERT_PAGE], NULL);          sqlite3_prepare_v2(db, sql, -1, &stmts[STMT_INSERT_PAGE], NULL);
         sql = "INSERT INTO mlinks "          sql = "INSERT INTO mlinks "
                 "(sec,arch,name,pageid) VALUES (?,?,?,?)";                  "(sec,arch,name,pageid) VALUES (?,?,?,?)";
         sqlite3_prepare_v2(db, sql, -1, &stmts[STMT_INSERT_LINK], NULL);          sqlite3_prepare_v2(db, sql, -1, &stmts[STMT_INSERT_LINK], NULL);
           sql = "INSERT INTO names "
                   "(bits,name,pageid) VALUES (?,?,?)";
           sqlite3_prepare_v2(db, sql, -1, &stmts[STMT_INSERT_NAME], NULL);
         sql = "INSERT INTO keys "          sql = "INSERT INTO keys "
                 "(bits,key,pageid) VALUES (?,?,?)";                  "(bits,key,pageid) VALUES (?,?,?)";
         sqlite3_prepare_v2(db, sql, -1, &stmts[STMT_INSERT_KEY], NULL);          sqlite3_prepare_v2(db, sql, -1, &stmts[STMT_INSERT_KEY], NULL);
Line 2061  static void *
Line 2316  static void *
 hash_halloc(size_t sz, void *arg)  hash_halloc(size_t sz, void *arg)
 {  {
   
         return(mandoc_calloc(sz, 1));          return(mandoc_calloc(1, sz));
 }  }
   
 static void *  static void *
Line 2148  say(const char *file, const char *format, ...)
Line 2403  say(const char *file, const char *format, ...)
         use_errno = 1;          use_errno = 1;
         if (NULL != format) {          if (NULL != format) {
                 switch (*format) {                  switch (*format) {
                 case ('&'):                  case '&':
                         format++;                          format++;
                         break;                          break;
                 case ('\0'):                  case '\0':
                         format = NULL;                          format = NULL;
                         break;                          break;
                 default:                  default:

Legend:
Removed from v.1.123  
changed lines
  Added in v.1.145

CVSweb