[BACK]Return to roff_escape.c CVS log [TXT][DIR] Up to [cvsweb.bsd.lv] / mandoc

Diff for /mandoc/roff_escape.c between version 1.6 and 1.10

version 1.6, 2022/06/01 23:20:26 version 1.10, 2022/06/05 13:54:09
Line 41  mandoc_escape(const char **rendarg, const char **rarg,
Line 41  mandoc_escape(const char **rendarg, const char **rarg,
         int              iarg, iendarg, iend;          int              iarg, iendarg, iend;
         enum mandoc_esc  rval;          enum mandoc_esc  rval;
   
         rval = roff_escape(--*rendarg, 0, 0, NULL, &iarg, &iendarg, &iend);          rval = roff_escape(--*rendarg, 0, 0,
               NULL, NULL, &iarg, &iendarg, &iend);
         assert(rval != ESCAPE_EXPAND);          assert(rval != ESCAPE_EXPAND);
         if (rarg != NULL)          if (rarg != NULL)
                *rarg = *rendarg + iarg;                 *rarg = *rendarg + iarg;
Line 63  mandoc_escape(const char **rendarg, const char **rarg,
Line 64  mandoc_escape(const char **rendarg, const char **rarg,
  */   */
 enum mandoc_esc  enum mandoc_esc
 roff_escape(const char *buf, const int ln, const int aesc,  roff_escape(const char *buf, const int ln, const int aesc,
     int *resc, int *rarg, int *rendarg, int *rend)      int *resc, int *rnam, int *rarg, int *rendarg, int *rend)
 {  {
         int              iesc;          /* index of leading escape char */          int              iesc;          /* index of leading escape char */
           int              inam;          /* index of escape name */
         int              iarg;          /* index beginning the argument */          int              iarg;          /* index beginning the argument */
         int              iendarg;       /* index right after the argument */          int              iendarg;       /* index right after the argument */
         int              iend;          /* index right after the sequence */          int              iend;          /* index right after the sequence */
         int              sesc, sarg, sendarg, send; /* for sub-escape */          int              sesc, snam, sarg, sendarg, send; /* for sub-escape */
         int              maxl;          /* expected length of the argument */          int              maxl;          /* expected length of the argument */
         int              argl;          /* actual length of the argument */          int              argl;          /* actual length of the argument */
         int              c, i;          /* for \[char...] parsing */          int              c, i;          /* for \[char...] parsing */
         int              valid_A;       /* for \A parsing */          int              valid_A;       /* for \A parsing */
         enum mandoc_esc  rval;          /* return value */          enum mandoc_esc  rval;          /* return value */
         enum mandocerr   err;           /* diagnostic code */          enum mandocerr   err;           /* diagnostic code */
         char             esc_name;  
         char             term;          /* byte terminating the argument */          char             term;          /* byte terminating the argument */
   
         /*          /*
Line 84  roff_escape(const char *buf, const int ln, const int a
Line 85  roff_escape(const char *buf, const int ln, const int a
          * it only makes a difference in copy mode.           * it only makes a difference in copy mode.
          */           */
   
         iesc = iarg = aesc;          iesc = inam = aesc;
         do {          do {
                 iarg++;                  inam++;
         } while (buf[iarg] == 'E');          } while (buf[inam] == 'E');
   
         /*          /*
          * Sort the following cases first by syntax category,           * Sort the following cases first by syntax category,
          * then by escape sequence type, and finally by ASCII code.           * then by escape sequence type, and finally by ASCII code.
          */           */
   
         esc_name = buf[iarg];          iarg = iendarg = iend = inam + 1;
         iendarg = iend = ++iarg;  
         maxl = INT_MAX;          maxl = INT_MAX;
         term = '\0';          term = '\0';
         switch (esc_name) {          err = MANDOCERR_OK;
           switch (buf[inam]) {
   
         /* Escape sequences taking no arguments at all. */          /* Escape sequences taking no arguments at all. */
   
Line 127  roff_escape(const char *buf, const int ln, const int a
Line 128  roff_escape(const char *buf, const int ln, const int a
         case '\0':          case '\0':
                 iendarg = --iend;                  iendarg = --iend;
                 /* FALLTHROUGH */                  /* FALLTHROUGH */
           case '.':
         case '\\':          case '\\':
         default:          default:
                 iarg--;                  iarg--;
Line 136  roff_escape(const char *buf, const int ln, const int a
Line 138  roff_escape(const char *buf, const int ln, const int a
         case ' ':          case ' ':
         case '\'':          case '\'':
         case '-':          case '-':
         case '.':  
         case '0':          case '0':
         case ':':          case ':':
         case '_':          case '_':
Line 269  roff_escape(const char *buf, const int ln, const int a
Line 270  roff_escape(const char *buf, const int ln, const int a
   
         if ((term == '\b' || (term == '\0' && maxl == INT_MAX)) &&          if ((term == '\b' || (term == '\0' && maxl == INT_MAX)) &&
             buf[iarg] == buf[iesc] && roff_escape(buf, ln, iendarg,              buf[iarg] == buf[iesc] && roff_escape(buf, ln, iendarg,
             &sesc, &sarg, &sendarg, &send) == ESCAPE_EXPAND)              &sesc, &snam, &sarg, &sendarg, &send) == ESCAPE_EXPAND)
                 goto out_sub;                  goto out_sub;
   
         if (term == '\b') {          if (term == '\b') {
                 if ((esc_name == 'N' && isdigit((unsigned char)buf[iarg])) ||                  if ((buf[inam] == 'N' && isdigit((unsigned char)buf[iarg])) ||
                     (esc_name == 'h' && strchr(" %&()*+-./0123456789:<=>",                      (buf[inam] == 'h' && strchr(" %&()*+-./0123456789:<=>",
                      buf[iarg]) != NULL)) {                       buf[iarg]) != NULL)) {
                         iendarg = iend = iarg + 1;                          iendarg = iend = iarg + 1;
                         rval = ESCAPE_ERROR;                          rval = ESCAPE_ERROR;
Line 282  roff_escape(const char *buf, const int ln, const int a
Line 283  roff_escape(const char *buf, const int ln, const int a
                 }                  }
                 term = buf[iarg++];                  term = buf[iarg++];
         } else if (term == '\0' && maxl == INT_MAX) {          } else if (term == '\0' && maxl == INT_MAX) {
                 if (esc_name == 'n' && (buf[iarg] == '+' || buf[iarg] == '-'))                  if (buf[inam] == 'n' && (buf[iarg] == '+' || buf[iarg] == '-'))
                         iarg++;                          iarg++;
                 switch (buf[iarg]) {                  switch (buf[iarg]) {
                 case '(':                  case '(':
Line 309  roff_escape(const char *buf, const int ln, const int a
Line 310  roff_escape(const char *buf, const int ln, const int a
         iendarg = iarg;          iendarg = iarg;
         while (maxl > 0) {          while (maxl > 0) {
                 if (buf[iendarg] == '\0') {                  if (buf[iendarg] == '\0') {
                           err = MANDOCERR_ESC_INCOMPLETE;
                           if (rval != ESCAPE_EXPAND)
                                   rval = ESCAPE_ERROR;
                         /* Ignore an incomplete argument except for \w. */                          /* Ignore an incomplete argument except for \w. */
                         if (esc_name != 'w')                          if (buf[inam] != 'w')
                                 iendarg = iarg;                                  iendarg = iarg;
                         break;                          break;
                 }                  }
Line 318  roff_escape(const char *buf, const int ln, const int a
Line 322  roff_escape(const char *buf, const int ln, const int a
                         iend = iendarg + 1;                          iend = iendarg + 1;
                         break;                          break;
                 }                  }
                 if (esc_name == 'N' &&                  if (buf[inam] == 'N' &&
                     isdigit((unsigned char)buf[iendarg]) == 0) {                      isdigit((unsigned char)buf[iendarg]) == 0) {
                         iend = iendarg + 1;                          iend = iendarg + 1;
                         break;                          break;
                 }                  }
                 if (buf[iendarg] == buf[iesc]) {                  if (buf[iendarg] == buf[iesc]) {
                         switch (roff_escape(buf, ln, iendarg,                          switch (roff_escape(buf, ln, iendarg,
                             &sesc, &sarg, &sendarg, &send)) {                              &sesc, &snam, &sarg, &sendarg, &send)) {
                         case ESCAPE_EXPAND:                          case ESCAPE_EXPAND:
                                 goto out_sub;                                  goto out_sub;
                         case ESCAPE_UNDEF:                          case ESCAPE_UNDEF:
Line 343  roff_escape(const char *buf, const int ln, const int a
Line 347  roff_escape(const char *buf, const int ln, const int a
                         iend = ++iendarg;                          iend = ++iendarg;
                 }                  }
         }          }
         if (resc != NULL && ((maxl != INT_MAX && maxl != 0) ||  
             (term != '\0' && buf[iendarg] != term)))  
                 mandoc_msg(MANDOCERR_ESC_BAD, ln, iesc, "%s", buf + iesc);  
   
         /* Post-process depending on the content of the argument. */          /* Post-process depending on the content of the argument. */
   
         argl = iendarg - iarg;          argl = iendarg - iarg;
         switch (esc_name) {          switch (buf[inam]) {
         case '*':          case '*':
                 if (resc == NULL && argl == 2 &&                  if (resc == NULL && argl == 2 &&
                     buf[iarg] == '.' && buf[iarg + 1] == 'T')                      buf[iarg] == '.' && buf[iarg + 1] == 'T')
Line 399  roff_escape(const char *buf, const int ln, const int a
Line 400  roff_escape(const char *buf, const int ln, const int a
                  */                   */
   
                 if (term != '\0' && argl == 1 && buf[iarg] != '-') {                  if (term != '\0' && argl == 1 && buf[iarg] != '-') {
                           err = MANDOCERR_ESC_BADCHAR;
                         rval = ESCAPE_ERROR;                          rval = ESCAPE_ERROR;
                         break;                          break;
                 }                  }
Line 414  roff_escape(const char *buf, const int ln, const int a
Line 416  roff_escape(const char *buf, const int ln, const int a
                         c = 0;                          c = 0;
                         for (i = iarg; i < iendarg; i++)                          for (i = iarg; i < iendarg; i++)
                                 c = 10 * c + (buf[i] - '0');                                  c = 10 * c + (buf[i] - '0');
                         if (c < 0x21 || (c > 0x7e && c < 0xa0) || c > 0xff)                          if (c < 0x21 || (c > 0x7e && c < 0xa0) || c > 0xff) {
                                   err = MANDOCERR_ESC_BADCHAR;
                                 break;                                  break;
                           }
                         iarg += 4;                          iarg += 4;
                         rval = ESCAPE_NUMBERED;                          rval = ESCAPE_NUMBERED;
                         break;                          break;
Line 431  roff_escape(const char *buf, const int ln, const int a
Line 435  roff_escape(const char *buf, const int ln, const int a
                 if (buf[iarg] != 'u' || argl < 5 || argl > 7)                  if (buf[iarg] != 'u' || argl < 5 || argl > 7)
                         break;                          break;
                 if (argl == 7 &&                  if (argl == 7 &&
                     (buf[iarg + 1] != '1' || buf[iarg + 2] != '0'))                      (buf[iarg + 1] != '1' || buf[iarg + 2] != '0')) {
                           err = MANDOCERR_ESC_BADCHAR;
                         break;                          break;
                 if (argl == 6 && buf[iarg + 1] == '0')                  }
                   if (argl == 6 && buf[iarg + 1] == '0') {
                           err = MANDOCERR_ESC_BADCHAR;
                         break;                          break;
                   }
                 if (argl == 5 && buf[iarg + 1] == 'D' &&                  if (argl == 5 && buf[iarg + 1] == 'D' &&
                     strchr("89ABCDEF", buf[iarg + 2]) != NULL)                      strchr("89ABCDEF", buf[iarg + 2]) != NULL) {
                           err = MANDOCERR_ESC_BADCHAR;
                         break;                          break;
                   }
                 if ((int)strspn(buf + iarg + 1, "0123456789ABCDEFabcdef")                  if ((int)strspn(buf + iarg + 1, "0123456789ABCDEFabcdef")
                     + 1 == argl)                      + 1 == argl)
                         rval = ESCAPE_UNICODE;                          rval = ESCAPE_UNICODE;
Line 449  roff_escape(const char *buf, const int ln, const int a
Line 459  roff_escape(const char *buf, const int ln, const int a
   
 out_sub:  out_sub:
         iesc = sesc;          iesc = sesc;
           inam = snam;
         iarg = sarg;          iarg = sarg;
         iendarg = sendarg;          iendarg = sendarg;
         iend = send;          iend = send;
         rval = ESCAPE_EXPAND;          rval = ESCAPE_EXPAND;
   
 out:  out:
           if (rnam != NULL)
                   *rnam = inam;
         if (rarg != NULL)          if (rarg != NULL)
                 *rarg = iarg;                  *rarg = iarg;
         if (rendarg != NULL)          if (rendarg != NULL)
Line 472  out:
Line 485  out:
         *resc = iesc;          *resc = iesc;
         switch (rval) {          switch (rval) {
         case ESCAPE_ERROR:          case ESCAPE_ERROR:
                 err = MANDOCERR_ESC_BAD;                  if (err == MANDOCERR_OK)
                           err = MANDOCERR_ESC_BAD;
                 break;                  break;
         case ESCAPE_UNSUPP:          case ESCAPE_UNSUPP:
                 err = MANDOCERR_ESC_UNSUPP;                  err = MANDOCERR_ESC_UNSUPP;
                 break;                  break;
         case ESCAPE_UNDEF:          case ESCAPE_UNDEF:
                 if (esc_name == '\\')                  if (buf[inam] != '\\' && buf[inam] != '.')
                         return rval;                          err = MANDOCERR_ESC_UNDEF;
                 err = MANDOCERR_ESC_UNDEF;  
                 break;                  break;
         case ESCAPE_SPECIAL:          case ESCAPE_SPECIAL:
                 if (mchars_spec2cp(buf + iarg, argl) >= 0)                  if (mchars_spec2cp(buf + iarg, argl) >= 0)
                         return rval;                          err = MANDOCERR_OK;
                 err = MANDOCERR_ESC_BAD;                  else if (err == MANDOCERR_OK)
                           err = MANDOCERR_ESC_UNKCHAR;
                 break;                  break;
         default:          default:
                 return rval;                  break;
         }          }
         mandoc_msg(err, ln, iesc, "%.*s", iend - iesc, buf + iesc);          if (err != MANDOCERR_OK)
                   mandoc_msg(err, ln, iesc, "%.*s", iend - iesc, buf + iesc);
         return rval;          return rval;
 }  }

Legend:
Removed from v.1.6  
changed lines
  Added in v.1.10

CVSweb