]> granicus.if.org Git - re2c/commitdiff
- Update unicode information in -u mode
authorhelly <helly@642ea486-5414-0410-9d7f-a0204ed87703>
Tue, 20 Feb 2007 22:16:13 +0000 (22:16 +0000)
committerhelly <helly@642ea486-5414-0410-9d7f-a0204ed87703>
Tue, 20 Feb 2007 22:16:13 +0000 (22:16 +0000)
re2c/htdocs/manual.html
re2c/re2c.1.in

index c415e0068a730fcd7de843a1c504392e23c92314..74c8df521e2db66d389f588f64f834df91d66ecd 100755 (executable)
@@ -332,9 +332,9 @@ and its two hexadecimal digits or a backslash, an upper cased <b>X</b> and its
 four hexadecimal digits.</p>
 <p>re2c further more supports the c/c++ unicode notation. That is a backslash
 followed by either a lowercased <b>u</b> and its four hexadecimal digits or an
-uppercased <b>U</b> and its eight hexadecimal digits. However using the U
-notation it is not possible to support characters greater <b>\U0000FFFF</b> due
-to an internal limitation of re2c.</p>
+uppercased <b>U</b> and its eight hexadecimal digits. However only in \fB-u\fP 
+mode the generated code can deal with any valid Unicode character up to 
+0x10FFFF.</p>
 <p>Since characters greater <b>\X00FF</b> are not allowed in non unicode mode,
 the only portable "<b>any</b>" rules are <b>(.|"\n")</b> and <b>[^]</b>.</p>
 <p>The regular expressions listed above are grouped according to precedence,
@@ -435,7 +435,7 @@ specification for each start condition (as illustrated in the above example).
 <br />
 <a name="lbAO" id="lbAO"> </a>
 <h2>VERSION INFORMATION</h2>
-<p>This manpage describes <b>re2c</b>, version 0.11.1.</p>
+<p>This manpage describes <b>re2c</b>, version 0.11.2.</p>
 <hr />
 <a name="index" id="index"> </a>
 <h2>Index</h2>
index a1c9fa95e9e09f82a188b752f543ba8293802426..afffae5a48ccaadbfa5fec37fef5465e3436daa9 100644 (file)
@@ -394,9 +394,8 @@ four hexadecimal digits.
 re2c
 further more supports the c/c++ unicode notation. That is a backslash followed
 by either a lowercased \fBu\fP and its four hexadecimal digits or an uppercased 
-\fBU\fP and its eight hexadecimal digits. However using the U notation it is 
-not possible to support characters greater \fB\\U0000FFFF\fP due to an internal 
-limitation of re2c.
+\fBU\fP and its eight hexadecimal digits. However only in \fB-u\fP mode the
+generated code can deal with any valid Unicode character up to 0x10FFFF.
 .LP
 Since characters greater \fB\\X00FF\fP are not allowed in non unicode mode, the 
 only portable "\fBany\fP" rules are \fB(.|"\\n")\fP and \fB[^]\fP.