]> granicus.if.org Git - python/commitdiff
Issue #19405: Fixed outdated comments in the _sre module.
authorSerhiy Storchaka <storchaka@gmail.com>
Sun, 27 Oct 2013 06:00:57 +0000 (08:00 +0200)
committerSerhiy Storchaka <storchaka@gmail.com>
Sun, 27 Oct 2013 06:00:57 +0000 (08:00 +0200)
Lib/sre_compile.py
Modules/_sre.c

index bd4070549a9db717c4d8b2d3474d3da25617fecb..471753e996ab784d06e0979568a551830f4c17e6 100644 (file)
@@ -276,10 +276,10 @@ def _mk_bitmap(bits):
 # set is constructed. Then, this bitmap is sliced into chunks of 256
 # characters, duplicate chunks are eliminated, and each chunk is
 # given a number. In the compiled expression, the charset is
-# represented by a 16-bit word sequence, consisting of one word for
-# the number of different chunks, a sequence of 256 bytes (128 words)
+# represented by a 32-bit word sequence, consisting of one word for
+# the number of different chunks, a sequence of 256 bytes (64 words)
 # of chunk numbers indexed by their original chunk position, and a
-# sequence of chunks (16 words each).
+# sequence of 256-bit chunks (8 words each).
 
 # Compression is normally good: in a typical charset, large ranges of
 # Unicode will be either completely excluded (e.g. if only cyrillic
@@ -294,7 +294,7 @@ def _mk_bitmap(bits):
 
 # In UCS-4 mode, the BIGCHARSET opcode still supports only subsets
 # of the basic multilingual plane; an efficient representation
-# for all of UTF-16 has not yet been developed. This means,
+# for all of Unicode has not yet been developed. This means,
 # in particular, that negated charsets cannot be represented as
 # bigcharsets.
 
index a7103cc456b2a82b0c4be04bf29a5353ee715492..bf802a686a31e735fdfbb97624cbbe6973eb4b0f 100644 (file)
@@ -2753,8 +2753,7 @@ _compile(PyObject* self_, PyObject* args)
     \_________\_____/        /
                \____________/
 
-   It also helps that SRE_CODE is always an unsigned type, either 2 bytes or 4
-   bytes wide (the latter if Python is compiled for "wide" unicode support).
+   It also helps that SRE_CODE is always an unsigned type.
 */
 
 /* Defining this one enables tracing of the validator */