see sample/listcap.c file.
-
-A-6. Problems
-
- + Invalid encoding byte sequence is not checked.
-
- ex. UTF-8
-
- * Invalid first byte is treated as a character.
- /./u =~ "\xa3"
-
- * Incomplete byte sequence is not checked.
- /\w+/ =~ "a\xf3\x8ec"
-
// END
有効にしていない理由は、どの程度役に立つかはっきりしないため。
-
-補記 6. 問題点
-
- + エンコーディングバイト値が適正な価かどうかのチェックは行なっていない。
-
- 例: UTF-8
-
- * 先頭バイトとして不正なバイトを一文字とみなす
- /./u =~ "\xa3"
-
- * 不完全なバイトシーケンスのチェックをしない
- /\w+/u =~ "a\xf3\x8ec"
-
- これを調べることは可能ではあるが、遅くなるので行なわない。
-
- 文字列として、そのようなバイト列を指定した場合の動作は保証しない。
-
終り