From 5e491553d2be4207caef4c36ffec1228bacb31a6 Mon Sep 17 00:00:00 2001 From: Peter Edberg Date: Thu, 12 Dec 2013 02:55:47 +0000 Subject: [PATCH] ICU-10571 Add 11 region names in Japanese to cjdict X-SVN-Rev: 34748 --- icu4c/source/data/brkitr/cjdict.txt | 11 +++++++++++ icu4c/source/test/testdata/rbbitst.txt | 6 ++++-- 2 files changed, 15 insertions(+), 2 deletions(-) diff --git a/icu4c/source/data/brkitr/cjdict.txt b/icu4c/source/data/brkitr/cjdict.txt index bc63cfb4710..debeabdaae4 100644 --- a/icu4c/source/data/brkitr/cjdict.txt +++ b/icu4c/source/data/brkitr/cjdict.txt @@ -18825,6 +18825,7 @@ アルザタワーズ 163 アルシンド 134 アルジェ 108 +アルジェリア 109 アルジュムフリア 181 アルス 110 アルセ 120 @@ -19414,6 +19415,7 @@ インド 80 インドア 104 インドシナ半島 128 +インドネシア 94 インドネシアルピア 144 インドホシガメ 142 インドルピー 143 @@ -19655,6 +19657,7 @@ ウスバカゲロウ 135 ウスリー 134 ウズベ 107 +ウズベキスタン 109 ウズラ 113 ウズラマメ 161 ウソ 92 @@ -20534,6 +20537,7 @@ オーストラリア 88 オーストラリアドル 122 オーストラリアン 116 +オーストリア 97 オーストリアシリング 156 オーソドックシー 192 オーソドックス 105 @@ -20699,6 +20703,7 @@ カザック 146 カザニ 155 カザフ 106 +カザフスタン 106 カザルス 121 カシ 85 カシアス 130 @@ -21811,6 +21816,7 @@ ギラン 114 ギリギリ 93 ギリシ 91 +ギリシャ 95 ギリシャドラクマ 168 ギルダー 129 ギルド 96 @@ -27772,6 +27778,7 @@ ニューイヤー 109 ニューイングランド医学ジャーナル 171 ニューギニアダトニオ 164 +ニュージーランド 96 ニュース 64 ニュースキャスター 117 ニュースソース 119 @@ -28432,6 +28439,7 @@ ハンウィ 158 ハンカチ 100 ハンガ 96 +ハンガリー 98 ハンガー 96 ハンガーストライキ 135 ハンク 116 @@ -30288,6 +30296,7 @@ ブラシ 89 ブラジ 108 ブラジャー 99 +ブラジル 84 ブラスバンド 112 ブラスール 161 ブラチスラバ 130 @@ -31553,6 +31562,7 @@ ポル 90 ポルカ 114 ポルト 92 +ポルトガル 95 ポルトガルエクスード 251 ポルトラーニン 179 ポルノ 95 @@ -32080,6 +32090,7 @@ マル優 123 マレ 104 マレー 91 +マレーシア 95 マレーシアドル 148 マレーシアリンギ 142 マレー半島 122 diff --git a/icu4c/source/test/testdata/rbbitst.txt b/icu4c/source/test/testdata/rbbitst.txt index 949d51d8140..c5cef368e8f 100644 --- a/icu4c/source/test/testdata/rbbitst.txt +++ b/icu4c/source/test/testdata/rbbitst.txt @@ -179,8 +179,8 @@ •芽キャベツ<400>芽キャベツ<400> # more Japanese tests -# TODO: Currently, U+30FC and other characters (script=common) in the Hiragana -# and the Katakana block are not treated correctly. Enable this later. +# TODO: some script=common characters in the Hiragana and the Katakana block may not be treated correctly +# (was formerly true for U+30FC); need to check and fix if so. #•どー<400>せ<400>日本語<400>を<400>勉強<400>する<400>理由<400>について<400> •て<400>こと<400>は<400>我<400>でも<400>知<400>ら<400>も<400>い<400>こと<400>なん<400>だ<400>。• •日本語<400>を<400>勉強<400>する<400>理由<400>について<400> •て<400>こと<400>は<400>我<400>でも<400>知<400>ら<400>も<400>い<400>こと<400>なん<400>だ<400>。• @@ -796,6 +796,8 @@ Bangkok)• •私<400>達<400>に<400>一<400>〇<400>〇〇<400>の<400>コンピュータ<400>が<400>ある<400>。<0>奈々<400>は<400>ワード<400>で<400>ある<400>。• # The following test is for #10300 •例えば<400>オーストラリア<400>。• +# The following test is for #10571 +•一部<400>の<400>地域<400>では<400>、<0>ブラジル<400>、<0>インドネシア<400>、<0>オーストリア<400>、<0>ニュージーランド<400>で<400>ある<400>。• # UBreakIteratorType UBRK_SENTENCE, Locale "el" # Add break after Greek question mark (cldrbug #2069). -- 2.40.0