2011年03月05日

漢数字の〇(ゼロ)

 縦書きの印刷物をOCRでテキスト化する作業をしていて、「二〇一一年」というところで、2番目のゼロが○よりもわずかに扁平なことに気づいた。
 ○とは違う丸、ひょっとして漢数字用のゼロがあるのかと調べてみた。

zero.gif



 その結果、漢数字の〇(ゼロ)があることが分かった。
 文字コードは、shit-jisで819d、unicodeで25ce。
文字コードは、shit-jisで815a、unicodeで3007。UTF-8で、E3 80 87。
 名称は「漢数字ゼロ ideographic number zero」。ideographicは「表意文字の」という意味なので、ここでは事実上「漢字の」という意味だと思っても差し支えない。



続きを読む
posted by kewpie at 08:29| Comment(2) | TrackBack(0) | 言語・文字
コメントの投稿について
○お名前とコメント欄の記入は必須です。
○メールアドレスは任意です。記入されても公開はされません。管理人のみに知らされます。
○スパム防止のため、
・ホームページアドレス欄への記入はできません。
・コメント欄にURLは記入できません。
・スパムと思われる語を記入できません。
 これらをしようとすると、最終的に投稿完了できません。
○投稿完了後に、管理人の判断でスパムと判断した投稿は削除させていただきます。