中華IT最新事情

中国を中心にしたアジアのテック最新事情

中国語は、どのようにして入力効率を高めてきたのか。九宮格、ダブルピンインなど、ピンイン入力だけではない中国語入力。

まぐまぐ!」でメルマガ「知らなかった!中国ITを深く理解するためのキーワード」を発行しています。

明日、vol. 206が発行になります。

登録はこちらから。

https://www.mag2.com/m/0001690218.html

 

今回は、中国語のピンイン入力ついてご紹介します。

 

読者のみなさんの中には、日頃からバリバリに中国語の文章を書いている方から、中国語はさっぱりわからないという方までいらっしゃると思います。中国語の文章を書かれる方はいずれかのピンイン入力を必要なレベルでマスターをしていらっしゃるでしょうし、中国語になじみのない方にはピンインという言葉すらよくわからないと思います。

今回は、さまざまな中国語の入力方法を歴史順にご紹介していきますが、あまり細部には触れないようにします。ご紹介したいのは、入力方法のやり方ではなく、中国が常に貪欲に効率的な入力法を開発し続けているということだからです。

コンピューターが登場して以来、文字はペンを使って書くものではなく、キーボードから入力するものになりました。これにより、中国、日本、韓国といった2バイト文字圏はコンピューターを効率的に使うという面で、英語などの1バイト文字圏に比べて圧倒的に不利になりました。

英語などの1バイト文字は、すべての文字をキーボードに並べることができるため、配置を覚えれば簡単に入力することができます。しかし、漢字やハングルでは文字数が多いために、すべての文字をキーボードに並べることができません。複数のキーを組み合わせて、ようやく1つの文字が入力できるのです。

日本語の場合、ローマ字かな変換を使うのが一般的ですから、1つのひらがなを入力するのに2回のストロークが必要になります。しかも、その後にかな漢字変換があります。苦労して「やまなし」と4文字(9ストローク)を入力しても、変換をすると「山梨」という2文字に圧縮されてしまいます。つまり、2文字を入力するのに11ストロークも必要なのです(変換キーと確定キーを押す必要がある)。

では、中国語ではどうでしょうか。最も効率的と言われる「双拼」(ダブルピンイン)入力では、1つの漢字を入力するのに2ストロークですみます。つまり、山梨は4ストロークで済むのです。中国語は、双拼入力の登場により、かなり効率的に入力できる言語になりました。

 

コンピューターが登場した時、多くの中国人が絶望的な気持ちになりました。どう考えても、漢字をすべてキーボードに並べることができないからです。1980年に発表された中国の文字コードGB2312には6763文字が収録されています。しかし、これだけでは入力できない文字がたくさんあり、2005年にはGB18030が発表され、これには7万244文字が収録されています。この膨大な数の漢字をどうやってコンピューターに入力するのか、それが大きな問題になりました。

1984年、ロサンゼルス五輪では、プレスセンターに世界中から約7000名の記者が集結し、日々の試合結果を世界に発信していました。この時には、すでにノートパソコンの原型となるラップトップパソコンがあり、多くの記者がラップトップパソコンを使ってキーボードを打って記事を書いていました。日本人記者も、パソコンを使う人もいれば、ワープロ専用機を使って記事を書く人もいました。しかし、中国の記者だけは、原稿用紙に手書きで記事を書いていたのです。

この状況は、国内で大きな話題となり、中国が世界のITの進化から落伍していることが問題視されました。そこから、効率のいい入力方法を模索する歴史が始まります。この過程をご紹介したいのです。

 

先ほど触れた双拼方式はどのくらい効率がいいのでしょうか。少し古い情報になりますが、「河本の実験室」というブログが、非常に面白い記事を掲載しています。「140文字の「重み」を言語毎に比較してみた」(http://kawalabo.blogspot.com/2015/03/140.html)という記事です。

当時、ツイッターが流行をし始め、140文字という文字制限があることが話題になりました。英語圏では簡単な応答をやり取りする使い方が主流であるのに対し、日本では濃い議論をする使い方が見受けられました。これは日本語は少ない文字数で多くの情報を表すことができるのではないかと言われ、この方の記事はそれを検証してみたという内容です。

各言語のツイートを1200件ずつ収集して、それを機械翻訳で英語に翻訳し、英語に直すとそのツイートが元の言語の文字数の何倍になるかを測定していきました。

▲各言語のツイートを英語に機械翻訳して文字数を比較した。中国語は英語にすると文字数が3倍以上に増える。「河本の実験室」より引用。

 

すると、中国語では英語に直すと平均して3.1倍になったのです。日本語では2.4倍でした。これは、「英語に直すと何倍の文字が必要か」という数値で、「情報量/文字数」を表す数値です。この逆数である「文字数/情報量」を計算すると、同じ情報量を表すのに何文字必要かが計算できます。これに、双拼方式=1文字に2ストロークにより、それぞれの言語で同じ情報を表すのに何回キーを打たなければならないかを計算してみました。

▲中国語では、同じ情報量を入力するために英語の64.52%のキーストローク数で入力ができる。

 

つまり、英語が1回キーを打たなければならないところを、中国語では0.6452回しかキーを打たずに済むのです。日本語も0.8334回と英語よりは効率がいいですが、かな漢字変換があるために、実際のストローク数はこれよりも増えることになります。

中国語は、ひょっとすると、同じ情報量を表すのに、世界で最もキーを打つ回数が少なくて済む言語なのかもしれません。実際、双拼入力ができる人は、人の話をリアルタイムで筆記していくことが可能です。

ロサンゼルス五輪のあの屈辱から40年、中国語の入力方法はここまで進化をしてきました。今回はその軌跡をたどります。

 

続きはメルマガでお読みいただけます。

毎週月曜日発行で、月額は税込み550円となりますが、最初の月は無料です。月の途中で購読登録をしても、その月のメルマガすべてが届きます。無料期間だけでもお試しください。

 

今月、発行したのは、以下のメルマガです。

vol.205:電子競技員、ネット販売師、ネット配音員、陪診師。続々生まれる新職業。国が新職業を認定する理由とは