はるか以前には、IBM ViaVoiceなどという音声入力ソフトも使ってみたことがありますが、時間をかけて話し手の癖を学習させた割には、実用ではほとんど使わずに終わってしまいました。
しかし、今ではスマホで簡単に音声入力ができてしまいます。iPodとAndroidでは、事情がやや異なります。
これは、iPhoneの(というか、iOSの、かと思います。)Dragon Dictationの入力画面です。
次のような文章を読み上げてみました。
コンピューター関連技術は昔も今も日進月歩の勢いだが、話が「インターフェース」になるとトーンダウンしてしまう傾向は否めない。マルチタッチパネルなどの新顔も増えつつあるが、いまだキーボードとマウスが主役だ。
しかし、人の言葉を解析しテキストに変換する「音声入力」は、近年目覚ましい進歩を見せている。今回紹介するiOSアプリ「Dragon Dictation」も音声入力処理系のひとつで、米Nuance Communications(ニュアンス コミュニケーションズ)の音声認識技術を活用し、日本語を含む各種言語を分析しテキストに変換してくれる。
iPhoneで話し言葉をバッチリ認識! 「Dragon Dictation」
これを一気に読み上げてみました。
さて、結果です。
事前の「学習」もなく、これほどの認識をしてくれるのはありがたいことです。
Dragon Dictationはちょっと面白い機能を持っています。上のスクリーンショットを見ると、すでに入力完了で、あとはカーソルを移動させながら修正をしていく、というふうに見えます。
しかし、Dragon Dictationが「単語」として認識をした区切りが残っています。
残念ながらうまくスクリーンショットが撮れなかったのですが、ここで「トーンダウン」が選択されているのは、数多くの「単語」としての区切りの1つなのです。選択する前には、文章全体が隙間なく、全ての単語が薄い青色の枠に囲まれて選択の候補として表示されます。
もっとも、操作できるのはご覧お通り「削除」だけかも知れませんが、単語単位で削除してそこに正しい単語を入力すればいいということかも知れません。
さて対するAndroid陣営のアプリですが、それは明日。