私はパソコンへデータを入力する方法に興味があるので、かなり早い時期からニュアンスコミュニケーションズの「ViaVoice」などの音声入力ソフトを試してきた。けっこうな出費だったが、まさかOSに音声認識機能が搭載される日が来るとは思わなかった。
今回は、Vistaの音声認識を使って「ディクテーション」を試してみる。ディクテーションとは、音声を聞き取って文字にする作業のことだ。
具体的には、パソコンの前で一人でぶつぶつと喋る行為であり、ちょっと恥ずかしい。しかも、ただ喋っているだけならいいが、文章をつづる間に「改行!」とか「○○を修正!」「イチ、オッケー」「ドキュメントの最後に移動」などと叫び続けなければならない。試してみれば分かるが、けっこう汗だくとなる作業なのだ。
では、実際の様子をレポートしよう。
と、文字で書いてしまうと、たったの2行で終わる作業なのだが、じつはメモ帳に文字を入力するまでが大変だった。いくら叫ぼうとわめこうと、音声認識のマイクボタンは無情にも「何ですか?」と聞き返してくるのである。
Windows XPからVistaにアップグレードした自作パソコンでは、最初、ヘッドセットがうまく認識されなかった。そこで、クリエイティブメディアのサウンドボードを増設したら、ようやくヘッドセットが認識できたのだった。
これでうまくいくと思いきや、やはり音声認識が行えない。「はっ!」と思い付いて、IMEをATOK 2007からMS-IMEに変更したとたん、音声認識がリアルタイムにできるようになった。
![]() |
| 図1 音声でメモ帳を起動し、音声をテキスト化したところ |
音声が認識されてしまえば、音声からテキストへの変換はさほど難しくない。「声を発して、それをテキストにする」という部分に関しては機械的に行われる。ユーザーはふだん通りマイクを通じて喋るだけでいい。音声認識率はかなりよいと感じた。ただ、パソコンがユーザーの声をうまく聞き取れるかどうかは、サウンドカードのVista対応やヘッドセット(マイクよりも音声認識に向く)の性能の影響が大きい。環境によっては不満に思うかもしれない。
手間がかかるのは、音声入力自体よりも、入力した文章の修正や削除である。キーボードから文字を入力するように、「変換」キーを押して、同音異義語の候補を選べない。音声をかな漢字交じり文へ変換する作業はすべてIME任せとなる。
もし間違った候補が出た場合、あるいは自分の言った単語を別の単語に変えたい場合は修正する。修正も音声で指示できる。
遊びにも仕事にも
楽しく快適に使いこなす!
誰も教えてくれなかった
スマートフォンの使い方が満載!
撮影から加工まで写真活用の
すべてまるわかり!
アンドロイド「使いにくい」を
徹底解消!
パソコンを仕事と生活に活かす総合情報誌
・お役立ち周辺機器購入ガイド
・最新画像処理ソフト驚きの実力
・新型CPU搭載の夏モデルが登場ほか
パソコン初心者応援マガジン
・必ず見つかるネット検索
・写真の保存&印刷決定版
・キーボードの便利技43 ほか
パワーユーザーのためのPC総合情報誌
・Ivy Bridge大研究
・本気で作る小型・静音PC
・新世代グラフィックスボードほか
ビジネスマンのパソコン誌
・パソコン&スマホで地図&GPS
・PDF「新」活用術
・ネットでらくらく資産管理 ほか