航空の現代電脳篇 → ホームページ作法(16)

ス リ ッ パ 始 皇 帝

 

 先日、新宿のパソコン・ショップをのぞいてみたら、音声入力のデモンストレーションをやっていた。デモ係りの女性が今朝の新聞を読み上げると、横のパソコン画面に文字があらわれる。それが非常にはやく、しかもほとんど誤りなく、正確な文字が出てくる。新聞の読み上げは、普通の朗読と変わらない。スラスラ読んでいくと、画面にもスラスラと文字があらわれる。

 私はちょっと驚いた。ワープロ画面の立ち上げから、声の入力はもとより、カーソルの移動や誤った変換文字の修正、そして画面の終了まで、すべて声だけで操作しているのである。

 これは大変なことになったと、すっかり感心しながら帰ってきた。

 さて、このあいだから本頁に「ヘリコプターの歴史」を掲載しはじめた。ところが20年前の文章である。当時はまだワープロがなくて、原稿はペンと紙で書いていた。したがって、ここに載せるためには改めて電子化しなければならない。

 『航空情報』の掲載文だから、そのままスキャナーにかければいいようなものだが、2年余り前(1997年4月)に大枚をはたいて買ったスキャナーは、本頁に書いたようにわけの分からぬ理由でいまだに動かない。2年ほど前のスキャナーは相当に高価で、まことに腹立たしい限りだが、機械と私のにらみ合いは当分終わりそうもなく、したがって使えない。

 といって何の工夫もなく、文面を見ながらキーボードを叩いていくだけの単純作業は何だか馬鹿らしい。そこで思い出したのが音声入力のデモンストレーションだった。

 幸い、私の機械には「声でAptiva!」とやらの装置が組みこまれている。今までは無視していたものだが、ちょっと使ってみることにした。

 最初にパソコン・ショップで見たようなやり方で、本を読み上げてみたのだが全く駄目で、わけの分からぬ文字と文章が出鱈目に出てくるだけ。なにしろ私の機械は2年ほど前のもので、ソフトが旧い。改めて説明書を読み直してみると、まずこちらの声や発音を機械に憶えさせなければならないことが分かった。

 それには200項目の文章を一語一語区切って、ゆっくりと読んでゆくところから始まる。やりました。幸いゴールデンウィークの連休がはじまったところです。3日がかりで200種類の文章を単語ごとに区切って読み上げた。途中いろいろあって、うまくゆかぬところや、よく分からぬところもあり、挫折しかけたりもしたが、何とか最後まで漕ぎ着けることができた。

 この作業を、説明書は「エンロール」と呼んでいる。英語の辞書を引いてみると「名簿に記入する、会員になる、入隊する……」などの訳語が並んでいるが、その中の「登録する」という言葉が最も近い意味ではないかと思う。それならば「音声登録」といった日本語で説明して貰いたかった。

 おそらくアメリカ人にとって、enrol という言葉は、そんな特殊なものではないはずで、すぐにピンとくるに違いない。しかし日本人がエンロールといわれても、先ずは意味不明で、何だか頭の中に霧がかかったようになり、思考力がそこで止まってしまう。

 ここは、エンロールなどという日本人にとって無意味な言葉は一切使わず、「音声登録」という表題で、「あなたの声を登録します」とか、「あなたの声を機械に憶えさせます。そのために先ず録音します」というように日本語で説明して貰うと分かりやすい。そこまで理解するのに、馬鹿な私は2日ほどかかったのである。

 というのは、もうひとつここに「トレーニング」という言葉が出てくるからである。そういわれると、こちらが機械に音声を吹き込むための訓練をしなければならないのかと思うのは当然。画面には一語一語区切って、たとえば「この トレーニング セット は 三つ の 部分 から なって います 。(マル)」というような文章があらわれる。

 私はこれを自分が訓練を受けているつもりで読み上げていった。たしかに、いくらかは自分の訓練のためかもしれない。初めのうちは「5単語が認識されませんでした」などという評価が出てきて緊張させられる。けれども10項目か20項目を過ぎれば、もういいだろうという気になってくる。

 しかし途中でやめるわけにはいかない。むろん手洗いが我慢できなくなったときのために「中断」のボタンはあるのだが、そのボタンを押して途中でやめたままにしておくと、どうやら音声登録がおこなわれないらしいのである。

 まず50番目の文章が終わったところで中間登録がおこなわれ、残りは200番目まで行かなければ登録されない。だから途中でやめるわけにはいかない。どうしても200種類の文章を最後まで読み上げなければならない。

 そのことに気づいたのも2日ほどたってからであった。「トレーニング」というのは、こちらの発声や発音の訓練ではなくて、機械のための訓練らしいのである。

 とすれば、最初にジャーンという吃驚音と共に「トレーニングを行うには少なくとも50の文を録音する必要があります」などと脅かさないで貰いたい。そうではなくて「あなたの声を機械に憶えさせます。そのために先ず機械の訓練をします。それには少なくとも50の文を録音する必要があります」とでも言って貰いたかった。

 ともかくも、3日ほどかかって人間と機械のトレーニングが終わり、改めて音声入力をやってみた。これを説明書では「ディクテーション」と呼んでいる。この言葉は中学生のときから英語のディクテーションに悩まされたから分かる。しかも今度は、ディクテーションの試験を受けるのは自分ではなくて、機械の方である。

 そこで機械にこちらの言葉を書き取らせてみると、単純な日常語はかなりうまくいくのだが、数字と航空用語ができない。数字は出鱈目な漢字になって出てくる。しかし、その書き取りについては何か要領があるらしい。まだ3日目でこちらの訓練ができていないだけで、いずれはもっとうまくできるようになるだろう。

 航空用語の方は、間違った言葉を修正していくことによって、機械が学習する。したがって時間をかければ正しい書き取りができるようになりそうだ。今のところはまだ、お互い不慣れなままで已むを得ないが、たとえばヘリコプターの「ローター」というと「モーター」と出てくる。いつまでたっても「モーター」になるので、いっぺんに「ローター ローター ローター」と繰り返したら「ロータス」と反応した。感情的に機械をどやしつけても、人間ではないから、急に出来がよくなったりはしないのである。

 要するに、この機械はもともと「ローター」という言葉を知らず、知らない言葉は表現できないのである。しかし「モーター」なら知っていたし、さすがに「ロータス」というソフト・メーカーもご存知だったらしい。そのうちに「ローター の 回転」とやったところ「ロータスの改定」と出てきたのには笑わされた。実は、私は10年ほど前、扱いにくいロータス123に悩まされたことがあり、それ以来このソフトが嫌いなのである。

 こうしたディクテーションの場合、初めのうちは気づかなかったけれども、機械が自分で学習するわけではない。ワープロは自習してくれるけれども、ディクテーション・ソフトは面倒なことに、いちいち教えてやらなければならない。

「テキストの修正」という作業がそれで、初めは知らないものだから、別のテキスト・エディタに移動して誤変換を修正していた。しかし、これでは駄目で、ディクテーションが終わったままの状態で、一定の手順にしたがって修正作業をしなければならない。

 たとえば「モーター」や「ロータス」を「ローター」に直す。そのとき機械にとって初めての言葉は向こうが訊き返してくるから、それに応じて登録作業をする。それによって機械は新しい「ローター」という言葉を憶え、次からは正しく書き取ることができるようになる。まことにうまくできているのだが、手間のかかることおびただしい。航空用語を憶えさせるのは、これからさぞかし大変なことだろう。

 それにしてもディクテーション作業の結果はさんざんだった。たとえば「機体」は「期待」になり、「自由飛行」は「十非行」、「1号機」は「市合金」、「ブレゲー」は「レゲエ」という具合。また「試作」が「ひしゃく」になり、「シコルスキー」が「非公式」になったところを見ると、この機械はアメリカ生まれかと思っていたが、実は江戸っ子だったらしい。

 またライト兄弟の「初飛行」が「ハチ公」になり、「クリッパー飛行艇」が「スリッパ始皇帝」になったのは笑ったけれども、「重量を削って」が「給料を削って」となったときは、とても笑えなかった。

 このような誤(?)変換は、実はワープロとは異なる。ひとつは、こちらの発声があいまいだからであり、もう一つは機械が懸命に考えて何とか辻褄の合う文章をつくろうとするからではないか。ワープロの場合は明確なデジタル・データが打ち込まれる。したがって誤変換があるとすれば同音異義語しか出てこない。しかしディクテーション・ソフトは発音の似たような言葉を次々と考えるらしい。そこで駄洒落にも似た変換が起こるのである。

 その結果、「ローター直径を増やした」が「太田休憩所を増やした」になったのはいいとして、「ポール・コルニュのヘリコプター」と吹き込んだら「オウム物件購入のヘリコプター」と出てきたのには驚いた。途中に「物件」が入ったのは「・」を「テン」と読んだからだが、それにしてもこの機械はオウム狂団の存在と同時に、彼らが東京上空でサリンをばら撒くためにロシアの大型ヘリコプターを買ったことまで知っていたのである。

 蛇足ながら、以上の変換例は決して私の創作ではない。すべて本当に出てきた言葉ばかりだが、これから私と機械の相互理解が進み、学習レベルが上がるにつれて、こうした駄洒落変換はなくなるのであろう。ちょっと寂しい気もする。

 またパソコン・ショップで見た最新ソフトを使えば、講演のテープ起こしができるかもしれない。そしてキーボード操作が嫌いな人にも都合がよいだろうし、手の不自由な人には大きな福音となるにちがいない。

 宣伝料を貰ったわけではないが、音声入力は面白いソフトウェアである。

 

(西川渉、99.5.4)

「電脳篇」目次へ戻る) (表紙へ戻る