2006年に最も利用されるアプリケーションは、検索エンジンであるという予測が発表されました(関連記事)。確かに、ことにインターネットを利用するうえでは、もはや必要不可欠のものになっています。競争も激しく、複数の検索エンジンがしのぎを削っているのはご存知の通りです。
しかし、主要なインターネット検索エンジンが軒並み、ある1社の技術を採用している、と言ったら驚かれるでしょうか。例えばGoogle、Yahoo!、MSNサーチ、Ask.jpなど名の通った検索エンジンはいずれもこの技術を利用しているのですが、一般にはほとんど知られていません。
それが、ベイシス・テクノロジーの形態素解析技術です。文章を、語として意味をなす最小の単位(形態素)に分割するものです。検索対象となる文章を細かく分割し、検索用の索引(インデックス)を作成する際に使われます。一般のユーザーがその存在を意識することは少ないのですが、縁の下の力持ちとして欠かせない技術です。特に、単語間にスペースを入れずに言葉を並べる日本語のような言語では重要です。
意外なのは、ベイシス・テクノロジーが米国生まれの会社だということ。日本語の形態素解析技術なら、日本のさまざまな企業や研究機関が古くから開発しています。なのになぜ、主要な検索エンジンがこぞって同社の技術を採用するのか。その理由を取材で質問したら、解析精度やカスタマイズの容易さに加えて、多言語に対応していることを強みに挙げていました。
ベイシス・テクノロジーの設立者であるカール・ホフマン氏は、18歳まで日本に住んでいた経験を持ちます。米国に帰国後、検索サイト「Lycos」から日本語対応に関する相談を受けて形態素解析技術を提供したのがきっかけとなり、複数の検索サイトで採用されるようになったそうです。さらに日本語以外にも展開したいという要望も寄せられ、対応言語を拡充させていったといいます。現在では、16種類の言語に対応しています。インターネットという舞台でサービスを展開するうえで、国や地域を限定せずに利用できることがいかに重要かを改めて実感しました。
余談になりますが、国や地域を限定しない、という意味では、個人的に注目している技術が一つあります。自国語で別の言語の情報を探す「言語横断検索」で、現在盛んに研究されています。この技術を使えば、例えば日本語で英語や中国語の情報を探せるようになるのです。検索結果も翻訳することを目指しています。本来は努力して外国語力を身につけるべきなのでしょうが、この技術の存在を知った今ではすっかり他力本願。実用化を心待ちにしている毎日です。
遊びにも仕事にも
楽しく快適に使いこなす!
誰も教えてくれなかった
スマートフォンの使い方が満載!
撮影から加工まで写真活用の
すべてまるわかり!
アンドロイド「使いにくい」を
徹底解消!
パソコンを仕事と生活に活かす総合情報誌
・お役立ち周辺機器購入ガイド
・最新画像処理ソフト驚きの実力
・新型CPU搭載の夏モデルが登場ほか
パソコン初心者応援マガジン
・必ず見つかるネット検索
・写真の保存&印刷決定版
・キーボードの便利技43 ほか
パワーユーザーのためのPC総合情報誌
・Ivy Bridge大研究
・本気で作る小型・静音PC
・新世代グラフィックスボードほか
ビジネスマンのパソコン誌
・パソコン&スマホで地図&GPS
・PDF「新」活用術
・ネットでらくらく資産管理 ほか