2006年に最も利用されるアプリケーションは、検索エンジンであるという予測が発表されました(関連記事)。確かに、ことにインターネットを利用するうえでは、もはや必要不可欠のものになっています。競争も激しく、複数の検索エンジンがしのぎを削っているのはご存知の通りです。
しかし、主要なインターネット検索エンジンが軒並み、ある1社の技術を採用している、と言ったら驚かれるでしょうか。例えばGoogle、Yahoo!、MSNサーチ、Ask.jpなど名の通った検索エンジンはいずれもこの技術を利用しているのですが、一般にはほとんど知られていません。
それが、ベイシス・テクノロジーの形態素解析技術です。文章を、語として意味をなす最小の単位(形態素)に分割するものです。検索対象となる文章を細かく分割し、検索用の索引(インデックス)を作成する際に使われます。一般のユーザーがその存在を意識することは少ないのですが、縁の下の力持ちとして欠かせない技術です。特に、単語間にスペースを入れずに言葉を並べる日本語のような言語では重要です。
意外なのは、ベイシス・テクノロジーが米国生まれの会社だということ。日本語の形態素解析技術なら、日本のさまざまな企業や研究機関が古くから開発しています。なのになぜ、主要な検索エンジンがこぞって同社の技術を採用するのか。その理由を取材で質問したら、解析精度やカスタマイズの容易さに加えて、多言語に対応していることを強みに挙げていました。
ベイシス・テクノロジーの設立者であるカール・ホフマン氏は、18歳まで日本に住んでいた経験を持ちます。米国に帰国後、検索サイト「Lycos」から日本語対応に関する相談を受けて形態素解析技術を提供したのがきっかけとなり、複数の検索サイトで採用されるようになったそうです。さらに日本語以外にも展開したいという要望も寄せられ、対応言語を拡充させていったといいます。現在では、16種類の言語に対応しています。インターネットという舞台でサービスを展開するうえで、国や地域を限定せずに利用できることがいかに重要かを改めて実感しました。
余談になりますが、国や地域を限定しない、という意味では、個人的に注目している技術が一つあります。自国語で別の言語の情報を探す「言語横断検索」で、現在盛んに研究されています。この技術を使えば、例えば日本語で英語や中国語の情報を探せるようになるのです。検索結果も翻訳することを目指しています。本来は努力して外国語力を身につけるべきなのでしょうが、この技術の存在を知った今ではすっかり他力本願。実用化を心待ちにしている毎日です。
7年分168冊、約2万ページが1枚のDVDに!
日経パソコン読者には特価を適用!
パソコンはもちろん、プリンター、スマホ、
テレビもつないで、もっと便利に!
とにかく読みやすい入門書!
見やすい文書作りのコツを「実例」で学ぶ!
そもそもスマホって? 携帯と何が違うの?
も解説。買い方、使い方を分かりやすく紹介
パソコンを仕事と生活に活かす総合情報誌
・Vista/XPから脱出せよ
・「2012年型パソコン」を読み解く
・ビジネスプリンター購入ガイドほか
パソコン初心者応援マガジン
・写真とビデオをデジタル保存
・ウェブアルバムを使おう
・フェイスブック初めの一歩ほか
パワーユーザーのためのPC総合情報誌
・2012年版自作の疑問100
・旬のPCケース25製品レビュー
・Radeon HD7970を速攻テストほか
ビジネスマンのパソコン誌
・今すぐ始めるクラウド
・DVD&ブルーレイ活用術
・ネット&携帯電話 節約ガイドほか