新しいタブでプレビュー

Azure Preview(プレビュー)の特長となっている機能の中に、「セマンティック検索」とあり、ふと思い出したので、本日は「セマンティック検索」について簡単にまとめたいと思います。

セマンティック検索とは

セマンティック検索とは、検索されるキーワードとなる自然言語を理解し、そのキーワードの意味にあった検索結果を表示する「検索技術」のことです。

セマンティック(semantic)とは、日常的に使う言葉ではない為に、いまいちピンと来ない人も多いと思いますが、セマンティックとは「意味」「意味論」と直訳され、主に言語学の世界やIT用語として使用される言葉です。ITの世界では、「検索キーワードなどのデータが持つ意味をコンピューターが理解する技術」を指しています。

セマンティック技術の効果

セマンティック技術を使った検索では、検索する人が検索したいキーワードや文章からセマンティック技術によってその意味を読み取った検索結果を返すことで、検索の精度が大幅に向上すると言われています。

検索するキーワードや文章を一般的な「完全一致検索」や「前方/後方一致」で検索しただけでは表示することができなかった検索なども、セマンティック検索技術を使うことによって、より自然言語に近い形で検索したい内容を読み取った検索結果を返すことができるようになります。

セマンティック検索は、類似検索ではない

たまに、セマンティック検索をタイプミスや大文字小文字、カタカナ・ひらがな・漢字などの検索されたテキストの「表記の揺れ」の修正技術である類似検索(あいまい検索)と誤解している人を見かけますが、セマンティック検索は表記の揺れを修正して検索結果を返す技術ではありません。

表記の揺れを修正してくれる検索は、「類似検索(あいまい検索とも言う)」と呼ばれる検索技術で、検索されるキーワードの出現頻度や出現集中度などからスコアを算出し、高いスコアをもったキーワードをもって検索補助をする技術です。

IT業界用語ですと、“サーバー“と”サーバ“、”プリンター“と”プリンタ“を同じ検索キーワードとしてひとまとめにして検索してくれるのが類似検索(あいまい検索)技術ですので、検索キーワードや文章の意味を理解して、検索精度を向上させるセマンティック検索とはバックグランドで利用されている技術が大きく異なっています。