2020.01.10
カテゴリ:
検索エンジンに導入されたBERTとは?対策は必要?
コラムはアイレップが運営するWebメディア「DIGIFUL(デジフル)」からご覧いただけます。
米 Google は2019年10月25日、公式ブログにおいて自然言語処理技術「BERT(バート)」の技術を検索エンジンに導入したと発表しました。BERTの導入により、言語の文脈を理解し、より的確なページを検索結果画面に表示させることができるようになります。発表時は米 Google の英語検索のみ導入されていましたが、2019年12月10日、日本語を含む70以上の言語に展開されました。米 Google の英語検索では、全検索クエリの10%に影響を与えたと言われています。BERTはどのようなアップデートなのか、特別な対策は必要なのかを解説します。
BERTとは
BERTとは、Bidirectional Encoder Representations from Transformers(Transformerを活用した双方向のエンコード表現)の頭文字を取った自然言語処理技術のひとつです。自然言語処理とは人が日常的に使う言語をコンピュータに理解させる技術であり、古くから研究されています。BERTは最新の自然言語処理の技術で、とくに「文脈」を理解することに長けています。BERTが検索エンジンに採用されたことにより、検索されたクエリ※の背景を理解し、より適切な検索結果を返せるようになると考えられます。
※ユーザーが検索エンジンの検索窓に入力した語句
Google は常に検索エンジンの改良を行っており、2013年には「Hummingbird(ハミングバード)」と呼ばれるアップデートを発表しています。ハミングバードも検索されたクエリの意図を組んで検索結果を返すことを特徴としており、主に会話型の長い検索クエリに有効といわれています。しかし、複数の意味をもつ単語で構成された文章型のクエリに対しては正しく理解できていませんでした。今回のBERTの導入により、検索クエリの文脈を理解できるように改良されました。英語の例となりますが、BERTによる改善例を紹介します。
BERTによって検索結果はどのように改善されたのか
改善例①:「to」の意味を正しく認識した検索結果例
下の図をご覧ください。これは「2019年にアメリカに行くブラジルの旅行者(brazil traveler to usa)はビザが必要なのか」と検索した例です。
BERT導入前は「to」の意味を理解できておらず、アメリカ人がブラジルへ旅行する内容の検索結果を返してしまっている状態でしたが、BERT導入後はブラジル人がアメリカへ入国する際の内容が表示され、検索クエリとの関連性が高くなっています。
(図1:BERT導入による検索結果の改善例①)
改善例②:「no」の意味を正しく認識した強調スニペット例
これは「縁石のない(no curb)坂での駐車」で検索した例です。
BERT導入前は「no」の意味を理解できておらず、縁石がある坂での駐車に関する内容が含まれた事例が表示されてしまっている状態でしたが、BERT導入後は検索クエリに合った縁石がない坂での駐車方法を記載した内容の強調スニペットが表示されています。
(図2:BERT導入による検索結果の改善例②)
「to」や「for」などの前置詞は前後の文脈によって意味を大きく変えてしまいます。BERT導入後は、検索クエリの文脈や検索意図を理解し、ユーザーが満足する検索結果を返せるようになっています。今回の改善例は文章型のクエリが多く、音声検索などの長い会話型のクエリで改善が見られることが想定されます。またBERTは強調スニペットの生成にも関与しています。
参考:The Keyword(Google 公式ブログ)“Understanding searches better than ever before”
BERT導入の背景
BERT導入の背景として、「多様化する検索クエリへの対応」が挙げられます。スマートフォンの普及により、ユーザーは瞬間的に「何かをしたい」と思ったそのときに検索を手軽にできるようになりました。多彩なニーズにより検索クエリの種類や数は増加傾向にあります。また対話型の音声操作をメインとするスマートスピーカーも増加してきており、検索クエリはより長文で複雑化しやすい傾向があります。Google は全クエリの15%はこれまで見たことがないクエリと述べており、検索クエリを理解し適切なコンテンツをユーザーに提供できるよう日々改善し続けています。今回のBERTは多様化するクエリの理解に役立つアップデートといえます。
BERTの影響と対策
BERTは長文で複雑な検索クエリの際に効果を発揮すると推測されるため、ビッグキーワードにあたる「賃貸」や「保険」といった単ワードのクエリではほとんど影響を受けないと考えられます。一方、会話文のような複数の単語が含まれるクエリの場合、BERTの導入によって今まで表示されていなかったページが上位に表示される可能性があります。検索キーワードによって違いはありますが、ユーザーに対して、より検索意図に合った検索結果を返せるようになったといえるでしょう。
ただBERT対策として自社サイトのSEO運用方針を大きく変える必要はありません。Google が目指している、「世界中の情報を整理し、アクセスして使えるようにすること」というミッションは変わらず、今回のBERT導入はGoogle が目指す過程のひとつに過ぎないからです。Webサイトの担当者は、ユーザーが自社サイトに訪問するまでの行動を考え、各検討段階での検索されるキーワードに対してユーザーが満足できるコンテンツを提供することが重要となります。
Summary
今回は2019年12月に全世界で導入されたBERTの特徴を解説しました。BERT対策として特別に対応する必要ありませんが、進化し続けるアルゴリズムの特徴を知ることは重要です。Webサイトを運営する担当者は、BERTのようなアルゴリズムに適したコンテンツを作るのではなく、自社サイトに訪問する見込みユーザーに気付きを与えるようなコンテンツを制作することを意識しましょう。
Google および Google ロゴは、Google LLC の商標です。
執筆者
川口 摩悠美(かわぐち まゆみ)
2012年株式会社アイレップ入社後、一貫してSEOに携わる。不動産・介護・バス予約のデータベース型サイトからブランドサイトまで幅広く担当し、2017年よりマネージャーとしてサービス品質向上に従事。現在はSEOをベースとしてインバウンドマーケティングに尽力している。