単一と複合キーワード、Googleはどう認識しているのか

今回の記事は以下の続きとなります。
 
Googleの形態素解析アルゴリズムを分析して内部SEOに活用する
http://blog.mf-seo.com/archives/8891
 
『2つの語句から成り立つキーワードについて、Googleではどのように認識しており、どのように最適化すべきか』この疑問から今回の記事を書きました。
 
前回の記事説明となりますが、Gooleが運営するサイトでは、なぜか特定の単語の間に空白タグを入れているという現象がみられました。「プライバシー ポリシー」のような形です。ただ、「ウェブサイト」のように空白タグを含まれないキーワードも存在します。これはGoogleが運営するサイトすべてに適用されています。どういう意図でこういった使い方をしているのかわかりませんでしたが、キーワードについてもう少し掘り下げて考えてみるべきだと考えました。
 
キーワードによっては2語から成り立つものがあり、意味のある単語同士を組み合わせて新しい語句が形成されているキーワードに関して、検索エンジンはどのような認識をしているのかが非常に気になるところです。つまり、例を挙げると「seo対策」という検索クエリに対して、「google対策」という言葉の「対策」部分を重要とみなすのかどうかということです。もちろん語句との関連があれば意味のあるものにする方が良いかと思いますが、「パンダアップデート」のように本来の意味とはまったく関係のないケースもあります。
 
キーワードによって、分割して認識するケースと認識しないケースを探してみることにしました。結果が以下となります。記号部分の説明ですが、「-」は除外「””」は完全一致となります。つまり、検索したキーワードの中から、完全に一致したものを除外してくださいという意味です。これで、対象のキーワードが分割されて認識しているのか、いないのかを判断することができると思います。
 
【見つかったキーワード】
検索エンジン最適化 -“検索エンジン最適化”
アンカーテキスト -“アンカーテキスト”
内部対策 -“内部対策”
被リンク -“被リンク”
アクセス解析 -“アクセス解析”
 
【見つからなかったキーワード】
SEO -“SEO”
ホームページ -“ホームページ”
スマートフォン -“スマートフォン”
ブックマーク -“ブックマーク” -“ブックマーク”
JavaScript -“JavaScript”
 
見つからなかったキーワードですが、「JavaScript」のケースで考えると、「java」とウェブページに掲載していたとしても、「JavaScript」の検索クエリに関しては、まったく無視されてしまうということが予想されます。「JavaScript」と「Java」は異なるプログラム言語ですが、「JavaScript」のことを「Java」と省略して呼ぶこともあります。ですが、「Java」と省略して書いてしまった場合、まったく検索に引っかかることがないということになってしまいます。
 
こういったケースはめずらしいことではありません。一般的に同じような事例はたくさんあると思います。検索エンジンの認識と人間の認識が違う可能性があるということはサイト内のコンテンツや文章を作成する上で気を付けておかないといけない部分です。自分が運営する業界で検索エンジンからの流入が期待できるキーワードは、どういった取扱いになるのかを一度調べておく必要があります。
 
分割されたキーワードに空白タグを入れて検索することで、本当に認識されているのかを掘り下げて調べてみました。「Java Script」で検索をしたところ、下記のような結果が見つかりました。空白タグを入れているにも関わらず、javaの文字部分には太文字で表示されず、検索エンジンはこの語句を検索クエリとは関係ないと認識しているようです。
 

 
他の検索結果を見ていると下記のような検索結果が見つかりました。javaと使用しているにも関わらず、太文字で表示されております。これは一体どういうことなのでしょうか。同一の語句であっても場合によっては重要とみなす場合もあれば、みなさない場合もあるということです。その原因は一体なんでしょうか。先ほどの語句との違いはどこにあるのでしょうか。
 

 
引き続き検索結果を見てみると、少し答えが見えてきたような気がします。次の結果には太文字で表示されておりません。共通部分は「javaとJavaScript」JavaScriptとの比較表現が出たときには太文字には表示されないという可能性が出てきました。単体で記載されているときにはjava=JavaScriptであるけれど、同時に使われた時の認識はjava≠JavaScriptということです。これは非常に興味深い現象です。
 

※URLにマークしておりますが、パンくずリストが出現した時に太文字になる例がありませんでした。
 
語句の意味を認識するだけでなく、他の語句が出現した時には別の意味になるということを理解しているということです。「seo」だけの場合であれば、もしかすると「瀬尾」という人物の英語表記なのかもしれませんが、「リンク」「上位表示」などと同時に使われることで、検索エンジン最適化の意味だと確信することができるということです。
 
java.comのケースでは、単体で使用されている為、「Java Script」の検索結果に表示されておりますが、検索結果としては適切ではありません。不完全な部分もあるということです。また、検索ユーザーの目的を理解することはできませんので、検索順位とは関係がない部分となります。わずかな事例ですので、完全にそうだと言い切れる内容ではありませんが、Googleの内容を理解するための基準が、より人間に近いものになっているという印象を受けました。
 


他の記事も読んでみませんか
【内部対策】:タイトルタグだけで上位化させる最高峰のSEO対策”9″つの戦術
【内部対策】:悪意のない、サイト内重複コンテンツでペナルティ”6”事例
【CRO】 :サイトに訪れたユーザーを逃さない、直帰率を改善する”11″の方法
【ツール】 :プロのSEO技術者なら知っている、使えるツール&サイト56選!
【戦 略】 :最高のキーワード選定は上位化率をアップさせSEOを成功へ導く
【内部対策】:Googleの形態素解析アルゴリズムを分析して内部SEOに活用する
【仮 定】 :関連性の高いサイトからのリンクが危険な理由
【内部対策】:【内部対策】低品質なページを改善して検索順位上げる方法
【調 査】 :有名サイト、昔と今のタイトルタグを比較
【仮 定】 :認知度やニーズの変化による検索ランキングの変化