Googleの形態素解析アルゴリズムを分析して内部SEOに活用する

形態素解析とは、情報源となる言葉から言語を分割して品詞を判別することです。
 
「anything」
 
この言葉を分割した場合「anything」となります。「any」と「thing」に分けられることはありません。これは情報源となる言葉に「anything」という言葉があるからです。日本語の場合も同様に「いつでも」という言葉を「いつ」「でも」と分けられることはありません。「いつでも」という言葉をすでに理解することができるからです。
 
では、「プライバシーポリシー」「ウェブサイト」この言葉はGoogleの辞書にあると思いますか。答えはGoogleのウェブサイトの中から探すことができます。
 
Google Chrome のプライバシーに関するお知らせ
http://www.google.co.jp/chrome/intl/ja/privacy.html
 
冒頭は下記のような記述です。
「Google のプライバシー ポリシーでは、」
 
「Googleのプライバシーポリシーでは、」という使い方ではありません。おそらく単語として認識していないものに関しては、空白タグを挟んで分割しているのではと考えられます。Googleはこのページだけでなく、すべてのコンテンツの中にあるテキストでこういった使い方をしています。
 
AdWords 日本版 公式ブログ
http://adwords-ja.blogspot.jp/
 
Google クラウド プリント
http://www.google.co.jp/cloudprint/learn/
 
など、異なる人物が記述した内容と考えられますが、こういった言葉の分割が行われた後使用されています。ちなみに、ウェブマスターツールなどでGoogleの関係者以外の文章には適用されていません。Googleが自社のサイトで分割したテキストを使う理由は、
 
1.検索アルゴリズムと同一のものを使用して、新しい言葉を1つの言葉として扱いたくない為
 
2.なんとなく見やすいから
※こちらであれば今回の記事はすべて意味のないものとなります。
 
この形態素解析アルゴリズムをSEOにどう応用すればよいかというところですが、自社のサービスのメインキーワードが2語から成り立っているのか、1語で成り立っているのかを認識しておくことができれば内部対策も明確になります。
 
「プライバシー ポリシー」の場合を例に出すと、Googleが2語と認識しているのであれば、「プライバシー」というアンカーテキストやサイト内テキストでも一定の評価が得られる可能性があります。また、プライバシーポリシーという続きの言葉を使用していなくても、キーワードの比率が多くなってしまう可能性があります。
 
まずは下記のような検索でGoogleサイト内で使用されている使い方を見てみましょう。
site:google.co.jp キーワード
 
今回の記事はあくまで仮定の段階となりますので、今後、検証を重ねて、明確なデータとして蓄積していきたいと思います。
 


他の記事も読んでみませんか
【内部対策】:タイトルタグだけで上位化させる最高峰のSEO対策”9″つの戦術
【内部対策】:悪意のない、サイト内重複コンテンツでペナルティ”6”事例
【CRO】 :サイトに訪れたユーザーを逃さない、直帰率を改善する”11″の方法
【ツール】 :プロのSEO技術者なら知っている、使えるツール&サイト56選!
【戦 略】 :最高のキーワード選定は上位化率をアップさせSEOを成功へ導く
【内部対策】:Googleの形態素解析アルゴリズムを分析して内部SEOに活用する
【仮 定】 :関連性の高いサイトからのリンクが危険な理由
【内部対策】:【内部対策】低品質なページを改善して検索順位上げる方法
【調 査】 :有名サイト、昔と今のタイトルタグを比較
【仮 定】 :認知度やニーズの変化による検索ランキングの変化