2013年11月2日 土曜日

サンドボックスからフレッシュネスの時代へ

Googleサンドボックスという懐かしい言葉があります。新しく取得したドメインは一定の間上位表示されることがなく、検索エンジンから信用を得る為には、継続したサイト運営が必要だというものです。

YSTに関してもアップデートが行われるまで順位変動がほとんどなく、ドメインエイジが重要視されていた時代がありました。今でもドメインエイジを重要と考えるのは、その名残ではないかと思います。当時は検索エンジンの性能が追い付いていなかったという面もあるのかもしれません。

今はというと、サンドボックスのような現象は、自分の知る範囲ではほとんどなくなりました。新規のドメインであってもインデックスされるスピードは早く、上位化のためにドメインエイジの古いサイトとの差は感じられません。

最近のGoogleはというと、QDFアルゴリズムと呼ばれる最新情報を上位に表示させるものや、フレッシュネスアルゴリズムと呼ばれる最新のコンテンツを優先的に評価する機能が導入されています。

確かにSEO関連の検索キーワードを打ち込んでみても、昔の有名なSEOサイトやページの情報はまったくと言っていいほど見る機会はなくなりました。もちろんクエリによって異なると思いますが、歴史ある古いサイトの評価はなぜなくなってしまったのでしょうか。

ソーシャルメディアの台頭によって、ページを拡散する為のハブサイトが増え、今まで少しづつしか増えることがなかった被リンクが、極端なスピードで増えるようになってしまい、歴史あるサイトを評価していては、ユーザーが求める検索結果を表示できなくなってきたという背景があるのではないでしょうか。

コンテンツは今、一瞬のうちに使い古されています。瞬間的に人気を集めたコンテンツでも、1ヶ月程度たった後のデータを見てみると、被リンクの伸びは極端に少なくなります。検索エンジン経由から訪れるユーザーはリンクを貼ることは少なく、ソーシャルメディア経由でリンクを共有する人が増えているように感じます。

常に新鮮な情報を求めているユーザーに対して、コンテンツは今以上に質とスピードが求められ、不要なアーカイブは、悪影響を及ぼす時がくるのではないかと考えました。

2013年10月5日 土曜日

ペンギンアップデート 2.1実施、順位変動するサイトの傾向

本日キーワードの全体的な順位変動を確認しまして、情報を探しているとどうやらペンギンアップデートだということです。

米Google、ペンギンアップデート 2.1 を週末実施
http://www.sem-r.com/news-2013/20131005062544.html

ペンギンアップデートは外部リンクに対して、ペナルティを与えるアルゴリズムです。今回は全体の1%に影響を与えるそうです。

ペンギンアップデートの対象となったサイトは順位を落としていますが、その影響もあって順位が上昇するサイトも多くありました。順位を大きく落としてしまったサイトの外部リンクを見ると、以下のような傾向が感じられましたので共有させて頂きます。

・yomi-searh
・自動相互リンク
・コメント&トラックバックスパム
・掲示板リンク

これらのリンクがすべて悪いという訳ではなく、一定の質を保ったページでないと、評価を与えることができないという印象です。ですので新規ドメインのサイトなどはあまり影響を受けていないかもしれません。

オリジナルのテキストやコンテンツがない自動生成系のページからのリンクは、今後評価を与えることができないようになっていく可能性が高いです。

過去に対策している施策でも、現在にまで影響を与えることがあるようです。今回順位保っていたとしても、ペンギンアップデートは次々と更新されていきますので、今のうちに外せるリンクは外しておいた方がいいかもしれません。

2013年9月27日 金曜日

Google最大級の検索アルゴリズム、Hummingbird(ハミングバード)

Googleが新しいアルゴリズム(Hummingbird)を導入していたそうです。アクセス解析などを見返してみても、あまり大きな変化があったような様子はありませんが、このアルゴリズムはどうやら会話型検索に影響を与えるものだそうです。音声検索のことかと思いましたが、以下のような表示のことでしょうか。※詳細は不明です。

検索キーワード:アメリカの首都はどこですか
検索結果:ワシントンD.C.

検索キーワード:日本の人口は何人ですか
検索結果:1.276億 (2012年)

検索エンジンの精度が高くなり、単一キーワードから、より詳細な情報を得る為に2語、3語と複合キーワードを入力するユーザーが増えて、解決しなければいけないボリュームになってきたということなのか、siriの普及という背景もあって、文章のような検索キーワードを打つユーザーが増えているのかもしれませんね。参考記事で気になる部分を引用して下記にまとめました。

CNETより
http://japan.cnet.com/news/service/35037714/
Amit Singhal氏によると、「私がGoogleに入社したとき、ウェブサイトに対して簡単な検索ができるようになっただけで人々は喜んだ。その後、その状態に慣れてくると、人々はさらに複雑な質問を投げかけてくるようになった。Hummingbirdは、その根本的な再考の結果である」

ASCII.jpより
http://ascii.jp/elem/000/000/828/828873/
この新しい検索アルゴリズムは、会話型検索で発生するような、長い検索クエリにおいてより適切な検索結果を提示できるようにする働きを持つ。

ロイターより
http://jp.reuters.com/article/topNews/idJPTYE98P07F20130926
新アルゴリズム「ハミングバード」を約1カ月前から導入

ITmediaより
http://www.itmedia.co.jp/news/articles/1309/27/news038.html
The Next Webによると、このアップデートは世界の検索の90%に影響を与えるとしているが、The Search Engine Landによると、GoogleはSEOの変更の必要はなく、パブリッシャーが心配することはないと語ったという。

TechCrunch Japanより
http://jp.techcrunch.com/2013/09/27/20130926google-recently-made-a-silent-shift-to-a-new-search-algorithm-hummingbird/
「このアップデートでは自然言語の質問文(単語を並べた検索ではなく)を高速に解析し、それに応じた適切なコンテンツとランクを判断して回答を提供するアルゴリズムが実装されている」と繰り返し強調した。

2013年9月16日 月曜日

Googleの第一の目的はユーザーを守ること

2011年2月にパンダアップデートと呼ばれる検索ランキングアルゴリズムが導入されました。低品質なサイトや薄っぺらいサイトの検索ランキングを下げることを目的としたアルゴリズムで全世界で話題となりました。アップデートは定期的に繰り返しており、パンダアップデートは学習し続けています。

低品質なサイトの具体例
・テキストを引用してきただけのコピーコンテンツ
・広告だらけでオリジナルコンテンツが薄いサイト
・内容が薄く、ユーザーに付加価値を与えないサイト
・自動生成された重複コンテンツや内容の薄いサイト
・情報量が少ないサイト
・信ぴょう性に欠けるサイト

ユーザーから自然にリンクされる機会が少ないサイトは、低品質なコンテンツであるという理解をしておく必要があります。
良質なサイトと判断する基準は、Googleウェブマスター向け公式ブログで公開されています。
http://googlewebmastercentral-ja.blogspot.jp/2012/09/more-guidance-on-building-high-quality.html

良質なサイトは、実際にこのような方法で判断している訳ではなく、検索エンジンのアルゴリズムという一定の基準に従って決定されます。

パンダアップデートの登場により、スパム対策が強化されたイメージがありますが、コピーコンテンツや自動生成コンテンツへのペナルティ対策は昔から存在していました。ヤフーやyoutubeなどのAPIを使った自動生成などは、登場当時より対策が行われ、単純にページ数を増やすだけのコンテンツは削除されていました。

以前より存在したアルゴリズムとパンダアップデートとの大きな違いは、スパムでなくとも、低品質と判断すれば評価を下げるという方向性です。例えば、日常的な記録を記しただけの日記や、個人的な内容のコンテンツなどは、訪れるユーザーにメリットを与える可能性が低い為、掲載順位を下げる可能性があるということです。

googleは、外部リンクに対しても同様の方向性を示しています。


あなたのサイトへの不正なリンク操作を行うかもしれません。
Googleの第一の目的はユーザーを守ることです。
(4:07~4:14頃)

Googleは自分が行った外部施策ではなくとも、ユーザーを守る為に場合によってはペナルティを与える可能性があるということです。最優先に考えるべきはユーザーという軸にブレはないでしょう。

低品質なコンテンツが存在することによって、順位に影響を与える可能性がある。ということは、今までウェブマスターはSEOのことを考えずとも、良質なコンテンツを提供していれば様々なキーワードで上位化することができました。

但し、今後は知らなかったでは通らず、知らない間にペナルティを受けてしまう可能性があり、検索エンジンで集客するのであれば、正しい知識を持つ必要があるのかもしれません。

スパムフィルタが優れ、SEOがやりやすくなったという声がありますが、自分のイメージでは、サイト運営者にとっては、SEOに対するハードルがさらに高くなったという印象があります。

2013年2月16日 土曜日

画像検索でも重複画像は禁止、ファイル名はわかりやすく設定する

画像検索で上位化するという需要はウェブ検索よりも多くありませんが、検索内容によっては画像一覧から対象のページを発見し、情報を集めるといったことも少なくありません。画像検索で上位表示を達成する為に必要な要素と注意点をまとめます。

1.ファイル名はわかりやすくする
0001.jpgのような画像はどういう内容の画像かわかりませんが、dog.jpgとなっていれば、それが犬の画像だということを知ることができます。管理面を考えると、2014-11-05.jpgのような設定をする場合もあると思いますが、画像からの流入が少しでも考えられるのであれば、画像内容をファイル名に使用するようにしてください。

2.altタグを詳しく設定する
代替テキストを設定することで、画像の内容を検索エンジンに伝えることができます。画像検索に出しても意味のない画像、サイトコンテンツと関係のない画像に対しては特に設定する必要はありません。また、単語のみで使用するのではなく、なるべくシンプルな1文でわかりやすい文章にする必要があります。キーワードの詰め込みはスパムになりますので、もちろん禁止です。

3.重複画像の禁止
ウェブ検索では、重複コンテンツにならないようにすることは常識ですが、画像検索においても同様です。どこかのサイトから画像を持ってきた場合、それは重複画像と判断されてしまいます。オリジナルの画像を用意することで、画像検索からのアクセスを集めることができます。素材を使用する場合などは、オリジナルの加工をすることで解決できるかもしれません。

4.画像周辺にテキストを記述する
画像にaltタグを設定しただけで安心してはいけません。例えばaltタグに「京都にある、けいはんな記念公園」と設定していた場合、ユーザーは視覚的に公園であることは認識できますが、それがどこの地域にある公園で何という名前の公園かは判断できない可能性があります。視覚的にも情報を与えることで、リンクが張られる時のアンカーテキストも適切なものとなる可能性があります。

5.高品質な画像を使用する
ウェブ検索と同様優れた画像を使うことで、上位に表示されやすくなります。独自性があり、高画質の画像はユーザーがリンクを張りたくなるような画像です。画像検索時にも高品質な画像はクリックされやすくなり、さらにユーザーを呼び込むことができます。

2013年2月12日 火曜日

Googleがユーザーの利便性を考えることがベストだとする理由を考える

・独自のコンテンツが必要な理由は、内容が薄いページには、○○○を□□□くれないから。

・ソーシャルが重要な理由は、ユーザーが拡散して増えてくれないと○○○を□□□くれる数が増えないから。

・関連性の高いコンテンツに評価されなければいけない理由は、流入してくるユーザーが○○○を□□□くれる確率が高くならないから。

・重複コンテンツがダメな理由は、○○○を□□□くれる数が分散してしまい、ページの評価が低くなるから。

・各ブラウザできちんと表示されるかどうか確認しなければいけない理由は、デザインが崩れたページに対して○○○を□□□くれないから。

・ABテストをしなければいけない理由は、わかりやすいコンテンツや配置によって、直帰率や滞在時間が改善され、ユーザーが迷子になることなく○○○を□□□くれるから。

・広告が多すぎてはダメな理由は、広告をうざいと思い○○○を□□□くれないから。

・タイトルタグやaltにキーワードを入力する必要があるのは、○○○を□□□もらう時に評価を最大限にできるから。

・無効なリンクがないかどうか確認しなければいけない理由は、リンク切れのサイトに対して、安心して○○○を□□□くれないから。

・Googleがユーザーの利便性を高めることを常に推奨する理由は○○○を□□□くれるのはユーザーだから

 

○○○…リンク
□□□…張って

※ナチュラルリンクが必須となることですが、「リンクを張る」を強調しすぎると、そればかり意識してしまうユーザーが増えてしまうため、順位に影響を与える大きな基準ではありますが、あえて記載していないのではと考えました。

 

2013年1月31日 木曜日

単一と複合キーワード、Googleはどう認識しているのか

今回の記事は以下の続きとなります。
 
Googleの形態素解析アルゴリズムを分析して内部SEOに活用する
http://blog.mf-seo.com/archives/8891
 
『2つの語句から成り立つキーワードについて、Googleではどのように認識しており、どのように最適化すべきか』この疑問から今回の記事を書きました。
 
前回の記事説明となりますが、Gooleが運営するサイトでは、なぜか特定の単語の間に空白タグを入れているという現象がみられました。「プライバシー ポリシー」のような形です。ただ、「ウェブサイト」のように空白タグを含まれないキーワードも存在します。これはGoogleが運営するサイトすべてに適用されています。どういう意図でこういった使い方をしているのかわかりませんでしたが、キーワードについてもう少し掘り下げて考えてみるべきだと考えました。
 
キーワードによっては2語から成り立つものがあり、意味のある単語同士を組み合わせて新しい語句が形成されているキーワードに関して、検索エンジンはどのような認識をしているのかが非常に気になるところです。つまり、例を挙げると「seo対策」という検索クエリに対して、「google対策」という言葉の「対策」部分を重要とみなすのかどうかということです。もちろん語句との関連があれば意味のあるものにする方が良いかと思いますが、「パンダアップデート」のように本来の意味とはまったく関係のないケースもあります。
 
キーワードによって、分割して認識するケースと認識しないケースを探してみることにしました。結果が以下となります。記号部分の説明ですが、「-」は除外「””」は完全一致となります。つまり、検索したキーワードの中から、完全に一致したものを除外してくださいという意味です。これで、対象のキーワードが分割されて認識しているのか、いないのかを判断することができると思います。
 
【見つかったキーワード】
検索エンジン最適化 -“検索エンジン最適化”
アンカーテキスト -“アンカーテキスト”
内部対策 -“内部対策”
被リンク -“被リンク”
アクセス解析 -“アクセス解析”
 
【見つからなかったキーワード】
SEO -“SEO”
ホームページ -“ホームページ”
スマートフォン -“スマートフォン”
ブックマーク -“ブックマーク” -“ブックマーク”
JavaScript -“JavaScript”
 
見つからなかったキーワードですが、「JavaScript」のケースで考えると、「java」とウェブページに掲載していたとしても、「JavaScript」の検索クエリに関しては、まったく無視されてしまうということが予想されます。「JavaScript」と「Java」は異なるプログラム言語ですが、「JavaScript」のことを「Java」と省略して呼ぶこともあります。ですが、「Java」と省略して書いてしまった場合、まったく検索に引っかかることがないということになってしまいます。
 
こういったケースはめずらしいことではありません。一般的に同じような事例はたくさんあると思います。検索エンジンの認識と人間の認識が違う可能性があるということはサイト内のコンテンツや文章を作成する上で気を付けておかないといけない部分です。自分が運営する業界で検索エンジンからの流入が期待できるキーワードは、どういった取扱いになるのかを一度調べておく必要があります。
 
分割されたキーワードに空白タグを入れて検索することで、本当に認識されているのかを掘り下げて調べてみました。「Java Script」で検索をしたところ、下記のような結果が見つかりました。空白タグを入れているにも関わらず、javaの文字部分には太文字で表示されず、検索エンジンはこの語句を検索クエリとは関係ないと認識しているようです。
 

 
他の検索結果を見ていると下記のような検索結果が見つかりました。javaと使用しているにも関わらず、太文字で表示されております。これは一体どういうことなのでしょうか。同一の語句であっても場合によっては重要とみなす場合もあれば、みなさない場合もあるということです。その原因は一体なんでしょうか。先ほどの語句との違いはどこにあるのでしょうか。
 

 
引き続き検索結果を見てみると、少し答えが見えてきたような気がします。次の結果には太文字で表示されておりません。共通部分は「javaとJavaScript」JavaScriptとの比較表現が出たときには太文字には表示されないという可能性が出てきました。単体で記載されているときにはjava=JavaScriptであるけれど、同時に使われた時の認識はjava≠JavaScriptということです。これは非常に興味深い現象です。
 

※URLにマークしておりますが、パンくずリストが出現した時に太文字になる例がありませんでした。
 
語句の意味を認識するだけでなく、他の語句が出現した時には別の意味になるということを理解しているということです。「seo」だけの場合であれば、もしかすると「瀬尾」という人物の英語表記なのかもしれませんが、「リンク」「上位表示」などと同時に使われることで、検索エンジン最適化の意味だと確信することができるということです。
 
java.comのケースでは、単体で使用されている為、「Java Script」の検索結果に表示されておりますが、検索結果としては適切ではありません。不完全な部分もあるということです。また、検索ユーザーの目的を理解することはできませんので、検索順位とは関係がない部分となります。わずかな事例ですので、完全にそうだと言い切れる内容ではありませんが、Googleの内容を理解するための基準が、より人間に近いものになっているという印象を受けました。
 

2013年1月29日 火曜日

QDFアルゴリズムの発動対象となるキーワードを調査

QDFアルゴリズムとは、人気のトピックに対して新鮮な記事を一時的に上位表示させるというアルゴリズムです。ブログやニュースサイトが上位に表示されている例をよく見かけますが、実際にどういったキーワードがQDFアルゴリズムの対象となり、上位に表示することができるのでしょうか。ビッグキーワードでも発動されるという事例も見かけますが、発動以前のキーワードボリュームによる変化はあるのか調べてみることにしました。

検索ボリュームの増加により発動対象となり、上位表示される対象ページは、ソーシャルや急激な被リンクなどがシグナルとなる可能性が考えられます。また、古い記事を上位に表示させても仕方がないので、発動条件後、インデックスされたページに限られると思います。ただ、発動条件の幅を広げすぎてしまうと、よく使われるキーワードがQDFアルゴリズムによって、かえってめちゃくちゃになってしまうのではないかと思いました。

結果は以下のようになりました。より具体的なキーワードが対象となる傾向となりましたが、「FP」などは元々よく検索されるキーワードで検索ボリュームも多く、対象とするにはどうかなといったところです。それほど注目度が高かったのでしょうか。

また、「IPS」に関しては対象となっていませんでしたが、最近よくニュースで話題となっているので、発動されてもおかしくないのではないでしょうか。これらのキーワードはYahoo!ニュースのトップに表示されていた記事ですので、言及するブログやニュースが少ないということはないと思います。もしかすると、記事が新しすぎて、ニュースやブログが記事を掲載する前にチェックしてしまったということは考えられると思います。

全体的なイメージとしては、通常の検索ボリュームから急激な伸びを見せたキーワードに対して発動される傾向となりました。ですので、元々ボリュームの多いキーワードは対象となりにくいのかもしれません。ビッグとミドルでキーワード自体の意味合いも異なるケースも多い為、判断が難しいところではありますが、例外もありましたので、さらなる検証を続けていきたいと思います。
 
各キーワードのQDF発動判定

ビッグワード 判定 ミドルワード 判定
IKEA × IKEA 愛知
FP FP検定
AKB × AKB柏木
ダイエット × ダイエット はし置き
iPS × iPS再生医療
シャープ × シャープ 子ども向け
通販サイト × 偽通販サイト
すし × すしダンス
韓国 △別の記事 韓国大統領
春闘 春闘スタート
日銀 × 日銀 否定
牛肉 × 米産牛肉



 

2013年1月29日 火曜日

QDDは本当に存在するアルゴリズムなのか

QDDというアルゴリズムを聞いたことがありますか。検索結果に多様性を持たせるアルゴリズムです。例えば『スラッシュ』という言葉で検索した時に、同一の意味であるスラッシュというキーワードの様々なサイトを表示させるということです。ミュージシャン、記号、製品名など。こうすることで検索ユーザーの求めている検索結果を表示させる可能性が高くなるということです。
 
このQDDという言葉は2008年の5月11日にseomozによって生まれました。それ以前にこのアルゴリズムについて言及しているサイトは見つかりませんでした。マット・カッツのブログでは今まで言及例はありません。
 
QDDアルゴリズムは実際に導入されているものなのでしょうか。それともseomozの仮定にすぎないのでしょうか。確かにそれらしい検索結果は多くあります。ただ、例外の検索結果もまた多く存在します。例外の理由はなんでしょうか。回答例として、検索ボリュームに偏りがあると考えられると思いますが、当然サイト数も多い場合があり、リンクが集まる比率は高くなります。ですので的確な回答とは言えません。
 
Googleはサイト上に以下の言葉を掲載しています。
 
Google がユーザーのためにしていること
検索をさらに賢く高速にするということです。そうすれば、キーボードから「ジャガー」と入力されたときに、ユーザーが探しているのが動物の写真ではなく、自動車であることを理解できます。

https://www.google.com/intl/ja/about/company/products/
 
多様性を持たせれば関連性がなくなり、適切な検索結果を表示させることが難しくなる可能性があります。QDDというアルゴリズムは存在すると思いますか?
 

2013年1月28日 月曜日

グーグルページランクは検索順位に直接影響を与えないが理解は必要

なぜ今さらページランクの説明かというと、ページランクは順位決定にはそれほど意味がないと語られていますが、まったく無視してよいものではなく、検索エンジンで上位表示を達成しようとしている方であれば、どういうものなのかを知っておく必要はあると思ったからです。
 
ページランクとは、ウェブページの重要度を決めるアルゴリズムで、Googleの検索結果で使われている土台となるアルゴリズムです。このページランクを簡単に説明してみても、ややこしい数式やら数値が絶対必要になるので、図解にすればまだわかりやすいのですが、ペイントぐらいしか使わない自分からすると余計にわかりにくい結果となってしまう為、別の例えで説明してみたいと思います。
 
ページランクとはいわゆる『年齢』のようなもので、PR0は「0歳~10歳」PR1は「11歳~20歳」というイメージを持ってみてください。下記のような人物がいたとします。この3人はそれぞれの人生の中でゲームに関わってきました。この人物はどういう人ですかと聞かれた時にそれぞれ下記のような意見が集まりました。
 
①13歳 男 趣味はゲームで知識量は豊富。ページランクは『1』
 
②26歳 女 化粧品会社の会社員でたまにゲームをする。ページランクは『2』
 
③46歳 男 ゲーム会社の社長。ページランクは『4』
 
この中でゲームについて訊ねられた時、一番詳しい人は誰でしょうか。
おそらく③の男性です。次に①、②と続きます。①と③の人物は同じようにゲームについての知識を付けてきましたが、『年齢』という部分で経験と知識の差を付けられたということです。
 
『年齢』が高くても、すべての人が例えば「美容」「医療」「賃貸」に詳しい訳ではありません。但し、得られた知識量は若い人と比べると多いはずです。また専門家として一筋でやってきた人もいれば、様々な業種を経験してきた人もいると思います。
 
ページランクはこのように高ければ高い程、検索順位に対して明確な答えを持っているサイトとは言えませんが、専門的な知識を増やせば自然と増えていくものです。ページランクは数字自体がリアルタイムで更新されるものではありませんし、数字自体が直接検索順位に影響を与えるものではありませんが、意味のあるものだという理解は必要です。