2013年8月28日 水曜日

クローキングスパムなる例、ならない例

SEOの為に、意図的なクローキングをしているサイトはほとんど見かけなくなりました。サイト内に存在しないキーワードで上位化していて、被リンクにもそれらしきアンカーテキストがない場合、ユーザーエージェントを変えてみると、テキストがすごいことになっているサイトがあったり、そういう場合は大抵ディスクリプションでもわかるのですが、微妙なクローキングをしているサイトはわずかですがまだ存在しています。デメリットの方大きすぎますね。ただ、検索順位を操作する目的でないクローキングが最近増えてきたように感じます。それは、LPOやデバイスの振り分け、会員専用コンテンツなど、ユーザーセグメントの機会が増えてしまった為だと思います。

クローキング
クローキングとは、ユーザーと検索エンジンに対して、それぞれ別々のコンテンツを表示させることです。簡単に説明するとこういうことなのですが、覚えておくべきポイントは『検索エンジンに対してのみ、セグメントをかけなければ問題ない』ということです。

デバイスの振り分け
PCと携帯の振り分けは、iphoneでアクセスしてきたユーザーは携帯サイトに飛びます。PCのクローラーはPCサイトをみます。一見、ユーザーとクローラーに対して別々のページを見せている為、クローキングになってしまう可能性が考えられますが、PCデバイス、携帯デバイス2種類の分類の中で生じた振り分けなので、特に問題ありません。

ABテスト
これは、難しい問題ですが、基本的にはSEOでABテストはやらない方がいいかもしれません。内容によりけりですが、まず大幅なテストは少なからず順位に影響がでます。それ以外にも一定の制限がかかってしまうので、リスティングやその他広告でnoindexで導入する方法をお勧めします。クローキングになるかというと基本的には問題ないと思いますが、偏った表示が続いていれば、もしかするとペナルティを受ける可能性は0ではありません。

エリア別のLPO
地域ごとに見せるコンテンツを変更するLPOは、特に問題はありません。デバイスごとの振り分けと同様、エリアごとのセグメントは設定されていますが、検索エンジンだけに用意されたコンテンツが存在しない為です。googleのクローラーは米国から来ますが、米国から来たユーザーも同じコンテンツを見ますので、得に問題はありません。

会員制コンテンツ
ログインしないと見れないコンテンツはクローキングになりません。条件さえクリアしていれば、検索エンジンにも見れたはずだからです。但し、まれにログインしないと見れないコンテンツが、検索エンジンにインデックスされてしまっているサイトがあります。運営者がアクセス数を伸ばしたい為にコンテンツを検索エンジンにのみ認識させているという例です。これはクローキングとなってしまいますので、注意が必要です。

クッキーによって振り分け
初回アクセスの表示と、2度目に訪れたユーザーに対する表示を、クッキーを元に変更するケースがあります。これも会員制コンテンツと同様クッキーを保持すれば、検索エンジンにも同じように見えたはずなので、クローキングと認識されることはありません。

2013年8月10日 土曜日

ウェブマスターツールに手動対策ビューア登場

参考
グーグル、自分のサイトのスパム判定を確認できる手動対策ビューアを公開
2013年08月09日
【公式】ウェブマスター ツールでの手動によるウェブスパム対策の表示
2013年08月09日

Googleが手動ペナルティの詳細をウェブマスターツールで公開するようになったようです。どういったジャンルのスパムに該当して、それはサイト全体に影響を及ぼすものであるか、一部か。また対象となっている箇所はどこなのか。

手動対策ビューアによって、修正すべき箇所と何を修正すべきかという部分が、ある程度明確になりました。一番気になる箇所と言えば、やはり外部リンクに関する項目だと思いますが、2種類に分かれているようです。違いは何なのかを考えてみます。

1.サイトへの不自然なリンク
https://support.google.com/webmasters/answer/2700611?hl=ja&ref_topic=2604771

推奨される対処として、リンクを確認し、違反を特定して修正するとあります。最近(数か月以内)のものから修正するという指示がありますので、リンクに問題があればかなり早い段階でアラートが来るのではないかと予測することができます。長い運営歴があり、リンク数も膨大な数になっている場合には、チェックがかなり大変となりますが、最近のものを重点的にチェックすれば問題なさそうです。自分の経験ですが、かなり昔の外部対策が、当時問題なく、最近になってペナルティを受けるということは少ないです。これは、もちろん問題あるケースもありますが、かなり質の低い対策でなければセーフになっている例が多くあります。ペナルティのアルゴリズムは単発的で、その時に引っかかっていなければ、とりあえずその時点では問題ないという認識です。

2.このサイトへの不自然なリンク – 影響のあるリンク
https://support.google.com/webmasters/answer/2604772?hl=ja&ref_topic=2604771

こちらの対応方法として、管理下にない場合は何もする必要はなく、リンクの効果をゼロにしたので、特に対応をしなくてもよいということが書かれています。但し、人為的なリンクを削除できる場合には、削除した後、再審査リクエストをするように推奨しています。考えられることとしては、疑わしいけれど、効果をゼロにしたのでなにもしなくてもよい。但し、手動対応が行われていることには変わりなく、今後のアラートのことを考えると、今のうちに修正可能であれば、対応することを推奨するということでしょうか。

いずれにしても、アラートが来たということは、修正すべきことがあるということです。手動対策ビューアに従ってウェブサイトの修正を行う必要がります。

2013年3月6日 水曜日

Googleの手動によるスパム対応データ(2012年4月版)

Googleの手動スパム対応データです。2012年4月の月間データとなります。
http://www.google.com/intl/ja/insidesearch/howsearchworks/fighting-spam.html

純粋なスパム
131,247

レガシー(未分類)
0

ハッキングされたサイト
21,181

サイトからの不自然なリンク
10,781

自動的に生成されたコンテンツと無限のスペース
255

クローキングまたは不正なリダイレクト
1

付加価値がほとんどまたはまったくない、実質のないコンテンツ
8,998

サイトへの不自然なリンク
17,904

パークドメイン
0

ユーザー生成スパム
1,240

隠しテキストまたはキーワードの乱用
217

スパム性のあるホストと動的DNSプロバイダ
15

ウェブマスターツールの警告メッセージ
408,068

SEOスパムで一番多い例がワードサラダ系コンテンツのようです。圧倒的に多い事例となりますが、簡単に作成できることが原因でしょうか。ウェブマスターツールの警告メッセージが急増していますので、被リンク系のスパムがもう少し多いと思っていましたが、増加しているものの、そこまで多いとは感じませんでした。

また、あくまで手動による対応ということですので、アルゴリズムによる対応の方が圧倒的に多いとは思いますが、手動対応が増加している部分に関しては、逆に考えると現時点ではアルゴリズムでは対応しずらい部分という可能性もあります。ワードサラダ系は減少していますので、アルゴリズムによる対応が進んだということでしょうか。

2013年2月23日 土曜日

rel=”prev”とrel=”next”の使い方、間違っていませんか?

rel=”prev”とrel=”next”は、複数のページにまたがるコンテンツを検索エンジンに対して正しく伝える方法です。例えば、1ページ目「今日は」、2ページ目「晩御飯に」、3ページ「ラーメンを」4ページ目「食べました」こういったコンテンツがあった場合、検索結果に優先すべきページは1ページ目です。通常何も設定しなくても、Googleは関連性の高いページを優先しますが、処理がうまくいっていないと感じるようであれば、rel=”prev”とrel=”next”を使用してみるのも良いかもしれません。

「今日は晩御飯にラーメンを食べました」
このような、すべて掲載されたページ(View-allページ)があればベストです。1~4ページそれぞれから、View-allページに対してcanonicalの設定をすることができます。canonicalは、指定先に指定するコンテンツが含まれていない場合は使用できませんので、1ページ目から2ページ目へ指定するようなことはできません。また、rel=”prev”とrel=”next”は、canonicalのような機能とは別ものですので、両方とも宣言するといった使い方も可能です。

こういった機能があるrel=”prev”とrel=”next”ですが、使い方を間違っているサイトをよく見かけます。トップページによくある質問や、問い合わせページなどを指定しまっているサイトや、指定先のURLが指定ページと同一のサイト、まったく別のドメインを指定しているといったような使い方です。こういうミスをした時に、検索順位に影響を与えるのかどうかが気になる所ですが、調べてみた所、どうやら実装方法が間違っている場合には無視するようです。実際に誤った使い方をしているサイトを25サイトほどチェックしてみましたが、順位に影響を与える様子はありませんでした。

ウェブマスター向けの機能がどんどん追加されており、運営者にとっては、大変うれしいことですが、理解不足のまま使用してしまうと、今回のように影響を与えるものでなければ良いのですが、強力な指定を間違ってしまった場合、サイトの検索順位に大きな影響を与えてしまう可能性があります。要注意事項を下記にまとめます。

マルウェア
Googleセーフブラウジング診断ページで100サイト程チェックしてみると、あやしい動きをしているサイトが複数見つかります。そういった意図がなくとも、システムの重要なアップデートを怠って被害に合うケースもありますし、悪意のある攻撃を受けてしまうことも少なくありません。定期的にチェックを行うようにしましょう。マルウェアに感染した場合、検索順位に大きな影響を与えます。

robots.txt
他のサイトを参考にせず、robots.txtで検索エンジンのクローラーを弾く記述が書けますか?あまり自信がない方は、一度robots.txtを見直すことをおすすめします。無料レンタルブログのサービスでrobots.txtの記述に誤りがあり、ほとんどのページがインデックスされないといったケースがありました。その他にもrobots.txtの間違いはよく見かけます。/を入れるか入れないかで致命的なダメージを受ける可能性があります。

noindexメタタグ
こちらのタグは、間違って設定しているサイトはあまりないですが、ゼロではありません。head上部にindex、head下部にnoindexと2つのタグを入れており、インデックス削除されているサイトがありました。このように誤りを発見しにくいケースもありますので、注意するようにしましょう。

canonical正規化ミス
こちらも致命的な影響はないかと思いますが、かなり多い事例となります。canonicalで正規化ミスをしている場合です。wwwありに正規化しているのにもかかわらず、wwwなしでcanonicalをしてしまっているサイトは、一度メインのURLを決めなおした方が良いかもしれません。

悪意のないクローキング
携帯振り分けに関するクローキングペナルティに関しては以前の記事を参考にしてください。その他にも、ユーザーにはフラッシュサイトを表示させ、検索エンジンにはHTMLサイトを表示させる例や、ユーザーには広告を見せて、検索エンジンには広告を見せない例、ユーザーには会員登録の画面を見せて、検索エンジンにはログイン後の画面、など考えればきりがないですが、問題ないような気がするクローキング方法です。検索エンジンをだます意図がなかったとしても、ユーザーが見るソースと検索エンジンが見るソースは絶対に変えてはいけません。変えても問題ないケースはモバイル端末の振り分けと国・言語による振り分けのみとなります。

2013年2月16日 土曜日

悪意のないクローキングに注意、携帯振り分けでの重要ポイント

Googleのクローラーとユーザーで異なるコンテンツを表示させることはクローキングといい、検索エンジンスパムと認識されてしまう可能性があります。SEO目的でクローキングを行う人は随分少なくなった印象受けますが、デバイスの振分時に、無意識のうちに設定してしまう可能性がありますので注意が必要です。

PC端末から携帯サイトへアクセスした場合、PCページにリダイレクト。携帯端末からPCサイトへアクセスした場合に携帯ページにリダイレクト。これは何もおかしいところはありません。

問題はGoogleボットに対しての振り分けです。クローラーは、ウェブ検索用のGooglebotとモバイル検索用のGooglebot-Mobileとがあります。PCから閲覧した場合には「当サイトは携帯端末専用となっております」と中身のコンテンツが見れない状態になっていて、Googlebotがアクセスした時にはモバイルサイトを見せてしまっている場合があります。

この場合、ウェブ検索用のGooglebotがモバイルサイトをインデックスしてしまいますが、人間には閲覧できるサイトではありませんので、クローキングとなってしまいます。PCユーザーに対してソースを見られたくない、表示させたくないというサイトはあると思いますが、調べてみると、こういったクローキングとなってしまい、うまく検索エンジンに認識されていないケースがありました。

運営者には悪意はなくとも、振り分けはクローラーに対して強制ですので、注意する必要があります。知らない内にペナルティを受けてしまっている可能性があります。

2013年2月7日 木曜日

重複コンテンツ厳選63記事まとめ

【Google公式 重複するコンテンツについて】

1.重複するコンテンツ

http://support.google.com/webmasters/bin/answer.py?hl=ja&answer=66359

2.クロスドメイン URL の選択 – 複数のドメイン間の重複コンテンツの正規化について
http://googlewebmastercentral-ja.blogspot.jp/2011/11/url.html

3.URL パラメータ
http://support.google.com/webmasters/bin/answer.py?hl=ja&answer=1235687

4.正規化
http://support.google.com/webmasters/bin/answer.py?hl=ja&answer=139066

5.rel=”canonical” 属性について
http://support.google.com/webmasters/bin/answer.py?hl=ja&answer=139394

6.301 リダイレクト
http://support.google.com/webmasters/bin/answer.py?hl=ja&answer=93633

7.多言語ウェブサイトの作成について
http://googlewebmastercentral-ja.blogspot.jp/2011/11/blog-post.html

8.rel=”alternate” hreflang=”x” について
http://support.google.com/webmasters/bin/answer.py?hl=ja&answer=189077

 

【重複コンテンツ対策全般】

9.パンダ・アップデート後の重複コンテンツを知る – 重複コンテンツ対策完全ガイド #1
http://web-tan.forum.impressrd.jp/e/2012/01/30/12025

10.重複コンテンツ問題を解決する12の手段 – 重複コンテンツ対策完全ガイド #2
http://web-tan.forum.impressrd.jp/e/2012/02/06/12026

11.重複コンテンツが発生してしまう19の具体的なパターン – 重複コンテンツ対策完全ガイド #3
http://web-tan.forum.impressrd.jp/e/2012/02/13/12027

12.URL正規化のポイントと重複を診断する4つのツール- 重複コンテンツ対策完全ガイド #4
http://web-tan.forum.impressrd.jp/e/2012/02/20/12028

13.Google、重複コンテンツ(コピペサイト)の対処方法について解説
http://www.sem-r.com/seo/20080616131002.html

14.「重複コンテンツ例とその解決ポイント」解決策は、SEOの知識に「ユーザーへの訴求・心遣い」を融合させて生まれるものがある
http://whitebear-seo.com/seodirector-blog/google/naibutaisaku/copy-content/

15.複製コンテンツ(Duplicate Content)問題丸わかり絵解きガイド
http://web-tan.forum.impressrd.jp/e/2007/04/19/1215

 

【事例&応用】

16.バーバリーのUSサイトがインデックスから消滅、原因は重複コンテンツ 2012年04月06日
http://www.suzukikenichi.com/blog/berburry-us-deindexed-due-to-dupulicate-content/

17.重複コンテンツペナルティを解除した事例のご紹介
http://seo.muraweb.net/blog/seo/%E9%87%8D%E8%A4%87%E3%82%B3%E3%83%B3%E3%83%86%E3%83%B3%E3%83%84%E3%83%9A%E3%83%8A%E3%83%AB%E3%83%86%E3%82%A3%E3%82%92%E8%A7%A3%E9%99%A4%E3%81%97%E3%81%9F%E4%BA%8B%E4%BE%8B%E7%B4%B9%E4%BB%8B/

18.寄稿記事(全文転載)を行う時のベストプラクティス(SEO観点)
http://www.sem-r.com/news-2013/20130111132836.html

19.A/Bスプリットテストはクローキングや重複コンテンツになるのか? 2012年08月10日
http://www.suzukikenichi.com/blog/how-to-run-ab-testting-correctly/

20.ネットショップでオリジナルコンテンツを増やして重複コンテンツを減らす方法 2012年01月16日
http://www.suzukikenichi.com/blog/how-to-make-original-content-and-reduce-duplicate-content-on-ecommerce-sites/

21.ネットショップ運営者が気をつけるべき重複コンテンツ問題 2009年05月28日
http://www.suzukikenichi.com/blog/e-commerce-sites-should-avoid-duplicate-content/

22.地域別の重複ページを差別化する7つのコンテンツ
http://lblevery.com/blog/blog/2012/07/17/differentiation-7contents/

23.Google: 重複コンテンツはrobots.txtでブロックしてはいけない 2009年10月08日
http://www.suzukikenichi.com/blog/google-tells-you-not-to-block-dupulicate-content-via-robots-txt/

24.パンダアップデートをすり抜けた重複コンテンツのサイトの特徴
http://gomiseo.blog.shinobi.jp/google%E3%81%AEseo%E5%AF%BE%E7%AD%96/%E3%83%91%E3%83%B3%E3%83%80%E3%82%A2%E3%83%83%E3%83%97%E3%83%87%E3%83%BC%E3%83%88%E3%82%92%E3%81%99%E3%82%8A%E6%8A%9C%E3%81%91%E3%81%9F%E9%87%8D%E8%A4%87%E3%82%B3%E3%83%B3%E3%83%86%E3%83%B3%E3%83%84%E3%81%AE%E3%82%B5%E3%82%A4%E3%83%88%E3%81%AE%E7%89%B9%E5%BE%B4

25.Googleが重複コンテンツを見破るアルゴリズムとは?
http://www.seojapan.com/blog/google%E3%81%8C%E9%87%8D%E8%A4%87%E3%82%B3%E3%83%B3%E3%83%86%E3%83%B3%E3%83%84%E3%82%92%E8%A6%8B%E7%A0%B4%E3%82%8B%E3%82%A2%E3%83%AB%E3%82%B4%E3%83%AA%E3%82%BA%E3%83%A0%E3%81%A8%E3%81%AF%EF%BC%9F

 

【多言語コンテンツ】

26.グーグル、「rel=alternate hreflang=x」サポートを拡張、多言語サイトを適切にインデックス可能に
http://www.sem-r.com/seo/20111220185440.html

27.Googleの多言語マークアップでグローバルSEOに勝つ方法
http://www.seojapan.com/blog/global-seo-markup-by-google

28.ccTLDと重複コンテンツの関係について、グーグルとヤフーから新情報
http://web-tan.forum.impressrd.jp/e/2009/04/20/5404

29.翻訳記事を公開すると重複コンテンツになるのか 2011年12月22日
http://www.suzukikenichi.com/blog/does-translated-content-cause-a-duplicate-content-issue/

 

【rel=”canonical”】

30.link rel=”canonical”によるURL正規化タグ–SEOにとって非常に重要な進歩(前編)
http://web-tan.forum.impressrd.jp/e/2009/03/05/5112

31.link rel=”canonical”によるURL正規化タグ–SEOにとって非常に重要な進歩(後編)
http://web-tan.forum.impressrd.jp/e/2009/03/06/5113

32.link rel=”canonical”(カノニカルタグ)の使い方
http://whitehatseo.jp/%E3%82%AB%E3%83%8E%E3%83%8B%E3%82%AB%E3%83%AB%E3%82%BF%E3%82%B0%E3%82%92%E4%BD%BF%E3%81%A3%E3%81%A6url%E3%82%92%E6%AD%A3%E8%A6%8F%E5%8C%96%E3%81%95%E3%81%9B%E3%82%8B%E6%96%B9%E6%B3%95/

33.rel=”canonical”の正規化で、重複コンテンツを撃退 2009年02月16日
http://www.suzukikenichi.com/blog/rel-canonical-resolves-duplicate-content/

34.canonicalタグを設定しているのに重複コンテンツとして認識される。
http://productforums.google.com/forum/#!msg/webmaster-ja/W6NiA8eZYwU/vAbA7cxR_QIJ

35.canonicalタグはソーシャルボタンの挙動にも影響する
http://holy-seo.net/blog/seo/canonical-social-button-behavior-influence/

36.記事の7割をコピーしたページに対しGoogleに著作権侵害申立てしたらインデックス削除してくれた
http://www.jweb-seo.com/blog/wordpress/2013/01/28/4323

 

【実験】

37.canonical属性にまつわる6つの興味深いテスト

http://www.7korobi8oki.com/mt/archives/2011/06/canonical6.html

38.canonicalが受け渡す情報についての実験結果
http://www.seo-matome.jp/blog/algorithm/canonical-effect/

39.canonicalタグの恐ろしさを改めて知る
http://lblevery.com/blog/blog/2011/10/06/canonical-fear/

40.WordPressサイト内で起こる重複ページをGoogleはどう処理するのか実験
http://www.jweb-seo.com/blog/wordpress/2012/03/26/3118

41.WordPressブログの自然発生的な重複コンテンツ実験2
http://www.jweb-seo.com/blog/wordpress/2012/03/28/3136

42.重複コンテンツ(コピーページ)をGoogleはどのように処理するのか
http://www.jweb-seo.com/blog/wordpress/2011/09/20/2089

43.重複コンテンツ(コピーページ)実験の途中経過
http://www.jweb-seo.com/blog/wordpress/2011/09/28/2171

44.重複コンテンツ実験の続き~記事にリンクを張ってみる編~
http://www.jweb-seo.com/blog/wordpress/2011/10/05/2207

45.重複コンテンツ実験~リンク後の経過報告~
http://www.jweb-seo.com/blog/wordpress/2011/10/21/2307

 

【ツール&サービス】

46.コピペチェックツール「影武者」を使ってみた

http://www.seotemplate.biz/blog/seo-tool/10938/

47.重複コンテンツ改善支援サービス
http://xn--seo-kc4b382n.com/%E3%82%B5%E3%83%BC%E3%83%93%E3%82%B9%E4%B8%80%E8%A6%A7/%E9%87%8D%E8%A4%87%E3%82%B3%E3%83%B3%E3%83%86%E3%83%B3%E3%83%84%E6%94%B9%E5%96%84%E6%94%AF%E6%8F%B4%E3%82%B5%E3%83%BC%E3%83%93%E3%82%B9/

48.新しい年を迎える前に、やっておくべきブログの大掃除
http://www.wakatta-blog.com/tag-zenback-pagenation.html

 

【www、index.htmlの有り無し統一】

49.URLの正規化ってどうすればいいんですか?
http://girls-seo.com/seo/url-normalization

50.301リダイレクトを使った「WWWあり」と「WWWなし」の統一
http://www.suzukikenichi.com/blog/integrating-www-and-non-www-by-301-redirect/

51.楽:技林ブログ
http://tech.bayashi.jp/archives/entry/techweb/2007/001981.html

52..htaccess ファイルを簡単作成「.htaccess Editor」
http://www.htaccesseditor.com/

53.www有りと無しが検索結果に表示され、何故かトップページはインデックスされません。
http://productforums.google.com/forum/#!category-topic/webmaster-ja/%E3%82%AF%E3%83%AD%E3%83%BC%E3%83%AB%E3%82%A4%E3%83%B3%E3%83%87%E3%83%83%E3%82%AF%E3%82%B9%E3%83%A9%E3%83%B3%E3%82%AF%E4%BB%98%E3%81%91/oZxDmZ8ZHpc

 

【モバイル】

54.図解でわかる、デスクトップPC・スマートフォン・フィーチャーフォンの三つ巴ページ切り替え設定
http://www.seo-matome.jp/blog/mobile-smartphone/raptop-smartphone-featurephone/

55.モバイル向けサイトでクローキングと重複コンテンツを防ぐには 2011年01月19日
http://www.suzukikenichi.com/blog/how-to-avoid-cloaking-and-duplicate-content-for-mobile-seo/

56..htaccessでPC,モバイル,スマートフォンサイトの振り分け
http://lab.gpol.co.jp/tsubo/2011/11/htaccesspc.php

57.Smart QR
http://qr.quel.jp/form_smartlink.php

 

【Google発表】

58.クロスドメイン(ドメイン間)の重複コンテンツ発生をGoogleウェブマスターツールが通知
http://www.suzukikenichi.com/blog/cross-domain-url-selection/

59.クロスドメインURLの重複コンテンツ検出メッセージがウェブマスターツールに届いた
http://www.suzukikenichi.com/blog/cross-domain-url-selection-messages-in-webmaster-tools/

60.Googleウェブマスターツールで、重複コンテンツをチェック
http://www.suzukikenichi.com/blog/looking-into-duplicate-content-with-google-webmaster-tools/

61.大規模サイトの更新をGoogleに伝える方法と重複コンテンツを減らす方法
http://whitebear-seo.com/seo-info/google/large-scale-site-and-duplicate-content/

62.重複コンテンツはペナルティにはならない – グーグルが再説明
http://www.suzukikenichi.com/blog/google-says-duplicate-content-is-not-penalty/

63.矛盾するGoogleのヘルプ:重複コンテンツをrobots.txtでブロックするのはOK?、NG?
http://www.suzukikenichi.com/blog/whether-or-not-to-block-duplicate-content-by-robots-txt/

2013年1月24日 木曜日

悪意のない、サイト内重複コンテンツでペナルティ”6”事例

※この記事はBloggerで公開しておりましたが、当ブログと統合しました。

ペナルティ事例で多い重複コンテンツ

SEO業者が対策しているサイトで圏外に飛んでしまっているサイトを無作為に100サイト集め、内部が原因と仮定して、改善できる箇所はないか調査しました。考えられるペナルティを洗い出している内に重複コンテンツが以外に多いことに気づき、重複コンテンツに絞り、事例を集めてみることにしました。

意図的に重複コンテンツを作りあげる人は、ペナルティをすぐに察知することができると思いますが、サイト構成上知らない内に重複コンテンツになってしまっているサイトが多くありました。勝手にコピーされてしまう重複コンテンツ事例は多くありますが、あくまで質の低い他ドメインによるものですので大きな影響がないことがほとんどです。サイト内部の重複コンテンツはサイト運営者の判断で実行したことですので、与える影響は大きなものとなります。

事例①ECサイトでサイズ違いの製品ごとにページが作られている

ABC 0001 80型
ABC 0001 90型
ABC 0001 100型

架空の型番ですが、個々のページの違いと言えばサイズと値段のみ、製品説明などはすべて同一のものが使われていました。サイズの種類が膨大にあれば、複製されているとみなされてしまう可能性が高くなります。

【解決策】
製品ページを1つ用意して、プルダウンで別の型番を選ぶタイプの構成に変更すれば重複コンテンツを改善することができます。システムの変更が必要となるため、腰が重いですが、検索経由のアクセスを集めるのであれば必須となります。

事例②全国向けポータルサイトで都道府県、市区町村ページ

東京(25)
山梨(0)
群馬(0)

よくあるポータルサイトですが、各テキストがリンクとなっており、リンク先に飛べるのですが、東京以外コンテンツがありません。こういった構成の場合、該当の情報がありませんとだけ表示されるページが大量に作られてしまう可能性があります。

【解決策】
コンテンツが0件の場合のみリンクにしないように設定する。こういったプログラムの修正はそれほど手間はかからないと思いますが、1件が0件になる可能性がある場合は、過去のURLにアクセスできないように設定する、noindexを設定するなどの対応が必要となります。

事例③画像メインのサイト

画像がメインで構成されており、サブページもテキストがほとんどないようなサイトの場合、検索エンジンが参考とする情報が少なくなります。ソースをみてもどのページかほとんどわからないようなサイトは注意が必要です。

【解決策】
altの設定で適切なテキストを用意する、または画像であっても文字だけうまくコーディングしてテキストを使うことで回避することができます。

事例④サイトタイトルが長いサイト

○○で○○なら○○に○○な株式会社○○へご相談ください。|TOP
○○で○○なら○○に○○な株式会社○○へご相談ください。|商品名

このようなタイトルタグの場合、商品名が補足的な状態となります。すべてがダメということではなく、他の事例と重なることで危険性が高くなります。また、サブページの検索経由のクリック率も悪くなる可能性があります。

【解決策】
すべてのページに同一の内容を反映させる情報を少なくする。個別のページに独自のテキストを使うことを検討してみてください。

事例⑤ECサイトの商品説明がメーカー提供

ほとんどのECサイトがどこかのメーカーから商品を卸しているかと思いますが、商品説明なども合わせて提供されていることが多くあります。

【解決策】
販売店独自の商品説明を用意することで重複がなくなります。一つ一つの商品説明を店舗側で用意するのは非常に骨の折れる作業ですが、コンバージョンにも大きく影響してくる部分となりますので、人気の商品から優先的に独自テキストを入力するようにしていきましょう。

事例⑥1つのページに複数のURLでアクセスできてしまう。

hogehoge.com/?mode=rp&id=01
hogehoge.com/?mode=rp

上記のようなURLで同一の内容が表示され、2つのリンクがサイト内に存在し、検索エンジンにインデックスされてしまっている場合、重複コンテンツと判断される可能性があります。

【解決策】
htaccessやcanonicalで正規化するか、プログラムで余計なURLが生成&アクセスされないように制御する。すでにインデックスされていないかどうかを確認しましょう。

追記事例⑦法律関係のサイトで法令をそのまま掲載している

法律事務所のサイトで法令内容をそのまま掲載しているサイトはミラーページと判断される可能性があります。法令をリライトするなどはできませんので、その他の対応方法が必要となります。

【解決策】
canonicalで法令データ提供システムなどの引用先を設定するのが適切でしょうか。それ以外であれば画像表示させる。noindexやrobots.txtで制御するなどがありますが、あまり適切とはいえないかもしれません。

SEO対策は、内部対策がしっかりとできていない場合、ほとんど意味のないものになってしまいます。SEO業者に対策を依頼しても、サイト全体の設計に関する内部対策まで出してくれる業者は少ないです。理由としましては大規模なコンテンツの場合は膨大な修正が必要になるケース、プログラムが介在している場合に仕様がわからない為、指示書を作成しずらいというケースがあると思います。まずご自身のサイトの状態がガイドライン違反になっている可能性があるかどうか確認しておくようにしましょう。

2012年10月16日 火曜日

Googleから不自然なリンクで違反メッセージが届いた場合はどうすべきか?

【2012年10月17日追記】

 

自分の管理しているサイトにおいて不自然なリンクでGoogleウェブマスターツールに登録しておりガイドラインの違反メッセージが届いた場合はどのように対応すべきなのでしょうか?

 

1.現状のリンクを把握する。

 

現状のリンクを把握するには「Open Site Explorer」などのリンク調査ツールではなく、Googleのウェブマスターツールから

 

Googleのウェブマスターツールの画面01

 

「トラフィック」で「サイトへのリンク」を選び、「リンク数の最も多いリンク元」の下を見ると「詳細」というリンクがあります。

 

Googleのウェブマスターツール画面02

 

「詳細」をクリックすると上の方に「このテーブルをダウンロード」、「その他のサンプルリンクをダウンロードする」、「最新のリンクをダウンロード」この3つのボタンがあります。

 

ここで現在のリンクをより正確に把握するためには「その他のサンプルリンクをダウンロードする」、「最新のリンクをダウンロード」を選択しましょう。

 

そしてGoogleでは、

その際に毎回全てのデータをダウンロードするのではなく、[最新のリンクをダウンロードする]方法でダウンロードすることにより、差分のみを確認することも可能ですので、お試しください。

http://productforums.google.com/forum/#!category-topic/webmaster-ja/google-%E3%81%8B%E3%82%89%E3%81%AE%E3%81%8A%E7%9F%A5%E3%82%89%E3%81%9B/NotEbnFLKw8

 

このように書かれていますので、リンクというのは外部サイトに常に設置される可能性があるということも理解しつつ最新のリンクをダウンロードして不自然なリンクを発見した場合は再審査リクエストを送られる際に書かれると良いでしょう。

 

有料リンク警告が来てもWMTの被リンクデータにリンクデータが全て表示されない!!??

 

上記のように有料リンク警告メッセージが届いてもGoogleウェブマスターツールのリンクデータ上に問題あるリンクが表示されない恐れもあるので「最新」のリンクを確認する、または削除し忘れがないか確認しましょう。

 

2.再審査リクエストレポートはGoogleが正しい審査を行えるように細かく正確に。

 

検索エンジン最適化(SEO)の施策を提供している会社によって不自然なリンク操作がおこなわれた場合の記入例を示します。
__________

http://www.example.com/111.html
http://www.example.com/222.html
http://www.example.com/333.html
http://www.example.com/444.html

上記の URL についてはSEO 業務を委託していた AAA 株式会社によるもので、現在違反箇所の修正が困難となっています。
・SEO 施策を依頼した会社名:AAA 株式会社
・依頼時期とその内容:2010 年に~~
・削除のために行なった対応とその経緯:SEO会社AAAに~~にて連絡を取り~~を依頼しましたが~~
・削除が困難となっている理由:

 

上記がSEO業者によって不自然なリンクが行われた際のレポートの記入例です。Googleは警告メッセージが届いたサイトが現在どのようなリンク状況になっているかは理解しているでしょう。

 

しかし問題となっているリンクをなぜ削除できないのか、またどこの会社にSEO施策を依頼しているのかといったGoogle検索内だけでは分からない(判断できない)ことを正確に伝える必要があります。

 

また詳細に対処内容を伝える場合は、GoogleではGoogleドライブのドキュメントを推奨しています。

 

Googleドライブ画像01

 

Googleドライブでドキュメントを作成するには「作成」から「文章」を選びます。

 

Googleドライブ画像02

 

そして右上に「共有」という水色のボタンがあるのでクリックします。

 

 

それから「限定公開」の右隣に「変更…」というリンクがありますのでさらにクリックします。

 

Googleドライブ画像04

 

すると公開設定オプションという3つの選択項目があり「リンクを知っている全員」を選び、共有リンクを再審査リクエストする際に設置して送ります。

 

3.「リンクの否認」ツールを利用する。

 

不自然なリンクでGoogleウェブマスターツールにガイドラインの違反メッセージが届き、問題となっているリンクを削除がどうしても困難な場合は「リンクの否認」ツールを利用してみましょう。

 

Googleの「リンクの否認」ツール画面01

 

「リンクの否認」ツールにアクセスすると上記の画面が表示されます。ここで削除が困難となっている問題があるリンクが残っているサイトを選び、「非承認のリンク」をクリックします。(サイトはGoogleウェブマスターツールに登録済みでないといけない)

 

Googleの「リンクの否認」ツール画面02

 

クリックすると、

 

これは高度な機能なので、慎重に使用する必要があります。使い方を間違えると、Google 検索結果でのサイトのパフォーマンスに悪影響が及ぶ可能性があります。ご自分のサイトに対して、スパム行為のあるリンク、人為的リンク、品質が低いリンク が数多くあり、それが問題を引き起こしていると確信した場合にのみ、バックリンクを非承認とすることをおすすめします。

このような文章が表示されます。文章からも分かる通り、高度な機能のため使用する場合は注意が必要です。

 

ちゃんと理解できた方は「リンクの非承認」のボタンをクリックしましょう。

 

Googleの「リンクの否認」ツール画面03

 

すると「非承認とするリンクのみを含むファイルをアップロードしてください。」という文章が表示された画面になります。

 

# spamdomain1.com のオーナーに 2012 年 7 月 1 日にリンクの削除を依頼。しかし返事が得られなかった。
domain:spamdomain1.com
# spamdomain2.com のオーナーはほとんどのリンクの削除に応じてくれたが、一部削除できていないリンクが残っている。以下がその一覧。
http://www.spamdomain2.com/contentA.html
http://www.spamdomain2.com/contentB.html
http://www.spamdomain2.com/contentC.html

ここで削除が困難で問題となっているリンクを上記のようにテキストファイル(.txtファイル等)でシンプルに1行ごとで記述します。ちなみにファイルサイズの上限2 メガバイトまでとなります。

 

またここで参考にしている文章で「#」記号を始まる行がありますが、これは参考コメントとしてツールでは無視されます。

 

さらに”domain:” という表記を使用することで、そのドメインからのすべてのリンクの否認を指定することができるので便利です。

 

Googleの「リンクの否認」ツール画面04

 

テキストファイルが用意できたら、ファイルを選択しましょう。そして「送信」ボタンを押せばGoogleに送信されます。

 

検索結果にサイトを表示させたいのであれば正確な審査を行えるようにしていきましょう。

 

2012年10月2日 火曜日

Googleウェブマスターツールからのメール通知は全てが警告ではない!

本日、TwitterでSEO関係者などのツイートを確認していました。

 

 

ホワイトベアー株式会社の秋好かおりさんがこのようなツイートをしていたのですが確かに現在Googleウェブマスターツールに登録していると、

 

Googleウェブマスターツール画面01

 

「Google ウェブマスターツールからのメール通知について」というメッセージが届くようになっています。

 

Google ウェブマスターツールからのメールというとSEOを行っている人は特に警告メッセージ、問題があって順位が下がってしまうのではないかと連想してしまいそうになります。

 

Googleウェブマスターツール画面02

 

しかし「Google ウェブマスターツールからのメール通知について」の内容をよく見てみると、登録したサイトで重大な問題や重要な問題がある場合に対してGoogle ウェブマスターツールから自動でメールを通知するようになりましたというお知らせメッセージであることが分かります。

 

しかもほとんどのサイトはこのような問題は稀にしか起こらないのでよほどのことがない限りは送られないようになっているのでメールが届いてドキッとされた方も安心してください。

 

ただGoogle ウェブマスターツールからメールが届いてやましい点に心当たりがありドキッとされた場合は、サイトで後ろめたくなるような行為をした箇所を修正してみてください。

 

Googleウェブマスターツール画面03

 

ちなみにメールを届かないようにするためにはGoogle ウェブマスターツールの「設定」→「メール通知を有効にする」というチェックボックスにチェックが入っているのでこれを外せばメールが届きません。

 

2012年7月24日 火曜日

Googleのリンク周りの取り締まりも強化されてきているようです。

2012年7月18日、日本でパンダアップデートが導入されました。その前にペンギンの導入もありました。

 

そして、最近巷のSEOブログ記事などを拝見していると、Googleのウェブマスターツール上に届く警告メッセージ(不自然なリンク)が手動対応か、または不自然なリンクになっていることを”指摘する”もの(不自然なリンクに対しては無効化する)かを区別できるようになったようです。

 

ただ、日本ではGoogleから不自然なリンクを指摘するようなメッセージが届いたという報告はまだありません。このような警告メッセージの仕様変更があり、私が管理しているサイト(ウェブマスターツール)で警告メッセージが届いていないか確認してみたのですが、残念ながら届いていませんでした。(1度は自分の管理しているサイトで不自然なリンクの警告メッセージを見てみたいのですが、なかなかそうさせてくれないGoogle)

 

なにやら最近Googleのリンク周りの取り締まりが厳しくなってきているようです。しかし、私が今のGoogleで調べてみると、「あれれ?」みたいなリンクを使っているところも存在しています。この先、私が確認したリンクがGoogleに見つかりサイトがBANされるのか、されないのかオタクな私としては気になるところではあります。

 

あと、ちょっと気になるのが海外SEO情報ブログで不自然リンクを個別に無効化したメッセージ(日本語訳)が公開されてましたが、

 

 しかし、一部のリンクは自分で制御できないことも私たちは認識しています。結果として、この特定の出来事に対しては貴サイト全体ではなく不自然なリンクだけに厳密に対象を絞って対応しています。

 

この不自然なリンクだけに厳密に対象を絞って対応というのは自動で不自然なリンクを検出するのか、もしくは手動で検出していくのか。恐らくGoogleの不自然なリンクを検出する精度というのは上がっているとは思いますが、”厳密”にとなると全てを完璧に検出するのは難しいので、手動もありえるのではないかと思いました。

 

ま、どのように検出されているにせよ、今後のリンクでの対策は注意していかないといけない。