ウェブマスター向けガイドラインメモ

googleウェブマスター向けガイドラインをしばらく見ていなかったので見てみた。
改めてこれは気をつけよう、というのはなくて、
普通はやらないような方法を取らなければ問題ない。
たとえばSEO目的でのサイト改変やクローラーに不正なレスポンスを返すなどだ。
ちょうどいいので気になったところをメモしておこう。
内容が理解できなかったところは飛ばしてる。

サイトが出来たら

ウェブマスター ツールに自分のサイトを登録する
サイトマップを作って送信する

デザインとコンテンツに関するガイドライン

・少なくとも1つの静的なテキストリンクからアクセスできるようにする
・1ページのリンクを妥当な数にする(妥当な数っていくつか気になる)
・情報が豊富でコンテンツはわかりやすく正確なものにする
・ユーザーが検索時に入力するであろうキーワードをサイトに含める
・重要なワードやリンクは画像ではなくテキスト文にする。画像を使用する場合はalt属性にテキストを入れる
・titleタグとalt属性をわかりやすく正確なものにする
・動的なページはクローラーがクロールできない場合があるので、パラメータを短くしたり、パラメータの数を少なくしたりすると、クローラはクロールしやすくなる
画像動画にはそれぞれ細かな決まりがあるので気になるなら参照

技術に関するガイドライン

クローラー(でいいのかな?)はテキストブラウザを使用してサイトを確認する。そのため、JavaScriptCookie、セッション ID、フレーム、DHTML、Flashは表示されないのでクロールできない可能性がある
・セッションIDやサイト内のパスをトラッキングする引数がなくてもクロールできるようにする(ログイン機能やパラメータでページを振り分けないってことかな)
・サーバがIf-Modified-Since HTTPヘッダーに対応していると前回クロール時からサイトが変更されたかをGoogleに通知できるため、帯域幅や負荷を軽減できる
robots.txtを使うとクロールを実行するディレクトリと実行しないディレクトリを指定できる。
CMSを使う場合はクロールしやすいページやリンクが生成されてるかを確認する
robots.txtを使用してユーザーにとって価値のないページをクロールしないように制御する
・各ブラウザで正しく表示されるかを確認する
・サイトの読み込み時間を短縮する。YSlowLive HTTP Headersを使ってサイトの表示速度を調べて改善する

品質に関するガイドライン

・ユーザーを騙すようなコンテンツやユーザーとクローラーそれぞれに別々のコンテンツを返さない
・リンクプログラムに参加しない(PageRank の操作を意図したリンク、過剰な相互リンクやリンク交換など)
・ページの送信や掲載順位の確認にプログラムを使って自動でクエリを送らない

品質に関するガイドライン - 具体的なガイドライン

・サイトに隠しテキストや隠しリンクを埋め込まない
http://support.google.com/webmasters/bin/answer.py?hl=ja&answer=66353

  • 白の背景で白のテキストを使用する
  • テキストを画像の背後に隠す
  • CSS を使用してテキストを隠す
  • フォント サイズを 0 に設定する

リンクが隠しテキストで構成されている(テキストの色と背景色が同じであるなど)
CSS を使用して、高さが 1 ピクセル程度の非常に小さいハイパーリンクが作成されている
リンクが小さな文字(段落中のハイフンなど)に組み込まれている
クローキングやリダイレクトをしない

  • 検索ページには HTML テキストのページを表示し、ユーザーには画像や Flash のページを表示する。
  • ユーザー向けとは異なるコンテンツを検索エンジンに表示する。
Googlebot は JavaScript を含むページもインデックスに登録しますが、JavaScript そのものに含まれるリンクをたどったりインデックスに登録することはできません。

また、ユーザーをJavaScriptでリダイレクトさせてクローラーとは異なるコンテンツを見せてもいけない

Google検索結果でのウェブサイトやウェブページのランクを調べようとする行為はしない
・コンテンツに関係ないキーワードは含めない
複数のページ、サブドメインドメインで同じコンテンツを公開しない
・フィッシングや、ウイルス、トロイの木馬、不正なソフトウェアのインストールなど、悪質なページを作成しない
・オリジナルのコンテンツがほとんどないアフィリエイトプログラムを使用したりしない
アフィリエイトプログラムに参加している場合は、サイトを訪れるユーザーにとって価値のある内容であることを確認する

参照:
ウェブマスター向けガイドライン