重複ページを回避するURLの正規化(canonical属性)
2009年の3月にGoogleをはじめとする各検索エンジンは、URL正規化タグをサポートすることを発表しました。
この正規化タグはhead内に設置するタグで、重複ページを一つのURLにまとめることができる効果があります。
URLの正規化
canonical属性は、検索エンジンに対してのみ指定する属性で、意図しない重複ページを一つのURLにまとめることで、検索エンジンに重複ページとしてみなされない効果があります。
Googleは、Googleが重複ページとみなしたページが複数ある場合、Googleの判断でその中の1ページしかインデックスしないという特徴を持っています。そのため、場合によっては、本来インデックスして欲しいページがインデックスされず、重複ページの1つがインデックスされてしまうというケースが発生します。
canonical属性は、重複ページの可能性があるページ内に記述することで、サイト運営者自身がGoogleにインデックスして欲しいページを自由に指定することができる便利な属性なのです。
例えば、ショッピングサイトなどで同じページがカテゴリを跨いで存在するケースがあります。
このような場合、ページは同じものですが、URLの後にパラメータが付加されるため、検索エンジンにとっては別のページ(重複ページ)という判断になります。
そこで、このページのhead内にcanonical属性でパラメータを除いたURLを指定することで、検索エンジンに対して複数のパラメータを持つページを一つのURLに統合(正規化)させることができるのです。
また、メールマガジンなどを配信する際に、リンクにセッションIDを付けてユーザーを特定したり、キャンペーン効果を計ったりすることがあります。このような場合でも、canonical属性によってURLを正規化することで、重複ページの問題を解決することができます。
canonical属性が始まってから数年が経過していますが、一部の情報の早いウェブマスターではすでに取り入れられている手法です。URL正規化設定は、Googleもウェブマスターツールヘルプで設定を推奨していますので、重複ページが発生するサイト構造の場合は、URL正規化設定をお薦めします。






















