スタッフブログ

Google検索エンジンの仕組みを改めて理解する

2022.09.15 Posted by

Webに少しでも携わったことのあるほとんどの人が耳にしたことがあるであろう「SEO」ですが、実際どのような流れで検索エンジンが検索順位を決めているのか理解している人は意外に少ないのではないでしょうか。

もちろん、どのような基準によって順位が決まっているのかについては、具体的には公開されていません。しかし、どのような手順や仕組みによって、順位が決まるのかについては、Google社が提供している公式情報からある程度の推測ができます。

今回は、Google検索エンジンの仕組みとは、いったいどのようなものなのか、基本的なポイントについてわかりやすく解説してきます。

検索エンジンの仕組みについて

検索エンジンの仕組みについて理解する場合、次の4つのポイントを意識しておくと、その構造がわかりやすくなります。

 

  • ディスカバー
  • クロール
  • インデックス
  • ランキング

 

それぞれのポイントについて説明していきます。

ディスカバー

ディスカバーとは、無数に存在するWebページ(URL)を以下の方法で検索エンジンが探し出すことです。

 

【あるページ内に貼られているリンクを発見する】
クローラーと呼ばれるWebサイト情報収集を自動で行うロボットが世界中のWebサイトを巡回する際に、サイト内に貼られているリンクを同時に集めて行くことでURLの存在が検索エンジンに伝わります。

 

【sitemap.xmlから発見する】
sitemap.xmlは、クローラーにWebページの存在をこちらから伝えるための方法です。XMLサイトマップとも呼ばれており、検索エンジンは、XMLサイトマップの情報に基づいてWebサイトのクロールを開始します。XMLサイトマップには、更新情報はもちろん、更新日時や優先度について記すことができます。

そのため、XMLサイトマップでWebサイトを正しく管理することで、クロールしてもらいやすい仕組みを形成できます。

クロール

クロールとは、発見したURLの内容を解析する作業のことです。その際、クローラーにクロールされやすいように対策していくことを“クローラビリティを改善する”といいます。Web担当者は、有効な対策を講じればクローラビリティを改善できます。

たとえば、具体的な改善方法にURLの正規化があります。Webサイト上のURLには、wwwがあるものと、wwwが含まれないものが存在します。この2種類のページが存在していた場合、重複コンテンツとGoogleにみなされてしまい、クロール回数が減り、検索エンジン上で検索上位を目指すことが難しくなります。そのため、URLを統一することで、クローラビリティが向上します。

他にも、リンクは画像ではなくテキストで設定することで、クローラビリティは向上します。このように、クローラーが解析しやすいようにマークアップしていくことは非常に重要なことです。

インデックス

インデックスとは、クロールしたURLをデータベースに登録する作業のことです。URLの中身を解析した結果、Googleのデータベースに登録する必要があるかどうか判断されます。URLがGoogleにインデックスされているかを確認する方法としては、次の2つの方法が有効です。

 

【サーチコンソールで検査】
サーチコンソールには、インデックスカバレッジレポートというものがあります。インデックスカバレッジレポートをチェックすれば、インデックスの情報を簡単に調査できます。

 

【site:URLコマンドで調査】
インデックスの状況は、検索エンジン上でsite:URLコマンドで調査できます。調査方法は非常に簡単です。URLに任意のサイトURLを記載し、検索します。これによって、インデックスされているかがわかります。

ランキング

検索エンジンは、検索キーワードに対して、関連度、情報の信頼度等をもとにアルゴリズムにより順位が決定しています。昨今のランキングの要因としては、E-A-Tがあります。E-A-Tの概要や有効な対策については、下記をご参照ください。

より重要視されているE-A-Tって何? Webの検索品質アップを目指す

最近の諸注意

2022 年 6 月 28 日にGoogle検索セントラルにて、HTMLファイルが15MB以上のものはインデックスされないといった情報が明文化されています。こちらについてはこれまでも同様でしたが、この度初めて明文化されました。一般的にWeb サイトのHTMLファイルのサイズは2MB程度なので、普通超えることはありませんがPDF、Wordなどのファイルを掲載しているページがある場合には注意が必要です。

 

Googlebot と 15 MB に関連する事項

まとめ

Google検索エンジンのSEO対策の仕方は、数多く公開されていますが、基本構造は、大きく変わりません。どうすればクローリングしてもらいやすくなるのか、検索上位にインデックスされるのかを考えて、有益なSEO対策を行っていきましょう。

オリエンシートダウンロード

採用サイト 絶対に外せない5つのチェックポイント

オリエンシートダウンロード

CONTACT

お電話でのお問い合わせ

03-5366-3277

受付時間:平日9:30〜18:30

メールフォームからのお問い合わせ

お問い合わせ(東京本社)

PAGETOP

Document資料請求

Contactお問い合わせ