記事をインデックス登録する方法

Googleインデックスついて

一生懸命書いた記事がようやくアップロードできたんだけども、数日経ってもGoogle検索で検索しても一向に出てこない。そんなケースはありませんか。もうこうなってくると検索順位を上げるという話の前に、そもそも存在がGoogleから認められてないこういった状態になってしまうんですよね。

 

今回はインデックス登録する方法についてお話したいと思います。

 

インデックス登録されるまでの流れ

まずその前にインデックス登録されるまでの道のりについておさらいしたいと思います。「クローラー」記事URL」があるとします。クローラーはその記事の存在つまりURLを認知し、そのページにアクセスします。そして、そのページの内容を取得をして持ち帰って、そしてインデクサーにコンテンツを渡し、インデクサーがコンテンツをインデックスデータベースに登録する。この流れを通して初めてインデックス登録が完了します。この登録完了すると記事URLを検索すると、検索結果に表示されるという状態になります。

 

 

では、インデックスされない状態はどういう状態なのか?

そのポイントとして、このクローラーとインデックサーの二つが関わってきます。

 

クローラーについて


まず最初、クローラーがページにアクセス。そもそもしないもしくはできない状態。ページの存在を認知して、クローラーがアクセスしコンテンツを取得して持ち帰ります。しかし、そのクローラーがそのページに対して全然アクセスしない。その場合は、当然Googleのインデックスには登録されません。なぜアクセスしないのか大きく分けて二つの原因が考えられます

 

1)グーグルクローラーがURL、つまりページの存在をそもそも知らない

これは、クローラーがページの存在を知らない状態ですから当然、クローラーはアクセスしません。本来は記事をアップロードしたときに、その記事が紐づくカテゴリーページやトップページもしくは横の詳細ページから内部リンクが渡されて、他のページにアクセスしたクローラーがその内部リンクを通って新しい記事の存在を知る。ですからその段階で、クローラーがアクセスできるようになります。もしくは、XML sitemapなどを通して、URLを通知する。これが本来、クローラーがURLつまりページの存在を知る方法になります。しかし、内部リンクやサイトマップのURLを送信されずに、そのページ自体が孤立している場合当然、クローラーもそのページの存在を知ることがでないので、アクセスはされないままと言う状態になります。

 

2)ページの存在、URLは知ってるんだがアクセスしたくないというケースです。

そもそもクローラーが、そのページにアクセスしたくなという状況です。例ばですが、クローラーがアクセスし、検出したんだけども、品質が低くインデックスに登録しないというケースがあります。つまりページ一つ一つを見ても、各ページがとても内容が似ていたりとか、各ページの内容の品質が低い。こういったケースに関しては、すべてに対して、クロールアクセス頻度を下げるということも考えられます。こういった状況を理解せずに、クローラーに対してページをどんどん送信してもクローラーのアクセス頻度が落ちているもしくはアクセスしたんだけども、インデックス登録しないところで、全然アクセスしなくなってしまう可能性もあります。

 

では、どうしてこうなってしまうのか要因の例としていくつかあります。

 

品質が低いページが、そのディレクトリやページ配下に多数存在。もしくはそのページそのものに対してクローラーがアクセスできていない。

これもクローラーの回遊数が減ってしまう要因です。もしくはそのページのindex登録自体を許可していないいっというケースです。許可していない場合に関しては、クロールのアクセス頻度も当然下がってきます。こういった要因に該当しているページやディレクトリに関してはクローラーの回遊頻度が下がる可能性が高くなってきます。

・no indexタグによって除外しているとフィールドアクセスも下がるし、インデックス登録は永遠にされないという状況です。

・品質が低い。ページそのものに情報性がない場合とか、もしくはほかのページと類似している場合があります。そういった場合に関しては、インデックス登録がされない可能性が高いです。

一生懸命、品質の高いコンテンツを執筆したんだけども、実は過去のコンテンツとかなり類似していたというケースも可能性としてはあります。ですから、インデックス登録がなかなかされない、もしくはインデックス登録されたんだけども、すぐ外されてしまうという場合に関しては、実際にサイト内外で類似するコンテンツがないか?それを確認していただくのが望ましいかと思います。

クローラーがページにアクセスしようとした時にそのアクセスに対して拒否している場合、こういった場合に関しても当然クローラーが回遊できないので、ページはインデックス登録されません。クローラーのアクセスを拒否していないかを確認する方法として、Google Search ConsoleのURL検査を使って調べることも可能です。

 

インデックスについて


このインデクサーがインデックス登録を拒否している場合においても当然、検索結果にページが出てくることはありません。というのも、クローラーが一生懸命コンテンツを取得して持って帰ってきて、インデックサーにコンテンツを渡しても、インデックサーがコンテンツ登録を拒否した場合に関しては登録されないということです。

では、なぜ登録されないのか。大半のケースとしてはコンテンツの質に課題がある場合です。Google Search Consoleで調べることが出来ますので。但し、インデックス登録される場合もあれば、インデックス登録までに数時間や数日かかるケースもあります。まだ数時間しか経ってない場合に関しては、インデックス登録中のケースがありますので一旦時間をおくことをお勧めします。

しかし、一ケ月二ケ月たっても全然登録されない場合に関しては、ページの品質を疑うべきです。実際にインデックス登録されないページの内容を見てみて、そのコンテンツ内容があまりにもスカスカな場合に関しては、コンテンツのリライトするべきですし、自分が書いたコンテンツとほかのコンテンツが類似している場合もあります。そういったコンテンツがないかを確認して、もしある場合に関してはコンテンツのリライト対応したり、そのページが必要ない場合に関しては削除したり、もしくはno indexなどを使ってインデックスを制御するのが望ましいでしょう。

 

ここまでクローラーとインデックスはこの二つの視点からインデックスされるまでの道順を説明させて頂きました。

 

インデックスさせるためには、まず最初クローラーにページの存在、つまりURLを認知させて、そしてインデックスを許可してあげる必要があります。さらに、ページをインデックスに登録してもらうためには、ページの質を保つ必要があります。この三点を押さえることによって、大半のケースではインデックス登録されると思います。

 

その後は、何やるか?・・・・あとは待つのみです

 

少しでもインデックスを早めたいという方には、Google Search Consoleを使いましょう。Google Search ConsoleにインデックスさせたいURLを入力します。そして、このURL検査の画面のインデックス登録をリクエストをします。これは何かというとGoogle Search Consoleを通して、特定の記事に早くクロールするように指示するというものです。しかし、クロールされた後のコンテンツを登録するかどうかの判断は、インデックサー任せになりますので、インデックサー判断に対して指示することはできませんので、出来ることはクロールの回遊頻度をあげるということになります。

その後のインデックス登録に関しては指示することはできませんですので、このインデックス登録をリクエストでインデックスされないケースに関しては、ページの質が低い可能性があります。インデックスされたんだけども、すぐにインデックスが消える場合に関してもページの品質が低い可能性があります。

 

Googleの公式のGoogle Search Consoleインデックス登録リクエストをして、インデックス促進していただくのが望ましいですし、一番安全で、なおかつお金もかからない方法です。

 

今回はインデックスさせる方法についてお話をさせていただきました。最後までご覧いただき、誠にありがとうございます。