Googleで検索されない?サチコを確認せよ!

サイトにコンテンツ(記事やページ等)をアップしても、検索エンジン(通常はGoogle)から検索されないのでは、そのコンテンツは「この世に存在しない」も同然だ。
そこで、コンテンツを新規作成した場合や更新した場合、XMLサイトマップサチコGoogle Search Console)で送信し、早くGoogleにインデックス登録して検索で表示されるようにする。
ゆえに、ひたすらコンテンツを作ってサイトにアップし、XMLサイトマップサチコで送信することを繰り返せば、サイトも成長するしPVも増えるし (`ω´)グフフ となるが、そんなに甘くはなかった
XMLサイトマップで送信しているページであっても、Googleがインデックスに登録してねーでやんの
てめぇサチコイワすぞ!(#゚Д゚)ゴルァ!!

サチコを確認せよ!

WordPressの場合は、SEOに威力を発揮する定番かつ有名プラグインがいくつかあるから、そのプラグインをブチ込んでひたすらコンテンツを作り、都度XMLサイトマップサチコで送信すれば良いが、PukiWikiの場合はそうはイカない。
WordPress同様、標準でXMLサイトマップを出力するプラグインが無いのもそうだが、PukiWiki用URL短縮ライブラリを導入している場合、PukiWiki用URL短縮ライブラリ対応XMLサイトマッププラグインをブチ込んで利用する必要がある。

上記プラグインは時間を作って調査し、バージョンアップしたいと思っているが、今のところ致命的な問題はない(ハズ)。
その割に、ページ数が多い私設松本零士博物館サイトが、あまりにGoogleで検索されていない。
確かに松本零士先生の作品名(例えば「銀河鉄道999」や「宇宙戦艦ヤマト」等)で検索しても、検索順位が出版社やマンガサイト等に負けるのは仕方がない。
しかし、Google検索で全然出てこないってのはどーなのよ?
この場合、ページのURLをサチコで確認し、Googleに登録されていない場合は「インデックス登録をリクエスト」する必要がある。

サチコをイワす方法

イワす」といっても、別にサチコクラッキングして痛めつけるワケではない。
サチコを使って自サイトのページがGoogleに登録されているかを確認し、登録されていない場合に「インデックス登録をリクエスト」する方法を解説する。
なお、本稿では私設松本零士博物館サイトを例に解説するため、適宜自サイトに読み換えて試してみて欲しい。

まずサチコを開き、図URL検査」をクリックする。
すると、フォーカスが図に移動するため、図の場合だと図赤下線のURL「https://museum.dajya-ranger.com/?1c28503101」(調べたいページのURL)を入力してEnterキーを押す。
すぐに検索が走り、図のように「URLがGoogleに登録されてません」とフザケた結果画面になるのだ。
このままだと永遠にインデックス登録されないので(多分)、図③赤枠インデックス登録をリクエスト」をクリックする。

図の画面になり、しばらくインデックス登録のテスト処理になるので待つ。

インデックス登録に問題がないURL(ページ)の場合、図のようにインデックス登録をリクエスト済みである旨のメッセージが表示される。
だったら、なんで登録してねーんだよ?と思いつつ、図赤枠OK」をクリックする。

すると図のような画面になり、図赤下線インデックス登録をリクエスト済み」となる。
サイトのページ数を考えれば軽く死ねるが、粘り強くGoogleにインデックス登録されていないページを「URL検査」で調べ、インデックス登録されていない場合は「インデックス登録をリクエスト」するのを繰り返すしかない。

ところが、だ。
インデックス登録リクエストには上限があって、それ以上のリクエストを送信すると、図のようなエラーが表示される(仕方がないので図赤枠表示しない」をクリックする)。
この上限値は具体的な数値が公表されておらず、1日10回程度で上限になる場合もあれば、30回や40回とリクエスト送信が可能な場合もある。
明日、もう一度お試しください」とあるが、サチコ日本標準時ではなく、太平洋標準時が基準となっているようで、日本時間の0時過ぎにインデックス登録リクエストをしてもダメだったり、太平洋標準時が基準の割にOKだったり、実によくワカラン
ちなみに、インデックス登録をリクエストしたページはいつ登録されるのか?も、Googleが公表していないようなので、やっぱりワカラン

図は上記手順でインデックス登録リクエストしてから、半日以上経過してから調べた結果だが、早速登録されていた

※2022/06/02 追記
私設松本零士博物館サイトの展示全243点中、約80点がGoogleインデックスに未登録で、インデックス登録をリクエストした。
ページ追加・更新の都度、XMLサイトマップサチコで送信していたのに、約3割が未登録だったことになる。
正直、こんなにGoogleインデックスに登録されていないページがあるとは思わなかったが、内部SEO的にサイト(PukiWiki)の構成を見直す必要があるのかも知れない。

Bing Webmaster Toolsはどうなのか?

マイクロソフトのBing Webmaster Toolsも同様に、ページがインデックス登録されていないのか?
Googleにインデックス登録されていなかったページのURLで、簡単に調べてみた。

Bing Webmaster Toolsを開き、図URL検査」をクリックする。
に調べたいページのURLを入力(図の場合は「https://museum.dajya-ranger.com/?1c28503101」)、図③赤枠検査」ボタンをクリックする。
すぐに検索されて図のような画面が表示され、図赤下線正常にインデックスが付きました」のメッセージが表示される。
つまり、ページがBingにインデックス登録されていたのか、登録されていなかったのか、問答無用で分からない。その代わり、速攻でインデックス登録をしてくれるようだ(なんだそれ?)。
パソコン用Edgeブラウザは重たいし、その標準検索エンジンのBingもシェアが低いので、Googleほど労力をかける意味はないだろう。

robots.txtを設定してみる

なぜGoogleにインデックス登録されないページ(URL)があるのか、また、その量はどのくらいなのか?
XMLサイトマッププラグインに何かしらバグがあって、Googleにインデックス登録されていないのなら大問題だが、プラグインのコードをザッと見ても、特に問題があるとは思えない。
思い当たるとしたら「robots.txt」ファイルで、XMLサイトマップファイルのパス指定をしていないくらいだ。
PukiWiki用URL短縮ライブラリ対応XMLサイトマッププラグインの場合、XMLサイトマップファイル「sitemap.xml」を「cache」フォルダに出力している。
よって、「robots.txt」ファイルでは、次のように記述する必要がある。

Sitemap: https://サイトドメイン/cache/sitemap.xml

例えば、私設松本零士博物館サイトの場合は次のようになる。

Sitemap: https://museum.dajya-ranger.com/cache/sitemap.xml

上記「Sitemap」に関しては、記述は省略可能なものの、検索エンジンのクローラーが早くサイトを巡回する可能性があるようだ。
少しでも可能性があるのならば「robots.txt」ファイルを修正し、サイトのドキュメントルートにFTPした方が良いかも知れない。
とすると、「cache」フォルダの「.htaccess」ファイルも検索エンジンのクローラーがアクセス可能なように、次のように修正しておく必要があるだろう(PukiWiki1.5.2および1.5.3)。

cache\.htaccess

#Require all denied
Order allow,deny
Deny from all

# Amazon plugin's Image cache
<FilesMatch "^ASIN.*\.jpg$">
  Require all granted
</FilesMatch>

# sitemap.xlmアクセス
<FilesMatch "\.xml$">
    Allow from all
</FilesMatch>

いかんせん、Googleにインデックス登録されていないページが存在する原因がハッキリと分からないため、キッチリ対策することが出来ないが、だからこそ可能性に賭けてみるしかない

おわりに

SEOについては周知の通り、ほぼシェアを独占しているGoogleがその技術的な内容を公表していないため、手探りの試行錯誤を繰り返すしかない。
Googleのインデックス登録その他に関しても同様だし、Web系は押さえておく技術やその手法も多い上に、どれが正解なのかは誰も分からない。
ゆえに、PukiWiki用URL短縮ライブラリ対応XMLサイトマッププラグインの仕様を決めるのは悩ましいし、コードで実装した結果を試行錯誤するしかない上に、SEOは結果が分かるのに数ヶ月かかる。
私が四半世紀ほど前から、インターネットやOSSについて懐疑的な目で見ていたのは、「標準仕様がない」の一点に尽きる。
無論、コンピュータのハードとソフトは徐々に規格が出来て普及するモノだし、デファクトスタンダードになる闘いの歴史であることは、重々承知している。
しかしながら、ブラウザが違うだけで表示が異なったり、最悪レイアウトが崩れるといった時代からWebサイトを運営していると、とてもインターネットが商売になるとは思えなかった。
また、LinuxFreeBSDApacheといったOSSは「タダで使える」といった面ではありがたいが、全て利用者の自己責任という文化は、受け入れがたいモノがあった。
特に自分がプロのSEでプログラマであると、利用者の自己責任であるソフトをこちらで責任を負って、顧客に提供するのは困難だ。
そもそも、自分のコードが悪いのか、OSSのコードが悪いのか?の切り分けは、非常に困難を伴う(バグ満載のWindowsNT3.xとOracle6でパッケージソフトをVB2で開発していた炎上プロジェクトの火消しでは、正にこの点で地獄を見た)。
しかしながら、世界中のプログラマが不眠をモノともせず、健康を害しようが、恋人と別れたり離婚されようが、苦労して苦労して苦労して、それも30年もの歳月を経て、やっと今のネット社会がある。
私もその恩恵に浴している一人として、また同じプログラマとして、PukiWikiを通して恩返しが出来れば、と願っている。

関連記事

この記事が気に入ったら
いいね ! をお願いします


ITで何かお手伝い出来ることはありませんか?

CTA-IMAGE

本サイトでは、外部サービスと連携して「ITの困った」を解決します!

PukiWikiカテゴリの最新記事