サイトにコンテンツ(記事やページ等)をアップしても、検索エンジン(通常はGoogle)から検索されないのでは、そのコンテンツは「この世に存在しない」も同然だ。
そこで、コンテンツを新規作成した場合や更新した場合、XMLサイトマップをサチコ(Google Search Console)で送信し、早くGoogleにインデックス登録して検索で表示されるようにする。
ゆえに、ひたすらコンテンツを作ってサイトにアップし、XMLサイトマップをサチコで送信することを繰り返せば、サイトも成長するしPVも増えるし (`ω´)グフフ となるが、そんなに甘くはなかった。
XMLサイトマップで送信しているページであっても、Googleがインデックスに登録してねーでやんの。
てめぇサチコ!イワすぞ!(#゚Д゚)ゴルァ!!
サチコを確認せよ!
WordPressの場合は、SEOに威力を発揮する定番かつ有名プラグインがいくつかあるから、そのプラグインをブチ込んでひたすらコンテンツを作り、都度XMLサイトマップをサチコで送信すれば良いが、PukiWikiの場合はそうはイカない。
WordPress同様、標準でXMLサイトマップを出力するプラグインが無いのもそうだが、PukiWiki用URL短縮ライブラリを導入している場合、PukiWiki用URL短縮ライブラリ対応XMLサイトマッププラグインをブチ込んで利用する必要がある。
上記プラグインは時間を作って調査し、バージョンアップしたいと思っているが、今のところ致命的な問題はない(ハズ)。
その割に、ページ数が多い私設松本零士博物館サイトが、あまりにGoogleで検索されていない。
確かに松本零士先生の作品名(例えば「銀河鉄道999」や「宇宙戦艦ヤマト」等)で検索しても、検索順位が出版社やマンガサイト等に負けるのは仕方がない。
しかし、Google検索で全然出てこないってのはどーなのよ?
この場合、ページのURLをサチコで確認し、Googleに登録されていない場合は「インデックス登録をリクエスト」する必要がある。
サチコをイワす方法
「イワす」といっても、別にサチコをクラッキングして痛めつけるワケではない。
サチコを使って自サイトのページがGoogleに登録されているかを確認し、登録されていない場合に「インデックス登録をリクエスト」する方法を解説する。
なお、本稿では私設松本零士博物館サイトを例に解説するため、適宜自サイトに読み換えて試してみて欲しい。
まずサチコを開き、図①「URL検査」をクリックする。
すると、フォーカスが図②に移動するため、図の場合だと図赤下線のURL「https://museum.dajya-ranger.com/?1c28503101」(調べたいページのURL)を入力してEnterキーを押す。
すぐに検索が走り、図のように「URLがGoogleに登録されてません」とフザケた結果画面になるのだ。
このままだと永遠にインデックス登録されないので(多分)、図③赤枠「インデックス登録をリクエスト」をクリックする。
図の画面になり、しばらくインデックス登録のテスト処理になるので待つ。
インデックス登録に問題がないURL(ページ)の場合、図のようにインデックス登録をリクエスト済みである旨のメッセージが表示される。
だったら、なんで登録してねーんだよ?と思いつつ、図赤枠「OK」をクリックする。
すると図のような画面になり、図赤下線「インデックス登録をリクエスト済み」となる。
サイトのページ数を考えれば軽く死ねるが、粘り強くGoogleにインデックス登録されていないページを「URL検査」で調べ、インデックス登録されていない場合は「インデックス登録をリクエスト」するのを繰り返すしかない。
ところが、だ。
インデックス登録リクエストには上限があって、それ以上のリクエストを送信すると、図のようなエラーが表示される(仕方がないので図赤枠「表示しない」をクリックする)。
この上限値は具体的な数値が公表されておらず、1日10回程度で上限になる場合もあれば、30回や40回とリクエスト送信が可能な場合もある。
「明日、もう一度お試しください」とあるが、サチコは日本標準時ではなく、太平洋標準時が基準となっているようで、日本時間の0時過ぎにインデックス登録リクエストをしてもダメだったり、太平洋標準時が基準の割にOKだったり、実によくワカラン。
ちなみに、インデックス登録をリクエストしたページはいつ登録されるのか?も、Googleが公表していないようなので、やっぱりワカラン。
図は上記手順でインデックス登録リクエストしてから、半日以上経過してから調べた結果だが、早速登録されていた。
※2022/06/02 追記
私設松本零士博物館サイトの展示全243点中、約80点がGoogleインデックスに未登録で、インデックス登録をリクエストした。
ページ追加・更新の都度、XMLサイトマップをサチコで送信していたのに、約3割が未登録だったことになる。
正直、こんなにGoogleインデックスに登録されていないページがあるとは思わなかったが、内部SEO的にサイト(PukiWiki)の構成を見直す必要があるのかも知れない。
Bing Webmaster Toolsはどうなのか?
マイクロソフトのBing Webmaster Toolsも同様に、ページがインデックス登録されていないのか?
Googleにインデックス登録されていなかったページのURLで、簡単に調べてみた。
Bing Webmaster Toolsを開き、図①「URL検査」をクリックする。
図②に調べたいページのURLを入力(図の場合は「https://museum.dajya-ranger.com/?1c28503101」)、図③赤枠「検査」ボタンをクリックする。
すぐに検索されて図のような画面が表示され、図赤下線「正常にインデックスが付きました」のメッセージが表示される。
つまり、ページがBingにインデックス登録されていたのか、登録されていなかったのか、問答無用で分からない。その代わり、速攻でインデックス登録をしてくれるようだ(なんだそれ?)。
パソコン用Edgeブラウザは重たいし、その標準検索エンジンのBingもシェアが低いので、Googleほど労力をかける意味はないだろう。
robots.txtを設定してみる
なぜGoogleにインデックス登録されないページ(URL)があるのか、また、その量はどのくらいなのか?
XMLサイトマッププラグインに何かしらバグがあって、Googleにインデックス登録されていないのなら大問題だが、プラグインのコードをザッと見ても、特に問題があるとは思えない。
思い当たるとしたら「robots.txt」ファイルで、XMLサイトマップファイルのパス指定をしていないくらいだ。
PukiWiki用URL短縮ライブラリ対応XMLサイトマッププラグインの場合、XMLサイトマップファイル「sitemap.xml」を「cache」フォルダに出力している。
よって、「robots.txt」ファイルでは、次のように記述する必要がある。
Sitemap: https://サイトドメイン/cache/sitemap.xml
例えば、私設松本零士博物館サイトの場合は次のようになる。
Sitemap: https://museum.dajya-ranger.com/cache/sitemap.xml
上記「Sitemap」に関しては、記述は省略可能なものの、検索エンジンのクローラーが早くサイトを巡回する可能性があるようだ。
少しでも可能性があるのならば「robots.txt」ファイルを修正し、サイトのドキュメントルートにFTPした方が良いかも知れない。
とすると、「cache」フォルダの「.htaccess」ファイルも検索エンジンのクローラーがアクセス可能なように、次のように修正しておく必要があるだろう(PukiWiki1.5.2および1.5.3)。
cache\.htaccess
#Require all denied
Order allow,deny
Deny from all
# Amazon plugin's Image cache
<FilesMatch "^ASIN.*\.jpg$">
Require all granted
</FilesMatch>
# sitemap.xlmアクセス
<FilesMatch "\.xml$">
Allow from all
</FilesMatch>
いかんせん、Googleにインデックス登録されていないページが存在する原因がハッキリと分からないため、キッチリ対策することが出来ないが、だからこそ可能性に賭けてみるしかない。
おわりに
SEOについては周知の通り、ほぼシェアを独占しているGoogleがその技術的な内容を公表していないため、手探りの試行錯誤を繰り返すしかない。
Googleのインデックス登録その他に関しても同様だし、Web系は押さえておく技術やその手法も多い上に、どれが正解なのかは誰も分からない。
ゆえに、PukiWiki用URL短縮ライブラリ対応XMLサイトマッププラグインの仕様を決めるのは悩ましいし、コードで実装した結果を試行錯誤するしかない上に、SEOは結果が分かるのに数ヶ月かかる。
私が四半世紀ほど前から、インターネットやOSSについて懐疑的な目で見ていたのは、「標準仕様がない」の一点に尽きる。
無論、コンピュータのハードとソフトは徐々に規格が出来て普及するモノだし、デファクトスタンダードになる闘いの歴史であることは、重々承知している。
しかしながら、ブラウザが違うだけで表示が異なったり、最悪レイアウトが崩れるといった時代からWebサイトを運営していると、とてもインターネットが商売になるとは思えなかった。
また、LinuxやFreeBSD、ApacheといったOSSは「タダで使える」といった面ではありがたいが、全て利用者の自己責任という文化は、受け入れがたいモノがあった。
特に自分がプロのSEでプログラマであると、利用者の自己責任であるソフトをこちらで責任を負って、顧客に提供するのは困難だ。
そもそも、自分のコードが悪いのか、OSSのコードが悪いのか?の切り分けは、非常に困難を伴う(バグ満載のWindowsNT3.xとOracle6でパッケージソフトをVB2で開発していた炎上プロジェクトの火消しでは、正にこの点で地獄を見た)。
しかしながら、世界中のプログラマが不眠をモノともせず、健康を害しようが、恋人と別れたり離婚されようが、苦労して苦労して苦労して、それも30年もの歳月を経て、やっと今のネット社会がある。
私もその恩恵に浴している一人として、また同じプログラマとして、PukiWikiを通して恩返しが出来れば、と願っている。
関連記事
Warning: strpos() expects parameter 1 to be string, array given in /home/eware/dajya-ranger.com/public_html/wp-includes/compat.php on line 498
Warning: preg_match_all() expects parameter 2 to be string, array given in /home/eware/dajya-ranger.com/public_html/wp-includes/shortcodes.php on line 155
Array