/tool/kgbody.php リファラ(キッズgoo)経由で表示が崩れる件

kgbodyなるリファラを辿ってキッズgooを見に行ったら、設計思想がインターネット黎明期の頃のgooとあんまり変わってなくて妙に感心したので思い出した昔話を少々。

/tool/kgbody.php リファラ(キッズgoo)経由で表示が崩れる件

アクセスログに /tool/kgbody.php なるサイト経由でアクセスされた形跡を見かけて調べたメモ。その正体はキッズgooのフィルタリングサービスでした。そこで実際に確認してみたところ、うまくページが表示されないケースもあるようです。

/tool/kgbody.php はキッズgooのコンテンツフィルタスキン

何げなくサイトのアクセスログを見に行ったら、うちの形式ではないデータが流れてきて目に留まりました。ページタイトルが平仮名になってます。

/tool/kgbody.php/リファラのログ

最初はURLの構造から翻訳サイト経由で読まれてるのかなと思ったんですけど、「サイトの丸パクられ」でも同じことが起こり得ます。…ということで念のため運営元をチェックしてみたところキッズgooだったというわけでした。

そういえばgooって子供向けにフィルタリングサービスをやってましたね。

キッズgoo経由で見た目をチェック

リファラ元が判って「めでたしめでたし」なんですけど、どうせなのでキッズgooにアクセスして実際の見た目を確認してみることにします。

キッズgoo キッズgoo

ここで検索窓に適当なキーワードを表示させて自分のページを見てみました。

キッズgooでの閲覧結果

上部にナビゲーションバーがつくんですね。作者としては少々複雑な感もありますが、子供達の安心のためですから仕方ありません。

しっかしWebフォントは表示されないのか!これ今どきのサイトには結構痛手じゃないでしょうか。フラットデザインどうすんだ…。

スクリプトやバイナリデータを除外

コンソールで見るとフレームで元ページを引いてます。

キッズgooのソース構造

これも運営側としてかなり悩ましいところですが、フィルタリングという用途に限って言えばフェアユースの範囲と言えるでしょう。(ただし日本国内のコンテンツにフェアユース概念は直接適用できないので注意。)

Webフォントなどのブロッキングが単純に拡張子で見てるのかどうかも気になります。多少変わったデータを突っ込んでどうなるか確認してみなくては。…と思ったんですけど、チェックしようにもちょっと変わったページだと検索結果に引っかからないので検証してません。

キッズgooエラー画面
【エラー画面の例】

ガイドラインが公開されてないため以下は想像になりますけど、コンテンツ内でプログラム動かしてるようなページは引っかかりにくいようです。1ドメインあたりの表示数も30ページくらいしかインデックス(マウント?)されないようですね。

ただ、検索結果に上がってこないページでもリンクを辿れば見られるようです。うちのサイトに関して言えば、トップページからアーカイブに入れば下世話な生物ネタやJavaScript書いたページも普通に閲覧できるし動きました。

規制基準が謎でござる。

gooと言えば余談

唐突ですが、インターネッツと言えばカーときてgoo。ちょっと思い出した話をします。

サムネイル用スクリーンショット事件

よそのサイトを紹介するサムネイルとして良くスクリーンショットを貼りますね。この手法は1998年頃(多少前後するかも)にgooが広めたと記憶してます。当時は著作権的にどうなんだと随分騒ぎになりました。

結局その議論はうやむやのままGoogleが画像検索サービスを始め(2001年)、以降なし崩し的に認められたという認識です。

アメリカでは「サーチエンジンという性質上フェアユース」になるのは判るんですけど、日本に置ける法的根拠が今ひとつわからず、未だにヒヤヒヤしながらサムネイル貼っております。皆さまにおかれましては如何お過ごしでしょうか。

goo.co.jp事件

これまた前世紀の話をします。昔goo.co.jpというエロサイトがありまして、当時のgoo.ne.jpは玄人向けサーチエンジンとして人気が高かったため「URLウィンドウに手打ちでドメイン入れて誤爆する」という案件が各地で多発しておりました。

そこでドメイン取得日で言えば後発に当たる goo.ne.jp が先発の goo.co.jp を訴える事例が発生。結果、サーチエンジンの goo.ne.jp に軍配が下りました。現在の goo.co.jp はgooを運営するNTTレゾナントによって管理されています。

一頃の goo.ne.jp が執拗にテレビCMで「ぐーねーじぇーぴー」を連呼していたのは背後にこれがあったため。

公益を考えたら妥当な判決とは言え、ドメイン取得日で言えばエロサイトの方が早かったことから co.jp に同情する声も多数ありました。

そもそも「goo」と言う言葉を辞書で引くと

  • ねばつく[べたつく]もの…新英和中辞典
  • べたべたした甘い言葉[感傷]…新英和中辞典
  • (GLUE の変形)…新英和中辞典
  • 厚く堆積したきたない物…日本語WordNet英和

だったりします。むしろ何故これを検索エンジンのサービス名にしたし?

肝心のgoo辞書(中身はプログレッシブ英和中辞典)で「goo」を引くと

  • いやらしい[ねっとりした]感傷…goo辞書(中身はプログレッシブ英和中辞典)

ですしね。ちなみに私も co.jp に同情派でした。エロサイトは嫌いだけど、さすがにこれはもうちょっとうまくやって欲しかった感じです。

おわりに

何で最後に余談をあれこれ盛ったかというと、キッズgooのフィルタ適用範囲を調べてたらサーバの挙動が「特定の方法でアクセスした時だけ表示される」設定になってたからでした。

具体的に言うと「gooの基準を満たしたページでもキッズgooから検索しないと目的のページが表示されない」んです。直接URL叩くとダミーが出ます。フィルタリングサービスとしては非常に妥当な仕様だけど、悪い人達がサイトを偽装する時に使うテクニックでもありますね。

ナイフは調理具にも凶器にもなる。ネットの利便性と安全ってほんと紙一重で難しいです。

【 関連記事 】

フィルタリングサイト「キッズgoo」はふりがな機能が便利

ついでなのでキッズgooのフィルタ精度や使い勝手について調べたメモ。