最初に読んでね ダウンロード 検索 ユーザー登録する 連絡 マイストア ログイン  
必読のこと
 
phpBB2/3 の話題などでお話ししましょう。「便利なMOD見つけた」とか、「良いテーマ発見したよ」などなど。

投稿前に【書込みのルール】を先に読んでください。

開発研究室なんてのもあります。

・携帯関連:phpBB2 の携帯対応化(試案) | mophpbb 1.6.2 改造 / Mobile Online phpBB
 
トピックに返信する 危険なgooglebot このエントリーを含むはてなブックマーク
危険なgooglebot
maverick
投稿初級者さん
投稿初級者さん

登録日: 2006.03.18
記事: 22
引用付きで返信する
googlebotというのをご存知かと思います。Googleが(他の検索エンジンのサイトもやっていますが)使っているロボットでいろいろなサイトをサーチしてデータを集めるロボットですが、うちのサイトのログを見ていたらこのロボットがposting.phpを探っていました。もしかしたらやばいんじゃないかと思い、googlebotがあぶないスクリプトを実行しないようにrobots.txtをおいたらそのようなことは無くなりました。当然ですが。私の置いたrobots.txtは

コード:
User-agent: *
Disallow: /posting.php
Disallow: /login.php
Disallow: /faq.php
Disallow: /privmsg.php


というものです。

それが今日googleを検索していたらたまたまhttp://www.google.com/search?q.....C%E8%AA%9Eを検索していた時、12個目の"Mozilla L10N :: 返信の投稿"というのがまさにそのような例だと気づきました。これを押すといきなり返信のページに飛びます。

このようなリンクをはられないように気を付けましょう。

他に実行されたらまずいスクリプトはありますか?
ユーザーのプロフィールを表示maverick の記事をすべて検索プライベートメッセージを送信メールを送信
面白いと思いますが、
群青
投稿上級者さん
投稿上級者さん

登録日: 2005.04.17
記事: 75
所在地: 【アダ被の部屋】
引用付きで返信する
phpファイルをGooglebotに巡回されても、そのphpを含むURLで検索結果にリストされる可能性があるだけで、特に実害があるとは思えないのは思えないです。確かにたまに「新規投稿フォーム」でGoogle検索に引っかかるケースはありますが、特にパスワードを拾われる訳では無いのではないかと。


心配されているのは何でしょう?返信のページに飛んでも、人のIDやパスを使えるわけではないのでわ?


URLに含まれる「記号」に何らかの情報が含まれているのは確かですが、実際にクリックしてみてもゲスト投稿になるみたいですし。
ユーザーのプロフィールを表示群青 の記事をすべて検索プライベートメッセージを送信投稿者のウェブサイトに移動
maverick
投稿初級者さん
投稿初級者さん

登録日: 2006.03.18
記事: 22
引用付きで返信する
そのゲスト投稿が気になるんです。タイトルがおおげさで紛らわしかったらすみません。検索で間違って訪れた人になんかわけのわからない投稿をされても意図しているのかまぐれなのか区別できないと困るし、ゲスト投稿を消せるのはmoderatorかadminですからわけのわからないゲスト投稿は避けたいのです。もちろん、2.0.11や2.0.13のようなセキュリティーの問題はまったくありません。

これをgoogleに問い合わせたら「あぶないと思ったらそのサイトのwebmasterに連絡すればいい」という返事でした。まあ、確かにそうなんですが自分がロボットのことを知らずに妙なゲスト投稿が続いたら変に思うだろうとおもうのです。なんかふに落ちないなあ。以下がgoogleからの返事です。

コード:
Thank you for your reply. Please note that Google aggregates and organizes
information published on the web; we don't control the content of these
webpages. If you're concerned about the content on a particular page in
our search results, we suggest that you directly address the webmaster of
the page in question. To learn how to contact the webmaster of a site,
please visit http://www.google.com/support/bin/answer.py?answer=9109. For
more information about our Terms of Service, please visit
http://www.google.com/terms_of_service.html

We appreciate your taking the time to write to us.

Regards,
The Google Team


ロボットがポストページを見ている所をログで見付けた時は驚いた、というより笑いました。記号はsession idでログから推測するとロボットが毎回ランダムにつくり出しているようですが、もしかしたらサーバからとっているのかもしれませんが毎回変わるのをみるとランダムのようです。でもなぜ32バイトと分かっているかは疑問です。

robots.txtの設定に関してはhttp://www.robotstxt.org/wc/ex.....#robotstxt,また、はからずも掲載された検索結果を消去するためにはhttp://www.google.com/webmasters/remove.htmlが役立つと思います。

その他、login,faqとかpmとかgoogleの検索に入れられても意味が無いので入らせないようにしています。robots.txtの規格はGoogleだけではないようです。
ユーザーのプロフィールを表示maverick の記事をすべて検索プライベートメッセージを送信メールを送信
Re: 危険なgooglebot
hiikun
あどみん
あどみん

登録日: 2005.03.16
記事: 830
所在地: 大阪府
引用付きで返信する
maverick の記述を引用:
他に実行されたらまずいスクリプトはありますか?

こんな風な内容でイイんじゃないでしょうか。▼

robots.txt
コード:
User-agent: *
Disallow: /profile.php
Disallow: /posting.php
Disallow: /login.php
Disallow: /search.php



あとのは、お好みでしょうかね。▼
コード:
 :
Disallow: /privmsg.php
Disallow: /memberlist.php
Disallow: /groupcp.php
Disallow: /viewonline.php
Disallow: /modcp.php
Disallow: /faq.php




それか思い切って、ボットちゃんを全て拒否するとか。▼
あ)robots.txt
コード:
User-agent: *
Disallow: /



い)templates/subSilver/overall_header.tpl
<head>~</head>間に挿入
コード:
<meta name="robots" content="noindex,nofollow">


う)mod_rewrite

以上、あ)い)う)をすべて採用するのもイイかと思います。

★参考
Arrow http://www.math.tohoku.ac.jp/~kuroki/keijiban/Robots.html

_________________

Arrow 【ニューリリース】2.0.23/3.0.0

マイホームノートアイテム探索小都市
ユーザーのプロフィールを表示hiikun の記事をすべて検索プライベートメッセージを送信投稿者のウェブサイトに移動
maverick
投稿初級者さん
投稿初級者さん

登録日: 2006.03.18
記事: 22
引用付きで返信する
確かにprofile.phpは拒否した方がよさそうですね。本当にあとはお好みみたいです。

logを良く見るとgoogleだけでなく、msn,yahoo,askjeevesなどもrobots.txtを参照しています。結局ゲストの書き込みを止めれば済む話のようですが…
ユーザーのプロフィールを表示maverick の記事をすべて検索プライベートメッセージを送信メールを送信
tatsunoko
投稿上級者さん
投稿上級者さん

登録日: 2006.11.13
記事: 81
引用付きで返信する
このような記事を見つけたのですが
Googleにサイトを全消去されたかわいそうなサイト
http://gigazine.net/index.php?/news/comments/20060331_google/

GIGAZINEによると、googlebotはログインページも飛ばして削除のリンクを押した
と書かれていますが、phpbbでも考えられますよね。
最近、googlebotが記事の投稿、とか、プライベートメッセージの・・・とかACPに出ているのですが、。
robots.txt?っていうのをやってみて様子を見ます。 Sad
ユーザーのプロフィールを表示tatsunoko の記事をすべて検索プライベートメッセージを送信
hiikun
あどみん
あどみん

登録日: 2005.03.16
記事: 830
所在地: 大阪府
引用付きで返信する
tatsunoko の記述を引用:
このような記事を見つけたのですが
Googleにサイトを全消去されたかわいそうなサイト
http://gigazine.net/index.php?/news/comments/20060331_google/

それはそのスクリプトの設定の問題(ローカルテストの設定のままが影響した)か、もしくは欠陥ではないでしょうか。
それか、Googlebot を偽装したクラックボットかもしれません。
(ファーストポストしか読んでません Razz


引 用:
GIGAZINEによると、googlebotはログインページも飛ばして削除のリンクを押した
と書かれていますが、phpbbでも考えられますよね。

phpBBではそうならないでしょう。
ACP に入るには再認証(ユーザーログインのあとにもう一度ログイン)しなくてはいけませんし、アドミンのセッションIDもチェックします。


引 用:
最近、googlebotが記事の投稿、とか、プライベートメッセージの・・・とかACPに出ているのですが、。

投稿の場合、posting.php?mode= を開いてる場合でも表示されるので。PMも同様です。

_________________

Arrow 【ニューリリース】2.0.23/3.0.0

マイホームノートアイテム探索小都市
ユーザーのプロフィールを表示hiikun の記事をすべて検索プライベートメッセージを送信投稿者のウェブサイトに移動
instnet
投稿入門者さん
投稿入門者さん

登録日: 2010.01.11
記事: 2
引用付きで返信する
確かに危険です。
ユーザーのプロフィールを表示instnet の記事をすべて検索プライベートメッセージを送信
危険なgooglebot
新規投稿: 不可
返信投稿: 不可
記事編集: 不可
記事削除: 不可
投票参加: 不可
添付アップロード: 不可
添付ダウンロード: 不可
All times are GMT + 9 Hours (JST)  
Page 1 of 1  

  
  
 トピックに返信する    

Board Security

3713 Attacks blocked

Powered by phpBB © phpBB Group
Design by phpBBStyles.com | Styles Database.
Traduction par : PHPBB JAPAN / UTF-8 i18n Edition : JP Support Forum
Content © phpBB2 日本語サポートフォーラム
[ Debug on | page generation = 1.51971 seconds | sql queries = 20 ]
Feed RSS 2.0
JP Support Forum
SourceForge.jp