百度

日本のサイト管理者様へのメッセージ:

<span class="STYLE2">日本の皆様、初めまして。百度株式会社代表取締役の陳海騰です。</span>
   <span class="STYLE2">百度は中国の最大の検索エンジンです(ネットユーザの約7割)。 </span>
<span class="STYLE2">海外初の進出となった日本市場へは2006年の12月に本格的に参入致したばかりです。 </span>
<span class="STYLE2">さて、弊社はまもなく日本語版検索サービスを開始致しますが、それにあたり現在日本語サイトのwebページの収集Spider(クローラ)を実施しております。 </span>
<span class="STYLE2">これにより御社のサイトに過剰なアクセスが発生したため、管理者の方には多大なるご心配をおかけ致しました。 </span>
<span class="STYLE2">百度株式会社の代表としてこの度Baiduspiderが御社のサイトにご迷惑をおかけしましたことに関して心よりお詫びを申し上げます。 </span>
<span class="STYLE2">今後はこの問題について会社全体が真摯に受け止め、日本のインターネット業界におけるルールに従い、このようなことが二度とないように努めていく所存でございます。 </span>
<span class="STYLE2">弊社はこれまで現れた問題について以下のように対処致しました: </span>
   <span class="STYLE2"></span>
  1. 各サイトへのクローラー負荷を下げております。Baiduspiderの最大クローラー頻度を9回/秒から1回/3秒までに下げました。以前のクローラー頻度の1/27になりました。
  2. 各サイトの規模とIP負荷に対し、それぞれ対応できるクローラー対策を設定し、中小のサイトに対し、クローラー頻度は20秒/回以内にコントロールしています。
  3. サイトに対し圧縮クローラー機能を追加したことにより、同じ負荷においてサイトへのアクセス量をもともとの1/3に下げました。
  4. 各サイトに対し、毎日のクローラー総量をコントロールしました。仮にサイトの最大制限を超えた場合、当日に調整致します。
  5. 各サイト管理者様におきましてはBaiduspiderに対し、何かご質問がございましたら、たいへんお手数ですが、webmaster-jp@baidu.com までにご連絡して頂きたいと思います。

百度はこの様な努力を継続し、御社のページビューにも役に立つような最適なネットワーク構築や、より一層の協力関係を築けるよう、日々全力をあげて参ります。

<span class="STYLE2">そしてユーザーがより良い体験をできるよう、弊社のリソースを日本のユーザーの皆様にご提供できれば幸いでございます。 </span>
<span class="STYLE2">万一今後も弊社の情報収集Spiderが御社にご迷惑をおかけすることあった場合、お手数ですが、<a href="mailto:webmaster-jp@baidu.com" title="webmaster-jp@baidu.com">webmaster-jp@baidu.com</a> までにご連絡いただくか、直接百度株式会社の代表陳海騰 <<a href="mailto:htchen@baidu.com" title="htchen@baidu.com"> htchen@baidu.com</a>> 宛てまでご連絡頂ければと思います。</span>
<span class="STYLE2">迅速的に対応させていただきますので、何卒よろしくお願い申し上げます。 </span>

</p>

敬具

</span>

</blockquote>

Cited from www.baidu.jp

It SEEMS that (according to Google Translate) Baidu’s spider consumes quite huge amount of bandwidth of the websites in Japan and therefore this is a statement/correspondence about the spider policy. Well, baidu.jp still has a long way to go.

有懂日语的朋友大致解释日文意思么? 我也想了解一下日本的媒体对百度的进入是怎么样的看法. 中日韩市场潜力不可估量的大啊!
Could anyone who speak Japanese simply explain the basic idea of this? I just wonder to now the attitude that the Japanese media holds towards Baidu.

Something interesting:
1. baidu.jp has an IP address of 122.152.128.48, which belongs to Asia Netcom. I’ve looked it up via several ip-geo look-up system. To my surprise, either they do not have a clue or they report Europe, that’s ridiculous.

2. If you use wget -S to crawl baidu.jp, baidu.com and www.baidu.com, you will find something interesting.

Baidu.jp:
Server: Apache/2.2.3 (Unix)
Last-Modified: Tue, 27 Feb 2007 09:10:45 GMT

Baidu.com
Server: Apache/2.0.55 (Unix) PHP/4.3.11
Last-Modified: Fri, 16 Dec 2005 03:33:13 GMT

www.Baidu.com
Date: Fri, 02 Mar 2007 00:04:04 GMT
Server: BWS/1.0


We can now assume that BWS is possibly built on UNIX system like BSD or sth.