转贴一乐事! "负责内容监控的爬虫给封了,结果我就被 ...

来源:百度文库 编辑:超级军网 时间:2024/05/03 07:45:51
Robbin 解释 JavaEye 被封的原因
http://www.oschina.net/news/13267/robbin-javaeye

Robbin : JavaEye被封是因为我写的动态防火墙代码太智能了,把电信负责内容监控的爬虫给封了,结果我就被封了。这年头,代码写的好也是杯具啊。把监控爬虫加入白名单了,争取下午恢复网站访问。Robbin 解释 JavaEye 被封的原因
http://www.oschina.net/news/13267/robbin-javaeye

Robbin : JavaEye被封是因为我写的动态防火墙代码太智能了,把电信负责内容监控的爬虫给封了,结果我就被封了。这年头,代码写的好也是杯具啊。把监控爬虫加入白名单了,争取下午恢复网站访问。
又一件功夫网的伟绩;P
这也是个人才啊。
这个强
不懂
大胆居然敢给六扇门的吃闭门羹

能不把你房门封了么
蛋定~
搞笑哇卡卡
2,装逼的也信,这件事流传的还挺广,竟然都跑到军事网站来了,看来小白真不少。

还电信爬虫呢,在IT行业混了这么多年,天天跑技术论坛,头一次听说“电信爬虫”;P

中国这么多网站、世界这么多网站,这么多年了全没听说过这个所谓的电信爬虫,合着这个所谓的电信爬虫是为他的这个网站专设的{:3_76:}

还是那句话莫装逼装逼被雷劈,你看他说解封这个所谓的爬虫后,网站怎么到现在还没开啊。
死鱼高达 发表于 2010-11-25 23:54
就是搜索引擎的蜘蛛。
很多搜索引擎都有的,服务器上你一看访问过来客户端http的头信息,就知道是谁了。
电信用的着爬虫?网站所有的内容都会通过电信的路由,只要愿意,没有他们不能查到的,还用得着上你的网站去爬??
虽然我也玩wow并且很菜,不过还是斗胆对lz说一句:莫装×,装×被人×。
当然如果你要守我尸的话我只能表示摇头怕怕~~~
lidao888 发表于 2010-11-26 11:18

实时监控和内容遍历是两个不同的方式,一般来说,监管部门都是双管齐下的。


只要你的服务器还是放在国内 电信和机房承包方打声招呼就能直接拷贝硬盘 还爬什么虫

只要你的服务器还是放在国内 电信和机房承包方打声招呼就能直接拷贝硬盘 还爬什么虫
冰刃 发表于 2010-11-26 11:43

总不能天天上门拆硬盘吧...
TripleX 发表于 2010-11-26 12:03
定期就是了 再说还有关键字过滤呢
爬虫不是电信的
要网站数据找baidu多方便.
没听说有什么电信爬虫
搜索引擎不都是用爬虫?所以鬼知道真相是怎么回事
我想不通,电信爬下来干什么,人工核销吗?
Robbin 的javaeye属于技术类的网站,上面的不少是行家(虽然大部分集中在应用层)。
但是他不至于撒这种没必要的慌吧。
mark存疑
呵呵,坐等真相。
镜像分光过滤加扰,放着轻松的事不做放爬虫?
@robbinfan
Robbin Fan

user agent信息看了一下,是:Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1),可能是在Windows机器上跑的一个程序,自动调用IE内核不停的扫描网页。

我的防火墙其实很人性化,封爬虫会给页面填注册码,如果继续不填注册码才封。刚才查了一下日志,发现网段被封之后,该网段都有IP登录上来填注册码解封。被封,然后填注册码解封,再被封,几次三番下来,把监管人员逗急了,就下手了。所以我该加一个功能:连续几次填验证码的网段就自动加白名单


根据我和公安技术部门接触的情况来看,基本属于装x类型的,不排除只是封了个菜鸟黑客
javaeye我也常上,但这个理由也太牵强了
难道没听说有个叫端口镜像的……还用爬虫?24楼懂行……
有人说当时有时能上有时不能
被roq或dos攻击了吧
估计是电信发觉流量异常,把网站给关了