本站注意到来自 211.143.79.108 的数据抓取请求量飙升,24 小时内该 IP 发出的请求高达 20710 次,如此高频次的抓取导致网站服务器受到影响且浪费带宽和流量。
目前我们已经将该 IP 地址屏蔽,从 UA 信息来看这也不是搜索引擎的爬虫,从特征来看主要是访问各个文章页面,应该是某个 AI 公司用于抓取数据进行训练的爬虫。
下面是该恶意 IP 的特征信息:
- IP 地址:211.143.79.108
- IP 位置:中国,河北省,保定市
- 运营商:中国移动
- ASN 号码:AS24547 CMNET-V4HEBEI-AS-AP Hebei Mobile Communication Company Limited
使用的 UserAgent:
Mozilla/5.0 (Windows NT 6.2; Win64; x64; Trident/7.0; rv:11.0) like Gecko
从目前本站收集的信息来看该 IP 地址并不是用于 PCDN 刷流量的,不过考虑到没有爬虫明确信息以及高频次抓取问题,直接屏蔽是最好的,如果使用 Nginx 可以直接返回 HTTP 444 代码丢弃连接,降低服务器资源开销。
将下面内容添加到网站的配置文件中:
# 使用 if 指令检查客户端 IP 地址并返回 HTTP 444 if ($remote_addr = 211.143.79.108) { return 444; }