近期小红书反爬风控下的舆情监测软件厂商到底哪家采集小红书数据最强?
想必大家都知道最近小红书反爬虫风控做得比较厉害,之前还有很多舆情监测软件厂商都信誓旦旦的说他们的小红书数据采集有多么的快,采集数据有多么的全,甚至有客户还说他们拿到的是小红书API接口数据,多么多么的牛逼,小编我也曾经因为公司采集小红书的数据很快经常跟客户吹牛逼。但是最近小红书风控反爬一系列的动作,给舆情监测行业来了一个措手不及,主要动作有:
1、封掉水军号百万,据说还在持续封号中,每天的量非常大
2、链接转换技术,让很多舆情监测软件厂商爬到的链接无法正常打开,必须经过转换步骤后才可以打开
3、封掉了海量的爬虫IP
4、升级了反爬虫算法
目前服务企业客户的舆情监测软件厂商都在找公司的技术哭爹骂娘的,各种抱怨,说技术怎么怎么无能之类的脏话一大堆,那么就目前小红书的风控程度来看,小编觉得至少还需要很长一段时间才可以彻底解决掉小红书的反爬,就算解决掉爬到的数据无论数据时效性还是全面性都会大不如前。也有很多销售跟舆情监测客户在质疑自己用的软件,其它的软件都可以爬到小红书全量的数据,那么小编今天用了国内主流的8套舆情监测软件数据做测试对比,得出来的小红书采集结论是:
1、国内排名前4大的舆情监测软件厂商小红书数据采集情况:相差不多,采集到的数据都是极少的,看不出来哪家采集好坏,反正都坏,小红书三十分之一的数据都没有采集到。
2、国内一般的4大舆情监测软件厂商采集小红书的情况:残次不齐,有采集质量好的,但是距离采集小红书全量数据还是有很多的采集,50%的小红书数据都没有采集到。
所以小编觉得,目前国内大部分舆情监测软件厂商采集到的小红书数据有等于没有,各位关注小红书数据的舆情监测软件厂商销售跟客户小编建议还是要定期手动都小红书上面搜索一下,会比较靠谱,目前依赖舆情监测软件采集小红书数据完全靠不住。