一年一度的618电商盛宴在买买买,同时“如何省钱”成为大家最关心的问题。比价、返利、优惠券正是消费者网购时所需要的。
然而,在这些“让步”的背后,一直存在着灰色地带。爬虫因为成本低,门槛低,成为黑产常用的技术手段。
返利平台非法爬虫获取淘宝用户个人资料
近日,河南省一份裁判文书揭开了部分淘宝返利平台的黑幕。
不法分子为了自己的“淘宝客”业务,抓取淘宝客户个人信息近12亿条,在微信群推广淘宝商品,从而获取淘宝佣金和商家服务费。
裁判文书显示,自2019年起,被告人邹受雇于被告人李某。邹某利用家中自行开发的爬虫软件,通过淘宝网页界面抓取淘宝客户的信息,并将淘宝客户的手机号码提供给李某设立的浏阳泰创网络科技有限公司(以下简称“浏阳泰创”)进行经营活动。公司从2019年8月到2020年7月。
经司法鉴定,邹某共抓取淘宝客户数字身份证、淘宝昵称、手机号等淘宝客户信息11.8亿条。通过其开发的软件,邹将其抓取信息中的淘宝客户手机号码以微信文件的形式发送给李使用,共计1971.26万条。
2020年8月,淘宝(中国)软件有限公司向警方报案称,2020年7月6日至13日期间,部分黑产通过mtop订单评价接口绕过平台风控,批量抓取加密数据,抓取字段数量巨大,7月6日至13日期间平均每天抓取字段500万个,抓取内容包含买家昵称、用户评价内容、昵称等敏感字段。经淘宝网调查,邹有重大作案嫌疑,遂下达该计划。
据证人证言,浏阳泰创的主营业务是淘宝客,在微信群推广淘宝商品,从而获取淘宝的佣金和业务服务费。2019年以来,邹某使用自写软件抓取淘宝客户信息后,不时将公司需要的淘宝客户手机号码发送给李某。李某收到手机号后,将信息数据导入“微信加”软件。添加微信好友成功后,公司员工负责发送广告链接,用户在广告群里购买商品,公司从中获得提成。
很多目击者对微信群总数的描述不一。根据他们的描述,有多达1100个小组,每个小组的人数从90到200不等。照此粗略计算,使用浏阳太创搭建返利平台的用户至少有10万人。浏阳台创平台一年获得业务395万余元,非法所得34万元。
返利平台“受益”了谁[S2/]
目前国内返利平台很多。从不同的电商平台来看,阿里巴巴自营的“阿里妈妈”平台和京东。COM自营的“JD。COM联盟”平台都是电商自营大数据营销平台。从业务渠道来看,涉及网页、APP客户端、微博、微信等多种渠道。
记者下载并体验了阿里巴巴自营平台“阿里妈妈”的返利模式。用户可以在淘宝联盟注册为“淘宝客”,复制自己想要推广的商品链接,从淘宝联盟后台获得专属推广链接。任何一个买家复制推广链接进入店铺完成购买后,推广的用户都可以获得卖家按照一定比例支付的佣金。
简单来说,返利平台其实就是一个营销推广平台。电商平台的商家按照销售额比例支付佣金,一部分以优惠券链接的形式给予消费者价格优惠,另一部分作为营销推广费用支付给返利平台或个人。在消费者认为可以从返利平台获得利益的同时,返利平台也通过赚取商家的分佣金赚得盆满钵满。
一些返利平台已经进入资本市场。比如今年1月,“韬奋吧”也进入上市辅导阶段,拟在a股上市。5月,返利数码科技股份有限公司(SH.600228)在昌九生化公司上市。
电商平台爬虫拔河
爬虫对电商平台的威胁由来已久。
据记者了解,目前针对电商平台的爬虫行为有商品详情页爬虫、用户隐私数据爬虫、交易数据爬虫三种,其中商品详情页爬虫是很多比价平台惯用的技术手段。
业内人士指出,目前电商平台最敏感的爬虫行为是商品详情页的爬虫,尤其是价格数据。一方面,友商总是用各种手段互相抓取数据,另一方面,黑产利用平台间的差价牟利。
维宣科技系统架构师赵晓彤告诉记者,一些比价平台通过抓取电商平台的商品详情页数据来引流网站平台,然后通过流量变现来盈利,并不是长久之计。未来电商平台反爬虫技术逐步完善后,将面临技术和合规的压力。
据悉,近两年来,针对数据安全保护,国内一些大型厂商已经成立团队研究相关问题,包括数据存储安全、计算安全、传输安全等。电子商务平台的爬虫和反爬虫技术处于长期的相互进化和促进的拉锯阶段。
目前电商平台通过限制访问次数、加密前端页面显示、提高人机识别技术等手段对黑产进行拦截识别,增加黑产的作恶成本。[/s2/]
值得注意的是,最近全国各地都在加快数据立法。比如深圳出台的数据条例草案,就明确了数据的公平竞争原则。
这意味着电商平台的数据爬虫未来将面临更高的违法成本。
根据征求意见稿:
市场主体不得使用非法手段破坏其他市场主体采取的保护数据的技术措施;
不得违反行业惯例收集或使用其他市场主体的数据;
不使用非法收集的他人数据提供替代产品或服务;
未经其他市场主体或者消费者同意,不得将其他市场主体的数据直接用于商业用途;
不得采取法律法规禁止的其他侵害其他市场主体或者消费者合法权益的行为。
主编:顾万全文字编辑:宋会题图来源:海龟图片编辑:苏伟
来源:作者:21世纪经济报道