近日,有人在网上发帖称,自己遇到了一个信息乌龙——因为同名同姓,被视为被法院执行的某公司法定代表人,其公司股份被法院冻结,公司因此被封杀投标活动,蒙受损失。
他分析乌龙的根源在于企业信息查询平台,并在文中分析了这类平台存在的问题。
《中国经营报》记者发现,在中国裁判文书网、黑猫投诉网上,涉及企业查询平台的诉讼和投诉不在少数。受影响的主体不仅包括个人和中小企业,还包括360、中石化等知名大企业。
一些商业查询平台曾宣称自己的使命是促进信息公平透明,以技术助力社会信用体系建设,市场对此也给予了积极回应。然而,随着乌龙事件的不断出现,质疑和担忧的声音越来越多。
持续目标
一个叫“高”的人曾经遭遇过一次企业信息搜索平台的乌龙。
中国裁判文书网的一份民事裁定书显示,原告武汉中科瑞泽光电科技有限公司在被告(湖北)实业有限公司、西藏信诚悦物业服务有限公司经营的软件、微信小程序中发现以下错误信息,其法定代表人高于2020年12月17日被郑州市中原区人民法院裁定限制消费。在(湖北)实业有限公司法定代表人高的简介中,赫然写着“中科瑞泽创始人高”。
事实上,蔡中(湖北)实业有限公司与原告没有任何关系,其法定代表人只是同名而非同一人。被告在未与原告确认核实的情况下,仅凭借法定代表人同名同姓,擅自任意误判原告与蔡中(湖北)实业有限公司之间的关系,并将主观误判的结果向社会公布。被告错误的连接判决导致原告法定代表人被误认为失信被执行人,原告及其法定代表人的社会评价受到质疑。
武汉中科瑞泽光电科技有限公司指出,截至起诉状之日,原告和蔡中(湖北)实业有限公司的基本信息在被告平台上分别被浏览了7216次和4441次。
因此,原告要求被告公开道歉、进行经济赔偿并退还会员费。
此类事件并非孤例。例如,2019年5月5日,某企业查软件向认购人推送蚂蚁金服旗下重庆蚂蚁肖伟小额贷款有限公司开始清算的消息,并将该信息的风险等级列为“预警信息”。对此,蚂蚁金服表示,上述清算信息其实是2015年的历史信息,企查平台发布了错误信息,误导了外界,故以涉嫌不正当竞争将企查平台告上法庭。
类似的问题并不是某个平台独有的。当《第一财经》记者在黑猫投诉平台输入相关关键词时,弹出了很多类似的案例。
比如2021年10月1日,有网友投诉:“企业调查平台中湖南唐竹建筑服务有限公司法人显示是我的名字,而且和我的其他企业有关联。事实上,我和这家公司没有任何关系。我目前正在谈论投资...这导致了我和我的伴侣之间的隔阂,并最终导致没有成功。”同年10月15日,Enterprise Check在黑猫投诉平台回复:“信息已解除关联。非常抱歉。”
2021年11月8日,有网友投诉天眼查作为多家超市的联系人,输入了他的电话号码,导致他长期接到各种猪牛羊鸡饲料化肥的推销骚扰电话,并经常因这种影响而失眠。后来该网友到当地工商局查询时发现,这些超市在注册时输入的联系电话并不是自己的手机号码,而是自己的错。天眼查在黑猫投诉平台对此进行了回应,但回复内容选择了“隐藏内容”。
同样的情况也发生在开心宝。2020年,有网友投诉启信宝将自己的个人联系方式放在其他企业网站上,导致每天有无数人给他打电话,严重干扰了自己的生活。
也有很多相关的公开报道。
2020年3月5日,天眼查显示,卸任途牛信息法定代表人,由朱接任。此外,朱还是江苏途知信息科技有限公司等4家企业的法定代表人..但同年3月12日,途牛相关负责人回应称,这只是公司的正常变动。
2020年4月21日,360金融称,自4月21日起,天眼查连续发表《周卸任360金融董事长,助理接任》、《360金融高管变动:周卸任360金融服务董事长,吴海生、金新增董事》等系列报道文章,与事实严重不符,并表示准备起诉。
针对“360金融准备起诉天眼查”一事,天眼查回应:由于360金融主体变更信息未向社会公布,其平台信息与360金融不同,并非因为空捏造或数据错误。天眼查尊重360财经的官方声明,对此次事件可能给360财经团队带来的困扰深表歉意。
此外,仅在2020年,关于退出魅族股东、宗辞任娃哈哈执行董事、豪斯成立新的半导体设备公司、董明珠退出银隆新能源的消息就层出不穷,但很快被相关公司否认。
技术和机制的陷阱
很多企业调查平台都声称以“公平看世界”为己任,但为什么信息乌龙不断出现?
这可能与企业检验平台的固有缺陷有关。“就是太依赖技术,只靠技术识别信息,所以错误是不可避免的。”总之,熟悉企业调查平台操作的人。
与传统的国家企业信息信用公示系统不同,商事查询平台通过各种渠道获取了中国上亿社会主体的信息,很多主体甚至拥有300多个数据维度,包括企业背景、企业规模、发展历史、上市信息、知识产权、司法风险、经营状况、相关风险等与涉案主体经营和信誉相关的重要数据。
在这些商业查询平台的广告中,他们主要是通过制作公开信息,运用大数据、人工智能等技术手段,让企业的公开信息“活”起来。企查和天眼查的客服人员告诉第一财经记者,平台获取的所有信息都是通过大数据和公司独有的相关技术,由公开信息自动抓取的。
“商业查询平台通常使用爬虫技术从国家相关部门的公共平台抓取数据内容并同步更新。”北京理工大学计算机网络攻防对抗研究所所长颜在接受第一财经记者采访时表示。
中国裁判文书网2020年公布的浙江蚂蚁小额贷款服务集团有限公司、重庆蚂蚁小额贷款有限公司、苏州朗动网络科技有限公司一审民事判决书中有这样的描述:企业调查的核心原理是从全国工商信息网站等政府机关官方网站和互联网公开数据中抓取企业信息,形成企业信息报告,提供给B端企业和C端用户。
所谓网络爬虫(又称网络蜘蛛),其实就是互联网上常见的信息自动获取程序,是各种信息搜索的核心技术。其功能是通过URL(统一资源定位系统)批量访问和抓取互联网上的网页、图片、音频、视频等相关数据内容,收集后再进行存储和处理。
据颜介绍,爬虫技术的优势是爬行速度快、规模大、适应性强,可以根据平台的爬行策略及时调整。但是爬虫技术也有自己的缺点和风险。“很多网站提供的是非结构化数据,爬取后的分析复杂困难,平台数据整合压力很大。很多网站都采用了反抓取机制,使得抓取变得更加困难,有时甚至会抓取到网站故意提供的虚假数据,这就大大降低了抓取信息的真实性。”
在颜看来,商业平台出现信息错误的原因有很多。比如,爬虫技术虽然可以帮助平台快速抓取海量信息,但这些信息中的一部分可能在源头就存在错误,如果一味地成为信息“搬运工”,自然也难逃错误。
一位了解企业搜索平台运行机制的人士介绍,在这些平台中,爬虫技术抓取信息的过程有两个明显的点。一个是乱爬,一个是只能爬公共信息。前者可能导致信息混杂,后者限制了身份证等非公开信息无法抓取。一旦出现同名信息,很难区分。即使有些平台通过技术引入第三方信息(如“合伙人”)进行交叉比对,一旦遇到类似“枪哥”的巧合,也无法区分。
建议对抓取的信息建立验证机制,包括人工验证。
当被问及为什么平台上经常出现数据和信息错误时,两家企业调查平台的客服人员对第一财经记者表示,平台抓取的数据不能保证完全准确,只是为用户提供了一个参考。同时,他们表示,只要涉及的数据和信息有误,用户可以直接向平台反馈,平台核实属实后再进行修改和更新。
颜表示,商业查询平台作为第三方查询平台,有时是原始数据的“搬运工”,有时是聚合数据的“生产者”。他们在提供查询数据结果时,存在一定的错误率,与他们宣称的“公平看世界”还有一定差距。
[/s2/]繁荣和缺陷
在中国,2014年是商业信息查询市场发展的重要一年。
今年6月,国务院印发了《社会信用体系建设规划纲要(2014-2020年)》,这是第一个在国家层面部署加快社会信用体系建设的指导性文件,是我国社会信用体系建设的重要顶层设计。同年10月1日起施行的《企业信息公示暂行条例》使企业信息不断公开。
正是在2014年,天眼查、企查、启信宝等基于企业公开信息的大数据业务查询平台相继出现。“那可以说是商业查询平台的元年”,某企业员工在接受第一财经记者采访时表示。“当时很多业内人士都觉得商业询价平台的春天来了。”
随后几年,风报、企业查询宝、易企查询、企业征信宝、水滴征信、大征信等业务查询平台相继出现。
艾媒咨询发布的《2021年中国商务查询行业研究报告》显示,2020年中国商务查询用户规模将达到4.79亿,预计2022年将增至5.89亿。报告显示,在商业查询平台中,天眼查占活跃用户的72.4%,企查以17.6%排名第二,启信宝以6.5%排名第三。
由于信息透明、数据聚合的特点,企业检验平台受到越来越多人的信任和依赖,这些平台也受到资本的青睐。
第一财经记者根据公开信息查询发现,作为商业查询平台的三大头部平台,天眼查、企问、启信宝均已获得融资。
其中,天眼查有三次融资过程。2015年天使轮融资交易金额2500万,投资方为腾业创投。2017年A轮融资交易金额1.3亿元,投资方为国家中小企业发展基金;2019年Pre-B轮融资,交易金额未披露,投资方为中鼎资本、弘道资本、魏冉资本。
企业调查中有7个融资流程。2015年天使轮融资交易额220万,投资方为险峰K2VC。2015年Pre-A轮融资交易金额1000万,投资方为创东方投资和火石资本。2016年A轮融资交易金额5000万元,投资方为金庸集团、苏大高新创投、苏大天工创投等2017年Pre-B轮未披露交易金额,投资方为苏州善登贸易有限公司和重庆志坚企业管理合伙企业;2018年B轮融资和2019年Pre-C轮融资均未披露交易金额。投资方为北京文投、鹏远郑新和文华海辉。2019年C轮融资交易金额为5亿元,投资方为万得投资和兴福资本。
启信宝能找到的融资过程只有一次,来自2015年的M&A,交易金额3000万,投资方是合和信息。
市场越来越大,融资越来越多,但同质化的问题也越来越明显——连信息乌龙之类的错误都一样。
在颜看来,在数字经济时代,数据资源已经成为最重要的核心要素之一。商业查询平台存在和发展的基本前提是建立健全完善的数据安全和信任体系。减少数据和信息中的错误是商务查询平台开发中不可避免且必须解决的问题。
熟悉企业调查平台运营的人士指出,出售自由抓取信息的商业模式,却无法对所售商品保持保真,是这些平台在技术和商业质量上的缺陷。他建议改变企业调查平台免费抓取信息的模式,由平台为抓取的信息方付费。