2019年7月30日,灵犬推出的反低俗助手迎来重要升级:“灵犬”新版本全面支持图像识别!
你可以拍照,上传图片,或者提供“灵犬”的链接,“灵犬”可以帮你检查健康指数。
自2018年3月28日“灵狗”首次上线至今,已完成3次迭代,用户量突破300万。
据官方介绍,“灵犬反低俗助手”脱胎于反低俗模式。这是一个测试内容健康程度的小程序。目前用户可以直接搜索使用。
字节跳动人工智能实验室主任王长虎
好了,听了这么多官方消息,这只灵犬真的如传说中的那么“灵”吗?
我们做了以下实验:
文本识别:
首先,我们来识别两个网信办批评的标题:
“天津500套房居然引发千人暴动”的识别结果是“样本必须人工检验”,而“乳房饱满的宝宝,金钟国赞:中国最佳女演员”的识别结果是健康概率30%。
我尝试了另一个震撼的标题党,“震撼,我活了30年都不知道,白活了”。
健康的概率是50%,但是灵犬说“打电话给人类朋友求助”。
从上述识别结果来看,单个标题的检测侧重于一些关键术语,而“居然”“震惊”等情感词的识别则更加保守和谨慎,也就是说需要人工审核。
的确,标题只是一个片面的因素,我们来鉴定一下文章,看看。
也是那篇《宝宝的咪咪很丰满,金钟国赞:中国最好的女演员》。我们通过导入链接来识别它,结果是:
然后,我们删除链接,复制文章的文本,并识别它。结果是:
所以标题是文章识别的一个重要方面,灵犬确实能“嗅”出一些蛛丝马迹。
图像识别:
图像识别是这次灵犬更新的一个重要方向。重点反血腥暴力和低速色情。
我先尝试了更血腥暴力的画面。(下图已经模糊)
尝试了另一张疑似色情的图片。(下图已经模糊)
但同样一张图片,去掉下面的文字栏后,识别结果也不一样:
我又找了一张维纳斯雕像的图片做鉴定,健康指数只有3%:
但是,我悄悄辨认了一下“现任男友”的图片,结果是:
综合以上结果,个人认为灵狗确实可以在一定程度上起到内容检测和检查的作用,但也可以从以下几个方面进行优化:
人机交互。
比如“样品必须人工审核”时,能否直接联动审核人员,主动介入审核?
识别提炼。
比如,当一张图片中既有图像又有文字时,就要识别是否应该设置不同的标准,防止别有用心的人以文字为幌子传播血腥的色情图像。
结果是透明的。
结果除了健康指标外,还可以鉴定是否可以做成检测报告,说明是题目问题、图片问题还是涉及到其他问题,便于自我纠错和投诉,从而建立更详细完整的数据库。
当然,以上几点只是个人提出的小想法。如果要优化它们,需要技术支持、人员调配、资金储备等。有待考虑。
总的来说,灵狗的诞生和不断升级,对内容创作者来说是好消息,对读者、观众、听众来说更是好消息。净化网络环境需要法律监管和技术支持。
点开文末的小程序,试试“灵泉”,看看有没有效果!