如果你曾经听到过一只鸟的叫声,并想知道怎么轻松地通过录音搜索就能知道它是哪种鸟,现在康奈尔鸟类学实验室现在已经推出了这种功能。
该实验室最近升级了其Merlin智能手机应用,该应用专为观鸟爱好者设计。它现在有一个人工智能的“声音识别”功能,可以捕捉鸟类的声音,并将它们与众包样本进行比较,从而找出是什么鸟发出了这种声音。自上月底推出这一功能以来,它成为了该应用程序中最受欢迎的功能(它还提供了人工智能工具来识别照片中的鸟类),人们已经用它识别了100多万只鸟类。Merlin的Drew Weber表示,自发布前两周以来,新用户数量也增长了58%,较去年同期增长了44%。
项目研究工程师Grant Van Horn表示,即使是在听鸟叫声的时候,该应用程序仍然依赖于图像识别方面的最新进展。当使用该应用程序记录周围的声音并扫描它们寻找鸟叫声时,它实际上会把声音转换成一种叫做声谱图的视觉图形,然后分析声谱图,寻找与康奈尔实验室项目中已知的鸟类叫声的相似之处。
有些鸟类的叫声变化不大。辨认像蓝鸟和模仿其他鸟类声音的鸟类会更具有挑战性,但该团队针对这些棘手的鸟类改进了应用程序。当识别特定类型的叫声存在问题时,他们可以寻找这种鸟的其他样本,请专家确认它们被正确分类,并将它们添加到训练数据集。
Grant Van Horn说:“目前,康奈尔大学没有共享任何数据。”“用户不需要担心隐私问题。”
目前,研究小组正致力于在明年春天之前进一步完善这个模型,那时观鸟者很可能会到公园和小路上,希望能识别向北迁徙的候鸟。其中一个挑战是,要确保该应用程序能够在鸟类特别多的时候,处理多个重叠的鸟类叫声。
信息源于:fastcompany