聚典数据开放平台是赋能B端应用进而满足C端用户知识查检需求的互联网知识服务产品,开创了传统工具书数字化转型的新模式,由上海世纪出版集团规划设计,上海辞书出版社自行开发建设。
数据库首页
产品亮点
响应用户查检需求,填补市场空白
随着移动互联网的兴起,数字阅读在整体阅读市场中所占比例显著上升。移动阅读具有随时随地、随手可读的特点,传统纸质工具书无法满足用户在移动阅读时即兴的知识查检需求。独立的工具书数字产品,需要用户在阅读界面和工具书应用之间反复切换,操作不便,使用体验欠佳。融合多种专业工具书的“聚典数据开放平台”彻底解决了用户在数字阅读中便捷查检知识内容的需求痛点,填补市场空白。用户只需在阅读界面,选取想要查检的内容,发起调用请求,查询结果即刻呈现到用户界面,方便快捷。
产品展示
数据安全有保障,下游企业开发简易
对于出版机构,在进行数字产品开发时,版权内容数据安全是其最担心的问题之一。以往出版企业在向合作方进行版权授权时,需要交付全部的数据内容,数据安全没有保障。但聚典数据开放平台采用数据云存储,SDK调用的方式提供知识服务,内容数据始终保留在自有平台内,版权安全得到保障。
原有版权授权方式,将原始数据交付给下游企业,企业需花费大量精力对数据进行加工,搭建系统;授权给不同企业时,因技术标准差异,通常需要重新开发;若涉及多个专业学科门类的内容,非专业人士在处理过程中也容易产生错误。当出版社图书修订,数据更新时,又需要再次交付数据,重新加工,造成大量的重复开发和资源浪费。而聚典数据开放平台中的数据内容,始终由出版机构负责维护,能最大限度保证数据的准确性,且所有下游企业均以SDK方式调用,只需分别选配各应用所需的工具书即可,极大地减轻了下游企业的开发工作。该模式让出版机构立足自身优势,继续专注于优质、权威的工具书内容生产和数据维护,互联网企业专注于其擅长的产品运营和用户维护,各展所长,各尽其能,共建良性的知识服务产业链和生态圈,共同为用户提供优质的知识服务。
清晰掌握用户数据
在传统出版时代,或是直接交出全部数据的数字产品授权模式下,出版社对用户使用产品情况的了解非常有限。而在聚典数据开放平台上,出版社能清晰地获得用户的使用动态,每日使用人数,使用次数,查检热词,查询较多、而平台暂未收入的词等等,都能够清晰地获得。一方面,平台可根据这些信息,及时调整各项技术参数,优化配置,提供更加稳定、流畅的服务;另一方面,基于用户反馈,可以对内容进行针对性的增补和修订,能够向用户提供更加准确、丰富的内容,使之成为真正意义上的以用户为中心的互联网产品。
该产品已获得产业链上下游的广泛认可。2019年11月聚典测试版上线,2020年8月正式版上线,截至2021年底,已有十几家出版社在平台开户,提供了近百种优质工具书,共计超过300万词条, 3亿多字内容。聚典也已向掌阅、起点读书、豆瓣阅读、咪咕阅读、上观新闻、澎湃新闻、中国搜索等20余家国内头部阅读应用、新闻咨询、搜索引擎提供数据服务。
主要技术
聚典数据开放平台建设所需的云技术、API技术、分布式数据分析技术、知识标引技术、结构化加工技术、全文搜索技术等都已比较成熟,达到了项目实施的各项需求,用户体验日臻完美,为项目顺利实施提供了技术保证。
聚典数据开放平台,实现了前端展示、内容资源管理、机构后台管理(机构管理、权限管理、接口管理)、用户后台管理、令牌认证、加密传输、软件开发包(SDK)、使用监控、统计报表、大屏展示等功能,成为目前国内领先、功能完备、技术先进的工具书数字出版平台。
聚典数据开放平台在应用过程中不断更新迭代,一方面不断完善各项已有功能,另一方面根据市场反馈开发新的功能,如增加纪年换算、古今地名对照和英汉双语互译接口,内嵌搜索框到第三方App,以及根据客户需求对库中词典数据进行个性化排序输出等,使聚典的应用场景越来越丰富。
在用户数据统计分析方面,目前数据大屏已经可以完整采集并分析终端用户(读者)、机构用户、供应商、词典、词条等各个级别和层次的瞬时数据、时段数据和长期数据,从而为内容建设、参数设置、产品运营和销售提供重要参考。
数据大屏
内容水平
入库数据内容首选各类荣获国家级奖项的权威工具书,如《辞海》《汉语大词典》《大辞海》等;次选学界已有定评且为各学科领域代表性的工具书,《中国历史大词典》《中国哲学大词典》《心理学大辞典》等等。
《汉语大词典》是我国目前规模最大的汉语语文工具书,是一部特大型历时性汉语语文词典。全书收条目37万余条,约5000万字。《汉语大词典》释义准确,义项齐备,资料翔实,从整体上历史地反映了汉语词汇发展演变面貌。联合国教科文组织将《汉语大词典》定为世界权威工具书、联合国汉语翻译工作用书。
《辞海》是我国目前唯一的大型综合性辞书,既收单字和普通词语,又收各类专科词语,兼具语文辞书和专科辞书的功能,收词丰富,检索方便,实用性强,深受广大读者欢迎。《辞海》(第七版)总条目近13万条,总字数约2350万字,在内容方面进行大量与时俱进的修订和增补,学科架构更趋完善,知识体系更趋系统。
除此之外,还入库了《现代汉语大词典》《中国成语大词典》《中国典故大词典》《同义词大词典》《反义词大词典》等语词词典,并为《汉语大词典》所有词目加注了拼音,建立了50多万条目的语词库;其次逐步入库《马克思主义大辞典》《哲学大辞典》《欧洲历史大辞典》《管理学大辞典》等专业百科辞典,建立近150万条目的百科库;第三是采购《英汉大词典》《汉英大词典》等双语词典,建立了超100万条目的双语库;第四是建立古今地名库和历史纪年库。总条目已达300多万条。
迭代计划
聚典将进一步增加数据类型,丰富数据内容,拓展用户渠道,从而使“聚典数据开放平台”成为国内数据量最大、内容质量最优、学科最齐全、技术最先进的工具书数据开放平台,保持在业界的优势地位。
数据类型:在平台已有词条释义、古今地名、纪年换算、双语互译等数据类型的基础上,增加古诗文鉴赏和中外大事记等数据类型,为更广泛的应用场景和更多样的客户群体提供服务。
数据内容:在现有300万条数据的基础上,继续充实平台数据内容,力争在2022年底将数据扩充至500万条,并根据维基百科、百度百科等网络百科高频词的数据情况,进行针对性词典资源采购和条目增补工作,从而进一步提高聚典平台的查得率。
用户渠道:目前聚典已覆盖大多数阅读类应用,未来将着重拓展新闻资讯类、在线教育类客户,尝试拓展学术类、搜索类和浏览器类客户,进一步推进内嵌于中国知网、中文在线、超星等数字经销平台的合作,力争将调用数提升至1亿次/季度。
聚典数据开放平台彻底解决了用户在数字阅读中便捷查检知识内容的需求痛点,填补市场空白,重新定义了工具书使用方式,改写了用户与工具书的关系,使用户能够高效便捷地获得权威准确的知识内容,同时保障了出版社内容数据的安全性,又使下游企业免于海量繁复的专业内容数据处理,是各展所长、多方共赢、可持续发展的工具书数字出版运行模式,真正实现了为阅读赋能,为学习赋能,为搜索赋能。
(作者童丽君童力军,系上海辞书出版社副总编辑)
END
书香上海 | 书香常伴
资料:中国新闻出版广电报
编辑:段鹏程