淘宝助理是什么(归因分析:淘宝直播数据助理及其价值研究)

近年来,直播已经成为一种新的流行形式。主播在直播间与线上消费者实时互动,大大提高了信息交流的效率。在这种实时性很强的场景下,主播对直播间实时信息的利用,可以显著影响直播间的投放情况。

为了让主播们实时、准确地掌握直播间的信息,我们为淘系主播提供了智能数据助手,帮助他们方便、准确、全面地查看和分析直播过程中和直播结束后的数据,进而做出决策和行动。

主播每天高频使用智能数据助手后,我们通过线上AB实验和量化分析的方法证明数据>:决策>:行动>:数据这个闭环的存在验证了数据和行动之间的因果关系,同时也证明了数据产品的价值。

01

背景

1。淘宝直播

如今,电商直播发货已经成为商家销售的一个非常流行和重要的渠道,并且主要依赖于各种直播平台。淘宝直播就是其中的佼佼者之一,相信大家都用过或者有所了解。在直播商业场景下,淘宝主播主要会做以下几件事:



综上所述,主播在整个直播业务流程中有很多事情要做,所以主播对平台有一些期待和需求,希望通过丰富平台的能力,帮助他们带货,更好的成长。



从直播过程的介绍中,我们不难发现有很多环节是需要数据支撑的,比如主播如何更快的选择合适的产品,如何更好的调整策略以及如何在直播中更好的互动,如何提高播后重播的质量和效果,接下来的直播需要改进什么,需要维护什么等等。接下来,我们来看看主播的核心诉求以及他们相应的解决方案。

2。锚需求

  • 在线直播过程中,可以实时调整直播策略,提高直播质量,提升C端用户体验。
  • 播出后可以及时回顾场次整体表现,直播能力、投放能力、互动能力、粉丝粘性、流量运营等是否达到预期,接下来的播出需要做哪些策略调整和准备。
  • 希望有数据帮我了解我的粉丝群,让我更好的运营我的粉丝。
  • 希望有能帮助主播更好成长的数据,比如他们在行业中的排名如何,有哪些可以互相借鉴的优点,有哪些需要改进的缺点。
  • 3。解决方案

    基于主播需求,达摩院数据情报团队和淘宝直播团队制定了以下解决方案:

  • 提供实时直播会话报告。通过不同的维度和不同的呈现形式,主播可以在直播过程中实时查看全面的核心会话数据,PC端和APP端均可查看。
  • 提供下载报告,提供整个会话的完整数据内容。与实时会话报告相比,它具有智能决策能力和交通运行总结等更多能力。
  • 提供一个数据机器人,方便主播及时查看直播诊断、行业排名等数据,给出成长建议,帮助主播成长。
  • 提供文本挖掘能力,对直播中的评论文本进行挖掘和聚类,为主播提供及时的C端用户声音(体现在会话报告中)。
  • 智能决策能力,识别直播过程中的关键时间点,并以此为基础做多模态归因分析,在离线会话报告的趋势图模块中显示多模态识别结果和直播快照。
  • 对于头部主播,提供了主播屏,方便运营团队人员实时查看直播核心数据,尤其是推广推广方面,方便团队协作,及时做出合理决策。
  • 提供比赛对比能力,让主播快速多维度对比历史比赛表现,总结直播经验,提高重播效率。
  • 以上解决方案对应的是智能数据助理的产品能力,包括会话报告、主播大屏、会话对比、数据机器人。以上产品均为PC+APP展示,数据支持直播和后播。接下来,我们来看看每种产品形式及其核心竞争力。

    02

    产品

    1。会话报告

    首先,我们来看看PC端。直播过程中,用户可以点击淘宝直播中控台流媒体界面右下角的【查看详情】按钮,跳转到实时会话报告界面,让主播实时了解直播间的情况,实时做出合理决策。

    开播后,主播可以在淘宝直播中控台的我的直播页面看到历史播出次数。每次点击右侧的【数据详情】,会跳转到离线会话报告页面(也称播报报告),主播可以根据整场直播的数据进行离线回放。

    在场次报告的右侧,可以看到几个按钮,其中最显眼的是PK场次对比和数据大屏。点击这两个按钮后,可以分别跳转到会话对比和锚数据大屏的页面。除此之外,还有其他四个目录:概览、趋势、流量、商品,分别链接到数据概览、趋势分析(整合多模态识别归因能力)、流量运营、商品分析四个功能模块,下面逐一讲解:



    核心汇总数据:这里分为访问、转化、成交三个部分,相关指标以粉丝份额的数据进行分析。

  • 访问量主要包括观看次数、浏览次数、在线人数、观看时长等指标。
  • 转化主要包括新增粉丝数、产品引导PVUV、点击率等指标。
  • 交易主要包括引导成交笔数、人数、金额、预售固定金额、尾款金额等指标。
  • 实时趋势:流量波动、粉丝转化、交易运营三类核心指标的趋势分析。

  • 目前我们在做的是每5分钟打一个点,实时更新数据,让主播在直播过程中直观的看到数据的趋势变化,帮助他做出合理的决策;
  • 在该模块中集成了多模态识别归因能力,根据相关指标走势的波峰和波谷时间点,通过算法模型计算出异常点。然后借助直播快照、商品货架、互动数据和多模态能力,识别出某个异常点指数异常的原因,同时将直播播放定位到该时间点,大大提高了主播发现改善和推广复盘的效率。




  • 流量运营:主要包括实时流量运营【趋势图】和线下分渠道流量运营比例两个功能。

  • 实时流量运营主要是指进入直播间的流量来源趋势图。目前包括关注、推荐、广告、店铺、搜索等13个流量来源。主播可以根据各个流量源的趋势数据进行实时流量运营和决策。
  • 子频道流量运营主播可以判断会话整体流量分布是否符合预期,可以快速发现问题。
  • 商品分析:该模块主要展示直播间各商品的引导和交易情况。核心指标包括商品的点击量、人数、交易额、件数、预售金额、尾款金额等。在这里,主播可以看到每个商品的实时数据,从而实时调整播出顺序和策略。

    以上是PC版,会话报告还提供了APP端展示形式,更方便主播使用。接下来,让我们仔细看看:



    在APP端,主播开始流媒体后,可以在手机上进入会话报告【流媒体界面左侧滑动】,以浮动层的形式显示。看完数据后【在会话报告页面向右滑动】,主播可以返回串流界面,操作起来非常方便。显示的数据指示器与PC上的一致。但由于APP的空限制,我们只筛选出PC端指标中的重要指标进行展示,同时也间接为主播减轻了压力,通过核心指标快速决策。

    2。大数据屏幕



    直播数据大屏是头部主播的权益(目前只有V 4级和V 5级有接入),数据大屏的再推广、推广等关键时间点往往起着至关重要的作用。根据会话报告,点击会话报告PC端右侧的【数据大屏】按钮,进入主播数据大屏,整合在PC端【不在APP端】,是比会话报告更酷的展示形式。

    这里的功能模块主要包括:累计观看时长、累计成交额、新增粉丝数、观众区域排名(中间动态呼应中国地图)、观众画像指标、粉丝成交额百分比等三大核心指标。

    3。PK匹配比较







    以主播近期的平均表现为基础,标定基准,客观重复直播环节的数据;提供定制化的游戏对比工具,让主播快速多维度对比任意两场表演,总结直播经验,提高重播效率;点击会话报告PC右侧的【PK会话比较】按钮,进入会话选择页面。主播可以选择两个历史直播,然后点击确认按钮,进入会话对比页面。

    这里主要包含首页五大核心指标(访问量、最高在线人数、平均停留时间、新增粉丝数、引导成交金额)的对比,以及四类核心指标的对比详情,提供多种PK展示形式,如最高在线人数趋势分析PK、引导成交转化漏斗PK等等。

    4。数据机器人



    数据机器人就是APP的能力。在淘宝主播APP首页,点击【查看数据】进入机器人页面,数据机器人通过对话与主播进行互动。

    在对话页面,用户可以询问一些信息,如直播诊断、直播核心数据、排位赛赛程等。另外,主播可以输入一些他想看的指标,比如进入交易。数据机器人可以智能识别主播的问题,结合过往历史数据,给出主播想要看到的数据指标。

    机器人还集成了一些类似直播诊断的能力,可以为主播提供主播能力的雷达图,让主播直观的看到自己在行业内哪些方面做得比较好,哪些方面需要改进。还提供了全网、同级同类项目成交排名等指标。要让主播知道自己在业内的排名等等。

    此外,数据机器人还集成了竞选报告的推送能力,让参与竞选的主播可以及时了解竞选期间的直播相关数据。

    5。产品结果



    以上介绍了数据助理的所有产品形态。数据助理产品日峰值服务是75+%的淘主播,覆盖淘宝直播、闲鱼直播、淘直播等服务。

    数据助手提供数据查询能力,主播可查询实时会话数据、核心指数走势、带货交易数据、大屏监控、历史会话数据PK分析;还提供智能能力、异常点检测、多模式归因、直播诊断等能力,帮助主播定位直播过程中的优劣;还提供精细化运营能力,比如股权投放、粉丝运营、流量运营等等。精细化运营效果可以通过直播过程中的实时数据进行反馈,形成数据闭环,真正实现数据赋能主播和智能助理主播的决策。

    [S2/]03

    数据构造

    1。数据链路



    基于数据助理产品的前期规划,我们进行了详细的数据架构设计、平台研究和选择,兼顾了性能和成本。

  • 我们主要对Lindorm和ADB进行了调查、验证和比较。因为产品特点(多维度查询,实时性和灵活性要求高),最终选择了ADB来支持。
  • 因为数据助理是直接服务和淘宝主播,稳定性要求很高。为了保证产品的高可用性,我们做了核心环节【计算、存储、服务】的双链接保障。
  • 通过霸凌拦截恶意攻击流量,减少2/3数据的恶意无效数据访问,大幅降低存储和服务的资源消耗。
  • 在其他直播业务有复用需求后,我们也及时升级了数据链路,提取了实时数据的中间层,同时将DWS数据写入ADB、Lindorm和TT,以支持不同直播业务场景的需求,从而实现一个数据、一个口径、多个场景的复用。
  • 2。数据分层



    在数据链中,提到了构建活数据的中间层。接下来,我们来详细看看。中间层分为数据访问层、数据中间层[DWD,DWS]和业务应用层。

  • 数据接入层:主要来源于直播服务数据、群组公共层和达摩院智能数据。
  • 数据中间层:分为DWD、DWS层、维度表、实时数据构建和离线数据构建。下面重点讲保持实时部分,离线数据构造和实时数据一致。DWD层侧重于构建直播间的详细数据。包括曝光、点击、观看、互动(评论、点赞、分享、关注等数据。)、商品引导、商品交易、商品预售、文本语义识别、多模式归属、关键点识别等。在DWS层,我们主要总结了直播间、直播间+商品、直播间+频道、直播间+货源、直播间+粉丝等相关维度
  • 维度表:包含直播服务环节中的各种维度数据,如直播间、主播、商品、用户、商家、商品类别、渠道、来源等。
  • 应用:这主要是中间层数据服务的对象,包括达摩院直播赛道【数据助理,数字人,直播一体机,主播助理】,直播中控台,业务顾问,产品360等等。
  • 随着直播服务的日益火爆,达摩院的直播赛道(数据助理、主播助理、虚拟人、直播一体机)等集团直播服务产品线陆续上线,这套数据也得到了很好的重用。后来和集团的DT团队、淘宝直播数据团队一起搭建了集团内容中间层,并在此基础上也完善了达摩院自己的直播数据中间层。

    3。架构摘要



    上图可以概括整个数据助理产品的数据架构建设。我们也支持播出后在PC或APP上的数据展示,多方面保持数据一致性。实时数据下载后,会以下载报告的形式显示出来。其他产品形态与此类似。使用实时离线数据的同一个副本,严格保证数据口径一致。同时,我们有达摩院的智能能力加持,赋予了数据助理数据产品的智能特性。

    04

    商业价值

    基于前面介绍的主播诉求,以及针对主播诉求的数据助理产品的内容和架构。统计显示,很多主播在直播过程中或直播结束后,都在真正使用数据助理产品。接下来我们想知道主播使用的数据助理产品是否真的影响了主播的决策,是否真的给主播的直播带来了一些价值。所以我们要进行实验,分析数据,用数据来说明数据助理产品的商业价值。因此,我们与清华大学经济管理学院电子商务实验室的同学和老师合作,实现了项目的内容。

    1。实验过程

    ①提问



    因为数据助手已经提供给主播了,所以我们选择了数据助手实时会话报告的双十二版本,在不影响主播使用的情况下进行验证。与之前版本相比,双十二版本的实时时段报告中增加了实时预售信息。双十二版本的实时预售信息主要体现在这两个地方:第一个是指数总览的成交额可以显示本时段所有预售商品的总成交额;第二部分是在商品分析模块中,每个预售商品可以实时查看预售金额、成交笔数等指标。

    ②实验设计

    在设计部分,我们的实验方案是按照主播账号的尾号随机分组的。尾号为0、1、3、8的主播在12月1日-12月3日预售期间直播数据助手实时会话报告时可以看到实时预售信息,其他尾号的主播在同一时间直播时看不到实时预售信息。看得见的锚是实验组,看不见的锚是对照组。如下图所示:



    ③数据分析[/s2/]

    A.基础数据准备

    实验后,进行以下数据分析:

    据统计,实验组有737场直播,对照组有1051场直播,其中主播使用数据助理,播放内容包含预售商品。

    对实验组和对照组的主播粉丝数、产品预售数、主播评分、上个月播出时长等关键指标进行了对比分析。结果发现,实验组和对照组在这些指标上没有显著差异。指标的定义和分析结果如下图所示:





    做了进一步筛选,只关注预售商品销量大于1的直播间。进一步筛选后,我们对上述关键指标进行对比分析,确认实验组和对照组的关键指标无显著差异,以保证两组的可比性。

    具体指标采用T检验的方式进行分析,详细的分析值见上图。目前,本实验课题的分析已经完成并发表:

    Y.何等,“销售数据销售:实时销售分析对直播销售的影响”,2021年,第1-10页。

    https://aisel . aisnet . org/am cis 2021/data _ science _ decision _ support/data _ science _ decision _ support/12/

    B.主分析-数据助理有效

    在确保实验组和对照组之间的可比性后,我们分析了商品的销售量。下面圈出来的部分是预售商品销量的分析结论。模型1表示回归分析的结论,该结论介绍了直播间的特征,例如是否是最新的、主播级别和产品类别。模型2是不考虑直播间上述特征的分析结论。p值小于0.01。P值越小,结果越显著。



    此外,我们还做了进一步的稳健性检查:在实验组和对照组中,不使用数据助理的直播重复本金分析,发现预售商品的销量没有显著差异。



    综上所述,主要分析结论是:实时预售信息的引入显著提高了预售商品的销售,增加了18.6%的log(销售额)。

    C.数据助理为什么有效

    淘宝助理使用教程

    有了以上分析的主要结论,主播看到了预售信息实施后如何提高预售产品的销量,我们做了以下两个假设:第一个是主播延长了预售产品的直播时间。二是提高销售效率。

    因为我们无法确切得到主播对某个产品的介绍时长,所以我们选择取时间分布的中间部分作为主点击时间的区间,来近似模拟产品的直播时长。以[X%-Y%]为[10%-90%]、[20%-80%]、[30%-70%]和[40%-60%]进行分析,分别对应模型3、模型4、模型5和模型6。

    同时定义了销售效率的概念,定义为销售额除以主点击时间间隔。



    详细分析实验组和对照组的数据。相应的分析数据如下图所示,并得出结论:

  • 与对照组相比,实验组预售商品的主点击时间间隔没有显著延长,因此假设1不支持;
  • 与对照组相比,实验组预售商品的销售效率显著提高,因此支持假设2。


  • 进而对实验组和对照组直播间观众的评论数据进行分析,提取部分关键词进行比例分析和词云分析,如下图所示,得出以下结论:

  • 与对照组相比,实验组用户讨论预售的比例更高。
  • 与对照组相比,实验组用户提及缺货信息的比例较低;
  • 与对照组相比,实验组的用户问题比例较低。




  • 群组用户评论词云



    控制组的用户评论云

    D.数据助理为谁工作?

    进一步,根据主播粉丝的分位数,将样本分为三个子集,在每个子集上分别对应粉丝少、中、多的直播间进行分析。数据如下图所示。分析结论:粉丝中等的直播间可以显著提高预售产品的销量,粉丝少和多的直播间效果不显著。



    数据助理不提供自动刷新功能。如果想看到最新的数据,需要手动刷新。一次手动刷新算作一次使用。根据主播在一场直播中使用智能数据助理的次数中位数,分析深度使用智能数据助理的主播和较少使用智能数据助理的主播的指标。如下图所示,得出以下结论:

    直播中,主播们更频繁地使用智能数据助手,提供实时预售信息,大幅提升预售商品的销量。



    您可以还会对下面的文章感兴趣

    使用微信扫描二维码后

    点击右上角发送给好友