迅速拉高的体验阈值
从短视频到直播电商,到现在短剧的兴起,人们生活中已经离不开各种不同形式的视频内容。一份第三方研究报告显示,2022年中国Top100应用中,搭载视频类功能(包括点播、直播和实时音视频三类)的应用比例高达69%。视频类应用的消费时长占移动互联网应用的比例也呈现上升态势。而越来越多的行业开始引入视频帮助其进行业务创新。与此同时,视频类应用也开始加速渗透到企业的日常经营活动中。全面视频化的趋势正在重塑空间体验、知识传递、直播电商、商业连接等领域的体验。
整个2022年,中国的直播带货规模约为3.5万亿元,已经占到整个网上零售额的25.4%,市场预测这个占比在未来会持续增加。同样在C端,随着AR/VR设备的全球出货量在近几年快速增加,空间体验的重塑为视频的沉浸式体验带来了更多的想象空间,2027年AR/VR市场的复合增长率预计将达到 32.6%。
而在ToB市场,音视频能力几乎成为办公协同工具必备的基础能力,中国的云视频会议市场在2021年的37亿基础上持续增长,到2022年已达到42亿。由于音视频能力的成熟,近年来素质教育、职业教育以及教育数字基建等领域萌发了大量创新的线上场景,推动了知识传递方式的突破。
视频类功能成为所有产品“基建”的时候,也意味着它度过了野蛮生长的阶段而不再是一个全新的事物了。观众的胃口越来越刁,对视频内容的要求也从从无到有的阶段,到现在延伸到对画面质量、延迟等更细节的素质追求,以至于一种更全面的对于观看体验的追求。

要跟上这种变化,围绕视频的一切——从内容到产品本身——体验需要升级。
现在的观众对于视频观看的容忍度已经回不到那个画面粗糙、音画不同步甚至播放会出现卡顿的时候,任何一点体验上的瑕疵都会导致观众被劝退。这种高门槛的视频能力需求,已经开始降为未来新的视频产品需要具备的基本素质。
于是产品“视频化”的当下需要厘清一组体验、业务增长和成本之间的三元关系。用户音视频体验的变化会反映在业务增长的差异上,而体验与成本本身存在一定的矛盾关系。而如何在有限的资源条件下将用户体验最大化、取得三者间的最佳平衡,准确衡量音视频体验成为一个重要的前提。
“体验增长论”需要一个模型
经过几年沉淀,火山引擎视频云的一支团队开始试图将抖音集团视频产品体系的内部经验转换成一条“最优”路线。他们首先想要回答一个问题:
· 用户体验差距导致了用户增长的差距,要如何衡量体验?
随着视频化应用的深入,有大量客户开始找到火山引擎视频云,希望进一步提升用户的体验。客户了解产品和技术,但却没有一套明确的标准和衡量体系来指路。
火山引擎内部在服务抖音业务时总结了很多策略优化方案,覆盖涉及上传、存储、媒资处理、分发、播放多个环节,但客户能够合理用上这些策略的前提是他们对如何衡量自己用户的体验有足够准确的认识。出于这样的想法,火山引擎音视频测评实验室找到播放器团队,决定一起推演出一个通用而有延展性的,关于音视频体验的体验评估模型,来为包括抖音在内的所有音视频产品建立一个产品方法论。
“这是一次业务专家能力的自动化”,火山引擎音视频评测实验室音视频体验专家说。而在模型建立之前,首先需要形成一个衡量的指标体系,来为视频产品的体验评估找到一套稳固的观察方法。
这件事火山引擎从2021年就开始做了。
自2021年起,火山引擎开始体系性的量化每一项体验指标优化带来的业务收益,最终构建了一个标准透明、度量准确、归因全面、验证可靠的QoS指标体系。

这套音视频体验指标体系由音画质指标和流畅度这两个维度的25个指标组成。包含了视频从起播、播放中直到播放完成的整个完整周期。而在这套QoS指标体系背后,是在抖音上从播放时长、完播量、播放量、完播率到访问用户数等多维度的400余项A/B测试实验。
这套衡量标准确立了之后,接下来的挑战变成了:
· 如何定义体验与业务增长的关系?
传统的数据分析方法是利用长期积累的线上业务数据进行统计和归纳,以得出当前业务指标的典型值。尽管这种方法在精密分析的基础上较为准确,但它需要大量人力和计算资源的投入,并且在不同产品和业务的复杂场景中的复用价值不高。尤其是新场景的出现,传统的数据分析方法很难有效的去适应。
这次体验评估模型的构建仍然首先从抖音集团内部产品开始。2022年团队先在内部走完了一个测试项目——把与视频表现相关的一些核心因子抽出来,以A/B测试的方法来观察这些因子作为单一变量的情况下,对视频内容产出表现的变化。结果很有趣,也在团队的预想中。
这场内部测试所反映出的迹象是,哪怕现在抖音的用户生态已经十分繁荣,但音视频体验上的“微弱”提升,仍然能兑换出新的增长空间。
12月14日,火山引擎视频云发布了《音视频体验白皮书》。火山引擎音视频测评实验室花了接近一年时间,尝试理清音视频场景中技术指标与用户体验复杂参数之间的关联,然后呈现在这份白皮书里。
如何最有效率的提升音视频体验,有着巨大用户行为样本的抖音或许是最有发言权的。火山引擎视频云根据用户实践所给出的反馈,提出了音视频体验评估模型MPEI(Multimedia Playback Experience Index) 。
音视频体验综合评估模型MPEI表示的是两个子体验模块——沉浸体验质量 QImE、观看体验质量 QPE之间的函数关系(MPEI=f (QImE, QPE ))。QoS指标体系被进一步细分成了6个维度。沉浸体验质量QImE的评估模型是码流质量 QP、画面质量 QV 、音频质量QA这三个子模块的函数关系;观看体验质量QPE则是关于观看体验流畅性 QC、观看体验完整性 QI 以及交互体验质量 QInE三者的评估模型。不同指标对体验的影响最终反映成J、S、D三种不同的得分曲线。

J 型极致优化曲线意味着随着单一因素的不断优化,产生的用户体验收益会一直显著提升;S 型拐点优化曲线意味着这种随着优化而改善的用户体验会有一个迅速兑现收益的阶段,随后边际效益逐渐降低;D 型离散优化线表示的那些不规则、离散的体验变化,常见于网络波动或播放场景跳变等情况。
播放失败率就是典型的J 型曲线,即随着播放失败率的持续降低,用户体验会越来越好。画面分辨率则更贴近D型曲线,当分辨率到达一个足够高的临界点,这个要素本身就不再成为影响用户观看体验的因素。而更多的核心指标则偏向S型曲线。比如首帧时间(起播速度)、交互流畅度以及画面质量。
这意味火山引擎视频云在前两个问题的基础上,希望能够回答第三个问题:
· 体验与成本存在一定的矛盾关系,如何在有限的资源条件下将用户体验最大化,取得两者间的最佳平衡?
首先,并不是所有指标都同样重要,火山引擎音视频评测实验室音视频体验专家告诉硅星人。整个体验模型最初指标的选择是基于专家经验,然后以数据挖掘的结果为前者提供补充。而在最终模型出来后会对专家经验做二次验证。综合下来的结果表明,首帧未起播率等少数几个指标会对用户的体验造成很大的影响。
同时,MPEI模型的优势在于它的广泛适用性。无论是短视频、中等长度视频、长视频还是纯音频内容,它都能提供全面的体验诊断。更重要的是,随着新的业务场景不断出现,如短剧等,MPEI也显示了出色的拟合和适应能力。

在实际应用中,这一模型已经成功映射了用户体验的真实反馈。例如,我们观察到当视频的首帧加载时间持续降低时,用户体验在一个特定阶段内显著提升,但随后会进入一个较为稳定的满意阶段,表明进一步提升的效果变得不那么显著。这样的洞察能力帮助我们更精确地确认高roi的优化点,以最大化用户满意度。
客户也就能依此在这条曲线上找到体验与成本的平衡点。
模型背后的火山引擎视频云
有些客户因为音视频能力的需求找到火山引擎视频云,对于效果的要求也非常直接,“要达到抖音的音视频效果,”火山引擎音视频评测实验室音视频体验专家说。
这直接切中了火山引擎视频云在音视频领域的特殊位置。
火山引擎作为字节跳动旗下的云服务平台,长期服务抖音、西瓜视频等视频内容产品。而这些沉淀积累下来的,包括视频点播、直播、实时音视频、云游戏和云渲染等产品在内的可提供视频全链路技术服务的经验和解决方案,形成了这朵火山引擎视频云。现在火山引擎视频云已经服务了不同行业的近千家客户,不仅有得到、懂球帝、凯叔讲故事这样的互联网客户,也有九州、中文在线、掌阅短剧这样短剧的新场景客户。
火山引擎视频云的特殊之处在于,它首先要支撑抖音,而后者甚至是音视频产品中最严苛的那个客户。许多新的客户为了抖音的高标准而来,对于视频云团队来说,这是挑战也是机遇。
挑战在于,抖音的巨大影响力会变成非常大的优化压力,迫使火山引擎音视频团队在每一个指标分析都要做追求极致;而机遇则是,火山引擎视频云天生拥有这样一个足够有说服力的实验场。
这套归因全面且验证可靠的QoS指标体系,首先基于抖音这个亿级日活用户实践,又因为足够巨大的用户体量,抖音可以成为A/B测试时一个巨大的效果放大器,一些比较细微的指标变化能够转化成相对明显的数据影响而被衡量。
比如2022-2023的内部测验中,音视频团队将视频首帧加载耗时降低70毫秒,这一微弱的变动在巨大的用户样本中,变成了短视频内容上0.6%的人均播放时长。

另一方面,由于抖音用户群体的广度,一个要做视频产品的客户,他预想中的用户画像大概率能够被描述为抖音用户画像中的一个子集。这也为客户寻找适合自己的视频产品策略提供了方向和一些安全感,他要探索的新路很可能在抖音集团内部的视频内容产品身上已经有了一些成功经验。
在用这个足够有说服力的体验模型给出了一套音视频体验的衡量标准之后,火山引擎视频云拿着这枚“指北针”,能够为所有与音视频相关的产品提供更好的解决方案。
火山引擎音视频测评实验室负责人王飞用首帧未起播率这个指标的优化举了个例子。
前面提到,通过体验模型的多轮验证发现,首帧未起播率是所有影响音视频体验中权重较大的指标之一。针对这个指标进行的测试结果显示,在短视频的场景中首帧优化到100毫秒后体验收益会大幅放缓。团队最终确定了该业务的短视频场景的起播耗时优化的预期目标和技术手段。项目中主要采用了预加载和预渲染等优化手段。其中预加载指将从网络下载视频的流程整体提前,从而保证在用户选择播放视频时直接从本地读取视频数据;而预渲染则是在实际播放之前,提前完成视频的解复用、解码和渲染等流程,从而在用户播放请求发起时能够快速进入播放状态。
这一系列的优化中有一个明确的目标——将首帧耗时从170毫秒优化至100毫秒。王飞和火山引擎视频云团队再次通过 A/B 实验进行验证并获得了更具体的体验变化:对于部分型号的 Android 手机,在将首帧耗时压进100毫秒之后,最终带来了约0.6%人均观看时长提升的收益。
“这次优化再次说明,通过模型分析可以快速找到优化点,进行针对性的指标优化后可以有效的提升用户播放体验,并最终带来显著的业务收益”,王飞表示。
在抖音内部做了完整的验证后,这场关于首帧未起播率的试验最终变成“零耗时”首帧的解决方案向外推出,有了MPEI模型这样一套方法论的指引,未来能够这样直接打到痛点上的音视频解决方案会越来越多。
但更多新的音视频“痛点”,会伴随着直播电商、短剧甚至在AIGC技术加持下更新鲜的视频业态的出现而出现。甚至体验、业务增长和成本之间的平衡关系也会随着视频内容业态的起落而变化。这种情况下,MPEI模型也需要不断迭代,而这基于越来越多在不同场景和业务上对音视频能力有诉求的行业客户向MPEI模型的靠拢。
而经过了严苛的内部验证现在终于摆在众人面前的MPEI模型,站在了另一个起点上。随着与愈加丰富的客户和视频场景产生交集,它所承载的这套“体验增长论”,脉络会加速的清晰起来。
0 条评论
请「登录」后评论