内容平台在推荐算法上遭遇双重困境:一方面,算法过于透明,不仅会泄露商业机密,而且可能促使创作者和商家为了追求流量而针对特定数据进行优化;另一方面,算法若不够透明,一旦发生影响社会情绪的事件,用户往往会质疑内容平台在操纵信息传播。
抖音作为我国领先的内容分享平台之一,也面临着诸多尖锐的批评。去年11月,一位知名企业家钟睒睒公开发声,指责抖音对造谣账号放任不管,损害了其品牌形象,引起了广泛的关注和共鸣;而最近,北京大学青年教师韦东奕在抖音上开设个人账号后,粉丝数量迅速突破千万,又有用户对抖音“造神”现象提出了批评。
与此同时,我国的监管机构启动了对互联网平台的整治活动,旨在明确要求以适宜的方法公开算法推荐服务的根本原理、目标目的以及核心运作机制等内容。
自今年年初起,抖音组建了算法透明化项目团队,首次向外界阐述了其推荐算法的工作原理以及治理内容生态的策略。《晚点》杂志对抖音的算法和生态治理部门负责人进行了专访,深入探讨了该公司如何作用于用户,以及用户又是如何反过来影响公司的。
推荐算法学习用户行为规律
用户轻触手机界面上的音符图案,几秒钟后,抖音的推荐算法便在庞大的每日新增视频数据库中完成了运算,并依据计算结果对视频进行排列。整个过程逻辑并不繁复:,
首先,对视频可能激发用户点赞、评论、进入直播间等行为的可能性进行预估,接着,将预定的行为价值分数与对应的行为发生概率相乘,最后,将所得结果累加。得分越高,视频被广泛传播的可能性也就越大。
行为概率的预测依赖于历史资料。过去视频所引发的行为,以及这些视频本身及观看者的特点,将不断输入至机器学习模型中,如同配备了正确答案的练习题,为模型提供学习素材。在理想状态下,每次迭代后,模型在预测行为概率时都会变得更加精确。
模型的核心在于学习特定人群对特定视频产生特定行为的模式。抖音的算法专家刘畅表示,若模型认定我的兴趣与你的相似,那么在我曾点赞的历史视频中,它可能会推测你也有可能给予点赞。
平台所能收集到的多样化信息或许能够有效提升模型的预测精度。抖音平台为了丰富模型可利用的信息,有时会对用户界面进行重新设计。在 2021 年之前,为了保持首面板的简洁与整洁,用户必须通过长按屏幕或点击分享操作,才能在二级面板中实现视频的收藏功能。在推荐团队努力提高中、长视频分发效率的过程中,他们认识到“用户收藏”这一行为是衡量视频质量的关键指标,于是决定将收藏功能置于首要位置,以便更便捷地收集相关数据。
模型计算出用户各种行为的发生几率,随后需与事先设定的价值系数相乘。价值系数越高,表明该行为在平台上受到的激励越大。与旨在提升预测准确度的行为概率模型相比,价值系数更多地反映了平台的主观倾向。若价值系数的设定不当,可能会对平台的整体生态造成显著影响。
抖音通过A/B测试来确立行为价值分:对一组用户的推荐算法价值分进行微调,然后与未调整的另一组用户进行对比,观察平台所关注的各项关键指标发生了怎样的变化。这些关键指标包括日活跃用户数、创作者投稿量以及平台商品销售额等。
当多个指标出现方向不一的变动时,抖音的数据分析团队会着手在各项指标间建立相应的换算模型,同时确保这些指标对至关重要的“北极星”指标——即长期留存——的影响受到有效控制。
审视这些关键指标的变动,抖音能够评估业务团队是否如其所言达成了任务目标。以抖音电商为例,其定位为“兴趣电商”,旨在向用户推荐所需商品。“若要提高衡量商品推荐精准度的电商转化率,便不能同时降低衡量用户体验的活跃度指标。”刘畅如此表示。
用户在抖音上的使用习惯各异,因此,同样的行为所蕴含的信息量也会有所差异。那些热衷于点赞的用户,他们不会错过任何一个给予创作者鼓励的机会,不论视频内容的质量如何;而那些对内容要求较高的用户,他们只会对那些他们认为质量上乘的内容给予点赞。显而易见,这种更为挑剔的点赞行为反映出视频对用户的价值更大,因此,价值分数理应作出相应的调整。
因此,抖音在平台既定价值分的基础上,实现了个性化调整,针对不同用户的观看习性,制定个性化的策略,从而确保价值分能够准确反映用户的喜好。
抖音在调整个性化价值分时,会考虑到价值分模型的复杂性,以及针对特定行为策略的复杂程度。刘畅指出,这主要是因为增加一个模型进行动态调整,会导致算力成本显著上升。此外,为了保持推荐系统的稳定性,降低复杂度并提升算法的鲁棒性也是关键——即便在面临各种干扰的情况下,系统也能持续稳定运行。
先人工定调,再机器放大
推荐算法并非无所不能,它仅依据用户可能进行“点赞、评论、分享”的行为概率,并结合平台对这些行为的权重设置,对内容进行排序,却无法判断视频本身的质量。若要维护良好的内容生态,平台员工需首先确立内容评价的标准,随后推荐算法方可大规模执行。
《晚点》杂志采访了抖音内容运营的负责人李翔宇,他表示,自2023年起,抖音的运营团队将更加注重提升高质量内容的比例。
新岗位的起点在于明确“优质供给”的具体内涵。运营团队通过人工方式对各类别内容中的优质视频进行初步筛选,接着,他们定期举行会议,对筛选出的视频进行第二轮甄别和交流,从而总结出这些视频的共同特征,并确立一套可供文字描述的评判标准。
我们将邀请创作者共同进行评估,对于那些观看次数虽不多但我们认为质量上乘的内容,我们会将其发送给创作者,并请他们从专业角度进行评判。李翔宇如此表示。在此过程中,即便是播放量较高但缺乏创意的视频,也会被纳入讨论范围,“例如那些炫耀技巧却缺乏实质内容的视频。”
高标准是不断演变的。当初抖音刚崭露头角,流畅的运镜视频无疑是优质内容的代表。然而,随着上传者数量的激增,观众们的审美逐渐变得疲惫,创作者们便需要在运镜技巧的基础上,融入更多新颖的创意和玩法。正如李翔宇所言。
一旦标准确立,内容运营和审核团队便可依据这些标准,为大量内容贴上“优质视频”或“非优质视频”的标签。随后,借助学习样本的算法,便能高效地识别出尚未人工评估的优质视频内容。
算法之所以具有显著优势,就在于其强大的批量处理能力。因为运营人员所能评估的视频数量毕竟有限,而算法却能更早地识别并挖掘出更多杰出的创作者以及他们制作的优质视频。李翔宇如是说道。
抖音,如同其他内容平台,会对优质视频给予流量上的奖励。以往的做法是确保这些视频获得基本的播放量,然而效果并不显著。“以中、长知识类视频为例,通过确保一定播放量的方式帮助它们实现初步曝光,但即便如此,它们的完播率依旧无法与10秒短视频相媲美,也因此难以获得算法的青睐。”李翔宇这样说道。
在明确了优质内容的界定之后,抖音关注了哪些用户行为及其价值,以引导流量流向优质内容,并着重提升了诸如收藏、多次观看、搜索等行为的重要性。去年,一部得分为450分的红楼梦视频收获了3亿次的播放量、780万次收藏和637万次分享,众多用户的收藏与分享行为,使得该长视频获得了更广泛的传播,并被抖音视为算法与用户双向选择的最优范例。
在提振高质量内容的同时,内容生态的治理还包括一项关键任务,即打击低质量内容。这项任务需要机器与人工的紧密协作,才能有效完成。
创作者上传视频,内容需经过多级审查。首先,对所有视频进行初步筛选,旨在屏蔽违规违法、触及道德底线的内容,这一环节主要依赖机器完成,若机器判断内容风险较高,则需人工介入进行判断;当视频播放量达到一定规模,机器与人工将协同进行二次审查,处理那些不宜广泛传播但未触及底线问题的视频;而对于热门内容,还需接受第三阶段的严格审查。
若视频在审核过程中出现层级递进式的审查之外,遭遇大量用户的不满评价,或是流量出现异常波动,便将启动相应的治理程序。一旦负责治理的工作人员察觉到问题,便会即刻暂停该视频的分发与推荐。
除了上述的审核流程,抖音还特别针对网络暴力、未成年人权益保护以及AIGC违规内容等关键议题,开展了专门的整治行动,并独立组建了团队来构建相应的治理体系。例如,针对网络暴力的应对措施涵盖了建立网络暴力账号监控库、推出一键关闭陌生人评论、私信及搜索结果的选项等。
之所以被称为“专项”,是因为解决这些问题需要多个部门的协作,就好比推出新功能那样,需要产品和研发部门的支持。然而,“专项治理”并不等同于“项目制”,它并没有明确的结项日期,一旦启动,就会长期且持续地进行。李翔宇这样解释道。
平台影响用户,用户改变平台
在推动优质内容的发展或遏制低俗内容的传播上,抖音所采取的治理手段并非仅是平台单方面的决定,而是与用户的行为相互交织、相互调整的产物。
在抖音平台上进行电商直播时,主播们常常用“米”来指代货币,这一习惯的形成源于一种说法,即“钱”字在平台的敏感词库中被列入,若主播频繁提及,可能会对直播间的流量产生不利影响。
对这种治理方式我感到非常不以为然。‘钱’字作为常用词汇,根本不可能被当作敏感词进行过滤。”李翔宇这样回应。尽管抖音自2021年起已经明确表示“钱”字可以使用,然而一涉及到流量以及随之而来的收益,电商商家们还是宁愿相信那些传闻。
随着案例的累积,抖音平台需着手整治不规范用字问题,计划今年首先针对播放量突破千万的高人气视频进行治理。同时,考虑到众多用户已适应直播间中的特定用语,故不宜采取一刀切的做法。
在应对谣言的过程中,抖音平台设置了“举报”功能,期望理性用户能够主动辨别并抵制部分虚假信息。然而,李翔宇指出,举报途径所传递的信号并非完全可靠,实际上,每日举报量最大的信息往往与明星相关,这背后往往是由某个明星的粉丝群体试图减少另一明星相关内容的传播量。
抖音为了更有效地识别和对抗谣言,专门组建了一个由三十人组成的团队。该团队每日主动进行巡查和搜集各种虚假信息,并将这些信息整理成所谓的“谣言库”。随后,这些信息会被输入到机器学习模型中进行识别,以便识别出相关的视频内容。“举例来说,如果有人工将‘韦东奕解决了六个博士四个月未解的难题’这一谣言信息录入系统,那么只要新上传或已有的视频包含这一表述,机器就会自动识别并对其进行处理。”
在信息传播过程中,由于缺少关键信息,用户可能会产生误解,进而滋生谣言。为此,平台需要经过多次核实,才能有效应对这些不实信息的传播。
近期,网络上广泛流传着所谓的“禁养犬类名单”。这些谣言的制造者将各地零散的养犬管理规则杂糅在一起,将某些城市在特定区域内对特定犬种实行的限养措施,错误地放大为全国性的禁养政策。对此,抖音平台需要不断查阅官方文件,才能揭示事件的真相:截至目前,国家层面尚未颁布统一的禁养政策,相关的管控措施实际上是由各省市地方政府自行制定的。
自今年第二季度起,抖音的管理团队根据信息的危害性等级,对谣言进行了细致的分类,区分出“需验证”与“无需验证”两大类别。
“无需核实”这一类别涵盖了那些明显具有不良社会影响或违背常理的荒谬言论,例如“某高校的研究成果宣称人类能够复活”,此类内容将直接受到平台的传播限制。核实所需信息时,首先由联网的大语言模型进行事实查证,一旦模型未能找到足够的权威信息源,便会启动人工核查员的介入。经过核查,依据结果,将内容细致划分为“谣言”、“疑似谣言”以及“争议内容”三大类别,并据此实施相应的分级处理措施。
热点事件与谣言一样难以处理。去年,一位昵称“胖猫”的男生不幸投江自尽,他的姐姐在抖音平台上公开发声,指责“胖猫”的女友骗取钱财,这一事件迅速演变成公共话题。然而,经过公安部门的调查,发现指控并不成立。在回顾这一事件时,抖音平台意识到,热点事件的当事人确实拥有发言的权利,但在真相大白之前,也应当避免当事人滥用舆论,对其他相关方造成伤害。
今年五月,抖音正式发布了社区热点信息和账号管理的规定。其中一条核心原则是“确保在热点事件发酵过程中,涉事方(包括当事人)的隐私、名誉以及人身安全等权益得到有效保护。”对于那些事实尚不明确的热点信息,抖音将增设提醒标签,并通过热榜、弹窗推送等形式,广泛传播事件的关键节点信息和核心事实。
此外,一旦争议焦点事件激化,抖音平台将临时限制涉事者进行商品推广、广告合作以及直播时的收益获取。此举一方面源于公众对于素人迅速实现经济利益的不满,另一方面则是为了规避当事人可能因巨大流量而遭受的负面影响。
当被问及是否对热点事件的当事人管控过于严格时,李翔宇表示难以给出明确结论:“参照众多热点事件的发展历程,当事人往往需要一段冷静时间来深思熟虑接下来的计划。待冷静期结束之后,我们将放宽对变现行为的限制。”
必然的变革,漫长的适应期
告别你的浏览器吧!1997年,科技评论家凯文·凯利在《推送!》一文中如此表述。他将依赖用户主动搜索信息的互联网称为“拉式媒体”,并预测其将被“推式媒体”所取代,即信息主动推送至用户的模式。
内容无需用户主动点击,便会在电视、电脑、墙面、挡风玻璃等各式屏幕所能容纳的场所自发呈现。无线传输技术的应用,使得原本宁静的角落也充斥着信息流。广告商为争夺民众的注意力,竞争愈发激烈——总之,借助全新的交互手段,推式媒体将引领一个崭新的世界。
人类的创造信息速度超过了其吸收信息的速度,这一趋势按照凯利所描述的方向发展是必然的。然而,这一进程并不迅速。2006年,随着无限滚动式的News Feed信息流上线,依托推荐算法的推式媒体才真正在电脑上崭露头角。而等到推式媒体开始占据手机屏幕,又过去了十年。
在实施过程中,各种争议接踵而至。推荐算法曾因过分追求“用户观看时长”而备受争议,其引导用户观看容易上瘾的阴谋论视频的做法,引发了广泛关注;同时,它还被指责加剧了用户的身材焦虑,而其他主流内容平台的信息流也几乎无一例外地遭到了批评。
这种情况在所难免。随着改天换地的创新技术不断涌现,它们往往引发矛盾和争议,这些矛盾和争议进而催生了新的监管机制和社会共识,最终有助于新技术更有效地服务于社会。
每次公众和监管部门对内容平台提出质疑,每次平台在问责之后进行自我反思和调整,都成为了新技术与社会相互适应的明证。
决定算法好坏的关键,并非其与内容及观众匹配的精确度,而是它同用户之间的契合度。
本站简单学堂,主要教新手怎么在网上开店,分享网店运营知识,全力为学员打造一个电商学习的综合平台,欢迎您的关注。
还没有评论,来说两句吧...