运用大数据创作的剧集《纸牌屋》
在线票务平台群雄混战多年,双寡头突围不过是去年暑假发生的事情。有平台推出“试映会及营销监测产品”;阿里影业亦于今年初首秀其大数据宣发平台“灯塔”。无疑,双雄争霸的这一战,志在利用“数据”致胜精准发行的新战场。
无论是因为资本对“故事”与“模式”的渴求,还是由于不可逆的时代发展趋势,影视行业与大数据的结合已有5年之久,从最初的热情相拥,到后来的相互抵触。无论未来如何,壹娱观察(微信ID:yiyuguancha)不妨先对数据做一番探讨与研究,对当下影视行业的数据产品做一番了解与总结。
前言(1):只要跟数据沾边,就是大数据么?--数据分类及影视数据分类
数据不等同于大数据,数据包含大数据以及小数据。
还记得《Big Data》一书前三章的标题吗?
01更多—不是随机样本,而是全体数据;
02 更杂—不是精确性,而是混杂性;
03 更好—不是因果关系,而是相关关系。
的确,如舍恩伯格所言,大数据具有体量巨大、忽略特殊性、忽略因果关系等特点。在影视行业中,在线票务平台沉淀的消费数据、受众画像、评论舆情,播出平台沉淀的收视数据或浏览数据、会员画像、观影舆情等组成了影视大数据的集合。相对地,小数据的特点则包括:抽样的、样本反馈的、包含原因的等等,它们则来源于各类调研公司的调研活动。
大数据如何推动电影行业发展,我们正在探索;而小数据与电影行业的结合可追溯至上世纪20年代。
前言(2)影视数据研究发展的小历史
图表来源:凡影周刊
20 世纪20 年代,好莱坞的发行商已经开始对观影后的观众进行出口调研。他们起初是在影院的厕所里安排访问,而后建立起了预映制度。
接下来的30年间,George Gallup凭借一篇文章《用科学方法而不是猜测来确定读者的兴趣》正式出道,随后他不仅成功预测其岳母在竞选中的胜利,并组建了受众研究公司,为好莱坞各大制片厂及独立片商进行了超过5000次的调查。
二战前,Leo Handel受雇于米高梅,专职于受众调研与分析;二战后,他编著了影视调研手册,其指导及借鉴意义延续至今。
1946年,美国电影协会建立了研究分部,更多官方与民家成立调研机构,促进电影行业小数据统计、分析、预测与决策流程的建立与优化。
到20世纪80年代,观众调研和数据分析的标准流程成为每个大片的必经之路。
当代好莱坞电影数据调研体系已发展出七种主要类型的测试,这些调研及其背后的数据分析组成了一个相对完整的体系,渗透于影片从前期发展到发行的各个环节。
调研所处的舆论环境
1. 影视数据调研的核心要点是什么?
在分别介绍调研工具前,先对其依赖的方法体系做概要性描述,以帮助从业者在挑选调研供应商前,“临时抱佛脚”。
数据调研的核心要点包括四项:问卷设计、样本筛选、数据搜集、数据整理与分析。了解运筹学与决策学、大数据逻辑的朋友,不难发现后两项与上述学科完全一致,只不过决策学和大数据在其后增加了“决策”这一步骤。在调研过程中并不包含这一步的目的,是把这一步留给专业人员和权威人士。
问卷设计两分为筛选性问题和调查性问题。顾名思义,筛选性问题通过获得被调查者的社会属性(年龄、性别、所在城市)和特殊标签,用来过滤出合适的被调研对象,调查性问题透析出受访者对各个问题的行为及态度数据。
在判断问卷质量及其设计者的能力时,可以参考以下三个指标:
第一,有效性指标--即你的问题可以获得你想要的答案吗?
第二,可对话性指标—即你的问题可以让这场调查进行下去,不至于对方要掀桌子或瞒天过海。
第三,精确性—这条不用解释。
样本筛选包含筛选标准的制定和样本招募两个环节,后者又包含自行招募与外包招募两种合作方式。自行招募要求招募方具备适当的2C基础。外包招募对于一般公司而言更为简便易行,将专业的事交给专业人士执行是合作型社会的政治正确。
数据收集分为四种方式:线下问卷收集、线上问卷收集、线下访谈数据收集、电话调查数据收集。我们暂且先对线上问卷和线下访谈做简要对比。
第一,资源层面,线上问卷的调查范围更广阔,费用更低,数据收集速度较快,即互联网调查完胜。
第二,调查层面,线下访谈的调查问题可以更复杂、更多样、更开放,针对受访者的态度及时调整问题思路,从而得到更深入的洞察。即线下访谈深度性较好。
第三,数据功效,线上问卷能用量化的方式告诉你你想知道的答案。比如,从抽样来反推被调研内容是否会被大部分人所接受喜爱、哪部分细分人群是最喜欢的核心受众等。线下访谈则能了解具体某一种标签人群对于被调研内容的具体态度,收获的信息量更大。值得提倡的是,数据搜集方法的选择,要避免经验性的固化思维,而更应该辩证地具体问题具体分析。
数据整理与分析,与调研员的经验与能力息息相关。它要运用数学、统计学的知识方法,结合行业信息进行多维度的思考与讨论,对搜集、整理后的数据进行“解码和编码”、“归纳和演绎”,最终形成分析结论。这是调研的核心部分,也是调研中最为复杂的部分。建议多多训练,多多尝试,也建议在供应商选择时,多做考量并慎重评价。
最后,一件容易被忽略又让人沮丧的是,所有调研都存在误差。然而,更重要的问题是,找到误差源、判断其影响并制定应对方法。当然,有时,放过误差可能是最为明智的做法。
2.调研工具都有哪些?
结合电影的整个生命周期,调研工具贯穿于制作前后,具体包括:概念测试、市场定位测试、片名测试、物料测试、试映会、营销监测及出口调研。
首先可以解释一下概念测试和市场定位测试的区别。在研创投制宣发放的全流程体系里,概念测试处于项目的研发阶段,用于了解开发项目是否具备市场潜力、未来研发创作针对的细分受众是谁。这一项调研更多服务于项目开发和创作期。而市场定位测试则更多倾向于早期宣传营销阶段,目的在于当项目准备开始进行第一次宣传前,用实际的项目元素(片名、故事梗概、导演、演员、服装造型图等)来了解,目前的项目样貌应该如何在未来的市场环境中定位自己、以及再次验证需要重点营销宣传的受众是谁。这一项调研更多服务于项目营销早期。
具体来讲,概念测试(Concept Testing)通过测试故事概念和核心理念等要素,评估观众的反映并确定目标受众。相比于大数据利用历史成绩匡算未来效益的逻辑,概念测试让创作回到突破历史的本质上,但又不丧失大众艺术本身需要与观众对话的基础。
以下是一份我们经手的一个网大项目《专属疗程》的《概念测试报告》。
在调研1.0版本中,我们沿袭了好莱坞对于受众的标签制定规则,即通过年龄(25岁)及性别将受众分割为四象限。
受众四象限
如何解决小成本影片的分众调研需求?可以尝试将“微博用户”、“《万万没想到》之类的影片粉丝”等内容作为筛选样本并结合成组的标签,其结果是符合上述标签的受众对拟测试故事的感兴趣程度远高于对照组。这可能会更加贴合电影创作的规律与需求。
这份测试的测试物包括故事主线、人物设定、视觉化风格、特殊元素等,它帮助我们快速完成了一场“关于观众是谁”的大战,清楚地展现了核心目标观众—熟男,以及次核心目标观众—社会女性。
一旦我们可以提前描摹出目标受众的样貌,我们就可以通过相应渠道积累的受众分布比例、受众池的大小计算圈层收益。所谓圈层收益则是指最有可能第一批观影的受众规模及其带来的票房或收益规模。而第二批甚至是第三批观众的规模,与影片质量及口碑大大相关,暂时不做估算。在这里,我不得不提出一种假设,这种假设是这种收益规模预估的基础,即:一部影片绝对口碑的好坏,需要时间检验;然而一部影片相对口碑的好坏,与观影受众极大相关。这意味着,让第一波喜欢被测试影片的观众观影得到比其他受众对影片更好地反馈。他们的消费组成了我们计算的核心圈层收益。
看到这里,不知道创作领域的伙伴是何感受?不妨来回顾娱乐调研公司Market Cast的副总裁兼总经理Henry Shapiro的建议。他曾表示:“调研最直接的目的就是提前得到观众的反馈信息,是进行风险管理和资源配置的一种手段。而且这种手段能够以很少的钱来确保后续操作的安全性和准确性。当然,这种手段还是代替不了创意部门主管的敏锐触觉和眼光,但它可以让创意不会跑出轨。”
片名测试,如字面意义。1943年,电影研究局曾经做出对促使电影观众走进影院因素的研究,其中片名排在故事及演员之后,成为非常重要的因素之一。同样地,物料作为电影的广告(主要指电影海报、预告片等主要物料),其单价及预算占比越来越高;五万元一张海报,十万元一支预告,已经是时下最普遍的报价,因此相对于片名测试,物料测试的实际意义可能更大。
物料测试可以提前了解观众看过物料后对影片的兴趣程度,好的物料引发观影冲动,这类案例不胜枚举。物料测试结果不代表最终结果,其最大的意义在于帮助创作者听到最真实的声音,是否修改和如何修改则留给创作者的“自尊心和创造力”。另一方面,有效的物料传播意味着“在适当的时间、适合的渠道上被恰当的人看到”,因此,在物料不做后续修改的情况下,物料测试可以预知被测试物料对哪部分受众的观影兴趣提升效果最佳,继而在后续宣传推广中有针对性的选择匹配受众的渠道。这种适配性也是物料测试需要回答的问题。
试映会,可以简单描述为电影的诊断会—一方面,它可以帮助剪辑确定Final档案,另一方面可以指导物料的投放。读到这里,不少制片人伙伴也许会对这种痴人说梦表示幼稚,并举例说明,XX知名剪辑师对此不屑一顾。然而远如好莱坞、近有台湾,已有不少大牌剪辑师乐于接受试映会的反馈、倾听观众的声音。虽然平衡创作人与用户数据的关系很难,但借用乐创文娱(原乐视影业)CEO张昭的一句话来砥砺各位:不要让执行影响了策略。
营销监测与出口调研是影片上映前后的数据工具。我曾在另一篇文章中探讨过营销监测的低成本方法,参见《三生三世上映前已有票房颓势?我们从技术角度分析了它的营销成果和票房前景》。而出口调研是在电影院门口设置调查环节,通过实地采集观众在观影后的反馈,获取观影动机、口碑,并以此推断续集的可能性。
3.那些大数据下的数据工具
相比于小数据调研,大数据指导电影产业发展似乎一直遭到业内人士的普遍抗拒。其实证案例确实也是如此:《纸牌屋》提出所谓运用大数据创作的剧集,不过是确定了类型、导演、演员,这根本不足以支撑起一部完整的内容;同样地,实验作品《Sunspring》运用AI完全替代人工,只得出一部支离破碎、不知所云的作品。
然而,大数据真的无法像改造其他产业一样,帮助电影产业进步吗?它利用统计学模型代替专家系统的优势,难道不能提高电影产业效率吗?
借用黑格尔的一句话:我们对一个人的质疑和反驳,必须从接受他的前提开始,提出的质疑和反驳才是有效的。
所以我们首先对大数据做进一步研究与阐释。大数据是在掌握海量数据的技术基础上所产生的一种判断和预测的能力。相比于专家通过因果关系得出的模型,大数据则使数据本身变成模型。因为再复杂的模型也无法包罗万象。而当数据“大”到能对几乎整个样本空间进行充分覆盖时,就可以减弱对模型的依赖,不再需要通过模型去经历“从特殊归纳到一般,再从一般演绎到特殊”的流程,而是利用大数据去直接实现“从特殊到特殊”的判断和预测。
正是基于这一特点,大数据在内容推荐系统中被广泛使用并收效甚好。Netflix总结了大量广为人知的推荐算法,例如:Video-Video Similarity,其基础逻辑是Because You Watched (BYW),基于你观看过的某部电影进行相似度计算。除此以外,还有基于类型优先的PVR - Personal Video Ranker、基于个性化优先的Top-NVideo Ranker等等。
同样地,大数据在作为标准判断,针对大规模作品给出普遍评价时,具有提高效率的优势。例如,腾讯视频正在使用的ROI系统,小土科技的剧易评系统。前者尚未公布细节信息,后者已向部分电视台及网站提供了剧集采购的推荐服务,其系统通过比对近20的收视率与其对应的电视剧剧本,建立了动态的量化模型,通过模型计算评估拟定剧本及项目,并给出采买意见。
以上列举了我所知晓并认可的影视数据工具,希望在更加信息透明的市场中,建立数据探讨而非批评的研究氛围。这如同我们在物理课本上所看到的定律与法则,他们各有其适用领域。小数据可以分众、可以透析原因,从而可以辅助内容创作(这之中也包括营销策略的制定、物料的修改等);大数据追求真实完整、解决效率问题,有利于帮助平台筛选内容、分发内容。我们无须做儿童世界非黑即白的选择,我们更需要的是打开心灵,接纳更多的存在及其价值,选择适合的装备,迎接挑战。
借用康德对理性批判的视角,我也要批判数据。我批判数据的目的,不是否定它的作用,而是划清它适用的界限,以此给自由和创造留出余地,因为我们可能是这个社会中最向往“意志自由、灵魂不朽、上帝不死”的一小撮人。