一阵生成式人工智能(AIGC)的旋风,正在席卷众多领域。2022年底,OpenAI发布自然语言对话应用ChatGPT,并在今年3月迭代推出GPT-4,迅速吸引了各行业与公众的关注。全球范围内大模型风云骤起,资金、技术、人才持续涌入,科技公司布局不断,纷纷推出自家的大模型。据估算,到2030年,AIGC市场规模有望突破万亿元。
几年前,AlphaGo击败围棋选手李世石的新闻引发了一轮人工智能的热潮,然而,AIGC的浪潮更为猛烈,因为除了技术突破外,其低门槛与实用性使得应用端的感知更为显著。因此,大众不仅仅停留在讨论阶段,而是可以直接体验生成式人工智能的强大。
每轮技术革新,都将勾勒出一个新纪元。“在AIGC时代,所有行业都值得用AI重塑”。受到影响的领域包括教育、金融、电商、影视、设计等,其中新闻业是受影响最为剧烈的领域之一,对于AIGC的回应也最为积极。
在国际上,许多媒体已经开展了相关尝试。新闻聚合网站BuzzFeed发布由AI作答的测试栏目quizzes,并表示将使用AIGC编写测试类内容,以替代部分人力。5月24日,《华盛顿邮报》宣布成立跨部门AI协同机制,包括战略决策团队AITaskforce和执行团队AIHub,以更好地适应AI创新实践。英国《金融时报》也首次任命AI线编辑,密切关注该领域的最新进展。国内媒体如澎湃新闻、封面新闻、上游新闻等百余家媒体机构在今年2月宣布接入AIGC产品。腾讯研究院在今年6月份围绕“ChatGPT对新闻业的影响”话题展开了一项调研,结果显示,有80%的国内新闻从业人员已使用过ChatGPT或类似产品,其中超过一半(56%)受访者认为ChatGPT(或类似工具)对自己的工作带来了实际帮助。在文字生成能力出类拔萃的同时,ChatGPT也具备多模态内容生成能力。对于以内容创作为核心的新闻行业而言,这将带来许多交汇点,并产生显著影响。这个“堪比工业革命”(微软CEO萨提亚·纳德拉语)的技术突破,以及不亚于“个人计算机或互联网诞生”(比尔·盖茨语)的技术形态,它将究竟促成什么样的改变?是否会为新闻业带来新的契机?
通过本报告,我们试图探讨以ChatGPT为代表的AIGC技术给新闻业带来的影响与挑战,以及它所创造的新可能。AIGC正开启一场“技术革命”,新闻业是其中一个切口。通过这个切口,我们或许能捕捉到这场革命对人类社会的真正意义。
01. 大洗牌:新闻业的三重变革
千禧年以来的新闻业,既经历过充满希望的明亮时刻,也曾陷于悲观的泥淖。
全新的数字化生态赋予传统媒体蓬勃的发展活力,同时也催生了一批数字媒体新贵。然而,近年来流量逻辑的变迁、短视频等新媒介形态的冲击、线上广告收入的萎缩等种种因素,正在促使新闻业陷入新的困境。
(一)“流量时代”终结,新闻媒体大洗牌,连接读者变得无比重要
内容分发的逻辑屡次演变。
2008年金融危机之后,广告商的广告投入从传统媒体转向在线媒体。以Google为代表的搜索引擎和以Facebook为代表的社交媒体彻底重塑了内容流量格局。源自这两个端口的流量,成为在线媒体最重要的曝光来源。
尤为值得关注的是Facebook,其创始人马克·扎克伯格曾深信新闻内容的积极价值:提升平台的声誉以及提高用户的留存和互动。因此,Facebook一度大力强化新闻内容的推荐比重,让相关内容获得更多曝光。在2006年至2016年的十年间,社交媒体与新闻业迎来了一段蜜月期。
皮尤研究中心2015年的一项调查显示,高达64%的网络用户通过社交媒体获取新闻。这是由社交媒体缔造的“新闻业的流量时代”,造就了一大批数字媒体新贵。21世纪最为知名的数字媒体BuzzFeed和VICE,业务模式就建立在社交媒体的病毒式传播之上,巨大的流量和用户注意力涌入这些媒体,随之而来的是大量风险投资。鼎盛期的BuzzFeed和VICE,估值分别达到17亿美元和57亿美元。
但对于媒体而言,这种模式的根基是脆弱的,它们的兴衰存亡完全取决于平台。一旦平台的算法和规则改变,商业模式就会遭受重创,完全不由自己掌控。故事的转折发生在2016年,美国总统大选期间,Facebook被外界质疑利用算法操纵选举结果,“剑桥分析”事件则直接将马克·扎克伯格送上听证会。面对各方抨击,Facebook宣布减少新闻内容的比重。2020年,Facebook进一步强化相关举措,大幅减少新闻内容和政治内容的推送。
这不只是Facebook一家平台的转向,而是社交媒体的整体趋势。算法的调整使新闻类内容得到越来越少的曝光,这对依赖社交媒体流量的媒体打击严重,由此造成行业性的集体困境。2023年,BuzzFeed创始人乔纳·佩雷迪宣布关停旗下新闻业务BuzzFeedNews,VICE宣布关闭新闻品牌VICEWorldNews,其主站也正在计划进行破产申请。VoxMedia、Insider、ABCNews等媒体都进行了不同程度的裁员。
这些媒体的共同问题在于,并没有通过强化付费墙和订阅业务来积累起用户基底。在大浪来临之时,面对巨额的流量和广告收入,没有人会认为这是一个问题。但当潮水退去,才能发现谁在裸泳。作为对比,老牌媒体《纽约时报》在BuzzFeed等新贵风头正劲的时候,因对互联网适应迟缓而被业界看衰,甚至被视为要被革命的代表。在BuzzFeed的刺激下,《纽约时报》被迫转型,以适切数字化新闻的大背景。但这种步调并不急促,它把自己的内容置于付费墙之后,通过深耕内容来吸引订阅用户,反而成为能够熬过周期的资本。
在充满泡沫、浮光掠影的流量时代,以核心读者为基底,与读者建立更紧密的连接变得前所未有的重要。越来越多的新闻媒体认识到这一点,并由此催生出三种新趋势:
第一,利用新的媒介形式建立与读者的直接联系。近年来,播客和RSS阅读开始兴起,许多媒体推出自家的RSS订阅服务和播客品牌,旨在更直接有效地与读者建立紧密联系,强化媒体品牌并提升商业价值;
第二,更加专注本地内容,而非全球性的热点话题。例如,传媒集团MvskokeMedia将编辑策略调整为专注本地社区报道,体现对核心读者的关注;
第三,加强报道透明度和公开性,一方面帮助读者理解报道理念,另一方面也反向了解读者更需要怎样的新闻报道。比如檀香山公民报(HonoluluCivilBeat)在所在地区举办类似于快闪活动的“弹出式新闻编辑室”(pop-upnewsrooms),加强与读者的沟通。
(二)“短视频新闻业”兴起,受众注意力转移,传统新闻理念遭遇冲击
2023年,数据统计机构《新闻公报》(PressGazette)发布了一份千禧年以来成立的25家媒体资讯公司排名榜单,其中Facebook位居榜首,TikTok紧随其后。社交媒体的影响力不言而喻,以TikTok为代表的短视频平台的崛起,对新闻业发展趋势产生了深刻影响。
TikTok正迅速成为这个世界上最大的内容平台和流量基地之一。不仅大量年轻受众在该平台聚集,不同年龄段的受众注意力也逐渐转向短视频,而不再是新闻媒体所擅长的图文内容或严肃新闻报道。与受众注意力同步转移的还有广告收入和风险投资,它们同样流向了年轻用户更为关注的TikTok和Instagram平台。
不仅如此,一种新的新闻业态正在兴起:“TikTok新闻业”。当新冠疫情、俄乌冲突等重大新闻事件发生时,人们发现,主要信息源不再是新闻媒体,而是TikTok。大量即时、一手的视频内容在TikTok迅速传播,后者逐渐从一个娱乐性短视频平台,转型成为包含音视频内容的综合型内容平台,并成为互联网用户获取资讯的重要途径。对许多年轻受众而言,他们不是不看新闻了,只是不在新闻媒体上看新闻了。类似现象在国内也同样显著。
当新闻的主要载体从文字转向视频,这对绝大多数新闻媒体而言都是挑战。部分传统媒体积极求变,尝试融入短视频新闻生态。根据牛津大学路透新闻研究所发布的《2022年数字新闻报告》统计,约有一半(49%)的主流媒体机构会定期在TikTok上发布内容。作为老牌媒体代表,《华盛顿邮报》专门聘请第三方团队为自家TikTok账号制作内容;《洛杉矶时报》则组建了一个名为“404”的内容团队,基于年轻受众偏好进行实验性质的内容生产。
一些原生新闻媒体也从TikTok新闻业中涌现出来。例如,以短视频新闻起家的NowThis,已经拥有850万粉丝;西班牙内容公司Ac2ality以“在一分钟内讲述新闻”为核心理念,自2019年上线以来,在TikTok上已经积累了390万粉丝。TikTok新闻业的崛起,意味着受众注意力焦点的转变。对新闻业造成的冲击一方面体现在广告收入流失,媒体生存环境恶化,尽管付诸努力融入短视频新闻生态,但传统新闻报道与视频媒介之间固有的不兼容性,使这种转型的成效受限。另一方面,短视频新闻的广泛影响使传统新闻理念遭遇冲击,新闻业奉为圭臬的“客观性”“真实性”等价值观不再被强调,快速、耸动、视觉冲击力成为新的制作标准,点赞和转发等数据成为衡量新闻优劣的新指标。“黄色新闻”获得越来越多的流量与受众,传统新闻的生存空间进一步受到挤压。
从受众角度来看,人们逐渐习惯于通过短视频这样的渠道获取新闻和信息,这在一定程度上也是受日益显著的“新闻疲劳”和“新闻回避”等现象影响。新闻回避由认知和情感两个因素驱动:认知方面表现为人们认为某些主题或事件报道过多,阅读这些新闻会导致疲惫感,且难以获得信息增量,进而产生“新闻过载”;而情感方面则是指人们会主动回避那些会引发负面情绪的新闻,如关于疫情、暴力事件和自然灾害的报道。
根据路透新闻研究所与牛津大学发布的报告,2017年,29%的受访者表示他们会“经常或有时避开新闻”,到2019年,这一数字上升至32%。2020年新冠肺炎疫情爆发后,人们对新闻的需求短暂激增,但新闻回避的现象很快反弹,59%的人表示“有时或总是积极地回避新闻”。受众的信息接收习惯和心态变化,成为新闻业不得不考量的因素,也成为新闻媒体转型路上的阻碍。
(三)关停、裁员成为常态,新闻从业人员积极求变
三年的新冠疫情,对全球经济产生了巨大冲击,新闻业也无法置身事外。
新闻机构关闭成为常态。国外媒体包括BuzzFeed、VICE等一众数字媒体关闭旗下新闻业务,以及《利沃尼亚观察者报》(TheLivoniaObserver)这类纸质刊物实质性停刊。国内的情况也不容乐观。清华大学新闻与传播学院等机构联合发布的《传媒蓝皮书:cn传媒产业发展报告 (2022)》显示,新冠肺炎对传媒产业部分领域的影响仍在延续,传统新闻业广告收入持续下滑,广告主缩减对期刊、报纸等媒体的投放预算。国内报业广告和发行收入大幅下跌,电视广告市场发展疲软且下滑趋势严重。2020-2023年间,包括《城市画报》《东南快报》在内的数十家报纸宣布休刊或停刊。
新闻从业人员收入显著下降。根据《新闻公报》(PressGazette)的统计,经济不确定性影响了约三分之二的新闻工作者的工作。超过80%的受访者是全职新闻工作者,其中大多数 (71%)的年收入未达到10万美元,自由撰稿人的稿费更是平均不足300美元。裁员成为媒体机构的主要基调。根据不完全统计,自2020年以来,数十家媒体宣布了裁员计划。BuzzFeed因计划采用AI生成测验类内容而裁减一定比例的员工,2023年4月20日,BuzzFeed创始人再度宣布关闭旗下新闻业务,裁退约180名员工,涉及内容、技术、行政等部门,占总数的15%。根据福布斯的统计,自2023年1月至今,三十余家报纸及媒体机构进行了不同程度的裁员,最近一次发生在6月7日,《洛杉矶时报》宣布,由于“经济环境和新闻行业的独特挑战”,将裁减新闻编辑室的74名员工。
全球经济滑坡与技术冲击,正在使新闻业面临双重危机,而新闻记者的生存状况堪忧,也与新闻机构应用新技术密切相关。自动化报道和自动编辑系统的引入,在解放一部分人力的同时,也导致部分从业者成为冗员。媒介技术的迭代并未带来劳动关系的进步,这在内容产业中体现得尤为明显。2023年上半年,一场罢工行动正在好莱坞持续上演,影响到多部在播剧集。罢工事件背后,即是以Netflix为代表的流媒体平台对剧集生产方式和播出形式的改造,挤压着编剧的生存空间。技术机制的替代效应,也同样冲击着新闻业。
面对有限的生存空间,许多新闻机构和新闻工作人员开始将重心转向社交媒体和短视频平台。例如,在TikTok和YouTube上开设频道、发布视频内容,以吸引年轻受众,同时通过广告分成模式增加收入。另一方面,新闻记者通过Twitter、Linkedln等社交平台,分享知识和见解,建立个人品牌和影响力。
02. 涌现:AIGC正掀起一场
新的技术和产业革命
AIGC,即利用AI自动生成内容(AIGeneratedContent)。它并非新兴事物,最早可追溯到1957年莱杰伦·希勒(LejarenHiller)和伦纳德·艾萨克森(LeonardIsaacson)完成的人类历史上第一支由计算机创作的音乐作品,之后几十年也不断有AI生成模型、AI生成作品出现,但2022年才真正算是AIGC的爆发元年。AIGC的意义,并不仅仅是技术生成内容,而是AI具有了像人类一样的生成创造能力。得益于无限的创造潜力和未来应用空间,AIGC正在掀起一场新的技术和产业革命,推动人工智能迎来下一个时代。
(一)大模型是AIGC爆发的基石
随着2010年深度学习问世,人工智能的发展推进了第三次高潮,而大模型将这次高潮带到了新的阶段。2017年谷歌在《AttentionisAllYouNeed》一文中发布了具有里程碑意义的Transformer算法,虽然仍是深度学习的延续,但是它使得深度学习模型参数突破了1亿,Transformer取代RNN、CNN进入大模型时代,这无疑是一个重大的里程碑。
Transformer是一种基于自注意力机制的神经网络模型,最初用来完成不同语言之间的文本翻译任务,主体包含Encoder和Decoder部分,分别负责对源语言文本进行编码和将编码信息转换为目标语言文本。而后基于Encoder和Decoder,大模型的发展大致走上了三条路:第一条是舍弃Decoder部分,仅仅使用Encoder作为编码器的预训练模型,最出名的代表就是Bert家族;第二条是通过舍弃Encoder部分而基于Decoder部分的GPT家族;第三条是Encoder和Decoder都使用的谷歌T5大模型路线。AI大模型,又称为预训练模型、基础模型(foundationmodel),即基于大量数据训练的、拥有巨量参数的模型,可以适应广泛的下游任务。这些模型基于迁移学习的思想和深度学习的最新进展,以及大规模应用的计算机系统,展现了令人惊讶的涌现能力,并显著提高各种下游任务的性能。鉴于这种潜力,大模型成为AI技术发展的范式变革,许多跨领域的AI系统或产品服务将直接建立在大模型上。具体到AIGC领域,AI大模型可以实现多任务、多语言、多方式,在各种内容的生成上将扮演关键角色。按照基本类型分类,预训练模型包括自然语言处理 (NLP)预训练模型、计算机视觉(CV)预训练模型、多模态预训练模型。这三类模型在新闻业等领域,均有较为广泛的应用前景。
为什么说大模型是AIGC爆发的基石?是因为大模型引发了AIGC技术能力的质变。虽然过去各类生成模型层出不穷,但是使用门槛高、训练成本高、内容生成简单和质量偏低,远远不能满足真实内容消费场景中的灵活多变、高精度、高质量等需求。大模型解决了以上的诸多落地问题。比如,ChatGPT可以同时为不同国家、不同文化背景、不同专业领域和年龄阶层的人群提供优质的文字内容生成服务,在此之前是难以想像的。ChatGPT也展示了大模型带来的超越文本生成本身的神奇能力。ChatGPT、GPT-4、Bard、PaLM、LLaMA等带来了当下的大模型盛世,也带来了AGI的曙光。
总的来看,AIGC在2022年的爆发得益于大模型技术。拥有通用性、基础性、多模态、参数多、训练数据量大、生成内容高质稳定等特征的AIGC大模型成为了自动化内容生产的“工厂”和“流水线”。
(二)产业生态是AIGC发展的保障
此前AI产业发展缓慢的状况,与没有建立较为成熟的产业体系密切相关。任何成熟的行业都有较为完整的上下游产业生态体系,比如汽车行业,全球的发动机、变速箱等核心零部件厂商只有那么几家,面向消费者的汽车厂商可以有很多家。而此前AI行业,从基础的模型研发到产品服务上线销售,每家企业似乎都要覆盖全产业链的事情,成本投入和利润回报很难平衡,
行业发展陷入艰难困境。此前AI模型缺乏通用性是核心问题,而目前基于大模型,AIGC产业生态体系已经初步形成,呈现为上中下三层架构。第一层,为上游基础层,也就是由大模型为基础搭建的AIGC技术基础设施层。由于大模型的高成本和技术投入,因此具有较高的进入门槛。以2020年推出的GPT-3模型为例,AlchemyAPI创始人ElliotTurner推测训练GPT-3的成本可能接近1200万美元。因此,目前进入预训练模型的主要机构为头部科技企业、科研机构等。
在AIGC领域,美国的基础设施型公司(处于上游生态位)有OpenAI、Stability.ai等。因为有了基础层的技术支撑,下游行业才能如雨后春笋般发展,形成了目前的AIGC商业流。
第二层,为中间层,即垂直化、场景化、个性化的模型和应用工具。预训练的大模型是基础设施,在此基础上可以快速抽取生成场景化、定制化、个性化的小模型,实现在不用行业、垂直领域、功能场景的工业流水线式部署,同时兼具按需使用、高效经济的优势。以大模型为基础,模型即服务(Model-as-a-Service,MaaS)成为现实,它实现了AI从“手工作坊”到“工厂模式”的转变。AI大模型具有更强的通用性和智能程度,MaaS为下游应用提供安全、高效、低成本的模型使用与开发支持,能够大规模地在产业中落地应用,更广泛地赋能各行业应用,带来全社会的生产效率提升。OpenAI的CEO山姆·奥特曼曾明确指出,中间层是未来AI创业的核心阵地。
比如基于ChatGPT开放的API接口,产生了很多应用于金融领域、医疗领域的大模型或应用工具。JasperAI便是依靠GPT-3自动生成创意营销内容,在18个月里从白手起家化身为独角兽。还有在StableDiffusion开源之后,有很多基于开源模型的二次开发,训练特定风格的垂直领域模型开始流行,比如著名的二次元画风生成的Novel-AI,还有各种风格的角色生成器等。
第三层,为应用层,即面向C端用户的文字、图片、音视频等内容生成服务。在应用层,侧重满足用户的需求,将AIGC模型和用户的需求无缝衔接起来实现产业落地。基于GPT-3大模型的NotionAI便是这样的产品,可以满足用户的专业文本内容生成需求。以StableDiffusion开源为例,它开放的不仅仅是程序,还有已经训练好的模型,后继创业者能更好的借助这一开源工具,以C端消费级显卡的算力门槛,挖掘出更丰富的内容生态,为AIGC在更广泛的C端用户中的普及起到至关重要的作用。现在贴近C端用户的工具越发丰富多样,包括网页、本地安装的程序、移动端小程序、群聊机器人等,甚至还有利用AIGC工具定制代出图的内容消费服务。
目前,从提供大模型的基础设施层公司到专注打造AIGC产品和应用工具的应用层公司,AIGC生长出繁荣的生态,技术创新引发的应用创新浪潮迭起,并且技术赋能千行百业。随着数字经济与实体经济融合程度不断加深,以及互联网平台的数字化场景日趋丰富,人类对数字内容总量和丰富程度的整体需求不断提高。AIGC作为当前新型的内容生产方式,已经率先在新闻传媒、电商、影视、娱乐等数字化程度高、内容需求丰富的行业取得重大创新发展,市场潜力逐渐显现。与此同时,在推进数实融合、加快产业升级的进程中,金融、医疗、工业等各行各业的AIGC应用也都在快速发展。
(三)场景应用创新、具身智能、能力平权是AIGC的未来面向
场景应用创新是AIGC未来的发展路径。任何新兴技术只有在具体的场景中落地应用,产生经济和社会价值,才能获得广泛应用。同时在广泛的应用之中,技术才能不断迭代创新发展。这就形成了“场景应用和技术迭代”的飞轮效应。2022年科技部先后发布《关于支持建设新一代人工智能示范应用场景的通知》、《关于加快场景创新以人工智能高水平应用促进经济高质量发展的指导意见》,首批支持建设智慧农场、智能港口、智能矿山等十个示范应用场景。通过应用牵引推动人工智能技术落地已经成为行业共识。目前,OpenAI的战略也是尝试建立应用生态,将大模型落地到各行各业之中。
场景应用创新也代表着未来AIGC会更加垂直化和轻量化。第一,大模型虽然是通才,但它缺乏行业深度。其未来的发展趋势可能是六个方面的“垂直化”,包括行业深度化、企业个性化、能力专业化、规模小型化、部署分布化以及所有权私有化。第二,未来AI要嵌入到社会生产生活的各个领域,尤其是移动端设备和嵌入式设备上,即要进行本地化部署。而目前,大模型对硬件的算力和内存有很高要求,而移动端设备或者嵌入式设备往往算力有限,因此,模型轻量化会是未来AIGC发展的一个重要方向。具身智能是AI发展的必然形态。具身智能是指AI不仅仅是数字化或虚拟的,还在物理环境中具有实体形态的存在,例如机器人或其它能够与真实世界互动的装置。真正的智能和学习需要与物理世界的交互,这是因为大多数生物智能的进化都与它们的环境有直接的联系。具身智能可以通过与环境的交互来更好地学习感知和行为。与此类似的观点,便是一些学者认为ChatGPT未来无法实现超人工智能,因为它们缺乏与真实世界的交互能力。因此,具身智能被认为是通往通用人工智能的关键钥匙,“具身智能”机器人更是人工智能的终极形态
2023年7月,AI科学家李飞飞带领的团队发布了具身智能最新成果,他们将大模型接入机器人,把复杂指令转化成具体行动规划,人类可以用自然语言给机器人下达指令。更重要的是,通过将LLM(大语言模型)+VLM(视觉语言模型)结合在一起,机器人与环境进行交互的能力进一步提升,无需额外数据和训练便可完成任务。
能力平权是AIGC发展的必然结果。目前,AIGC的发展已经赋予了用户更多的创作权力和自由。比如普通人就可以借助AIGC创作小说、音乐作品、3D内容等,一切皆可基于输入词按需生成。不仅如此,未来人人都可能像钢铁侠那样拥有自己的“贾维斯”--个人智能助理。2021年,微软在GitHub首次引入了Copilot(副驾驶)的概念。GitHubCopilot是一个辅助开发人员编写代码的AI服务。2023年5月,微软在大模型的加持下,Copilot迎来全面升级,推出Dynamics365Copilot、Microsoft365Copilot和PowerPlatformCopilot等,并提出“Copilot是一种全新的工作方式”的理念。工作如此,生活也同样需要“Copilot”。出门问问创始人李志飞认为大模型的最好工作,是做人类的“Copilot”。AIGC大模型或会成为每个人的智能助理,让每个人都能享受到AIGC技术红利。
03. “供给侧改革”之外:
AIGC为新闻业带来了什么?
全球经济的整体衰退、新技术的替代效应、短视频的冲击、来自社交媒体的流量缩减等背景,致使新闻业面临困境。在这种情况下,AIGC的出现对新闻生产乃至整个新闻业来说可能是一道曙光。那么,AIGC会给新闻业带来哪些新的可能?它会是困境之中的一种出路吗?
(一)AI辅助新闻生产不是新事物
在探讨AIGC所带来的变革之前,回顾新闻业的发展历史,可以看到AI介入新闻业尤其是新闻生产环节并非没有先例。过去十余年,由人工智能引发的新闻业创新浪潮可以分为三个阶段:自动化报道阶段、增强报道阶段和生成报道阶段。第一阶段,人工智能自动化报道的阶段。在这个阶段,主要是利用AI的自然语言生成(NLG)能力,进行新闻的自动化报道。美联社、路透社、彭博社、法新社等媒体机构都有代表性的实践。自动化报道利用程序自动化生成文本内容,在报道效率和准确性方面具备优势,但由于缺乏思考能力和共情能力,难以写出与人类记者相媲美的报道,因此仅适用于特定领域,如财经、体育等可模板化生产的新闻类型。
在应用方面,例如路透社开发的名为“AI新闻生产线”的新闻自动生成系统,可以生成股票、体育和天气等类型的新闻;《华盛顿邮报》使用名为Heliograf的自动化写稿机器人,可以生成科学、政治和体育等领域的简单新闻报道;日本NHK电视台上线的自动写稿系统,在2011年3月的东京大地震报道中表现突出。腾讯2015年推出的DreamWriter和新华社的快笔小新等产品,则是国内在自动化报道方面的代表性实践。2018年全国两会期间,新华社推出的“媒体大脑”从5亿网页中梳理出全国两会舆情热词,并生成发布全球首条由机器生产的两会视频新闻,仅耗时15秒。
第二阶段,人工智能增强新闻报道的阶段。这一阶段着重运用机器学习和自然语言处理 (NLP)技术,分析数据并揭示相关趋势。例如阿根廷《国家报》(LaNación)自2019年起开始使用人工智能来支持数据团队,后与数据分析师和开发人员合作,建立AI实验室以进一步强化AI应用。
AI在舆情分析方面的应用,同样是人工智能增强新闻报道的例子。在舆情分析环节,AI可以辅助完成情感分析、主题检测、预测与趋势分析等任务,帮助组织更好地理解公众观点与态度,以应对复杂的舆情环境和市场环境。例如,美联社与NewsWhip合作开发的应用,可以帮助专业人员追踪内容传播情况,分析内容将如何推动会员和客户的社交参与,从而调整内容策略,以更好地满足用户需求。也有媒体利用AI的数据能力进行内容优化,如福布斯于2019年推出AI内容发布平台Bertie,可以生成更具吸引力的标题,并针对报道内容进行自动配图,以优化传播效果;《华盛顿邮报》也持续探索将AI纳入业务的实践,比如推出ForYou推荐系统,以及用AI模型检测订阅倾向和用户流失情况。
第三阶段,生成式人工智能(AIGeneratedContent)以多模态生成能力,参与新闻生产的阶段。ChatGPT、谷歌Bard、微软NewBing等产品的技术基础是能够生成叙事文本的大型语言模型(LLM),相较仅适用于财经报道、体育报道等领域的自动化报道阶段,AIGC可以进行更长篇幅、质量更高的报道撰写,并可以根据指令模仿特定作品风格。AIGC的多模态生成能力还带来了新闻报道可视化的诸多新可能。目前新闻业尚处于这一阶段,相关实践仍待深化,但可预见的是,AIGC将影响新闻采集、生产和呈现等环节,进而改变整个新闻业的格局。
(二)AIGC将实现新闻业“供给侧改革”
文生文、文生图、文生音视频、文生代码等多模态内容,都属于AIGC,即人工智能生成内容的范畴。传统内容生产模式,如UGC、PGC等等,主要区别在于作者的专业程度和构成属性,但本质上都是人作为主体来产出内容,而AIGC则是由AI来产出不同形式的内容。
AIGC对于新闻业的影响主要集中于新闻生产阶段。随着ChatGPT等AIGC技术能力的提升以及应用程度的加深,它对于新闻业的影响也会日益深化。目前的应用实践表明,AIGC对新闻业的影响,主要包括以下几个方面:
首先,新闻信息的采集与处理,优化生产流程。
借助plugins等插件,ChatGPT可以快速抓取和采集海量数据,并进行自动处理,如快速浏览文本和生成摘要,供记者进一步分析。这种能力提供了一种提升信息获取效率的可能,在资料检索阶段,记者和编辑无需阅读大量全文资料,而可利用ChatGPT的数据分析和语义分析能力生成摘要,快速获取核心信息,以提高工作的效率。ChatGPT的语言生成能力还可用于翻译跨语言文本,方便记者和编辑获取不同语种的资料与信息。同时,AIGC工具能辅助记者进行采访音视频内容识别与整理,提高生产力并优化创作流程。根据我们所做的调研,“进行资料检索”和“翻译内容”是目前媒体从业人员最多使用AIGC的两种用途,分别占54.8%和44%。
利用AIGC增强采集和处理信息的能力,将在新闻报道中发挥越来越关键的作用。英国《金融时报》总编辑RoulaKhalaf指出,新闻编辑室应当建立一支AI技术团队,协助记者完成数据挖掘、内容分析及翻译等任务,《金融时报》已经在部署系列课程,以提高记者利用生成式AI挖掘故事的能力。
其次,新闻内容的生成,提升报道效率。ChatGPT具有较强的学习能力和文本生成能力,在联网之后,还能迅速采集互联网资料进行新闻内容的生成。通过提示词(prompt)的设置,ChatGPT还可以生成特定风格的新闻报道。除此之外,ChatGPT可以应用于生成访谈提纲、文章框架和标题等内容,还能将新闻报道翻译成多种语言,打破语言边界,将新闻传播给多样化受众。
部分媒体已将AIGC纳入到新闻内容的生产流程中。如BuzzFeed将ChatGPT用于测验类内容的生成;2023年情人节前,《纽约时报》使用ChatGPT创建了一个情人节消息生成器,用户只需要输入几个提示指令,程序就可以自动生成情书;德国出版集团AxelSpringer和英国出版商Reach,近期也在地方新闻网站上发布了由AI撰写的文章。
全球首个完全由人工智能生成新闻报道的平台NewsGPT.com也已经上线。根据声明,该网站没有人工记者,由NewsGPT实时扫描、分析来自世界各地的新闻来源,包括社交媒体、新闻网站等,并创建新闻报道和报告。其创始人声称,NewsGPT“不受广告主、个人观点的影响”,7*24小时提供“可靠的”新闻。
最后,新闻报道的多模态呈现,催生“互动新闻”等新闻类型。
随着技术能力的提升,GPT-4已经具备多模态生成能力,除了文生文、文生图,未来还可能生成更多媒介形式。同时,借助Midjourney等AIGC工具,目前也已经实现文本生成图片、音频、代码、3D内容等多模态内容,这为新闻内容的生成创造了新的可能。新闻业曾经追求的“媒介融合”以及“全媒体记者”,现在因AIGC的出现与应用而见到曙光。《纽约时报》于2012年制作的多媒体报道专题《雪崩》,包含图片、影像、数据、3D内容等形式,耗时6个月时间,动用11人团队花费25万美元才完成,而AIGC的多模态生成能力,将极大降低类似内容的生产成本和门槛。
同时,得益于ChatGPT的即时互动能力,可以用于开发针对于新闻业的对话机器人,将其融入到新闻报道中,即时回答读者的提问并且根据数据资料提供补充信息。这可能拓展出一种“AIGC互动新闻”的内容形式,强调与读者互动性,通过不断的提问与回答,呈现完整的新闻图景。AIGC还可以增强“虚拟主播”等技术形态,优化新闻呈现效果。
在广告营销内容方面,AIGC也表现出强大的生成能力,例如使用ChatGPT编写广告文案或利用Midjourney等产品直接生成广告内容,提升创建效率。此外,ChatGPT还可用于分析数据集,帮助广告主了解消费者的行为模式和市场趋势,以优化广告的投放效果。AIGC有望实现数字营销领域的变革。
(三)客观认识AIGC对新闻业的作用
总体而言,以ChatGPT为代表的AIGC技术在新闻信息采集、内容生成以及多模态呈现方面,具有提升效率甚至实现变革的潜力。未来,随着技术能力的进一步提升以及在新闻业的应用深化,AIGC将替代部分常规的模式化内容生产环节,将记者和编辑从消耗时间与精力的繁琐工作中解放出来,专注于更具创意的工作。然而,在这个过程中,“技术替代”导致的人力缩减问题不可避免,因此新闻从业者在新技术环境下的生存状况值得关注。AIGC凭借强大的内容生成能力,有望实现一场新闻业的“供给侧改革”。但就现实应用情况来看,“改革”还为时尚早,目前ChatGPT等工具主要用于提升内容生产的效率,是自动化报道的“升级版本。由于其仍不具备共情、思考、常识判断等基础能力,AIGC并不能真正用于深度报道的撰写,而是在特定的领域如体育、股票方面,以及“边角料”如测验内容的生成方面有所应用。正如cn信通院云大所人工智能部副主任曹峰所评价,ChatGPT目前仍然无法代替具有高要求、高限定场景下的写作需求。从业界实践也可以看出,在ChatGPT大火之后,虽然不少媒体机构都进行了相关尝试,但并没有哪家权威媒体真正将ChatGPT应用于新闻报道的生产流程中。包括我们的调研结果也显示,仅有38.1%的新闻媒体机构,正在积极使用类似ChatGPT这样的AIGC工具。