生成式人工智能与电影创作

DeGao 2025-09-05 00:47:16

当代电影杂志 2024-05-06 北京


时 间:2024年4月11日下午

地 点:中国电影资料馆会议室、线上

责任编辑:张煜

版权:《当代电影》杂志社

来源:《当代电影》2024年第5期

周雯

北京师范大学艺术与传媒学院教授/博导

刘伟

北京邮电大学人机交互与认知实验室主任/博导

郭帆

电影导演、编剧及监制,代表作品:《流浪地球》系列

陈洪伟

电影制片人/监制、AI电影领域研究学者

编者按

作为最先個生产力科学技术,正带领人类进入全新人工智能阶段,生成式人工智能实行要紧突破,其在各個领域应用必然给人类世界带来重大改变,影像就业者、研究者尤其Follow它在文本、图像、影像生成等方面运用,运用AI工具实行电影制作,在大大提高就业效能同时也在很大层次上改变传统影像生产流程、生产方法,文生影像大模型Sora发生,更是给影视界带来极大震撼,AI2.0阶段,生成式人工智能作为工具,与人类创作思维交互会碰撞出怎样火花,它发生将给电影带来何种改变,是值得Follow难题,

AI,电影,AI电影及关于后世探讨



一、人工智能发展露状

周雯〔以下简称周〕:2024年2月16日,OpenAI发布 影像生成模型Sora,输入文本可生成 一分钟高清长 影像,Sora一 经发布就引起整個 影视行业恐慌,认 为将对视觉创作领域带来巨大冲击,虽说OpenAI官 方放出卖家秀影像并未达到1分钟时长,但“世界模 拟器”生成机制还是引发极大Follow,并一骑绝尘 之前众多4秒短影像AI生成工具,后续OpenAI发布 Sora技术报告,相关研究论文也连续发表,最近也有 一些测试号“买家秀”影像放出,这個时候,咱们 可以更理性客观地讨论人工智能影像生成,以及Sora这一要紧发展节点,

现阶段人工智能是根据大语言模型突 围,其涌现、幻觉 特性更适合较为宽容艺术领 域,因为这個先说在艺术领域爆发,请问刘老师,根据 Transformer大语言模型人工智能后续会如何发 展?

刘伟〔以下简称刘〕:现在整個人工智能界都处于 相对高亢状态,为什么高亢?因看到一丝曙 光,比方说ChatGPT,大家切实感受到人工智能可以做 很多文本就业, 又比方说用于影像创作Sora,大家感 觉、以前不太一样,时长不同样,清晰度不同样, 但其实中美两国科学家都感觉,这还不是根本性变 化, 为什么? 美国加州伯克利大学学者罗素说,过 去人工智能是现在自动化,现在人工智能是未 来自动化, 所以,现在人工智能还处于自动化状 态,这是它技术底层, 现在人工智能软件系统底 座都是transformer架构,但它是有缺陷, 三年前, 咱们翻译一本书叫《代数大脑: 揭秘智能背后逻 辑》, 它指出,多内层神经网络内部有两個函数,一 個叫线性函数,一個叫激活函数,这两個函数会造成 transformer架构发生瓶颈,这也是它造成幻觉由 来——线性函数、激活函数相互作用引发全程分配 不均匀、不透明与无法解释性, 除其自身缺陷外, 还有数据源、算法底座与“卡”限制, 比方说,现在 大语言模型或者多模态大模型数据源基本上还是英 文,中文数据语料库很少,大模型底座也最先选由美 国等西方国家开发, 国内有人提出可以另辟蹊径,把 大模型东西模块化,如推理、模型、算法等不同样模块, 运用什么模型则调用什么模块,能较好地搞定垂直领 域应用难题,

周:2023年11月,谷歌DeepMind团队在一個3D 模拟环境中,用神经网络结合强化学习训练出一個 智能体, 这個智能体从未运用任何预先收集人类数 据训练,从零开始,学习周遭环境,以模仿开始,其 自我改良后甚至超越被模仿者,习得人类行为, 这也 很类似于人类间文化传播, 因为这個,他们发表在《自 然通讯》〔Nature Communications〕上研究论文 题目就是《类文化传播少样本模仿学习》〔 Learningfew-shot imitation as cultural transmission 〕, 请问 刘老师您怎么看待这种人工智能发展路径?

刘:目前,有很多研究全力于开发这类能够从效 率、秘密角度,从与人类相仿其他個体那里实行社 会化学习AI智能体, 这样智能体可以经由观察其 他個体执行任务来学习新技能,而无需大量监督式 演示, 常用一种方法是利用仿真环境,让AI智能体 观察虚拟角色执行任务, 这种虚拟仿真环境可以大大 降低学习本钱,因可以轻松生成大量训练数据, 还有一种方法是利用互动式学习,让AI智能体与人类 或其他智能体实行交互,并从交互中学习新技能, 这 种方法可以模仿人类之间社交学习过程,使智能体 能够更快地学习新技能,

这篇研究论文是对具身智能〔指有身体并持助物 理交互智能体〕实行高速知识传播一次概念验证, 也是向人类-AI互动开放式交互学习迈出最先個步, 我想说是,这种人机交互智能方法还处于探索阶 段,基本上还属于“得形忘意”阶段,距离“得意忘形” 还相对远,究其因,涉及人类情感、意识、认知能 否经由数学计算实行底层难题,到底人类智能中除 学习性以外,还有非学习性〔指本能、遗传先验 本事〕; 除客观显性动作行为以外,还有主观隐性 意图动机,所以机器具身智能与人类具身智能 还无法百分之百等价, 但这個研究在一定层次上为AI领 域、文化演化心理学之间密切互动奠定基石,

周:您感觉当下人机交互最困难一部分是什么?

刘:是确定性与不确定性叠加纠缠,在人与机 器交互过程中,机器搞定、运算数据本事往往远 超过人类, 但是在面对复杂难题、环境时,人类判 断、决策本事往往更准确、灵活, 确定性是指事物或 大事发生结果是可以占卜、确定, 在机器中,确 定性往往由算法、逻辑、规则来驱动, 机器可以根据 已有数据、先验知识,以一定规则实行计算、判 断,并给出准确结果, 反而,在复杂现实世界中, 存在很多不确定性因素,如不百分之百信息、无法占卜 环境更迭、人类主观因素等, 不确定性是指事物或 大事发生结果无法百分之百占卜、确定, 在人类决策 中,咱们经常须要根据個人经验、直觉、情感、价值 观等因素来做出判断,这些主观因素往往是难以量化 、规则化,也是机器难以模拟、理解, 人类、机 器在搞定不确定性与搞定确定性过程中是互为补充 ,经由结合人类算计〔谋算〕、机器计算本事,可以更好地应对复杂难题、不确定性挑战,

周:《流浪地球2》里设置智能量子计算机550, 还有图恒宇女儿图丫丫数字生命,请问郭帆导演, 您是如何探究这些人工智能相关设定? 您对于人工 智能是怎么理解?

郭帆〔以下简称郭〕:拍摄《流浪地球2》时候,我 们邀请中科院研究人员为顾问,一起琢磨人工智能 发展, 这么做也是为把《流浪地球》世界观拓展开, 不再停留于宇宙范畴, 拍摄《流浪地球2》是在2021 年,我预估像GPT这种级其他人工智能还须要七八年 才干发生,但其实在《流浪地球2》上映前一個月它就 发生,真没想到这般之快, 咱们还在《流浪地球2》 里设定一個机器,就是550C自适应计算机,它可以 自主发现一些难题,以适应周围环境生成相对应策 略,根据生成策略再生成相对应应用, 这本是我 们天马行空想出现机器,却在浙大看到类似应 用, 我想这或许可以给予咱们新解题思路,防止创 作者陷入经验主义怪圈, 科幻跟科学之间有着巨大 鸿沟,为学习人工智能相关知识,咱们参加世界 人工智能大会,在国内考察华为、小米、商汤等高 新技术公司,在国外考察谷歌、Meta、苹果、英特 尔等高新技术公司,以及浙江大学、斯坦福大学等高 校高新技术实验室,

但回归电影创作自身,我对技术态度是“能用 才有意义”, 比方说虚拟制片技术,经过证明,实操性 价相对低,最保障方法还是回归到传统绿幕或者蓝 幕拍摄, 虽说虚拟拍摄LED屏企图打造是实时、可 见就所得状态,但背景神效也得提前做,与传统拍 摄须要花费时间其实不相上下, 所以,我对能实际 用在创作、制作中 AI工具更为Follow,

二、人工智能工具产业应用

周:您现在做《流浪地球3》前期,会运用哪些 AI工具? 在哪些环节运用?

郭:对于前期文字就业,语言模型如Claude3对 咱们影视创作协助很大, Claude3比GPT4更趋于一种 “人”状态,它甚至会对我提出难题实行“先测试”, 比方说难题提出后,它会先“糊弄”你一下,当你提醒 它说这個回答太糊弄时,它才会非常认真地回答你 难题, 这大概是它节省算力一种方法,但其实很类 似于人类社会中“耀领-员工”关系, 语言模型在文 字创作上能呈现很多发散性琢磨,甚至协助并非专 业编剧去搞定一些基石数学、化学、物理层面 计算,涵盖天体物理级其他计算,

咱们现在把人工智能应用在电影生产上,是将基 础逻辑拆分开, 一個语言模型完整地编写一個剧本这 并非现实,但整個编剧就业流程可以分成若干块, 在 编剧开会时候,录音与AI识别可以解析出每位与会 人员发言,最后形成语料库, 在连续十天、每天十 小时讨论后,AI识别可以“秒速”精准提炼每個人 要紧观点,防止人工查询冗杂, 写剧本也是同样, 在Claude3语言模型协助下,咱们基本上解放双 手, 事实上,人工写剧本这件事须要耗费很大一一部分 精力在遣词造句上,现在这样就业可以交付AI来 完成,咱们只须要在创意上花费更多琢磨——传统 剧本流程,从有想法到落成文字大概须要几個月到 几年不;但现在只要你轶事思路完整、人物清晰、 逻辑健全,那么从落成文字,再到生成剧本格式,乃 至文学润色,最多一周就可以完成, 作为电影来讲, 剧本是须要转化成视听语言,并非像小说那般着重 文学性,Claude3、GPT4等语言模型百分之百可以承担“将 事情讲清楚讲明白”任务, 我感觉这很好地呵护 咱们创作精力,

周:概念设定也是根据AI工具链集成运用逻辑 吗?

郭:是,咱们是试着将各异人工智能应用分 摊到所有生产环节里面,哪怕很小一個环节也大概 对应一個应用,最后形成应用组合,类似有扳手、螺 丝刀等不同样工具工具箱, 比方说剧本阶段会分切出 五六個分支环节,运用各异应用,筹备时候又会 分出若干個部门,同时部门中又分出几個环节,对应 不同样应用,相互组合运用,协助咱们从传统、价值 不高就业中解放出现,

概念设定也是,在基本想出一段剧情之后,咱们 马上就会用Runway、Stable Diffusion、Midjourney 生成视觉概念图,况且会有动态概念影像, 运用逻 辑是,咱们会先给出设定让Midjourney铺面,生成 1 000、2000张都可以,咱们像看照片一样概览,而后 把与想法接近图片选出现给Stable Diffusion进一步 深化, 另外,Runway能让概念图更有意境,比方说飘雪、下雨、闪电等动态意境 型疗效可以很快呈现, 深化 结束后,咱们会再从中选出一到两個最后运用方案, 现在人工才开始介入,根据AI生成意向性概念实行 细化设计、拆分模型、动画测试, 所以说,这些应用 并未取代创意这件事情,而是协助咱们节省实行创 意过程,

周:整個前期团队可以高速进展、相互促进,

郭:是,时而候AI生成视觉内容还可以促进 编剧琢磨, 打個比方说编一個“办公室开会”桥段,办 公室其实没有细节,只是脑海中一個概念,AI会根 据咱们“模糊办公室”生成几张图,那么当编剧看 到图片上相对具象化环境之后,大概会根据具体物 品实行拓展,这种拓展与情节、环境有关, 这样经由 视觉让编剧实行具象琢磨,使“办公室”不再是停留 在脑海中抽象概念,而是能协助编剧激发想象力, 实行从文字语言向视觉语言要紧转化, 这样连续地 相互促进、相互激发,能够更好地实行前期创作,

上述,咱们现在整体思路就是尽大概地把传统 生产逻辑拆分成一個個单点步骤,给这些步骤找到 对应应用,并测试哪個应用好用,好用就记录下来, 选定好这些流程之后,后世创作就可以依照这些好 用应用直接运用, 这是一种类似于汽车生产线一样 生产自动化逻辑,

周:所以AI工具其实已经系统性地应用在《流浪 地球3》前期阶段,这应该在国内影视行业中是 很最先进,

陈洪伟〔以下简称陈〕:一定是,郭帆导演提到这 种在项目开发环节与AI共时交互,应该是目前影视 行业对AI运用标杆, 我很赞同各类工具为我所用、 逐渐沉淀就业流逻辑, AI工具迭代很快,咱们传统 影视内容生产工艺流程,还不会很大层次被改变, 除非剧组主创,极具是导演与制片人愿意主动拥抱 新技术,才会创造一些新大概性, 我反而感觉,新 技术更多应用场景,大概不太会在成熟影视剧组, 而会在更多缺乏影视资源小团队, 比方说更多自媒 体、青年导演,或者愿意实行影视内容创作普通人, 都可以因AI技术赋能,做出更多富有想象力、创 造力作品, 同时各类AI应用工具迭代速度非常 快,是以月为单位,处于这种涌现式发展旋涡之 中,咱们很难准确判断这一次生产力技术革新会发 展到什么层次,

刘:咱们把这种群体人机环境相互作用生态 称为人机环系统, 事实上,根据TransformerAI应 用都是人机环, 最先個一部分预训练时候,这些模型框 架都是找人打标,这是人在介入; 第二一部分须要人 反馈调试,也是人在作用; 第三一部分在运用层面也需 要人选择, 所以,这些软件都有一個一道特点,就 是“欺软怕硬”——你水平越高,它给你东西越好; 你水平越低,它就泛泛而谈,

郭:对于AI工具搞定专业知识会引发幻觉难题, 咱们现在方法就是在它回答完之后立刻“骂”它一 遍,让它再细算,它会给出一個更细方案,紧接着 再“骂”一次,它又会再细化一步,最后给出一個相 对准确数据, 直到这個数据不再更迭或更迭不太 时候,咱们才会拿去与专业人士讨论, 另外,作为导 演,我还注意到 AI对于提升管理效能要紧作用,就 使这与电影创作无关,但是剧组人数众多、工种庞杂, 全效运作也是一個亟待搞定难题,

刘: 您所提到管理难题是AI工效学所Follow, 管理学鼻祖、工效学鼻祖都叫泰勒, 这也与AI 自动化与智能化有关, 在定义里,所有可编程、确 定输入、确定反馈叫自动化; 凡是一部分可编程、 无法编程、不确定输入、不确定反馈叫智能化, 智能化特点在于利己,就有利于我团队、有利于我 個人, 非常希望后世能在电影中看到利己、不确定 智能化 AI设定,

三、作为“世界模拟器”Sora

周:提到Sora,当下它还很难应用在电影产业制 作中,但工具会连续成熟,各位怎么看待它后续发 展?

陈:Sora发布,对于2024年意义很大,人工智 能在图像、影像生成领域为大众带来感官上巨大 冲击, 过去感觉AI很无敌最先选是一种想象,但Sora带 来真正视听震撼, “买家秀”影像确实展示AI 技术在视觉创作方面潜力,况且AI技术迭代、 进步会连续加速, Sora本事在一定层次上,会影响 、改变内容创作者就业流程,使得個人创作者能够 有机遇制作出具有专业水准视觉作品, Sora能够提 高生产效能,还降低制作本钱,使得更多创作者有机 会参与到影视制作中来, 同时它也对行业内就业 结构、专业技能准则带来挑战,使得从业者连续学习 、适应新技术,

郭:Sora现在费用大概是平均150美元一分钟, 但这不等于花150美元就能得到可用一分钟, 也许 生成100個一分钟乃至1000個一分钟才干获得可用 那一個,咱们选择本钱、耗时本钱、资金本钱都会 变得非常高, 所以当Sora发生时,对我来说,直觉上 影响并非强烈, 但是Sora倘若在短影像创作上继续发 力,对广告或者短影像行业冲击会相对大,长影像 行业则暂时会好一些, 另外,目前AI带来生产自 动化并非涉及百分之百创意层面,那么对创作者影响 就不是极具大,反倒能够释放生产力,让更多年轻创 作者持有更多机遇, 拍摄一部电影门槛在于须要组 织大量人力、物力去生产,对于年轻创作者来讲, 组织几百人或上千人队伍去拍摄大概难度更高, 这 不是创意难题,而是号召本事、管理本事难题,而 新AI应用可以帮他们降低组织本钱, 也许在后世, 几個年轻创作者就可以做出一部电影,这是对整個 创意领域释放,让他们有更多大概去施展自己 才华,被大众看到, 我觉得这是一件好事,对于电影 行业来讲也是好事,

显然,咱们也依旧要Follow Sora发展、可用性, 但最近放出艺术家生成“黄色气球脑袋”影像, 这個黄色其实是靠人为手段以传统DI完成,而非直 接生成, 后世,倘若 Sora能百分之百覆盖传统拍摄手法, 那么咱们就须要重新审视它在创作上作用,有可 能会对行业引发很大影响,

周:另外,Sora之所以引起大家惊恐,并非仅 仅因它能生成影像,而在于它“世界模拟器”特征, 是脱离二维图像局限,根据三维空间、物理世界 生成, 显然,现在模拟层次还未达到大家期待,

陈:关于世界模拟器这一部分,确实是很大分歧 所在, 也有很多专业人士,极具是在后期神效、3D建 模等领域深耕专业人士,也对Sora到底可以在多 大层次上还原物理世界持有相对大疑虑, 目前,AI 在3D领域发展具有并存两条路径: 在Sora之前, 物理3D世界还原,最先选是根据3D模型算法构建, 除传统3D模型软件之外,游戏引擎发展是希望所 在,极具是以UE5游戏引擎发布为地标, 它在呈现 物理世界自然光线、肌理质感等方面,取得让人 惊艳成果, 物理世界构建、还原在相当一段时间 内都是依托于游戏引擎算法, 直到Sora演示片发 布,让很多传统3D建模相关专业人士很难接受,或 者持有很强质疑态度, 至于Sora到底能无法像演示 所言,经由大语言模型构建,可以百分之百实行世界模 拟器本事,还要等待Sora真正面向大众运用之后, 才干一探究竟,

周:是,我之前也感觉虚幻引擎〔UE〕是后世 整個泛娱乐视听行业重心工具, 但今年3月,黄仁 勋 在英伟达GPU技术大会〔GTC,GPU Technology Conference2024〕上说: “在5到8年时间内,咱们看 到每個像素都将被生成,而不是被渲染, 借助AI生 成模型,这些像素将在被观看或被消费同时生成, ” 各位怎么看待?

刘:黄仁勋提出这個观点涉及人工智能在图像 生成方面发展, 倘若这個占卜成真,将会带来巨大 变革,影响诸如娱乐、设计、医学影像等多個领域, 意味着图像生成技术进步将达到一個新高度,

目前图像生成技术已经相当先进,但倘若在未 来5到8年内,每個像素都可以经由生成而非渲染来产 生,这将意味着更加细致、逼真图像,甚至可以达 到人眼难以分辨真实与虚构层次, 这种技术应用 将更加广泛,除涵盖游戏泛娱乐行业外,建筑设 计、虚拟现实等领域也将受益匪浅, 如在建筑设计中, 可以根据客户具体要求、场地特征生成高度個性化 设计方案,设计师可以更快地尝试各异方案,并 根据反馈实行调整,于是提高设计质量、效能, 在 增强现实〔AR〕、虚拟现实〔VR〕环境中,可以创建更 加逼真虚拟世界,还可以与自动生成、自适应性技 术相结合,使设计系统能够根据环境、运用者需求自动 调整、生成设计方案,大大提高设计灵活性、适应 性,进而供应更加让人信服运用者体验,

但这种技术发展也大概会带来一些挑战、 难题, 最先当其冲就是伦理、道德难题,比方说虚拟人 物滥用、秘密泄露、图像影像造假等方面,大概会 引发分歧、社会矛盾升级, 再者,技术进步大概导 致一些就业岗位消失,极具是那些依赖于传统渲染 技术行业等, 总而言之,黄仁勋观点展示人工 智能在图像生成领域潜力、前景, 倘若这個占卜成 真,将会对咱们生活、就业引发久远影响,须要 咱们做好百分之百准备来应对,

周:回到电影行业,今年3月底,OpenAI主动拜 访好莱坞也证明 OpenAI进入电影领域强烈意愿,

陈:OpenAI这次拜访带有很大营销属性,好 莱坞在电影制作工业体系上已经非常健全、完整, 对人工智能生成内容〔AIGC〕实际产能一直维持比 较高警觉、质疑, 从好莱坞编剧到演员诸多领域 罢工也可以看到,虽说 AI爆发式发展制造一定 焦虑,但OpenAI想经由Sora进入好莱坞重心生 产环节应该没有那么容易, 最先选原因在于,咱们尚且 不探究能耗,不探究算力巨大本钱消耗,乐观预计 AI影像生成可以在三年内完成多次迭代, 这已经是 一种非常乐观预判, 但只要你实际用过所有一线 AI影像工具,就会很明显感觉到目前所有AI影像工 具局限性,

电影发展一百多年来,已经创造非常丰富多样 视听语言成果,很多视听表达要想用AI轻松完美 地生成,还有相对远距离, 结合实际AI工具运用 情况,咱们可以得出如下推论: 两到三年甚至更长时 间内,AIGC都不太大概变成主流影视制作重心生 产力工具,也无法替代摄影机实拍、演员表演重心 生产要素功能, 但各类眼花缭乱AIGC工具,就如 郭帆导演所阐述,一定会变成非常要紧效能沟通 工具、创意互动工具、生产持助工具, 显然咱们也期 待以 Sora为代表更多AIGC工具面向大众投放运用, 就使主流电影工业无法短期内将AI工具作为重心生产 力,但对于青年创作群体、独立电影就业室甚至自媒 体创作者而言,在没有更多资金资源前提下,有机 会借助AI工具实行更王牌视听语言创作与表达、更 快地被主流观众看到,也一定是电影产业大好事,

四、人工智能对电影叙事影响

周:AI介入后,不光电影视听语言与生产方法 会引发更迭,甚至叙事方法都会发生很大更迭, 人工 智能体〔AI Agent〕大概变成角色之一,与运用者生成個 体化随机性轶事,学界把这种叙事方法叫“涌现叙 事”, 或许后世每個人都可以在自己创建轶事世界 观里、 AI角色实行前无古人后无来者剧情互动、情感交流, 每個 观者体验都不同样,尤其在VR技术持助下,故 事呈现方法会从“轶事讲述”〔Storytelling〕向“轶事生 存”〔Storyliving〕转变, 郭帆导演,您如何看待这种 大概?

郭:我对此心态相对开放,因人类对于轶事 需求至今都未曾发生更迭,从山洞壁画、结绳记事, 到皮影戏、小说创作,再到电影胶片、数字影像,这 些都只是讲轶事载体更迭,而個性化、定制化、互 动化讲述载体,本质上也还是在讲轶事——人类对 轶事有需求,而非对载体有需求,载体一定在不停地 更迭着, 载体更迭是根据科技更迭,而对轶事 需求是不会发生改变, 像英国纺织工人捣毁珍妮纺 织机运动,就使反抗声音再大,也无法阻碍阶段车 轮,咱们没有办法违逆技术发展势头,更何况,电 影自身也是伴随技术发展而引发一种信息载体, 没有技术何谈电影, 那么,根据信息化技术发展, 电影引发更迭是非常正常一件事情,任凭咱们主观 上是否喜欢这种技术迭代,载体革新都不会照顾到人 类主观感受,咱们须要秉持开放、学习态度去关 注这种发展,

陈:电影诞生一百多年,其实人类影像叙事方 式一直在连续发展更迭,一直在面向复杂化、多元化、 高信息浓度方向发展, 在本质上,与其说是电影 进化,不及说是人类大脑这一接收、反馈信息搞定 器, 伴伴随工业革命、信息革命、科技发展,在连续 被更大信息量所重构, 举一個最简单例子,咱们 都经历过2000年初好莱坞电影《黑客帝国》三部曲 上映,那时候大量观众都反馈看不懂,感觉各类隐喻 造成巨大理解障碍,而只能感叹于表面各类科 技神效,如子弹时间等, 但在二十年后今天,咱们 再重看《黑客帝国》时没有任何观影障碍,甚至惊叹 于这是一部非常超前预言电影, 为什么? 因咱们 在这二十年间,经历数字信息洪流冲击,从互联 网到移动互联网,人类进入史无前例数字信息爆炸时 代,生活方方面面都在深度数字化,数字世界与现 实世界边界越来越模糊, 根据这样全面数字化时 代背景,“涌现叙事”本质上就是人类信息涌现带来 “轶事”需求改变, 而这個过程中,AI语言大 模型技术突破与应用,代表着数字信息将得到指数级 放大,人类进入与AI共存阶段,这其中信息交 互方法,从单纯人与人借助互联网交互,百分之百进入 人与人、人与AI、AI与AI等更加复杂信息传递震荡, 郭帆导演借助 AI工具参与到电影剧本创作,已经 是与AI一道创作多元信息交互模式, 这是未曾有过 全新局面,会是人类大脑这颗超级信息搞定器面对 全新挑战,

周:根据现在已知人工智能,您对后世人工智 能判断是什么? 以及人类与AI关系?

陈:我感觉相相对于高速发展数字信息科技, 人类本性并非会这般之快地进化、与之匹配,咱们 依然有着可以称为“人之常情”各类古老情感, 短 时间来看,这诸多情感并非会湮灭,但会被各类繁 杂、高频、高速、碎片甚至冗余超载信息冲击, 这 会带来非常多戏剧张力,也是近些年越来越多全 球影视作品着墨重点, 整体来看,后世电影叙事 将呈现两种极端样态,一种为信息浓度暴增,经由高 倍信息轰炸与视觉、听觉等感官全面冲击,引起 普通人情感共鸣与观影兴奋度; 另一种为传统、缓 慢、真实、朴素各类古典叙事表达方法, 物以稀为 贵,它们依然会如今天各类非遗文化一样,历久弥 新,维持绵延而悠长生命力, 到底,咱们还是人类,

郭:我感觉也许会转变对于定义权争夺,对于 一個事物,咱们人类认知是什么? AI认知是什 么? 假设 AI认知、人类认知不匹配,甚至高于 人类认知,会发生什么样事情? 比方说咱们现在感觉 水蒸气、液体水、冰块在本质上是一样,但也许AI 不这么感觉,它有更精确定义,那么到那时会如何?

周:有专家感觉,通用人工智能〔AGI〕到来大 约须要 5到10年,可解释人工智能大约须要5到15年, 根据这些观点,刘伟老师您如何看待AI发展路径 、速度?

刘:人类已有数学支撑不行大家期待AGI, 所以也有专家感觉,现在人工智能实际上是高级 自动化, 、郭帆导演琢磨类似,苏格兰哲学家大 卫·休谟提出要紧“休谟之问”,就人类能否从客 观事实里得出主观价值? 从“是”〔being〕里能否得出 “应该”〔should〕? should就是智能重心, 在东方思 想里,“天行健”与“君子自强不息”便是一对being 与 should, 倘若没有 should引发,那么智能机器就只 是一個自动化装备,

所以,关于人工智能与AGI,须要格外Follow咱们 “人”should作用, 维特根斯坦在《哲学研究》中推 翻他前一部《逻辑哲学论》中重心观点,指出真 正理念是在生活、实践当中引发出现,有生命力 语言就叫自然语言〔NLP〕,而不是限定学术化语 言, 这与拍电影类似,倘若一部电影全都是规范式 镜头,观众绝对觉得索然无味,不确定表达更抓人 心, 这也就更好地解释为何AGI无法存在, Sora虽 然被称为“世界模拟器”,但底层逻辑依旧是数学统计, 而机器物理、生活物理百分之百是两個世界,人类不 单有物理,还有心理、伦理、道理;Sora、GPT 是无法能百分之百模拟出现, 极具是东方“非常名”“非常 道”这样表述,机器是很难清晰地生成出现,

郭:咱们在拍摄《流浪地球2》时候,“都在酒里 ”这句话就很难翻译,

刘:所以说,机器是计算,人类是算计,机器无 法理解人类should、人类“算计”,AGI是很难成 功, 能够取代科学是复杂系统——机器做“复” 人做“杂”, 科学在西方以还原主义姿态取代宗教, 而东方则更看重系统观,机器与人思维融合组成复 杂系统才符合当下发展, 事实证明,人机协同已经 变成当下人因工程最要紧研究方向, 在后世,并非 是单看Sora或Claude这些单個AI应用如何发展,而 是人机协同生态——人与机谁结合得更好,谁就最先进, 所以,在人工智能主题科幻电影创作上,我感觉应 该把人类哲学、神学、复杂性加进电影创作中,这 是人工智能无法涉足领域,

周:AGI普遍定义,是能够像人类一样琢磨、 学习、执行多种任务人工智能系统, 2023年10月, 英伟达、华盛顿大学、港大发布类人智能体〔Humanoid Agents〕, 根据心理学家丹尼尔·卡内曼〔Daniel Kahneman〕理论,人类有两個互补思维过程: 直 觉、轻松、就时系统1,、逻辑、有意、 缓慢系统2, 之前AutoGPT等多是构建根据系统2 以任务为导向智能体,而类人智能体则依据心理 学,模拟人类日常活动, 在生成对话响应时,可以 同时探究到系统1基本需求〔比方说饱腹感、健康、精 力〕以及情感、亲密度等多個方面, 这些内在动态 因素使得智能体能够根据自身状态来调整其日常活 动、对话方法,就像真正人类一样, 各位如何看待 这种AI发展路径?

陈:影视作品传递情感,本质上就是经由信息 传递、反馈,实行人类心理感受起伏过程, 这两种 互补思维过程,倘若简单直接地概括,就是意识与 潜意识 区别, 意识,涵盖定义、概念、逻辑这样 人脑理性活动行为,语言文字都是意识表现格局, 而大语言模型,顾名思义,就是根据人类语言研究搭 建数学算法模型, 因为这個从某种层次而言,目前AI 可以无限趋近于人类意识表达, 这也确实是咱们目 前运用各类AI工具实践过程中切身感受, 但人 类潜意识层面,更涉及直觉、碎片、非线性感性 心理活动,而正是这种无法轻易捕捉潜意识活动, 构成人类意识活动主体一部分, 就AI发展看来, 经由意识堆叠、算法提升,达到或者接近人类 潜意识思维,目前应该还是不太大概,

刘:其实,丹尼尔·卡内曼理论中人类系统1感性 思维与系统2理性思维经常是混合在一起, 这种混 合往往会让当代数学、逻辑学研究者们惭愧不止, 就目前数学及其他工具还远远无法持助机器智能模 仿人类混合思维, 要实行机器仿人混合性智能, 除新数学工具发展,还须要探索新方法、技术, 如新机器学习方法、自主认知系统、复杂领域交 叉研究等, 只有综合利用多种方法,才干更好地持助 机器智能模仿人类学习本事,

纵然机器智能在某些方面大概比人类更无敌,比 如搞定大量信息速度、准确性,但是机器智能远远 无法实行人类非理性智能,涵盖情感、创造力、直 觉等方面,这些是当前机器无法模拟或者达到, 虽 然机器智能可以经由学习、推理,从数据中挖掘出有 用信息,并执行特定任务,但要使机器智能具有 价值性,就须要探究、引入伦理、道德以及社会等因 素,

周:那么,AGI后续发展瓶颈、障碍最先选在哪 些方面?

刘:最先选面对着技术性、生物性、社会性三大瓶 颈,

技术性瓶颈表现在人工智能系统须要更高计算 本事、更先进算法、更有效数据搞定方法,以实 现更复杂、更智能功能, 通用智能“算”不光包 括计算本事,还涉及算计〔谋算〕本事,它指是智能 系统在搞定复杂难题、实行推理、决策时所须要能 力, 当前人工智能技术在搞定各类现实世界复杂问 题时,往往受限于算法设计、数据质量、模型解释性 等方面, 伴随技术连续进步、研究深入,咱们可 以期待智能系统在算计本事上取得更大突破,于是更 好地应对各类复杂挑战,

生物性瓶颈最先选体现在咱们对人类大脑认知能 力、运作机制理解还非常有限,要实行类似智能 水平,须要更深入神经科学、认知研究, 人类大脑 是一個高度复杂器官,大脑神经元之间相互作用 非常复杂,咱们对它就业原理理解还很有限, 要开 发出真正具有通用智能人工智能系统,须要更深入 地理解大脑就业原理,并将这些原理应用到计算机 系统中, 人类能够轻松地搞定非结构化、模糊信息, 但对于计算机来说,这是一個更大挑战,

社会性瓶颈则涵盖人工智能系统与人类社会 融合难题,比方说文化差异、伦理道德、秘密呵护; 这些都是影响人工智能发展要紧因素, 由于不同样文 化、社会背景下行为规范、价值观差异,通用智能 系统须要适应并尊重各异文化,如用于全球市场 客服机器人须要理解、回应不同样文化背景运用者,这 是一种跨文化交流, 同时通用智能系统必需探究伦 理、道德难题,涵盖秘密呵护、公平性、保障性等方面, 以确保其发展、应用符合道德准则、社会期望,

克服这些瓶颈须要跨学科协作、持续独创努 力,只有在技术、生物、社会方面取得突破,“通用 智能”才干迈向更加成熟、全面发展, 但这到底极 难实行,或许根本实行不行,也许“长生不老药”只 是传说、神话,

五、人工智能与影视教育

周:AI技术发展对高校冲击也很大,教师、学 生危机感、紧迫感都很重, 咱们从2023年5月开始 开设AIGC课,本学期是第二次,是、北京电影学院 摄影系协作,一道探索如何培养学生运用AI工具实行 影视创作,如何综合AI、传统技术方法创作卓著作品, 陈老师也作为主课教师,邀请非常多创作者、学生 互动,实行深度产教融合, 陈老师有哪些具体感受?

陈:AI技术发展对于咱们提升教育理念是一個非 常非常好契机, 咱们经常会感慨,在传统影视教育体系 中,教学内容距离产业实践相对远, 而AI技术突飞 猛进,对影视教育是一次巨大利好,AIGC会给同 学们供应高速百分之百实践机遇, 在实践中,学生们会 透彻感受到自己在基石知识、理论系统上不够,进 而非常有针对性地学习、补充,形成正反馈学习节 奏, 咱们这次教学实践是以视听语言为重心,但放弃 专业影视院校在讲授视听语言时以理论、文字为主 思路,全面借助AIGC工具,使每一個视听语言知 识点都可以经由AI生成,高速呈现在同学们面前,让 他们更好地感受视听语言带来无以言表魅力,

周:这次课程最先选是大二本科生,几周内,很 多同学就随堂创作出卓著视听作品, 虽说这次课程 是以AIGC为重心,但本质上是非常系统电影视听 语言课,

陈:是,但同学们创作探索过程不再根据传 统影视行业创作就业流, 虽说AIGC创作过程很多 时候是個人化,但他们创作并非孤独,他们创 作伙伴不再是身边同学,而是GPT等各类各样 AIGC工具, 我感受是: 这是一次美非常好教育探索、 尝试,况且在教学过程中,更加感受到视听语言在 后世 AIGC高速发展后要紧性,甚至是后世人们必 须百分之百掌握重心本事, 郭帆导演对此怎么看?

郭:我极具赞同您说法,我一直觉得咱们基 础教育中就应该包含视听语言教育, 在做《流浪地球2》 1000人复盘时,咱们发现短影像已经占到日常文化 消费97.5%,观看时间从两三個小时到十多個小时, 这意味着观众已经习惯于经由“视听”方法实行信息 接收,所以咱们须要培养他们视听表达,

在后世,大概咱们会面对更多不同样领域视听方 式信息传递, 人工智能倘若能够提全效、降低门槛, 也许在后世更多社交媒体、公共信息传播都会倾向 于运用视听语言,而非文字语言, 从报纸到门户网站, 再到今天短影像,信息传递本质没变,更迭是 信息传递方法, 后世,在人工智能降低制作与传播 门槛前提下,大概有更多视听信息传播,不光是 轶事,还涵盖社会新闻、科学普及,甚至表达情绪也 以影像方法呈现, 我对此相对乐观,

刘:我是相对悲观,我感觉着看重听其实也是 在弱化咱们智力, 因人机交互是“脖子以下”,是 生理、物理之间交流,而人机融合智能是“脖子以 上”,也就是人脑、电脑实行交融, 实际上当机器 水平越高,人水平是相对下降,

郭:我赞同,我刚才观点是在影视行业这個前 提下,视听语言这种语言传播面越来越广,意味着 咱们机遇越来越多, 但从社会难题来琢磨,这会让 咱们不太会像原来那样实行更多深度琢磨,

陈:从视听语言教育角度出发,我感觉可以找 到“可琢磨”基准线, 创作者在做电影时会对影 像镜头有质感要求,希望持有“电影感”这种高级感受, 这 告诉咱们,视听琢磨其实也分高、中、低, 在此我 引入“显性-意识”与“隐性-潜意识”这两個概念: 一 部电影主题概念可以经由文字表述,是显性,而 视听语言有着更海量信息,是隐性, 镜头构图很 多隐性内容是咱们在学习文字琢磨时意识不到, 但是我感觉,影视相关专业学生更要自觉晓得隐性 内容要紧性, 要做高阶品质作品,经由镜头传达 思想跟情感,隐性方法尤为要紧, 在传统影视教育 中,咱们往往过于着重显性意识要紧性,而忽略影 响力更大、更久远潜意识塑造与传播, 刘伟老师 感觉短影像会对人类琢磨弱化,最先选难题不在于短视 频影像内容自身,而是目前社交媒体算法投喂机制, 主导、推动勾起人们浅层欲望而非透彻琢磨海量 垃圾信息内容广泛传播, 这是另外一個对人类非常 要紧文化、社会议题, 但咱们无法因目前社交媒 体算法带来社会难题,就放弃对视听语言更加系统 化研究,甚至放弃让后世孩子们在成长阶段更加 系统化学习视听语言机遇,否则他们将在AI信息 爆炸阶段更加茫然无措,只能更加被动地接受AI视 听信息投喂,而百分之百丧失与AI共舞创造本事,

郭:我极具赞同这個说法,视听语言作为一种语 言其实还不是那么普及, 九年义务教育搞定很多文 字文盲,大家可以经由文字传递思想与感情,这样 扫盲就业是文字语言传播“基建”, 但遗憾是,视 听语言还没有完成这种基建很多人其实并非会拍摄 镜头、组合镜头, 只有先完成基建,咱们才干继续发 展,并达到顺畅运用视听语言层次, 我期待后世AI 协助咱们完成视听语言基石设施建设,有这個基 建,更多人才干掌握视听技能,影像发展领域才会有 更肥沃土壤与源源连续人才,

周:对于行业项目来讲,当下AI工具能够大量 节省前期就业、沟通本钱, 对于高校影视教育来讲, 也是很非常好创作训练及独创实行工具,

陈:是,目前AI在视听领域各类探索应用, 大概还无法高速变成传统影视产业重心生产工具, 却是极佳学习传统视听语言工具, 专业影视院 线本科生,在学习摄影、光线、构图等多种镜头技 能过程中,须要掌握各类摄影器材,实行各类实践拍 摄,这其中还会遇到根据场地、硬件等多方面无法 控因素变数,教学任务达成是一個缓慢过程, 而AIGC具备全效,同学们可以在没有丰富摄影器 材情况下,根据视听语言知识点去完成AI生成创 作,并经由创作成果对基石视听语言知识点实行快 速理解与掌握, 显然,一线实践学习至关要紧,但 AIGC方法确实能够大幅度提升学习效能, 这次“视 听语言与AIGC实践”课程刚实行两個多月,很多 同学短片作品非常让人惊喜,在视听语言驾驭、 应用上已经展露很高天赋, 这说明只要在教学过 程中实行足够精准引导、培养,就可以激发同学们 学习视听语言兴致与热情,让他们更快地看到自己 “准成熟”作品问世, 这样正反馈机制,也是激 发数字阶段孩子们创作热情有效教学手段,

另外,伴伴随AI发展,对人教育变得更加 要紧, 郭帆导演提到AI共创很明显特点,就是AI 欺软怕硬、遇强则强属性, 你要有更加清晰独立 琢磨本事,才不会被AI“敷衍”, 具体到影视方面,越 是在视听语言领域专业层次高创作者,越能够创 造出更非常好AIGC作品, 从2023年到今年,AIGC发 展一年时间,经由各类媒体平台AIGC影视作 品,咱们就已经明显地看到这样特点, 甚至很多早 期AIGC创作者依赖信息差,造成过一鸣惊人短暂 假象,但因视听语言根基不牢,对电影质感缺乏 足够理解与审美认知,伴随AIGC创作热潮涌动, 泯然众人大概性也是很大,

另外,视听语言教育与学习,在目力可及 时间范围内,不会因AI技术迭代而被取代,甚 至会更加要紧, 就以Sora样片为例,它们都是经由 Prompt语言驱动完成,只有对视听语言熟稔于心 创作者,才干够轻松驾驭Sora,实行想要镜头、景别、 镜头、质感,也才干变成最非常好AI创作者,

周:当下咱们,任凭是作为创作者、教师、还 是学生,也任凭是否已经做好准备,咱们都将进入 与AI共生共创阶段, 斯坦福HAI研究院院长,被誉 为“AI教母”李飞飞在今年3月发表一個观点: “AI 影响是对人类本质、本事、定义透彻影响, AI 会创作电影,创作供人们娱乐内容, 但只有人,能 利用AI创作触动他人、启发他人或服务他人内容, AI做不到。 ”我個人非常认可这個观点,也谨以此与 各位共勉! 感谢各位参与讨论!

  〔记录整理:孟可〕



很高兴你能耐心的读完我的文章,你一定不想在AI时代错过原创、深挖的消息,请关注DeGao的Twitter,不迷路!

相关资讯