2024年04月29日 星期一
Sora已来,文学如何面对人工智能时代的“风口”?
来源:中国作家网 | 作者:徐健 康春华  时间: 2024-03-13

日前,由美国人工智能实验室Open AI推出的文生视频模型Sora引发全球广泛热议。只要用户给定一段描述文字或者静态图片,Sora就能生成包含多个角色、不同类型动作和背景细节的高清短视频场景,而且视频时长可达60秒。从官方陆续发布的视频样片来看,许多画面精细而逼真,不输电影大片质感。

Sora的诞生不仅被视为文生视频领域的技术突破,也被认为是人工智能(AI)迈向“世界模型”的关键一步,启发人类探索迈向通用人工智能(AGI)的道路。人类文明历经千万年的发展,人文艺术、文学创作高度依托于人类的语言、文字、图像等符号载体。但如今,从人工智能聊天机器ChatGPT,到将文本进行可视化的视频模型Sora,人工智能在快速迭代中完成对漫长人类历史中的符号、语言体系的数据化压缩、理解及深度模仿,继而显示出可能存在的“创造性”。Sora真的能理解世界并以艺术的方式展现世界吗?媒介变革日益影响文艺创作的当下,人类应该如何想象未来的人文艺术发展?围绕相关话题,本报记者采访了来自科技界、传媒影视界、文学创作和人文学界的相关人士,以期从不同角度探索人工智能时代的“风口”之下,文学何为。

虚拟与现实之间的“融合共生”

潜水员潜入深海探索沉船,与鹦鹉并肩飞翔的高空跳伞男子,高速行驶的F1赛车手视角,还有夕阳下漫步沙滩的乌龟,孤独行走在街头的武士……在48个视频引发全球性关注之后,Sora团队又推出了最新一批视频样片。从这些作品来看,无论是光影色彩的自然转变,还是多角度分镜头的切换,甚至物理世界中细微纹理的变化和主人公内心情感的表达,Sora都能根据指令,自如变换视角与焦距、长宽比和清晰度,呈现一段段“以假乱真”的视频影像。普通观众也能直观感受到,Sora不仅能准确理解文本指令的含义,而且似乎已经能准确理解事物在物理世界中存在的方式。

事实果真如此吗?中国科学院自动化研究所研究员曾毅认为,Sora只是相对充分地利用了数据和数据之间的关联,对物理世界进行映射和呈现,生成具有高度真实感的视觉数据。这并不是真正意义上对物理世界和物理意义的理解,但这种映射足以让用户产生震撼的感受。在电影《流浪地球》制片人、编剧龚格尔看来,Sora只是基于物理学合理性现象的二次概率总结,如同电影是一种对人类世界的虚拟,生成式人工智能(AIGC)则是对这种虚拟的再虚拟,其核心追求依然是拟人化的。

让机器像人类一样理解世界的运转逻辑,继而对世界形成完整清晰的认知,曾经是许多科幻作家笔下的“幻梦”,而今似乎在快速变为现实。有科技人士指出,Sora通过对现实世界的学习,开始模拟人类来观察世界、描绘世界和表现世界。倘若有了足够的数据和算力,Sora会进一步理解现实世界的物理逻辑与因果关系。中国作协科幻文学委员会副主任、科幻作家韩松谈到,一直以来,科幻作家都在设想有一种更高级的智能生命,超越人类的存在,能够根据现有世界的物理规律来模拟世界,甚至打破现实规律,重新创造出新的世界。韩松表示,当前Sora技术还停留在二维的视觉方面,今后可能会以更加复杂和综合的方式把现实世界的一切呈现出来。从元宇宙、ChatGPT到Sora,这预示着人类科技革命又到了一个爆发的前沿,“我们不能只跟在这些科技热点后面讨论微观的东西,我们需要有独创性的创新举措。如果不抓住这个契机,我们将会在新一轮科技革命中远远落伍”。

生成式人工智能逐渐打破了真实和虚拟之间的边界。对此,南京大学文学院教授赵宪章表示,Sora目前制作的影像几乎达到真假难辨的程度,相信伴随技术的提高它会越来越逼真。不过,代替人类进行“语图互转”并不意味着打破符号之间的壁垒,恰恰意味着语言和图片是两种完全不同的符号体系,这种“互转”带给人观看世界的多种面向、多种感受和思考。在复旦大学中文系教授严锋看来,从远古的岩洞壁画开始,人类就开启了一个虚拟化的进程。对于现实世界,文学、绘画、戏剧、电影等构成人类的虚拟宇宙。伴随科技的发展,现实与虚拟之间的界限在逐渐打破,并且日益融合。生成式人工智能代表着虚拟化进程的一个新阶段,将促使人类重新思考文学、艺术和思想文化的价值。

在世界与AI相互重塑中,打开更多可能性

从ChatGPT到Sora,生成式人工智能在文本、图片、音频、视频之间的多模态切换以及相互生成的模式,被认为是最接近人类获取知识的方式。AI介入创作,让新的内容主体产生,每个人都可以用AIGC生成需要的内容,为世界提供更丰富的艺术作品。近日,博主“AI疯人院”发布了AI技术生成的长达3分56秒的《西游记》片段,通过AI生成展现了《西游记》混沌初开、石猴出世、拜师学艺等情节,画风大气磅礴。据了解,创作者先利用ChatGPT分析原著完成分镜规划,再利用AI绘图,继而使用文生视频技术完成动画,在一周时间里完成了原本需要花费半年进行人工渲染的内容。

AI也将赋予影视艺术创作更多可能性,在AI技术的加持下,文艺创作或许将拥有新的“打开”方式。2月23日,中国首部文生视频AI系列动画片《千秋诗颂》启播。它运用AI技术将国家统编版教材里的200余首诗词转化制作成唯美的国风动画,将中华古典诗词的神韵与现代视听艺术相融合,沉浸式再现诗词中的家国情怀与人间真情。清华大学新闻与传播学院教授沈阳表示,Sora运用精确与否,主要是基于用户的提示文本,因此起到决定性作用的还是“人”,其工具属性没有改变,它实现的是影视筹备流程中“概念呈现的自动化”。Sora能让有想法的人将创意视觉化,以更低的成本制作影视产品,解放更多创作者的生产力和创造性。

相较于传统“完形填空”式的技术发展,ChatGPT和Sora能实现“作文续写”,也就有了更优秀的创作能力。通过大数据的深度学习来模仿“人的创造力”,人工智能将来有一天是否会真正拥有创造力?“奇点”将在何时降临?福建社会科学院研究员南帆谈到,人类历史上有过许多伟大的发明。只要这些发明停留在工具范畴,愈是高端的发明,愈是会给人类造福,科技产品的强大功能不会主动危及人类。但是,人工智能会不会形成自己的“类”意识,这是许多科学家的担忧之处。人类的“类”意识如何出现,也是一个尚待揭秘的问题。“人类自身也不知道人工智能会不会出现相似的机制,产生相似的后果。尽管目前还没有突变的迹象,人工智能各种演变的速度已远远超出人们的预料。”

“当前的人工智能充其量是一种人类智力的综合与有限的增长。基于人类提供的材料,特别是语言材料,人工智能组织起一个自己的认知世界。”南方科技大学科学与人类想象力研究中心主任吴岩分析认为,从心理学角度看,智力跟驱动力、自我意识、情感、个性等是完全不同的心理活动。“我们应该庆幸当前的人工智能仅仅是一个智力高超的‘同事’。必须警惕的是科学工作者对机器本身的驱动力、自我意识、情感和个性方面的追求,这些追求才是把人类送到不稳定状态的真正祸根。换言之,对机器的‘全人培养’,是一条人类与机器关系的红线。‘全人培养’也是葬送人类命运的最终关口。”

人工智能学习人类的创造性,反过来也在对人类本身施加影响。在作家小白看来,Sora依然遵循的是Open AI大量数据、大模型和大量算力的理论逻辑。如果超级智能的诞生真是按照“更大更多”的路线,即便大模型能像人类一样思考、遵循人类的伦理,它也将深刻地改变人类社会。“GPT和Sora学习海量数据的过程,也是地球和人类数据不断被大模型吞食和处理的过程。世界不仅向AI提供数据,世界也在被AI生成的数据重塑,我们正在不知不觉与它对齐。”他同时也提醒到,艺术本质上具有表演性,作家与读者之间、创作者与观众之间,有一些神秘的具身“数据”交互是机器无法学习的。如果人类把GPT当作创作辅助工具,让它帮助阅读分析文献,生成学习提纲,搜索相关资料,“假以时日,人类写作的疆域总有一天会被圈禁在大模型画定的地图上”。

“未来的文学生产和消费模式会发生很大变化,由作家、出版商、传媒商构成的单向意义输出模式会遭遇挑战,消费者在人工智能的不断升级中会变成随机而匿名的意义创造者。”《散文》主编汪惠仁从人工智能与大众文化消费的角度谈到,人类文化消费的实用化与游戏化是大趋势。但这也意味着,确实存在着特别的、挑剔性的文艺消费,在这一消费模式下,关于人的文学的种种理想还继续存留,仍然具有重要价值,“毕竟运算程序与肉身是无法等同的,幻境如何逼真,也不等同于实境”。中国科普作协科学与影视融合专委会常务副主任林育智认为:“生成式人工智能的艺术创作提示我们,未来人类的艺术生活将与科技高度相关:要么是充满科学先进性的艺术,要么是充满艺术气息的科技产品。”

探索边界,展开对话

人工智能文学创作日益成为常态。从2017年“微软小冰”推出原创诗集《阳光失了玻璃窗》到2023年人机共创荣获文学大奖,AI参与写作的方式正在变得日常化和多样化。2023年10月,由人工智能对话提示创作、从生成字符里摘取而成的小说《机忆之地》获得第五届江苏青年科普科幻作品大赛二等奖;2024年初,第170届日本芥川奖获奖作品《东京都同情塔》被作者透露是利用AI辅助写作而成的,“小说中有5%的句子是从ChatGPT生成的句子中‘逐字引用’的”。对于人工智能文学创作的可能性与未来方向,青年科幻作家慕明说,作为创作者,她感兴趣的是想象力在不同媒介之间的转化,“在使用图片生成AI的过程中,我常常对小说中的场景有新的理解,乃至发现了小说可能具有的新层次。对我而言,这是生成式AI的最大价值所在。”她谈到,现阶段来看,无论是预制的定制化应用,还是作者自己训练的GPT,都无法替代作家本人。在“人机共创”实验探索方面走得很远的科幻作家陈楸帆认为,人机共创能够使用更多数据,研发出更智能的算法。但更大的意义在于探索边界,展开对话,实现人与机器思想的碰撞与流动。

伴随人工智能的高速发展,内容创作的主体认定、数据库来源、著作权保护等相关问题,正越来越受到人工智能治理领域的重视。为了促进生成式人工智能健康发展和规范应用,2023年7月,国家网信办等七部门联合印发《生成式人工智能服务管理暂行办法》,鼓励生成式人工智能技术在各行业、各领域的创新应用,生成积极健康、向上向善的优质内容,探索优化应用场景,构建应用生态体系。对于人工智能创作带来的隐忧,《人民文学》副主编徐则臣表示,是否让AI参与文学创作并非问题的关键。关键在于人机结合的写作中,创作主体性如何界定,AI的基础数据库从哪里来,是否合法合规、合乎伦理。

从远古的岩洞壁画、口耳相传的民族史诗到传诸后世的精妙小说,人类用梦境、口语、文字、图片表现自己眼中和心中的世界。文学也将千百年间的瑰丽想象、深沉哲思从口语时代、印刷时代传递到电子时代、互联网时代。人工智能的时代浪潮,让科技发展对人类思维、语言和文化而言如同一把锋利的“双刃剑”。文学如何护佑并表征人类永恒的创造力?也许如ChatGPT在被问及“人工智能将对人类产生怎样的冲击”时所回答的:“要做的事是适应变化”。