Sora已来，文学如何面对人工智能时代的“风口”？

首页>文坛时空

来源：中国作家网　|　作者：徐健康春华　　时间： 2024-03-13

日前，由美国人工智能实验室Open AI推出的文生视频模型Sora引发全球广泛热议。只要用户给定一段描述文字或者静态图片，Sora就能生成包含多个角色、不同类型动作和背景细节的高清短视频场景，而且视频时长可达60秒。从官方陆续发布的视频样片来看，许多画面精细而逼真，不输电影大片质感。

Sora的诞生不仅被视为文生视频领域的技术突破，也被认为是人工智能（AI）迈向“世界模型”的关键一步，启发人类探索迈向通用人工智能（AGI）的道路。人类文明历经千万年的发展，人文艺术、文学创作高度依托于人类的语言、文字、图像等符号载体。但如今，从人工智能聊天机器ChatGPT，到将文本进行可视化的视频模型Sora，人工智能在快速迭代中完成对漫长人类历史中的符号、语言体系的数据化压缩、理解及深度模仿，继而显示出可能存在的“创造性”。Sora真的能理解世界并以艺术的方式展现世界吗？媒介变革日益影响文艺创作的当下，人类应该如何想象未来的人文艺术发展？围绕相关话题，本报记者采访了来自科技界、传媒影视界、文学创作和人文学界的相关人士，以期从不同角度探索人工智能时代的“风口”之下，文学何为。

虚拟与现实之间的“融合共生”

潜水员潜入深海探索沉船，与鹦鹉并肩飞翔的高空跳伞男子，高速行驶的F1赛车手视角，还有夕阳下漫步沙滩的乌龟，孤独行走在街头的武士……在48个视频引发全球性关注之后，Sora团队又推出了最新一批视频样片。从这些作品来看，无论是光影色彩的自然转变，还是多角度分镜头的切换，甚至物理世界中细微纹理的变化和主人公内心情感的表达，Sora都能根据指令，自如变换视角与焦距、长宽比和清晰度，呈现一段段“以假乱真”的视频影像。普通观众也能直观感受到，Sora不仅能准确理解文本指令的含义，而且似乎已经能准确理解事物在物理世界中存在的方式。

事实果真如此吗？中国科学院自动化研究所研究员曾毅认为，Sora只是相对充分地利用了数据和数据之间的关联，对物理世界进行映射和呈现，生成具有高度真实感的视觉数据。这并不是真正意义上对物理世界和物理意义的理解，但这种映射足以让用户产生震撼的感受。在电影《流浪地球》制片人、编剧龚格尔看来，Sora只是基于物理学合理性现象的二次概率总结，如同电影是一种对人类世界的虚拟，生成式人工智能（AIGC）则是对这种虚拟的再虚拟，其核心追求依然是拟人化的。

让机器像人类一样理解世界的运转逻辑，继而对世界形成完整清晰的认知，曾经是许多科幻作家笔下的“幻梦”，而今似乎在快速变为现实。有科技人士指出，Sora通过对现实世界的学习，开始模拟人类来观察世界、描绘世界和表现世界。倘若有了足够的数据和算力，Sora会进一步理解现实世界的物理逻辑与因果关系。中国作协科幻文学委员会副主任、科幻作家韩松谈到，一直以来，科幻作家都在设想有一种更高级的智能生命，超越人类的存在，能够根据现有世界的物理规律来模拟世界，甚至打破现实规律，重新创造出新的世界。韩松表示，当前Sora技术还停留在二维的视觉方面，今后可能会以更加复杂和综合的方式把现实世界的一切呈现出来。从元宇宙、ChatGPT到Sora，这预示着人类科技革命又到了一个爆发的前沿，“我们不能只跟在这些科技热点后面讨论微观的东西，我们需要有独创性的创新举措。如果不抓住这个契机，我们将会在新一轮科技革命中远远落伍”。

生成式人工智能逐渐打破了真实和虚拟之间的边界。对此，南京大学文学院教授赵宪章表示，Sora目前制作的影像几乎达到真假难辨的程度，相信伴随技术的提高它会越来越逼真。不过，代替人类进行“语图互转”并不意味着打破符号之间的壁垒，恰恰意味着语言和图片是两种完全不同的符号体系，这种“互转”带给人观看世界的多种面向、多种感受和思考。在复旦大学中文系教授严锋看来，从远古的岩洞壁画开始，人类就开启了一个虚拟化的进程。对于现实世界，文学、绘画、戏剧、电影等构成人类的虚拟宇宙。伴随科技的发展，现实与虚拟之间的界限在逐渐打破，并且日益融合。生成式人工智能代表着虚拟化进程的一个新阶段，将促使人类重新思考文学、艺术和思想文化的价值。

在世界与AI相互重塑中，打开更多可能性

从ChatGPT到Sora，生成式人工智能在文本、图片、音频、视频之间的多模态切换以及相互生成的模式，被认为是最接近人类获取知识的方式。AI介入创作，让新的内容主体产生，每个人都可以用AIGC生成需要的内容，为世界提供更丰富的艺术作品。近日，博主“AI疯人院”发布了AI技术生成的长达3分56秒的《西游记》片段，通过AI生成展现了《西游记》混沌初开、石猴出世、拜师学艺等情节，画风大气磅礴。据了解，创作者先利用ChatGPT分析原著完成分镜规划，再利用AI绘图，继而使用文生视频技术完成动画，在一周时间里完成了原本需要花费半年进行人工渲染的内容。

AI也将赋予影视艺术创作更多可能性，在AI技术的加持下，文艺创作或许将拥有新的“打开”方式。2月23日，中国首部文生视频AI系列动画片《千秋诗颂》启播。它运用AI技术将国家统编版教材里的200余首诗词转化制作成唯美的国风动画，将中华古典诗词的神韵与现代视听艺术相融合，沉浸式再现诗词中的家国情怀与人间真情。清华大学新闻与传播学院教授沈阳表示，Sora运用精确与否，主要是基于用户的提示文本，因此起到决定性作用的还是“人”，其工具属性没有改变，它实现的是影视筹备流程中“概念呈现的自动化”。Sora能让有想法的人将创意视觉化，以更低的成本制作影视产品，解放更多创作者的生产力和创造性。

相较于传统“完形填空”式的技术发展，ChatGPT和Sora能实现“作文续写”，也就有了更优秀的创作能力。通过大数据的深度学习来模仿“人的创造力”，人工智能将来有一天是否会真正拥有创造力？“奇点”将在何时降临？福建社会科学院研究员南帆谈到，人类历史上有过许多伟大的发明。只要这些发明停留在工具范畴，愈是高端的发明，愈是会给人类造福，科技产品的强大功能不会主动危及人类。但是，人工智能会不会形成自己的“类”意识，这是许多科学家的担忧之处。人类的“类”意识如何出现，也是一个尚待揭秘的问题。“人类自身也不知道人工智能会不会出现相似的机制，产生相似的后果。尽管目前还没有突变的迹象，人工智能各种演变的速度已远远超出人们的预料。”

“当前的人工智能充其量是一种人类智力的综合与有限的增长。基于人类提供的材料，特别是语言材料，人工智能组织起一个自己的认知世界。”南方科技大学科学与人类想象力研究中心主任吴岩分析认为，从心理学角度看，智力跟驱动力、自我意识、情感、个性等是完全不同的心理活动。“我们应该庆幸当前的人工智能仅仅是一个智力高超的‘同事’。必须警惕的是科学工作者对机器本身的驱动力、自我意识、情感和个性方面的追求，这些追求才是把人类送到不稳定状态的真正祸根。换言之，对机器的‘全人培养’，是一条人类与机器关系的红线。‘全人培养’也是葬送人类命运的最终关口。”

人工智能学习人类的创造性，反过来也在对人类本身施加影响。在作家小白看来，Sora依然遵循的是Open AI大量数据、大模型和大量算力的理论逻辑。如果超级智能的诞生真是按照“更大更多”的路线，即便大模型能像人类一样思考、遵循人类的伦理，它也将深刻地改变人类社会。“GPT和Sora学习海量数据的过程，也是地球和人类数据不断被大模型吞食和处理的过程。世界不仅向AI提供数据，世界也在被AI生成的数据重塑，我们正在不知不觉与它对齐。”他同时也提醒到，艺术本质上具有表演性，作家与读者之间、创作者与观众之间，有一些神秘的具身“数据”交互是机器无法学习的。如果人类把GPT当作创作辅助工具，让它帮助阅读分析文献，生成学习提纲，搜索相关资料，“假以时日，人类写作的疆域总有一天会被圈禁在大模型画定的地图上”。

“未来的文学生产和消费模式会发生很大变化，由作家、出版商、传媒商构成的单向意义输出模式会遭遇挑战，消费者在人工智能的不断升级中会变成随机而匿名的意义创造者。”《散文》主编汪惠仁从人工智能与大众文化消费的角度谈到，人类文化消费的实用化与游戏化是大趋势。但这也意味着，确实存在着特别的、挑剔性的文艺消费，在这一消费模式下，关于人的文学的种种理想还继续存留，仍然具有重要价值，“毕竟运算程序与肉身是无法等同的，幻境如何逼真，也不等同于实境”。中国科普作协科学与影视融合专委会常务副主任林育智认为：“生成式人工智能的艺术创作提示我们，未来人类的艺术生活将与科技高度相关：要么是充满科学先进性的艺术，要么是充满艺术气息的科技产品。”

探索边界，展开对话

人工智能文学创作日益成为常态。从2017年“微软小冰”推出原创诗集《阳光失了玻璃窗》到2023年人机共创荣获文学大奖，AI参与写作的方式正在变得日常化和多样化。2023年10月，由人工智能对话提示创作、从生成字符里摘取而成的小说《机忆之地》获得第五届江苏青年科普科幻作品大赛二等奖；2024年初，第170届日本芥川奖获奖作品《东京都同情塔》被作者透露是利用AI辅助写作而成的，“小说中有5%的句子是从ChatGPT生成的句子中‘逐字引用’的”。对于人工智能文学创作的可能性与未来方向，青年科幻作家慕明说，作为创作者，她感兴趣的是想象力在不同媒介之间的转化，“在使用图片生成AI的过程中，我常常对小说中的场景有新的理解，乃至发现了小说可能具有的新层次。对我而言，这是生成式AI的最大价值所在。”她谈到，现阶段来看，无论是预制的定制化应用，还是作者自己训练的GPT，都无法替代作家本人。在“人机共创”实验探索方面走得很远的科幻作家陈楸帆认为，人机共创能够使用更多数据，研发出更智能的算法。但更大的意义在于探索边界，展开对话，实现人与机器思想的碰撞与流动。

伴随人工智能的高速发展，内容创作的主体认定、数据库来源、著作权保护等相关问题，正越来越受到人工智能治理领域的重视。为了促进生成式人工智能健康发展和规范应用，2023年7月，国家网信办等七部门联合印发《生成式人工智能服务管理暂行办法》，鼓励生成式人工智能技术在各行业、各领域的创新应用，生成积极健康、向上向善的优质内容，探索优化应用场景，构建应用生态体系。对于人工智能创作带来的隐忧，《人民文学》副主编徐则臣表示，是否让AI参与文学创作并非问题的关键。关键在于人机结合的写作中，创作主体性如何界定，AI的基础数据库从哪里来，是否合法合规、合乎伦理。

从远古的岩洞壁画、口耳相传的民族史诗到传诸后世的精妙小说，人类用梦境、口语、文字、图片表现自己眼中和心中的世界。文学也将千百年间的瑰丽想象、深沉哲思从口语时代、印刷时代传递到电子时代、互联网时代。人工智能的时代浪潮，让科技发展对人类思维、语言和文化而言如同一把锋利的“双刃剑”。文学如何护佑并表征人类永恒的创造力？也许如ChatGPT在被问及“人工智能将对人类产生怎样的冲击”时所回答的：“要做的事是适应变化”。