讲座回顾
2024年11月21日,由上海戏剧学院戏剧文学系主办的“AI与艺术”系列讲座之《从大语言模型到智能体协作》顺利在上海戏剧学院华山路仞之楼207教室开设。本次讲座为浙江大学计算机科学与技术学院副教授、博导、人工智能系主任、国家优秀青年科学基金获得者杨洋担任主讲人,由上海戏剧学院戏文系易杰副教授主持。
本次讲座聚焦于大语言模型与智能体协作的发展脉络及最新成果,为戏剧影视领域与AI的结合提供了新的思路和技术支持。
一、铺天盖地的概念们(人工智能、机器学习、深度学习、大模型、ChatGPT)之间的联系
杨洋教授首先向大家厘清了诸多概念。随着人工智能的发展,大语言模型已成为推动技术变革的核心力量。人工智能的目标是赋予机器以智能,使其能够执行传统上需要人类智慧完成的任务。从窄人工智能到通用人工智能的演进,标志着技术能力的不断提升。以图灵测试为起点,人类设想智能机器能够在人机交互中展现与人类相似的智慧。而通过机器学习和深度学习,人工智能得以利用大规模数据提取特征、建立复杂函数,最终实现了从单一任务的分类与预测到多任务通用生成的飞跃,这为大语言模型的诞生奠定了基础。
二、大语言模型:单词接龙背后的预训练-微调范式革新
杨洋教授就大语言模型的产生及优化进行了详尽阐述:大语言模型的崛起得益于预训练-微调范式,它通过无标注数据的广泛学习,结合具体任务的精细调整,实现了跨领域的知识迁移和任务泛化能力。然而,这一技术也面临挑战:模型可能会生成虚假的信息(幻觉)、存在知识更新的局限性(过时性),以及因数据来源产生的文化或社会偏见。为了解决这些问题,检索增强生成(RAG)成为关键技术,它通过外部数据库实时补充知识,不仅提升了模型的准确性,还增强了用户交互的可解释性。
三、如何将大语言模型适配到自己的场景
接下来,杨洋教授深入介绍了如何从实践层面运用大语言模型:其适配核心在于通过提示工程(Prompt Engineering)优化输入内容,从而引导模型生成符合预期的结果。思维链(Chain-of-Thought,COT)也是一种关键的推理策略,适用于复杂决策和多步骤任务。通过在提示中显式加入推理过程的逐步描述,模型能够基于上下文逐步生成逻辑清晰、准确的答案。这种“逐步推理”能够显著改善模型在逻辑分析等领域的性能。
四、如何打造属于自己的智能体
此外,杨洋教授还补充了如何打造智能体。首先,数据构建是智能体开发的基础,通过收集与目标任务相关的大规模高质量数据(如标注数据、合成数据等)为训练提供支持,并结合开放式和封闭式问题的生成方法优化数据多样性。其次,沙盒环境用于测试和优化智能体的行为,通过在安全的模拟环境中运行代码或指令,验证生成结果是否满足预期,并为进一步改进提供反馈。最后,指令微调通过对预训练模型进行领域任务的精细调整,使其更加贴合具体应用需求。结合反馈机制,智能体可以不断优化推理能力,实现对复杂场景的高效适配。这一流程为智能体从通用模型到定制化应用的转化提供了完整路径。
五、智能体之间的相互协作
杨洋教授也提到,在解决复杂场景问题时,单一模型的能力往往不足,这就需要跨模型协作的支持。此外,专家协作机制通过为任务分配特定领域模型也能提升效率和精度。这种协作机制使多个模型无缝合作,同时对用户保持透明,为复杂领域的智能解决方案提供了新的思路。
在讲座的末尾,业界的诸多前辈都对戏剧与影视领域中的大语言模型及智能体协作的运用表现出了强烈兴趣,提出了现阶段的不足之处以及对未来的期许。相信随着模型能力的持续优化,大语言模型和智能体协作将在从创意孵化到后期制作的全流程中扮演重要角色,推动戏剧与影视产业进入更加高效、创意无限的智能化时代。
文、图:陈思源
排版:尤旬
审核:沈亮 陈莹