观点:不要让大模型变成一场华丽的烟花秀

访客|
131

作者:肖仰华,系复旦大学教授、上海市数据科学重点实验室主任

来源:

·通用人工智能是人类历史上第一次关于智能本身的革命,是一种元革命,是历次某个技术革命难以比拟的。大模型的诞生宣告了整个人工智能进入全新的重工业时代。

·反观国内大模型产业,从表象上看是热闹非凡、模型林立,但是剥开外壳,从内里看是发展无序与内核空虚,不免让人担忧。大模型产业发展应该极力避免再走大炼钢铁的旧路,需要统一规划,合作协同,立法保障、有序发展、健康发展。

自2022年12月OpenAI发布ChatGPT以来,国内外人工智能产业界掀起了轩然大波,一场以生成式人工智能为核心的通用人工智能产业风暴席卷而来。国内相关研发机构与企业纷纷跟进,投入巨大资源发展类ChatGPT的各种大模型与产品。据不完全统计,在ChatGPT发布后的短短4个月时间里,已经有至少30个国内研发机构与企业在ChatGPT发布之后纷纷推出自己品牌的大模型与相关产品。一时间,整个产业圈热闹纷呈、争先恐后, “类ChatGPT”漫天飞舞,“国内首发”比比皆是,资本市场闻风而动、风起云涌。然而,越是表面热闹,越容易掩盖内里的空虚;越是噱头不断,越需要冷静的思考。热闹景象背后是一系列令人担心的问题,只有不断发现问题、总结问题、解决问题,才有可能保障这个产业健康有序的发展。

作为亲身经历者,我们正在见证着由通用人工智能所带来的前所未有的技术革命。通用人工智能是人类历史上第一次关于智能本身的革命。历次技术突破只是人类智能的产物,而唯独通用人工智能是‘智能’本身的革命。我们有可能在人类历史上首次见证一个全新智能物种的出现,它具备人类水平的智能,甚至有可能超越人类的智能。这样一种关乎智能本身的革命是一种元革命,是历次某个技术革命难以比拟的。我们见证了生成式语言模型,以ChatGPT为代表已经席卷全球,两个月之内,吸引了数亿的用户;我们见证了Midjourney以假乱真的文图生成;我们甚至还见证了谷歌最近发布的PaLM-E,第一个多模态的具身的大规模语言模型,它能够用语言模型操控机械臂并完成复杂的操控任务。机器已经从单纯的模拟人类大脑的智能逐步发展到与身体相结合的智能,这将引发机器智能持续的连锁的革命。如果机器智能仅限于实现人类的大脑,即便是超级大脑,其作用仅限于逻辑世界,起到辅助决策作用,但是一个武装了身体的大脑,就完全具备对物理世界进行肆意改造的可能。出于保障人类安全的考虑,必须足够重视通用人工智能,极力规范与控制其发展。

这一波通用人工智能产业浪潮始发于大规模生成式语言模型,也就是人们常说的大模型。最近几个月,国内人工智能各大厂商纷纷发布自己的大模型,可以说是热点纷呈。以往人类历史重大事件的发生一般会用年、月来作为度量单位,从来没有像今天这样,需要用天为单位记录某个变革事件。这一现象本身就已意味深远,人类社会可能已经经历了未来学家们曾预言过的奇点时刻,回过头来看可能是人类历史发展史上非常重大的历史事件。最近几个月,我们也看到了诸多的产业界巨头纷纷布局自己的大模型战略,可以说“不入局就出局”已经成为人工智能企业发展的基本态势。

大模型的诞生宣告了整个人工智能进入全新的重工业时代。回顾人类历史上的历次技术革命,多始于初始的相对低级的“手工作坊”模式,经过漫长的发展周期,最终形成了成熟的重工业发展模式。比如纺织业,早期的纺织业是典型的家家户户都可以从事的手工作坊模式,为了进一步提高质量与规模,最终演变成为重工业化的生产模式。人工智能产业发展也正在经历这样的模式转变。传统的人工智能产业发展多采取场景与任务特异的研发与产品模式,需要精心的设计、审慎的论证,需要领域定制与客户适配,很难形成通用的产品或平台。但是,伴随着AGI(Artificial General Intelligence,通用人工智能)的发展,使用大模型作为统一底座,再经领域知识注入、任务指令调优、人类价值对齐,就可以形成解决领域中特定任务的求解能力,并具备一定的伦理与价值安全性。这种统一架构、统一范式是人工智能技术规模化的强劲推进器。这样一种新的生产模式完全是一种重工业化的生产模式。我们要花大量的设备、人力、数据去炼制一个重型的装备,这就是起着底座作用的大模型。底座大模型作为智能的通用平台赋能各种各样的应用。

重工业化的人工智能有三个鲜明的特征:大模型、大算力和大数据。

大模型的名称本身表达的就是大规模参数化的模型。作为人工智能最为重要的分支之一,机器学习,旨在让机器模拟人类从经验进行学习的能力,在过去二十多年获得了长足的进步,带动了整个人工智能产业的发展。机器学习经历了从传统统计模型到深度神经网络、从单一学习方式到综合学习方式、从有监督到无监督等一系列转变,最终集中地呈现在从小模型到大模型的演变。为什么模型会越来越大?这本身就是个值得深入思考与严肃回答的问题。20世纪以来,现代科学与人文经历上百年的充分发展之后,变革了人类对于世界的理解,世界图景逐渐从确定性转变为不确定性、认知方式从分析转变为综合、建模范式从线性转变为非线性。这些转变为人工智能、机器学习的进步与发展奠定了必要的思想基础。近十年,数据的充分准备、算力的持续发展,最终为大模型的到来做好了最后的嫁妆。可以说大模型的到来是技术发展的必然。

重工业化的人工智能的第二个鲜明特点是大算力。随着大模型参数量的持续增长,大模型对于算力的需求越来越迫切。算力已经成为大模型玩家的准入门槛,已经成为制约大模型发展的主要瓶颈。如果说模型和数据都是虚拟化、数字化的软资源,那么算力则是实体化、现实性的硬实力。数字世界的发展从本质上来讲是建立在实体世界的基础之上的。实体决定数字是二者的基本关系。数字经济的发展与竞争归根结底将是算力的竞争。算力就是国家竞争力,就是企业竞争力。几乎所有的大模型玩家都缺算力,大家要么在买算力,要么在买算力的路上。大模型行业生态最稳定的赢家必然是算力供应方。夯实算力基础,实现算力自主可控,具有全局战略意义。

重工业化的人工智能的第三个鲜明特点是大数据。大模型需要数据作为原料。过去的大数据时代为大模型的发展奠定了必要的数据基础。大数据时代的发展为人工智能时代大模型的炼制准备了充分的炼制原料。大模型也成为了大数据价值变现的重要方式之一。传统的数据挖掘与分析方法需要极大的专家成本,需要专家标注样本、设计特征、构建模型、评测评价,才能捕捉大数据的统计规律、构建有效的预测模型,进而实现数据驱动的价值变现。很多甲方客户不单单要出资,还需要积极投入巨大精力输入行业知识。可以说传统大数据的价值变现之路是艰难的,是成本高昂的。而今天,大模型无疑成为了大数据价值变现最有效的方式之一,使得用户不再需要重度参与就能享受技术价值。躺在若干服务器上“沉睡”的大数据,经过必要的清洗与加工就可丢进大模型的冶炼炉里。最终通过炼制出的大模型实现行业统一赋能。大模型为大数据的价值变现趟出了一条“端到端”(无人干预,至少是无客户干预)的道路,加快了大数据的价值变现进程,为大数据价值变现提供了一条新路径。基于大模型的大数据价值变现给我国数字化转型带来全新契机。

除了以上这三个特征或者要素之外,我想强调第四个十分重要但是还未引起足够重视的因素,那就是工艺过程。工艺过程是所有重工业发展的至关重要的因素之一。传统的制造业给过我们很多有益的启发。我国是制造业大国,但在某些领域我们的制造水平仍然有限,限制其发展水平的往往不是原料、不是设备,而是工艺过程。也就是说,相同的生产原料与设备,经过不同的工艺过程会得到不同质量的产品。重工业的高质量发展离不开先进工艺。当前我国大模型产业发展在数据方面是有优势的,在算力方面是有基础的,在模型方面也不存在什么秘密,唯独大模型炼制的先进工艺过程是我们所缺乏的,是短期之内难以跟上或者超越的,是需要付出巨大代价进行摸索的。几乎所有核心部件的关键工艺过程,比如芯片封装,企业都是束之高阁视作最高机密。企业的核心竞争力往往就是成熟的、先进的工艺过程。OpenAI真正秘而不宣的核心关键就是它的工艺过程,包括数据配方、数据清洗、参数设置、流程设计、质量控制等等,从根本上决定了大模型的效果。所以任何重工业,包括人工智能,一旦进入重工业模式,都要尤为关注其工艺过程。