出品|搜狐科技
作者|杨锦
在大模型的热闹之外,朱松纯不惧做一个少数派。
他认为,科学本质是用简约的模型解释复杂的现象,比如杨振宁、爱因斯坦这些科学家,他们构建世界的模型里可能只有一两个参数。而今天的大模型,动辄百亿甚至千亿级的参数,还不可解释,“从这个角度看,确实是非常丑陋的。”
但他也承认,从工程的角度来讲,大模型又能够在某些方面产生比较好的结果。
他和北京通用人工智能研究院(通研院)及北大几位老师最新合编的图书《通用人工智能标准、评级、测试与架构》,针对通用人工智能提出了系统的标准、评级、测试与架构体系,对大模型也适用。
什么是智能?怎么样才算是通用了?在这套评测体系下,智能体不仅要完成任务,还需要自主定义任务,这意味着,智能体没办法像在其他评测体系上一样“刷榜”。
过去20年,刷榜像附着在人工智能发展史上的藤壶,他本人也曾长时间地站在数据驱动和刷榜的一线。2004年,朱松纯和另一位全球计算机领域顶级科学家沈向洋,在他的湖北家乡创建了莲花山研究院,是最早规模性地做大数据标注的机构。
刷榜是针对性地做端到端训练,而通用泛化的任务,是一个无穷的任务,比如训练机器人学会抓杯子,这很快,但问题是,稍微换个位置、改个重量、变个尺寸,它又不认识了。
打掉无数个榜单之后,他开始觉得,这是一个“任务陷阱”。这个路,可能是走不通的。
朱松纯目前担任北京通用人工智能研究院院长,北京大学人工智能研究院、智能学院院长。
作为国际知名的计算机专家、统计与应用数学家、人工智能专家,朱松纯曾在国际顶级期刊和会议上发表论文300多篇,解决了“什么是纹理”的底层科学问题。又分别在31岁、35岁和39岁的时候,三次问鼎计算机视觉领域最具声望的马尔奖。
一个登过顶的人,在遍览众山小后,从山上走了下来,不再爬山、更不想爬树。他想登月了。
2017年,朱松纯提出了“小数据、大任务”范式,核心是“给机器立心”,让智能体可以自主性地构建物理的感知,因为这是在数据中看不见的。
在这个理论体系下,通研院训练出了由价值、因果驱动的智能体“通通”,只用了10张显卡。整个通研院,也只有一两百张卡。
到今年,“通通”的智商和情商相当于一个五岁左右的小女孩,能够在一定程度上理解周围环境,有自己的个性,会耍赖、撒谎。
来源于《通用人工智能标准、评级、测试与架构》
相比之下,在一些测试中,大模型能通过人类司法考试,在数学、编程、法律等学科的表现接近人类博士平均分,在医学考试中的正确率能够超过大多数医学博士考生,看起来似乎厉害多了。
但朱松纯认为,AI会解几何题、能打螺丝,这些是专业能力,不是通用、泛化的能力。做出来的答案,可能是蒙的,也可能是刷题或者死记硬背的。有着认知架构的通用智能体,可能现在幼稚,却有自主性和成长性。
他一再呼吁,中国要形成自己的AI叙事,不能一味地跟随硅谷的模式,堆算力、堆数据,要找到一条自己的路线,做原创性的研究。
“我们要非常严肃认真地对待通用人工智能的问题,它不是一个只是炒作的热点话题。真正的通用人工智能还没有起来,还需要接着投入,这是真正关乎到我们国运的选择。”
以下为对话精编:
搜狐科技:注意到您对大模型的态度似乎有一些变化。之前在杨振宁先生百年诞辰活动上,您曾说大模型是非常丑陋的,很难通向AGI,但是您最新主编的这本通用人工智能的测试标准书,把大模型也覆盖进来了,另外通研院也开始在大模型上构建通用智能体的认知和决策体系,这个转变的契机是什么?
朱松纯:当时是谈科学的美,因为对于科学的美来说,整个理性的科学从20世纪黄金和白银时期,你看杨振宁、爱因斯坦这些人,他们构建世界的模型里面可能就只有一两个参数,咱们现在的模型可能几十亿甚至上千亿个参数。
物理模型要解释那么复杂的现象,它只有几个参数或者一个参数,从科学的角度来讲,大道至简,用越简约的模型来解释越来越复杂的现象,这是科学的本质。
大模型不光参数太大,还解释不清楚。搞深度学习的人都不清楚那个模型里面到底是个啥东西,没人能解释,Transformer这里面的表达也是完全无法解释的,所以从这个意义上讲,它肯定是很丑陋的。
但是从工程的角度来讲,它又能够产生比较好的结果,这一点我们不能不承认。
搜狐科技:为什么要把大模型纳为评测目标?目前中美头部大模型的测试结果怎么样?
朱松纯:肯定是要把它作为其中的一种智能系统,因为我们要把所有(种类)智能体都要放进来测,有的是它能够刷一个功能,有的刷很多功能。有的没有具身,我们就给它配个目前最好的身体给它测,从测出来的结果来看,效果确实是不太好的。
搜狐科技:您之前提得比较多的是UV函数,然后您今天讲CUV,这个C是指什么?
朱松纯:就是它的认知架构,它脑袋的复杂度有多大。比如说有一个图像,每个人看的东西都不一样是吧?假设我把人所有能看到的东西综合起来,那就是人的认知的极限了,有可能未来机器看到的比所有的人看到的还多。
这就是C,认知架构,它的英语是“Cognitive Architecture”。我们说C的进化,就是指它能够看到越来越多的节点了。
搜狐科技:对我们小数据、大任务的范式,外界似乎也有一些质疑。
朱松纯:有人说,是不是因为科学的方式在转换,你们是不是掉队了?也有人说你们是不是思想保守?如果数据是一个表层的现象,它是被里面的一些核心的诉求所驱动的怎么说话、怎么做事呢,如果你去拟合表层的东西,你就要很多参数,因为你是去拟合很高维的空间,但是如果你搞清楚了它底层的诉求,你就可以解释很多现象。
这就是我们说的要追求一个简化的模型,这也是为什么我们提CUV架构,我们还是希望不断地追求美和简约。
搜狐科技:您听到这种声音会生气吗?
朱松纯:根本就不需要生气,每个人的出发点都不一样,大部分对这个东西质疑的人,就是属于那种做实验刷榜刷惯的人。
我们刷榜刷了20年了,在20年过程中,已经形成了一个思维定势和习惯。就是说你给我拿一个代码,在哪个数据上让我测一下,试一下能不能work,这就是一种典型的思维。我就感觉很好笑。