但终点在哪,他恐怕想不到。
“你现在做的东西,”
顾屿收回目光,看向任少卿,
“在2013年是对的。但沿这条路走下去,十年后,你会碰到一堵墙。”
“什么墙?”
“规模的边际效益递减。”
顾屿顿了顿,把那套逻辑往更通俗的地方压,
“堆到某个临界点之后,你的收益增速会垮,但成本会疯涨。到那时候,别的大厂为了训练一个更好的模型直接烧掉几千万甚至一亿美金,你哪怕卖肾也跟不起。真正的破局,不在更大,在更聪明地用更少。”
“具体怎么做?”
任少卿的语气已经完全变了。
“让模型只用它需要用的那部分脑子去思考,别把整个网络都喊起来处理一个简单问题。”
顾屿把手从大裤衩的口袋里抽出来,随手在空中画了个圈,用极具画面感的网梗语气说道:
“打个比方,你现在开了一家号称能做全宇宙所有菜的饭店。但你现在的架构逻辑是,哪怕顾客只进来点一盘最普通的醋溜土豆丝,你也会把后厨几万个米其林顶级主厨全叫醒,让他们排着长队来切土豆。这叫什么?这叫大炮轰蚊子,纯纯的‘傻大款’式的大力出奇迹,非常浪费。”
任少卿微微一愣,这个大白话比喻糙是糙了点,却像一把锋利的手术刀,一刀精准地剖开了他模型里最大的那个病灶。
顾屿看着他:
“而我想让你做的真正神级架构,是懂得分工的‘混合专家机制’。系统接到点单,自动评估难度。是土豆丝,就只唤醒底层的小神经元去当切菜工;是满汉全席,才全面激活庞大的主网络。用最小的算力功耗,跑出最极限的效率。”
“同时,让它学会自己推理,而不只是学会背答案。让它像有常识的人类一样自己去验证、纠错,而不是靠你每天拿海量的人工标注喂它吃现成的结果。”
走廊里沉默了将近十秒。
任少卿站在原地,眼睛里有什么东西在动。
他不是在反驳。
他是在消化。
这是个经过长期训练的研究员的习惯。
先装进去,再开口。
“你是学AI的?”
他最终开口,语气里已经没了最初那层礼貌性的疏远。
“不是。”
顾屿站起来,拍了拍裤腿上沾的灰,