午后的阳光慵懒地洒在晚霞山庄操盘大厅的休息区。
落地窗外的景色被镀上了一层金黄。
休息区内,静谧中透着几分闲适。
叶回舟、信息部的杨闲以及小胖子王涛围坐在一张木质圆桌旁。
桌上,三杯咖啡正冒着袅袅热气。
咖啡的香气在空气中弥漫开来,为这略显严肃的氛围添了几分温馨。
杨闲刚看完马斯克g3的发布会,此刻满脸失望。
他轻轻将手中的平板电脑放在桌上,率先打破了沉默。
“今天看了马斯克g3的发布会,实在是太让人失望了。
这号称地表最强的ai大模型,依我看,完全是在走弯路。”
叶回舟正端起咖啡杯,轻抿一口。
听到杨闲的话,眼中闪过一丝好奇。
他放下杯子,问道:“怎么个走弯路法?我还没仔细了解呢,你给详细说说。”
杨闲轻叹一口气,身子微微前倾,缓缓说道:“你瞧,g3发布会给出的数据看似耀眼得很。
在数学科学和编程的基准测试上,确实超越了不少主流模型。
像gpt4o、cloud3.5、deptv3这些,在它面前都得甘拜下风。
而且在推理能力方面,g3.ingta和g3min reasoning的跑分也超过了同等级的其他模型。
比如说deeptr1还有openai的o3mini。”
小胖子王涛正百无聊赖地转着手中的铅笔,听到这儿,不禁皱起眉头,满脸疑惑。
“听起来很厉害呀,那还有什么可失望的?”
杨闲无奈地摇了摇头,用手指轻轻敲着桌面,解释道:“问题就藏在这些看似厉害的数据背后。
你看,数据差距其实很小,gpt4o差不多1400分,g3也就1400分左右。
只差20多分,也就1%多一点的差距。
deepr1是1360分,和g3的差距也就2%左右。
这种微小差距可能只是跑分的小误差,或者仅仅是记忆能力的体现。
况且,为了这点差距,它训练用了10万克的英伟达h100的gpu。
累计训电时长达2亿gpu小时,就为了这微不足道的差距,付出如此巨大的代价,简直是资源的极大浪费。”
叶回舟听着,陷入了思考。
他轻轻转动着咖啡杯,缓缓说道:“确实,如此庞大的算力投入,感觉有点得不偿失。
但你觉得这就能说明马斯克方向错了吗?”
杨闲推了推眼镜,身子往后靠了靠,接着说:“我觉得可能性很大。
他过度依赖跑分,要知道跑分这东西是可以作弊来营造优势的。
很多模型看着跑分很高,但实际使用起来却不尽人意,就像之前的glock2。
g3耗费这么多资源,才比其他模型多那么一点分数,就好比用大量资源去换取微不足道的优势。
再看看人类大脑,人脑功率10到30瓦,却能展现出强大的能力,关键就在于算法。
像李菲菲团队用50美金复现deep seek,就证明了一个模型强大与否,核心在于思考和推理能力,而非规模。”
小胖子王涛若有所思,停下手中转动的铅笔,摸着下巴说:“我明白你的意思了。
这就好比我们学习知识,要是只靠死记硬背,考试能应付,但实际应用就不行。
ai要是只依赖大量记忆数据,没有真正的推理和思考能力,也算不上真正的智能。”
叶回舟点头表示认同。
他拿起勺子,轻轻搅拌着咖啡,说道:“没错,所以像deep使用的moe混合专家模式,就很类似大脑节能的方法。
而且gpt系列模型,从gpt3到gpt4,参数不断增大。
可从人类发展角度看,人脑并没有因参数显著增大而变得更聪明。”
杨闲又补充道:“再看ai发展的总体趋势,现在的ai就像温水里的青蛙。
就拿欧洲来说,德国和法国这样的强国,各有心思。
德国是经济强国,法国是军事强国,可即便组合起来,也未必能称霸欧洲。
面对美国政策,欧洲反应混乱,美国态度的变化,才让欧洲看清美国本质。”
小胖子王涛