DeepSeek 的“修炼”之路,还要闯几关?
创始人
2025-02-28 14:35:52
0

  以小博大、逆袭吊打,曾是修仙爽文、微短剧里让人上头却略显荒诞的剧情,而今,DeepSeek(深度求索)让它在真实世界里发生了。

  火爆全球超过一个月,DeepSeek掀起的风暴还在持续,随之而来的还有一波三折的戏码,同行的围剿、跨界的争议……正如影视作品中每一位“爽文大女主”升级打怪时所面对的关卡一样。

  誉满天下,谤亦随之,DeepSeek的“修炼”之路,还要闯几关?

  “爽文大女主”出三招

  悄悄推出两款模型,即引发硅谷与华尔街的剧烈震荡,让OpenAI接连推出竞争产品并免费开放搜索,谷歌一股脑儿发布“满血版全家桶”,国内大厂的旗舰模型也开始免费开放。

  深有“天上掉馅饼”之感的万千普通用户,倒是想给DeepSeek送锦旗了,不过,大家也想知道,凭一己之力就把曾经高不可攀的全球最顶级大模型的价格打下来了,究竟用了什么招?

  ——“乱”拳打伤老师傅。从架构到工程,从算法到部署,DeepSeek悟透的是“四两拨千斤”的中国武术古训,不理会“参数规模决定论”,反倒是秀出了数据质量优化与算法架构创新的乘数效应,在看似不可能的壁垒中突围。

  ——拆掉半壁卫城墙。一般来说,大模型开发者用了英伟达的GPU,也就得用他家的运算平台CUDA搞研发。毕竟CUDA已经封装好一些函数,后来者使用时直接调用接口搞加工就行,这样的低门槛当然方便资源有限的开发者,但是,这也意味着深度研发执行效率的折扣。

  绕过CUDA,直接基于GPU的驱动函数开发,行不行?DeepSeek给出了肯定的答案。凭借独到软件算法优化,拆掉英伟达“卫城墙”,也就是不必仰赖其CUDA生态行事,DeepSeek走出了一条中国AI技术创新的新路子。

  ——小力也能出奇迹。自从OpenAI的ChatGPT发布以来,微软、谷歌、Meta等科技巨头一直在增加与人工智能相关的算力支出。“军备竞赛”式的投入,也催动了美国AI芯片股价一路攀升。

  就当行业仍困囿于“算力军备竞赛”的思维定式之际,DeepSeek凭借区区558万美元训练成本就让V3模型达到了GPT-4o九成功力,R1模型更实现以纯强化学习突破推理能力边界,向世界证明,AI大模型的革命,不一定要靠算力堆出来。

  是幻觉还是“真香”

  DeepSeek的小而精、强且美,是炒作出来的“幻觉”,还是厚积薄发而得的“真香”?

  自从在AI江湖中亮出名号,DeepSeek就不满足于追随者,这可以从其开发的一系列原创技术获得证明。MLA、GRPO、R1-Zero……门外汉对着这些字母大概会如坠五里雾中,但是,这些技术合力激发的“聚变”,恐怕是DeepSeek获得140多个国家用户认可的根本原因。

  北京白领小游说,DeepSeek的回答不像GPT的回答那么干巴巴,像个只会写材料的书呆子,按部就班安排任务步骤,而像个鬼马精灵,只要你说明目的,她就能拆解和揣摩你的弦外之音、思考怎么实现你想要的:“甚至你可以问她一些你都没有答案的大问题。”

  当然,DeepSeek依然在蓬勃的成长期。以最新的DeepSeek-R1为例,虽然其突破鼓舞人心,但学术界用起来还不免有点头疼——面对悠远文明时间中的复杂因果,现代学术论述的复杂规范,DeepSeek的回答还不免左支右绌。

  而且,DeepSeek暂时还不谙图像处理,回应大规模用户需求也有“体力不支”的情况,这些困难都意味着,DeepSeek的修炼,“高原期”刚刚开始。

  如何学习文明的智慧

  技术革命的浪潮里,没有永恒的王者,只有不断的超越。具体到AI领域,大家的共识更是:充满不确定性、一直充满热度、但不乏过度反应。

  无休止的波动,折射出的,其实是科技进化的深层图像——人工智能,就好像之前种种引发文明革命的重大科技进展一样,前进路线并非笔直的线性轨迹,而是永恒的螺旋。

  谁来驱动这螺旋?不论DeepSeek参演的是爽剧还是正剧,角色与剧本背后的导演还是人类自己。

  如果说AI是普罗米修斯之火,那么人类文明就是在自我颠覆中奔流不息、江声浩荡的赫拉克利特之河。我们最珍贵的不是回答和解决已有问题的能力,而是发现新问题的智慧、定义新问题的勇气——这更需要创造性与想象力。

  DeepSeek式创新的下一次突破,其通关密码,就生成于回向文明深处寻求思考变革的努力中。以文明赋能人工智能,人工智能的“飞升”时刻,也许就会到来。

  原标题《DeepSeek的修炼之路》

  半月谈记者:张漫子

  (半月谈微信公众号)

相关内容

热门资讯

最新考古研究:2000多年前维...   和商网北京2月28日电 (记者 孙自法)施普林格·自然旗下开放获取学术期刊《科学报告》最新发表一...
2024年我国新批准发布104...   和商网2月28日电 据国家市场监督管理总局网站28日消息,2024年,市场监管总局新批准发布一批...
山东青岛:课间“加长” 健康“...   近日,在山东省青岛市李沧区实验小学,四年级8班学生纪正师一下课就迫不及待地来到校园里的“AI运动...
中国外交部:敦促美国个别议员立...   和商网北京2月28日电 (记者 谢雁冰 黄钰钦)中国外交部发言人林剑2月28日主持例行记者会。...
辽宁省人大社会建设委员会原副主...   和商网2月28日电 据辽宁省纪委监委消息:辽宁省人大社会建设委员会原副主任委员孙东克涉嫌严重违纪...
广东发布“隐患排查治理年”行动...   广东发布“隐患排查治理年”行动方案  将推进电动自行车规章制度建立、AI智能劝导等措施  广州日...
普华永道:2024年中国并购市...   中新社上海2月28日电 (记者 姜煜)普华永道28日发布的《2024年中国企业并购市场回顾与前瞻...
鸿蒙原生版航旅纵横:行程跨端流...   作为民航信息服务领域“国家队”,航旅纵横是首批深度适配HarmonyOS NEXT的出行服务平台...
中方回应鲁比奥涉芬太尼言论:充...   和商网北京2月28日电 (记者 谢雁冰)中国外交部发言人林剑28日主持例行记者会。有记者就美国国...
国家医保局:口腔矫治器等个性化...   和商网2月28日电 据国家医疗保障局官网28日消息,近日,国家医疗保障局正式印发《口腔类医疗服务...
西藏推出第二轮文旅消费券补贴活...   和商网拉萨2月28日电(泽塔雍措)记者28日从西藏自治区文化和旅游厅获悉,为进一步释放文旅消费潜...
“广西三月三”活动3月末开启 ...   中新社南宁2月28日电 (俞靖)广西壮族自治区官方2月28日召开新闻发布会介绍,2025年“广西...
(经济观察)布局未来产业,中国...   中新社北京2月28日电 (王梦瑶)在发展面向未来的产业方面,中国178个国家高新区正发挥着越来越...
国家气候中心:预计3月有4次冷...   和商网2月28日电 中国气象局28日召开3月新闻发布会。国家气候中心副主任肖潺在会上发布3月气候...
存款特种兵不灵了?民营银行调低...   羊城晚报记者 戴曼曼  为了迎接开门红,此前不少中小银行接连推出大额存单、特色存款等“高息”产品...
上海轨道交通进一步明确禁止吸烟...   和商网上海2月28日电 (记者 陈静)2025年是《上海市公共场所控制吸烟条例》(简称《条例》)...
刚果(金)不明原因疾病致至少6...   和商网2月28日电 据美国广播公司报道,世界卫生组织27日发表声明称,刚果(金)出现一种不明原因...
财政部:1月份全国共销售彩票4...   和商网2月28日电 据财政部网站消息,财政部发布2025年1月份全国彩票销售情况。  一、全国彩...
美方威胁对中国输美产品加征关税...   和商网北京2月28日电 (记者 谢雁冰) 中国外交部发言人林剑28日主持例行记者会。有记者就美方...
宁夏银川农产品产销衔接成果丰硕...   和商网银川2月28日电 (李佩珊 马富强)2月28日,宁夏银川市举行农产品产销衔接会,来自上海、...