转自:上观新闻

据新加坡《联合早报》网站3月25日报道,中国初创企业零一万物首席执行官李开复说,在人工智能(AI)发展方面,中国已将与美国在某些领域的差距缩小至仅3个月,因为中国初创企业深度求索(DeepSeek)等公司已经研究出如何更有效地使用芯片和应用算法。
李开复是全球AI领域的重要人物,曾担任美国搜索引擎巨头谷歌公司的中国区负责人。李开复在香港接受路透社采访时说,DeepSeek的推出表明,中国已经在基础设施软件工程等领域取得领先地位。
今年1月,DeepSeek推出一款AI推理模型,震惊了全球AI行业。该公司称,该模型采用的芯片技术较落后,开发成本也低于西方竞争对手。这挑战了美国制裁将阻碍中国AI行业发展的假设。
李开复说:“之前我认为差距是6到9个月,在各方面都落后。现在我认为,在一些核心技术上可能落后3个月,但实际上在某些特定领域领先。”

李开复形容华盛顿的半导体制裁是一把“双刃剑”,既带来了短期挑战,也迫使中国企业在约束下进行创新,并提到中国企业如何开发自己的算法。
他说:“DeepSeek能够通过一种新的强化学习方式来弄清楚思路链,这要么是在赶超美国,要么是在快速学习,甚至可能更具创新性。”他指的是DeepSeek模型在给出答案之前,向用户展示推理过程。这一功能由美国AI巨头OpenAI率先开发,但尚未向用户发布。
2022年底OpenAI推出聊天机器人ChatGPT后不久,中国科技行业就加入了开发生成式AI的全球竞赛,但直到DeepSeek推出前,中国许多科技领袖都说,他们远远落后于西方同行。
新闻多一点
编程能力大大提升,DeepSeek发布更新版V3模型
据新加坡《联合早报》网站3月25日报道,中国初创公司深度求索(DeepSeek)发布了V3模型更新,加强了模型的编程能力,显示这家公司希望在人工智能(AI)领域的激烈竞争中保持领先优势。
综合彭博社和科技博客网站“风险投资节奏”网站的报道,AI开源模型DeepSeek-V3的更新版本V3-0324于24日深夜在AI开源平台低调上线。
深度求索没有为此次版本更新发布任何公告,延续了该公司的低调风格。
初代DeepSeek-V3发布于2024年12月26日,这款模型自上线后便以高性价比火速“出圈”。根据官方技术论文披露,DeepSeek-V3模型的总训练成本约为557.6万美元,而OpenAI的GPT-4o等模型的训练成本约为1亿美元。
更新后的DeepSeek-V3模型大小为641GB,模型参数为6850亿。与V3相同,V3-0324模型采用混合专家(MoE)架构,并开源允许自由商用。
此次更新的最大亮点是编程能力的优化。有网民使用V3-0324模型编写800多行代码,全程没有出现任何故障。
有AI研究者在社交平台X上发布评测指出,V3-0324模型在所有基准测试中都取得巨大进步,可能已超越美国Anthropic公司的Claude 3.5 Sonnet,成为最强大的非推理模型。Claude 3.5 Sonnet是当前最受认可的商业AI模型之一。
让更多科技博主关注的是,V3-0324模型可直接在消费级硬件上运行,如搭载苹果M3 Ultra芯片的Mac Studio上,而不需要动辄千瓦级别功耗的数据中心。
M3 Ultra芯片在进行推理时的功耗不到200瓦,意味着V3-0324模型的部署和运营门槛已大大降低。
“风险投资节奏”网站报道认为,DeepSeek-V3-0324模型的发布,可能预示着DeepSeek-R2即将到来。DeepSeek一贯先推出基础模型,再推出专门优化推理能力的版本,如V3后不久发布的R1。
路透社今年2月引述消息称,DeepSeek正加快推出R1模型的后续产品R2。据悉,DeepSeek-R2原计划在5月初发布,但公司现在希望尽早推出。
“风险投资节奏”网站认为,DeepSeek-R2的发布,可能成为直接挑战GPT-5的竞品。
原标题:《“缩小中美AI差距至3个月”,DeepSeek深夜更新》
栏目主编:张武 文字编辑:程沛 题图来源:上观题图 图片编辑:邵竞
来源:作者:参考消息



![[怒] [怒]](https://n.sinaimg.cn/commnet/2018new_nu_org.png)




