本文作者:author

DeepSeek:搅动全球AI产业的国产开源大模型

DeepSeek:搅动全球AI产业的国产开源大模型摘要: 国产开源大模型DeepSeek以其优越的性价比和惊人的增长速度,迅速成为全球科技圈的焦点,引发了算力信仰的动荡,并坚定了构建开放式人工智能生态的信心。DeepSeek由幻方量化...

国产开源大模型DeepSeek以其优越的性价比和惊人的增长速度,迅速成为全球科技圈的焦点,引发了算力信仰的动荡,并坚定了构建开放式人工智能生态的信心。

DeepSeek由幻方量化旗下的深度求索研发,其DeepSeek V3和DeepSeek-R1模型展现了卓越的效果和低廉的训练成本。数据显示,其应用软件下载量在短短18天内突破1600万次,日活用户数超过2000万,成为全球增长最快的AI应用。DeepSeek的成功证明了,无需堆叠巨量算力也能打造出优秀的大模型。其高效的模型蒸馏技术、Multi-Head Latent Attention(MLA)和DeepSeek MoE技术,显著降低了显存占用,优化了模型性能。

DeepSeek的崛起引发了对算力信仰的质疑,国际巨头英伟达股价一度大幅下跌,A股相关光通信板块也受到冲击。然而,英伟达随后声明,DeepSeek的成功体现了其芯片在中国市场的实用价值,并表示未来仍需更多英伟达芯片来满足DeepSeek的服务需求。集邦咨询预测,DeepSeek降低AI训练成本将扩大应用场景,从而增加全球数据中心建设量,进而带动光收发模块等相关产业发展。

DeepSeek获得了国际和国内AI芯片巨头的广泛认可和支持。英伟达、AMD、英特尔等国际巨头已宣布集成DeepSeek模型并提供算力支持,国产GPU厂商如海光信息、沐曦、摩尔线程、天数智芯和壁仞科技也纷纷宣布适配DeepSeek模型,提升计算效率和资源利用率。华为昇腾也与潞晨科技合作,推出了基于昇腾算力的DeepSeek-R1系列推理API及云镜像服务。

此外,华为云、腾讯云、阿里云、百度云等云计算巨头以及联通云也加入了DeepSeek生态。许多应用端厂商,如万兴科技、北信源、奇安信、当虹科技、易点天下、盛天网络和中文在线等,也积极探索和部署DeepSeek模型,将其集成到各自的产品中,以降低用户门槛和成本,提升用户体验。阅文集团的作家助手也已集成DeepSeek-R1大模型,华为小艺助手也已接入DeepSeek。

DeepSeek的成功,不仅是国产AI技术的一次突破,也标志着AI产业正朝着高效发展的方向前进,其开放的生态系统也为更多参与者提供了机会。

DeepSeek:搅动全球AI产业的国产开源大模型DeepSeek:搅动全球AI产业的国产开源大模型
阅读

发表评论

快捷回复:

验证码

评论列表 (暂无评论,18人围观)参与讨论

还没有评论,来说两句吧...