DeepSeek崛起挑战AI巨头 “DeepSeek新模型“火”到海外

行业资讯· 2025-01-26 22:11:35

DeepSeek正成为AI领域崛起的“黑马”。

1 月 20 日晚 ,DeepSeek(深度求索)公司发布推理模型DeepSeek-R1 正式版,该模型在数学、代码、自然语言推理等多个领域展现出与OpenAI o1正式版比肩的实力,更在开源策略上迈出了大胆的一步。此外,在2024年12月26日晚间,其开源模型DeepSeek-V3上线后更是在国内外AI圈刷了屏。

从量化基金入局人工智能

深度求索成“AI界拼多多”

据公开资料了解,DeepSeek(深度求索)创始人梁文峰出生于1980年代广东一个五线城市,本硕就读于浙江大学,攻读人工智能专业,同时,梁文峰还是幻方量化的实际控制人,幻方量化是目前国内头部量化私募机构之一。

2008年,梁文峰开始致力于量化对冲领域的研究,2015年创立了幻方量化,之后规模扩张迅速,随后2023年7月成立DeepSeek ,据了解,而DeepSeek的创立源于梁文峰在幻方量化时期对AGI的向往和热衷,该公司第一期研发投入就是幻方自主出资的,且旗下拥有 “萤火超算” 万卡级别的算力加持。

据悉,“萤火超算” 是由幻方构建、科技大厂之外为数不多的AI算力中心,配备了大量英伟达高性能计算卡,国内具备同等算力的企业不超过5家。

成立一年后,DeepSeek就拿出了让业界关注的产品, 去年5月,深度求索发布DeepSeek-V2,以其创新的模型架构和史无前例的性价比爆火。模型推理成本被降至每百万Tokens(大模型用来表示自然语言文本的单位)仅1元钱,约等于开源大模型Llama3 70B的七分之一,GPT-4 Turbo的七十分之一,引发字节、阿里、百度等企业的模型降价潮。

彼时,DeepSeek被迅速冠以“AI界拼多多”之称的同时,字节、腾讯、百度、阿里等大厂也按耐不住,纷纷降价。中国大模型价格战由此一触即发。

性价比继续拉满

产品性能获得业界高度认可

在DeepSeek-V2之后,深度求索迅速推出DeepSeek-V3,在全球AI领域已经引起震动,今年1月DeepSeek推出的R1模型更是获得了业内人士的认可,甚至被认为在推理和数学等领域比美国的大模型更加优秀。

官方资料显示,DeepSeek-V3自研了MoE模型,671B参数,激活37B,在14.8Ttoken上进行了预训练,性能上已甩开迄今为止发布的所有开源模型。

在大多数基准上,已比肩乃至优于世界顶尖闭源模型GPT-4o,而且PK起来极具性价比。

关键的是,有网友查阅资料后发现,DeepSeek-V3整个训练仅花费557.6万美元,这比OpenAI、Meta等用于预训练大型语言模型动辄数亿美元的成本要低得多。

此外,与DeepSeekV3相比,R1在推理能力上有了显著提升。它的回答更为全面、详实,且论证充分。R1通常以结构化的方式提供回答,并在思考和回答过程中补充大量背景信息,这些信息对用户来说极具启发性。

而DeepSeek-R1 API 服务定价为每百万输入 tokens 1 元(缓存命中)/ 4 元(缓存未命中),每百万输出 tokens 16元。DeepSeek震动美国科技界,不仅是因为其性能上比肩OpenAI的o1,并完全开源,且以极低的成本实现了这一突破。

有行业人士表示,从性价比来说,同等性能水平上它最便宜,而同等价位左右的竞品中它最强,市场卡位相当精准。

DeepSeek的崛起,不仅震动了国内科技界,更引起了美国科技界的广泛关注。知名投资人马克·安德森对DeepSeek R1给予了高度评价,称其为“我见过的最令人惊叹和印象深刻的突破之一”。而AI科技初创公司Scale AI的创始人亚历山大·王更是直言,DeepSeek的AI大模型发布可能会“改变一切”,让美国在人工智能竞赛中的领先地位受到挑战。

或为AI领域的发展注入新的活力

在这个科技迅猛发展的时代,人工智能(AI)逐渐成为各行各业的宠儿。尤其当这家AI公司还与投资公司有着共同的创始人,且公司产品DeepSeek-V3,并在多个基准测试中表现优异更是引爆了金融市场对AI炒股的热情。

然而,私募排排网的数据显示,幻方量化旗下的65只基金中,有36只在年内遭遇下跌,仅29只涨幅超过10%。整个量化私募基金行业的表现也并不令人满意,许多量化策略的平均收益显著低于主观投资策略。

不过,虽然在金融市场中暂时没有取得颠覆式成绩,但DeepSeek日前正式发布了其官方App,用户现在可以通过苹果App Store、小米应用商店等多个平台免费下载使用。

在实际应用中,DeepSeek-R1展现出了不俗的实力。在理科方面,它能够迅速解答高考压轴题,并生成用于解释量子力学概念的代码动画。在文科方面,它的推理能力提升了信息的丰富度,能够准确回答脑筋急转弯问题,并对历史事件进行详尽分析。

有行业人士指出,随着对AI技术的持续突破,以及开放共享的策略,DeepSeek有望吸引更多开发者参与,构建繁荣的生态系统。而DeepSeek本身,已成为中国AI领域的一支重要力量。

此外,DeepSeek-R1的开源和免费使用策略,无疑为全球AI开发者提供了宝贵的资源和机会。随着更多用户的加入和反馈,相信这款模型将会不断得到优化和完善,为AI领域的发展注入新的活力。



文章链接: http://ai.huangxinwei.com/aizixun/7080.html Chat AI人工智能机器人在线使用

[免责声明]如需转载请注明原创来源;本站部分文章和图片来源网络编辑,如存在版权问题请发送邮件至398879136@qq.com,我们会在3个工作日内处理。非原创标注的文章,观点仅代表作者本人,不代表炎黄立场。