DeepSeek全球爆火 震动科技圈

作者: 张帅

DeepSeek全球爆火 震动科技圈0

人工智能技术的发展正在重塑人类社会的方方面面,在这场技术革命中,DeepSeek以其独特的技术路径和创新精神,在AI领域开辟出一条独具特色的发展道路,迅速成长为行业瞩目的新星。近日,中国人工智能初创公司DeepSeek火了,国产AI DeepSeek在中国、美国的科技圈受到广泛关注,不仅在美区下载榜上超越了ChatGPT,还引发多个美国科技股的股价暴跌。美国总统特朗普称DeepSeek的出现“给美国相关产业敲响了警钟”。

DeepSeek是啥?

DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司,成立于2023年7月17日,是一家创新型科技公司,专注于开发先进的大语言模型(LLM)和相关技术。

2023年11月2日,DeeSeek推出首个模型DeepSeek Coder,该模型免费供商业使用,且完全开源。

2023年11月29日,DeepSeek LLM上线,其参数规模达到67B,性能接近GPT-4,同时还发布了该模型聊天版本DeepSeek Chat。

2024年5月,DeepSeek-V2发布该模型在性能上比肩GPT-4 Turbo,价格却只有GPT-4的百分之一。

2024年12月底,DeepSeek-V3发布其性能与GPT-4o和Claude Sonnet 3.5等顶尖模型相近,但训练成本极低,整个训练在2048块,英伟达H800 GPU集群上完成仅花费约557.6万美元。相比之下GPT-4o等模型至少要在万个GPU量级的计算集群上训练,且使用的是性能更为优越的H100 GPU训练成本约1亿美元。

DeepSeek-V3发布后,AI数据服务公司Scale AI创始人Alexander Wang就发贴称,DeepSeek-V3是中国科技界带给美国的苦涩教训。“当美国休息时,中国(科技界)在工作,以更低的成本、更快的速度和更强的实力赶上。”

英伟达高级研究科学家Jim Fan在社交媒体上表示,DeepSeek是2024年度开源大语言模型领域的“最大黑马”。

DeepSeek的发展历程,不仅是一家企业的成长史,更是中国人工智能产业创新突破的缩影。这不仅是中国AI技术发展的里程碑,更是全球人工智能竞争格局重塑的重要标志。DeepSeek的崛起,展现了中国在通用人工智能领域的创新实力,也为全球AI发展注入了新的活力。

DeepSeek全球爆火 到底火在哪

不到一个月之后,今年1月20日,DeepSeek正式开源R1推理模型。在数学能力基准测试中达到了77.5%的准确率,与OpenAI的o1不相上下,在编程领域的Codeforces评测中达到了2441分的水平,高于96.3%的人类参与者。

1月27日,DeepSeek应用登顶苹果美国地区应用商店免费APP下载排行榜,同时其在美区苹果App Store免费榜,从26日的第六位飚升至第一位超越ChatGPT、Meta旗下社交媒体平台Threads、Google Gemini、Microsoft Copilot等美国科技公司的生成式AI产品,苹果中国区应用商店免费榜显示,DeepSeek成为中国区第一。

DeepSeek表示,DeepSeek-R1在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版。

这一消息震动了全球AI圈,迅速引起国际社会广泛关注与讨论。

游戏科学创始人、CEO,《黑神话:悟空》制作人冯骥评价DeepSeek:可能是个国运级别的科技成果。

这一模型发布后,引发了海外AI圈众多科技大佬的讨论。例如,英伟达高级研究科学家Jim Fan就在个人社交平台上公开发表推文表示:“我们正身处这样一个历史时刻:一家非美国公司正在延续OpenAI最初的使命——通过真正开放的前沿研究赋能全人类。看似不合常理,但最有趣的结局往往最可能成真。”

DeepSeek R1被讨论的焦点集中在两方面,低训练与使用成本以及开源,区别于OpenAI“海量数据投喂”的方式。DeepSeek利用算法把数据进行总结分类,经过选择性处理之后输送给大模型,在提高训练效率的同时也降低了DeepSeek的成本。

据了解,此前DeepSeek在美区榜单的排名并无特别突出表现,处于稳步上升阶段,但未进入前十。此次突然蹿升,与其近期一系列突出表现有直接关系。

据广州日报报道,“DeepSeek爆火的原因主要可以归结为两点:性能和成本。”萨摩耶云科技集团首席经济学家郑磊告诉记者。DeepSeek解释称,R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。这种卓越的性能不仅吸引了科技界的广泛关注,也让投资界看到了其巨大的商业潜力。

更为关注的是,DeepSeek R1真正与众不同之处在于它的成本——或者说成本很低。DeepSeek的R1的预训练费用只有557.6万美元,仅是OpenAI GPT-4o模型训练成本的不到十分之一。同时,DeepSeek公布了API的定价,每百万输入tokens 1元(缓存命中)/4元(缓存未命中),每百万输出tokens 16元。这个收费大约是OpenAI o1运行成本的三十分之一,也因此,DeepSeek被称为AI界的“拼多多”。

在DeepSeek的高性价比模型发布后,OpenAI创始成员Andrej Karpathy表示,未来或许不需要超大规模的GPU集群了,除了极致性价比,让DeepSeek大模型脱颖而出的还有其代码和训练方法完全开源。目前,DeepSeek-R1已经一跃成为开源社区Hugging Face上下载量最高的大模型,达10.9万次,这意味着全球的开发人员正在试图了解这一模型,以辅助他们自己的AI开发。

DeepSeek创始人梁文锋表示,开源更像一个文化行为,而非商业行为,在颠覆性的技术面前,闭源形成的护城河是短暂的,即使OpenAI闭源也无法阻止被别人赶超。

加州大学伯克利分校AI政策研究员Ritwik Gupta表示,DeepSeek-R1的出现证明了“AI能力没有技术护城河”,并称中国的系统工程师人才库比美国大得多,他们懂得如何充分利用计算资源来更高效地训练和运行模型。

Meta首席人工智能科学家杨立昆也在社交媒体表示,DeepSeek成功的最大收获不是来自中国竞争对手的加剧威胁,而是保持人工智能模型开源的价值,以便任何人都能受益,这就是开放研究和开源的力量为AI领域带来更多可能。

DeepSeek本次“刷屏”起因是1月20日,其正式发布推理大模型DeepSeek-R1,该模型在数学、编程和推理等关键领域的表现能与OpenAI的最强推理模型o1“掰手腕”,但其API调用成本却低了90%-95%。

DeepSeek公布的信息显示DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下极大提升了模型推理能力。

1月22日,美国《福布斯》杂志网站表示,DeepSeek R1模型应用强化学习等先进技术,不仅已跻身世界最强大模型序列,而且完全开源可供世界上任何人检查、修改和进一步研发。

1月23日,英国《金融时报》网站刊发评论文章称,DeepSeek的成功标志着中国在人工智能领域日益强大的自主创新能力。

美国计算机科学家吴恩达表示,DeepSeek的进展令人印象深刻,他们能够以非常经济的方式训练模型,最新发布的推理模型表现非常出色。

微软CEO萨蒂亚·纳德拉公开表示,DeepSeek切实有效地开发出了一款开源模型,在推理计算方面表现出色,且超级计算效率极高。

业内人士表示,通过低成本、高性能、开源共享的模式,DeepSeek正在为全球科研人员和企业提供更多可能性。

DeepSeek爆火 英伟达股价暴跌

当地时间1月27日,美国股市开盘即大幅下跌,科技板块尤为惨重。市场分析认为,核心原因是中国人工智能初创公司DeepSeek的最新突破,动摇了美国科技行业的“无敌”地位。

因受到DeepSeek人工智能模型冲击,美国芯片巨头英伟达(NVIDIA)当日股价暴跌约17%,博通公司股价下跌17%,超威半导体公司(AMD)股价下跌6%,微软股价下跌2%。此外,人工智能领域的衍生品,如电力供应商也受到重创。美国联合能源公司股价下跌21%,Vistra的股价下跌29%。

对于DeepSeek爆火,85后创始人梁文锋回应:中国AI不可能永远跟随。

据证券时报消息,白宫人工智能和加密货币总管David Sacks在X上发帖称,DeepSeek R1的表现显示人工智能竞争将非常激烈,也证明美国总统特朗普废除拜登行政命令是正确之举。Sacks说拜登用行政命令束缚了美国的人工智能公司。他还说:“我对美国充满信心,但我们不能自满”。

在用R1模型震撼硅谷和暴击华尔街之后,DeepSeek又在深夜放大招。1月27日晚间10点左右,梁文锋在社交平台X上表示,DeepSeek新版本即将发布。三个多小时后,人工智能开源社区HuggingFace就显示,DeepSeek发布了参数大小从10亿到70亿不等,名为Janus-Pro和JanusFlow的一系列开源多模态模型。本次发布的新模型,重点在于文生图能力方面。

据英国《金融时报》报道,1月27日,中国一款聊天机器人的推出导致美国主要科技股指数暴跌1万亿美元,人工智能领域的争霸战就此拉开帷幕,一位投资者称这是世界人工智能超级大国的“斯普特尼克时刻”。

《金融时报》称,DeepSeek是OpenAI及其ChatGPT工具的有力竞争对手,它的出现动摇了人们对美国人工智能热潮的信心,因为中国人似乎可以用更少的资源实现同样的性能。

由于投资者正在消化DeepSeek开发的最新人工智能模型的影响,科技股密集的纳斯达克综合指数收盘下跌3.1%,跌幅一度从上周32.5万亿美元的收盘价值中抹去超过1万亿美元。

新加坡《联合早报》称,英伟达(Nvidia)是为人工智能模型提供动力的计算机芯片的领先制造商,其股价下跌17%,市值减少近6000亿美元,创下华尔街股票市值单日最大跌幅的纪录。谷歌母公司损失1000亿美元,微软损失70亿美元。

DeepSeek人工智能助手1月26日还在美国和英国的苹果应用商店登顶,超过了OpenAI的ChatGPT。

美国《纽约时报》称,美国总统唐纳德·特朗普说,DeepSeek应该“为我们的行业敲响警钟,我们需要集中精力在竞争中取胜”。

他说,他一直在“阅读关于中国”及其公司的报道,尤其是一家公司提出了一种“更快的、成本更低的人工智能方法”。“这很好,因为你不用花那么多钱。我认为这是一个积极因素,是一笔财富,”特朗普说。

1月28日,由于华尔街的溃败,与人工智能领域相关的日本科技公司连续第二天下跌。Advantest暴跌超过9%,而科技投资者软银(特朗普星际之门人工智能项目的主要投资者)暴跌超过5%,前一天跌幅为8%。

DeepSeek周一遭到网络攻击,被迫暂时限制注册。DeepSeek在其状态页面上说,它已于北京时间周一深夜开始调查这一问题。经过大约两个小时的监控,该公司称自己是“大规模恶意攻击”的受害者。虽然DeekSeek限制了注册,但现有用户仍可照常登录。

英国《卫报》称,DeepSeek在开发模型时使用了比竞争对手更少的芯片,因此生产成本更低,这也引发了人们对近年来美国公司“砸钱狂潮”的质疑。

经典小说推荐

杂志订阅

友情链接