DeepSeek全球爆火震动科技圈

DeepSeek全球爆火震动科技圈0

人工智能技术的发展正在重塑人类社会的方方面面，在这场技术革命中，DeepSeek以其独特的技术路径和创新精神，在AI领域开辟出一条独具特色的发展道路，迅速成长为行业瞩目的新星。近日，中国人工智能初创公司DeepSeek火了，国产AI DeepSeek在中国、美国的科技圈受到广泛关注，不仅在美区下载榜上超越了ChatGPT，还引发多个美国科技股的股价暴跌。美国总统特朗普称DeepSeek的出现“给美国相关产业敲响了警钟”。

DeepSeek是啥？

DeepSeek，全称杭州深度求索人工智能基础技术研究有限公司，成立于2023年7月17日，是一家创新型科技公司，专注于开发先进的大语言模型（LLM）和相关技术。

2023年11月2日，DeeSeek推出首个模型DeepSeek Coder，该模型免费供商业使用，且完全开源。

2023年11月29日，DeepSeek LLM上线，其参数规模达到67B，性能接近GPT-4，同时还发布了该模型聊天版本DeepSeek Chat。

2024年5月，DeepSeek-V2发布该模型在性能上比肩GPT-4 Turbo，价格却只有GPT-4的百分之一。

2024年12月底，DeepSeek-V3发布其性能与GPT-4o和Claude Sonnet 3.5等顶尖模型相近，但训练成本极低，整个训练在2048块，英伟达H800 GPU集群上完成仅花费约557.6万美元。相比之下GPT-4o等模型至少要在万个GPU量级的计算集群上训练，且使用的是性能更为优越的H100 GPU训练成本约1亿美元。

DeepSeek-V3发布后，AI数据服务公司Scale AI创始人Alexander Wang就发贴称，DeepSeek-V3是中国科技界带给美国的苦涩教训。“当美国休息时，中国（科技界）在工作，以更低的成本、更快的速度和更强的实力赶上。”

英伟达高级研究科学家Jim Fan在社交媒体上表示，DeepSeek是2024年度开源大语言模型领域的“最大黑马”。

DeepSeek的发展历程，不仅是一家企业的成长史，更是中国人工智能产业创新突破的缩影。这不仅是中国AI技术发展的里程碑，更是全球人工智能竞争格局重塑的重要标志。DeepSeek的崛起，展现了中国在通用人工智能领域的创新实力，也为全球AI发展注入了新的活力。

DeepSeek全球爆火到底火在哪

不到一个月之后，今年1月20日，DeepSeek正式开源R1推理模型。在数学能力基准测试中达到了77.5%的准确率，与OpenAI的o1不相上下，在编程领域的Codeforces评测中达到了2441分的水平，高于96.3%的人类参与者。

1月27日，DeepSeek应用登顶苹果美国地区应用商店免费APP下载排行榜，同时其在美区苹果App Store免费榜，从26日的第六位飚升至第一位超越ChatGPT、Meta旗下社交媒体平台Threads、Google Gemini、Microsoft Copilot等美国科技公司的生成式AI产品，苹果中国区应用商店免费榜显示，DeepSeek成为中国区第一。

DeepSeek表示，DeepSeek-R1在数学、代码、自然语言推理等任务上，性能比肩OpenAI o1正式版。

这一消息震动了全球AI圈，迅速引起国际社会广泛关注与讨论。

游戏科学创始人、CEO，《黑神话：悟空》制作人冯骥评价DeepSeek：可能是个国运级别的科技成果。

这一模型发布后，引发了海外AI圈众多科技大佬的讨论。例如，英伟达高级研究科学家Jim Fan就在个人社交平台上公开发表推文表示：“我们正身处这样一个历史时刻：一家非美国公司正在延续OpenAI最初的使命——通过真正开放的前沿研究赋能全人类。看似不合常理，但最有趣的结局往往最可能成真。”

DeepSeek R1被讨论的焦点集中在两方面，低训练与使用成本以及开源，区别于OpenAI“海量数据投喂”的方式。DeepSeek利用算法把数据进行总结分类，经过选择性处理之后输送给大模型，在提高训练效率的同时也降低了DeepSeek的成本。

据了解，此前DeepSeek在美区榜单的排名并无特别突出表现，处于稳步上升阶段，但未进入前十。此次突然蹿升，与其近期一系列突出表现有直接关系。

据广州日报报道，“DeepSeek爆火的原因主要可以归结为两点：性能和成本。”萨摩耶云科技集团首席经济学家郑磊告诉记者。DeepSeek解释称，R1在后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下，极大提升了模型推理能力。这种卓越的性能不仅吸引了科技界的广泛关注，也让投资界看到了其巨大的商业潜力。

更为关注的是，DeepSeek R1真正与众不同之处在于它的成本——或者说成本很低。DeepSeek的R1的预训练费用只有557.6万美元，仅是OpenAI GPT-4o模型训练成本的不到十分之一。同时，DeepSeek公布了API的定价，每百万输入tokens 1元（缓存命中）/4元（缓存未命中），每百万输出tokens 16元。这个收费大约是OpenAI o1运行成本的三十分之一，也因此，DeepSeek被称为AI界的“拼多多”。

在DeepSeek的高性价比模型发布后，OpenAI创始成员Andrej Karpathy表示，未来或许不需要超大规模的GPU集群了，除了极致性价比，让DeepSeek大模型脱颖而出的还有其代码和训练方法完全开源。目前，DeepSeek-R1已经一跃成为开源社区Hugging Face上下载量最高的大模型，达10.9万次，这意味着全球的开发人员正在试图了解这一模型，以辅助他们自己的AI开发。

DeepSeek创始人梁文锋表示，开源更像一个文化行为，而非商业行为，在颠覆性的技术面前，闭源形成的护城河是短暂的，即使OpenAI闭源也无法阻止被别人赶超。

加州大学伯克利分校AI政策研究员Ritwik Gupta表示，DeepSeek-R1的出现证明了“AI能力没有技术护城河”，并称中国的系统工程师人才库比美国大得多，他们懂得如何充分利用计算资源来更高效地训练和运行模型。

Meta首席人工智能科学家杨立昆也在社交媒体表示，DeepSeek成功的最大收获不是来自中国竞争对手的加剧威胁，而是保持人工智能模型开源的价值，以便任何人都能受益，这就是开放研究和开源的力量为AI领域带来更多可能。

DeepSeek本次“刷屏”起因是1月20日，其正式发布推理大模型DeepSeek-R1，该模型在数学、编程和推理等关键领域的表现能与OpenAI的最强推理模型o1“掰手腕”，但其API调用成本却低了90%-95%。

DeepSeek公布的信息显示DeepSeek-R1在后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下极大提升了模型推理能力。

1月22日，美国《福布斯》杂志网站表示，DeepSeek R1模型应用强化学习等先进技术，不仅已跻身世界最强大模型序列，而且完全开源可供世界上任何人检查、修改和进一步研发。

1月23日，英国《金融时报》网站刊发评论文章称，DeepSeek的成功标志着中国在人工智能领域日益强大的自主创新能力。

美国计算机科学家吴恩达表示，DeepSeek的进展令人印象深刻，他们能够以非常经济的方式训练模型，最新发布的推理模型表现非常出色。

微软CEO萨蒂亚·纳德拉公开表示，DeepSeek切实有效地开发出了一款开源模型，在推理计算方面表现出色，且超级计算效率极高。

业内人士表示，通过低成本、高性能、开源共享的模式，DeepSeek正在为全球科研人员和企业提供更多可能性。

DeepSeek爆火英伟达股价暴跌

当地时间1月27日，美国股市开盘即大幅下跌，科技板块尤为惨重。市场分析认为，核心原因是中国人工智能初创公司DeepSeek的最新突破，动摇了美国科技行业的“无敌”地位。

因受到DeepSeek人工智能模型冲击，美国芯片巨头英伟达（NVIDIA）当日股价暴跌约17%，博通公司股价下跌17%，超威半导体公司（AMD）股价下跌6%，微软股价下跌2%。此外，人工智能领域的衍生品，如电力供应商也受到重创。美国联合能源公司股价下跌21%，Vistra的股价下跌29%。

对于DeepSeek爆火，85后创始人梁文锋回应：中国AI不可能永远跟随。

据证券时报消息，白宫人工智能和加密货币总管David Sacks在X上发帖称，DeepSeek R1的表现显示人工智能竞争将非常激烈，也证明美国总统特朗普废除拜登行政命令是正确之举。Sacks说拜登用行政命令束缚了美国的人工智能公司。他还说：“我对美国充满信心，但我们不能自满”。

在用R1模型震撼硅谷和暴击华尔街之后，DeepSeek又在深夜放大招。1月27日晚间10点左右，梁文锋在社交平台X上表示，DeepSeek新版本即将发布。三个多小时后，人工智能开源社区HuggingFace就显示，DeepSeek发布了参数大小从10亿到70亿不等，名为Janus-Pro和JanusFlow的一系列开源多模态模型。本次发布的新模型，重点在于文生图能力方面。

据英国《金融时报》报道，1月27日，中国一款聊天机器人的推出导致美国主要科技股指数暴跌1万亿美元，人工智能领域的争霸战就此拉开帷幕，一位投资者称这是世界人工智能超级大国的“斯普特尼克时刻”。

《金融时报》称，DeepSeek是OpenAI及其ChatGPT工具的有力竞争对手，它的出现动摇了人们对美国人工智能热潮的信心，因为中国人似乎可以用更少的资源实现同样的性能。

由于投资者正在消化DeepSeek开发的最新人工智能模型的影响，科技股密集的纳斯达克综合指数收盘下跌3.1%，跌幅一度从上周32.5万亿美元的收盘价值中抹去超过1万亿美元。

新加坡《联合早报》称，英伟达（Nvidia）是为人工智能模型提供动力的计算机芯片的领先制造商，其股价下跌17%，市值减少近6000亿美元，创下华尔街股票市值单日最大跌幅的纪录。谷歌母公司损失1000亿美元，微软损失70亿美元。

DeepSeek人工智能助手1月26日还在美国和英国的苹果应用商店登顶，超过了OpenAI的ChatGPT。

美国《纽约时报》称，美国总统唐纳德·特朗普说，DeepSeek应该“为我们的行业敲响警钟，我们需要集中精力在竞争中取胜”。

他说，他一直在“阅读关于中国”及其公司的报道，尤其是一家公司提出了一种“更快的、成本更低的人工智能方法”。“这很好，因为你不用花那么多钱。我认为这是一个积极因素，是一笔财富，”特朗普说。

1月28日，由于华尔街的溃败，与人工智能领域相关的日本科技公司连续第二天下跌。Advantest暴跌超过9%，而科技投资者软银（特朗普星际之门人工智能项目的主要投资者）暴跌超过5%，前一天跌幅为8%。

DeepSeek周一遭到网络攻击，被迫暂时限制注册。DeepSeek在其状态页面上说，它已于北京时间周一深夜开始调查这一问题。经过大约两个小时的监控，该公司称自己是“大规模恶意攻击”的受害者。虽然DeekSeek限制了注册，但现有用户仍可照常登录。

英国《卫报》称，DeepSeek在开发模型时使用了比竞争对手更少的芯片，因此生产成本更低，这也引发了人们对近年来美国公司“砸钱狂潮”的质疑。

DeepSeek全球爆火震动科技圈

经典小说推荐

杂志订阅

友情链接

DeepSeek全球爆火 震动科技圈

经典小说推荐

杂志订阅

友情链接

DeepSeek全球爆火震动科技圈