DeepSeek是什么?
作者: 芭芭拉·帕兹2025年新年伊始,人工智能领域迎来了一位突破性的新“玩家”:由中国深度求索公司开发的人工智能助手——DeepSeek。得益于社交媒体的传播,DeepSeek最近在网络上引发了巨大轰动。
1月初,DeepSeek发布了其人工智能模型DeepSeek-R1,直接对标OpenAI的ChatGPTo1等领先模型。其独特之处在于能以极低的成本开发高性能人工智能模型。
它拥有用户友好的设计,能协助完成各种任务,包括回答问题、生成内容等,功能类似ChatGPT或谷歌的Gemini。但与通常提供免费版本却对高性能人工智能引擎收费的美国人工智能巨头不同,DeepSeek对普通用户完全免费使用。
近日,它还快速推出了人工智能图像生成器Janus-Pro,旨在挑战美国的Dall-E3、StableDiffusion和Leonardo等模型。
那么DeepSeek有何不同?它是如何运作的?又为何获得如此多的关注?

DeepSeek的创立
深度求索公司由对冲基金经理梁文峰于2023年创立,总部位于中国杭州,专注于开发开源大语言模型。由于是开源平台,开发者可根据需求进行定制。这个在1月之前还鲜为人知的人工智能助手,其发布为人工智能创新注入了乐观情绪,挑战了依赖芯片、数据中心和能源巨额投资的美国科技巨头的统治地位。
DeepSeek的工作原理
DeepSeek作为对话式人工智能大语言模型,能理解并回应自然语言输入。你可以向它提问、请求项目协助、研究支持、起草邮件,还能通过深度思考(DeepThink)解决推理问题。
DeepSeek提供两个大语言模型:DeepSeek-V3和DeepThink-R1。前者类似标准版ChatGPT,可快速响应、生成文本、改写邮件和总结文档;后者对标需要订阅的OpenAIChatGPTo1模型,但两者均免费开放。
用户可通过网页浏览器及手机应用访问DeepSeek。截至2025年1月下旬,DeepSeek应用已成为美国等全球数十个国家苹果和谷歌应用商店下载量最高的免费应用。
该平台采用先进机器学习模型处理信息并生成响应,能胜任多样化任务。与其他人工智能工具不同的是,DeepThink-R1模型会在给出详细答复前,展示其完整的“思考过程”及解题耗时情况。
创新技术与成本效益
DeepSeek因性能比肩甚至超越顶级人工智能模型而登上新闻头条。其R1模型在多项基准测试中优于OpenAI的o1-mini,人工智能基准测试和分析的独立平台ArtificialAnalysis研究显示,其综合质量超过谷歌、Meta和Anthropic的模型。
除了随模型升级而动态变化的基准测试结果,其惊人的低成本更引发关注。据悉,DeepSeek-R1开发预算仅550万美元,远低于OpenAIGPT-4传闻的1亿美元。这种成本效益源于采用非最先进的英伟达H800芯片,以及优化资源却不牺牲性能的创新训练方法。
市场颠覆与全球影响
DeepSeek的爆火在股市引发剧烈震荡。英伟达市值近日经历暴跌、反弹、再暴跌的过山车行情。甲骨文、微软、Alphabet(谷歌母公司)和荷兰芯片设备商阿斯麦等科技巨头也遭遇冲击。
DeepSeek的快速崛起颠覆了全球人工智能市场,挑战了“先进人工智能开发必须巨额投入”的传统认知。硅谷著名风投家马克·安德森将其比作人工智能领域的“斯普特尼克时刻”(指当一个组织意识到自己在关键领域落后于竞争对手时,所面临的巨大挑战和压力以及由此产生的紧迫感和行动需求)。