图片源于:https://www.bostonglobe.com/2025/01/27/business/deepseek-ai-china-openai-explained/
全球科技股在一月下旬大幅下跌,随着DeepSeek创新的炒作不断升级,投资者开始消化其对美国本土竞争对手及其硬件供应商的影响。
DeepSeek的崛起可能提供了一个反驳广泛信念的对立面,众所周知,AI的未来将需要不断增加的计算能力和能源来发展。
DeepSeek是一家成立不久的中国AI初创公司,成立于2023年,面临着硅谷的惊叹与担忧,该公司展示了突破性的人工智能模型,在性能上与世界上最优秀的聊天机器人相媲美,却似乎只需更少的成本。
DeepSeek究竟是什么?
DeepSeek由高科技驱动的量化对冲基金High-Flyer的首席执行官梁文峰创立,至今不足一年。该公司开发的AI模型是开源的,意味着开发者社区可以审查和改进软件。它的移动应用程序在1月初发布后迅速攀升至美国iPhone下载排行榜的首位。
该应用程序通过在回应提示之前清晰阐述其推理,与OpenAI的ChatGPT等其他聊天机器人区分开来。公司声称其R1版本在性能上与OpenAI的最新产品相当,并已授予那些希望利用该技术开发聊天机器人的个人进行构建的许可。
DeepSeek的R1与OpenAI或Meta AI的比较如何?
尽管公司并未透露详细信息,但DeepSeek模型的训练和开发成本似乎仅为OpenAI或Meta平台等最佳产品的一个小部分。这种更高的效率使得人们质疑,是否需要大量资金来获得来自Nvidia等公司的最新和最强大的AI加速器。这也引发了人们对美国对中国实施先进半导体出口限制的关注——这些限制旨在防止DeepSeek所显示的突破。
DeepSeek表示,R1在多个领先基准测试中接近或超越了竞争对手的模型,包括用于数学任务的AIME 2024,通用知识的MMLU,以及问答表现的AlpacaEval 2.0。此外,它还在与加州大学伯克利分校相关的排行榜“聊天机器人竞技场”中名列前茅。
美国的担忧在哪里?
华盛顿已禁止将高端技术如GPU半导体出口到中国,以阻止该国在AI领域的进展,这是美中技术霸权争夺战的关键领域。但DeepSeek的进展表明,中国的AI工程师已经找到了绕过限制的方法,专注于在有限资源下提高效率。尽管尚不清楚DeepSeek究竟获得了多少先进的AI训练硬件,但公司的表现已经表明,贸易限制并未完全有效地阻止中国的进步。
DeepSeek何时引发全球关注?
自2023年初版发布以来,这家AI开发公司便被密切关注。去年11月,它向世界展示了其DeepSeek R1推理模型,旨在模仿人类思维。这个模型为其移动聊天应用程序提供支持,连同1月份的网页界面,迅速在全球知名度上升成为一个更具性价比的OpenAI替代品,投资者Marc Andreessen称其为“AI的斯普特尼克时刻”。
截至1月25日,DeepSeek移动应用程序的下载量达到了160万次,并在澳大利亚、加拿大、中国、新加坡、美国和英国的iPhone应用商店排名第一,数据来自市场追踪机构App Figures。
DeepSeek的创始人是谁?
梁文峰,1985年生于广东,获得浙江大学电子与信息工程的学士和硕士学位,他以1000万人民币(140万美元)的注册资本创立了DeepSeek。
梁在接受中国媒体36kr采访时表示,进一步进展的瓶颈并非是更多的融资,而是美国对最佳芯片的限制。他表示他的许多顶级研究人员都是来自中国顶尖大学的应届毕业生,并强调中国需要发展类似于Nvidia及其AI芯片所建立的国内生态系统。
“更多的投资并不一定会带来更多的创新。否则,大公司就会神话全盘接管所有的创新。”梁说。
DeepSeek在中国的AI格局中处于何种地位?
中国的科技领军者,包括阿里巴巴集团、百度和腾讯等,已经投入了大量资金和资源,竞相获得AI硬件和用户。DeepSeek因其开源风格而脱颖而出,旨在快速招募大量用户,然后在这庞大的受众基础上制定货币化策略。
由于DeepSeek的模型更具经济性,它已经在帮助推动中国AI开发者的成本降低方面发挥了作用,而传统大型玩家则在价格战中进行了连续的价格削减,过去一年半中经历了多轮价格战。
DeepSeek的成功对全球AI市场有什么影响?
DeepSeek的成功可能迫使OpenAI和其他美国提供商降低价格,以维持其既有优势。这也对Meta和微软等公司的巨大支出提出了质疑——这两家公司今年各自承诺的资本支出超过650亿美元,主要用于AI基础设施——如果更高效的模型可能以更少的投入与之竞争。
这一消息动摇了全球股市,投资者抛售了如Nvidia和ASML等受益于AI服务需求激增的企业股票。同时,与DeepSeek相关的中国公司如科大讯飞的股价却上涨。
全球范围内,开发者们已经开始试验DeepSeek的软件,并寻找基于此构建工具。这可能加快先进AI推理模型的采用,同时也可能引发对其使用的监管需求。
DeepSeek的进展可能加速对如何开发AI的监管措施。
DeepSeek存在哪些不足之处?
与所有其他中国AI模型一样,DeepSeek在处理被中国视为敏感的话题时会自我审查。它回避关于1989年天安门广场抗议或中国可能入侵台湾等与地缘政治相关的问题。在测试中,DeepSeek机器人能够对印度总理纳伦德拉·莫迪提供详细回应,但对于中国国家主席习近平却拒绝透露。
DeepSeek的云基础设施可能会经受来自其突然流行的考验。该公司在1月27日曾经历过一次重大宕机,未来随着新用户和回归用户向其聊天机器人输入更多查询,需应对更大的流量。