标题 摘要 内容
    详情
    DeepSeek在全球范围内引发轰动,短短一个月便吸引了中国总理、美国前总统特朗普、欧洲多国政府首脑以及美国知名企业的关注,成为近年来国内极具影响力的营销事件。深圳市人工智能产业研究部指出,DeepSeek之所以产生如此广泛的影响,原因是多方面的,而搭建强大的数据层,为AI大模型提供数据生产力支撑,是中国未来发展的核心要点。

    图片

    DeepSeek的火爆很大程度上基于营

    DeepSeek成为热点主要基于两个因素。其一,2024年12月,DeepSeek-V3首个版本上线并同步开源,宣称训练成本仅557.6万美元,整个训练只需280万个GPU小时。这一信息经营销传播,被解读为模型整体花费仅5-600万美元。但专业人士分析,DeepSeek仅在GPU及硬件上的投资就远超5亿美元,其拥有的GPU数量超过国内大模型“六小龙”中任何一家,预计AI服务器整体投资在15亿美元以上。甚至有消息称DeepSeek仅用华为的GPU进行训练,绕开了英伟达。OpenAI CEO山姆奥特曼曾表示,GPT-4o的训练成本约1亿美元,未来训练大模型的成本将超10亿美元。DeepSeek的技术创新体现在独特的技术架构与高效的算法优化上。通过采用专家混合模型(MoE)实现精准分工与动态响应,引入多头潜在注意力机制(MLA)增强对复杂关系的洞察力,应用多Token预测技术提升自然语言处理的连贯性和效率,DeepSeek在图像识别、自然语言处理及智能推荐系统等领域实现了显著的性能提升。该大模型的最大优势在于,在模型能力较好的前提下开源并让客户低成本使用,这在很大程度上触动了美国科技企业的利益。

    图片

    其二,大量新闻报道称DeepSeek的性能达到甚至超过OpenAI的o1模型,这种说法较为片面。DeepSeek发布的主要是推理模型,而ChatGPT是多模态大模型,涵盖推理、语言、图片、视频等多方面,且涉及的产业范畴、语言类别、应用领域等广度远大于DeepSeek。图片尤其是视频模型的难度不亚于文本类,有理由认为OpenAI的ChatGPT模型在综合图片和视频的推理能力上远超过DeepSeek模型。从模型的广度和深度来看,DeepSeek或许还未达到OpenAI的十分之一,甚至更低。不能仅因达到或超过OpenAI的o1模型,就认为超越了OpenAI。据深圳市人工智能产业协会统计,截至2024年,OpenAI总融资规模超240亿美元,新一阶段拟融资规模约400亿美元。在DeepSeek投资较少、高端GPU受限、训练数据不足OpenAI百分之一甚至千分之一的情况下,很难期望其大模型能力超越OpenAI。由于对DeepSeek模型成本的误解和能力的误判,国内AI产业、政府、高校和民间,除了非大模型企业,在很大程度上陷入了集体超越美国的狂欢。

    图片

    其次,铺天盖地的赞美DeepSeek的文章明显存在营销迹象。这些文章大多极力贬低美国大模型产业界,标题多采用诸如“吊打美国”“美国哭了”“性能碾压OpenAI”“打爆美国科技圈”“单挑美国AI霸权”“DeepSeek登顶第一”“中国AI暴杀美国”“硅谷巨头集体失眠”“它摧毁了美国所有战略目标”“中国deepseek‘暴打’ChatGPT”等夸张言论。多数文章简单分析对比DeepSeek大模型能力后,便通过使用成本、开源、技术突破点、国际测试成绩、美国各龙头企业反应、特朗普言论、美国龙头企业股价波动、个别使用案例等,宣扬中国已超越美国。这些新闻标题与科技界严谨的惯例不符。实际上,中国本土的豆包、文心一言以及大模型“六小龙”并未因DeepSeek而慌乱,难道DeepSeek只针对美国?
    最后,大模型专业人士集体失声。在大量关于DeepSeek的新闻报道期间,几乎未见华为、腾讯、百度、大模型“六小龙”相关负责人的真实DeepSeek事件分析,理性文章匮乏,少量相对中性的分析还遭到网友攻击。对于AI产业而言,大模型国内测试影响力有待加强,中国政府和产业界需要科学严谨的言论作为参考,这才有利于中国AI产业的健康发展。据深圳市人工智能产业协会研究部使用实践,目前DeepSeek在聊天机器人领域和豆包、文心一言等还有不小的差距。

    美国推波助澜DeepSeek事件

    DeepSeek的“捧杀”最初源于美国。美国有意推动并夸大DeepSeek事件,旨在打压和阻碍中国AI产业发展。美国产业界和政客向来有通过抬高中国AI能力,促使政府出台打压中国AI产业政策的惯例。此前,他们曾以中国AI专利、AI成就、中国留学生和学者等为由,指责中国窃取美国AI技术、侵犯知识产权,甚至将其视为间谍。

    图片

    此次,美国极力夸大DeepSeek的能力,并指控其侵犯美国企业的知识产权和利益。微软和OpenAI指责DeepSeek“偷盗”ChatGPT数据,借此快速推动美国政府在AI领域进一步限制GPU出口、限制美国大模型API调用、限制双方AI人才流动、限制美国使用中国大模型、限制中国使用美国大模型,还联合盟友限制中国大模型使用。