标题 摘要 内容
    详情

    站在年尾来看,奔涌的AI浪潮呈现出怎样的趋势?又给2025年留下了什么样的伏笔?

    3个视角维度,10大年度趋势,在量子位智库今日重磅发布的《2024年度AI十大趋势报告》中清晰详尽地呈现。

    图片

    毫无疑问,现在的我们正处于一个深受AI全方位变革影响的时代。

    区别于其他智库和研究机构,量子位智库基于量子位对人工智能领域的长期理解把握和深厚积淀,持续跟踪领域在产学研届的创新、洗牌、动态,结合对近百家初创公司、研究院、投资机构的深度交流,从技术产品行业三个维度勾勒AI现状、展望未来走势。

    报告不仅深入剖析这一前沿科技如何迭代技术能力、重塑商业版图、引领产业升级,还敏锐洞察变革趋势,对未来路径进行前瞻性展望。

    该报告也得到了产学研领域众多机构的支持,不仅在趋势提名上众智,在具体技术方面,也分享了精彩判断和评论。这让报告有了更广的视角基础,以及更深的产业生态基础,特此鸣谢——

    图片

    现在,把镜头聚焦AI,年度十大趋势,一起先睹为快:

    • 大模型创新:架构优化加速涌现,融合迭代大势所趋

    • Scaling Law泛化:推理能力成皇冠明珠,倒逼计算和数据变革

    • AGI探索:视频生成点燃世界模型,空间智能统⼀虚拟和现实

    • AI应用格局:第⼀轮洗牌结束,聚焦20赛道5大场景

    • AI应用竞争:多领域竞速运营大于技术,AI助手兵家必争

    • AI应用增长:AI+X赋能类产品大干快上,原生AI爆款难求

    • AI产品趋势:多模态上马,Agent席卷⼀切,高度个性化呼之欲出

    • AI智变千行百业:左手变革生产力,右手重塑行业生态

    • AI行业渗透率:数据基础决定初速度,用户需求成为加速度

    • AI创投:投融资马太效应明显,国家队出手频率提升

    技术视角

    大模型创新:架构优化加速涌现,融合迭代大势所趋

    2017年《Attention Is All You Need》论文发表,Transformer架构问世,并逐渐成为自然语言处理领域主流技术范式。但Transformer并非完美无缺,产学研界也一直存在一种声音:架构领域需要新的突破,来构建强大且高效的新一代基础大模型。

    谁将革新甚至颠覆Transformer,取而代之?

    2023年以来,大量创新大模型架构涌现,尝试在保留Transformer优势的同时解决其算力开销太高的问题,有望在性能与效率上实现突破,对Transformer的绝对统治地位形成有力挑战。

    • 类循环神经网络模型(以RWKV为代表)

    • 状态空间模型(以Mamba为代表)

    • 层次化卷积模型(以UniRepLKNet为代表)

    • 多尺度保持机制模型(以RetNet为代表)

    • 液体神经网络模型(以LFM为代表)

    • ……

    图片

    多种有代表性的技术路径,在不同程度保留Transformer架构优势的基础上,结合RNN、CNN等思想所做出的创新发展,这也使得大模型架构呈现出日益明显的混合趋势, 更多创新架构具备 “博采众家之长”的特点。

    Scaling Law泛化:推理能力成皇冠明珠,倒逼计算和数据变革

    技术层面,另一个备受关注的重点是Scaling Law的泛化

    第一代Scaling Law指引模型开发者们在参数量、数据集和计算量之间寻找模型性能的最优解,引发了大家对算力、数据等资源分配的思考。

    量子位智库观察到,参数量与计算量的膨胀带动我国万卡集群以及高性能网络的建设和发展;同时数据耗尽危机中,合理善用合成数据成为较优选择。

    此外,OpenAI o1无疑是今年受瞩目的模型之一,在它身上体现了推理能力的大幅提升。以o1为代表的新Scaling Law,促使大模型追求更高的推理能力。

    横向对比Apple Intelligence Foundation、Gemma 2、Llama 3.1、Qwen2训练方法可以看到,后训练的比重正在不断增加,模仿学习+强化学习成为典型AI发展路径范式。

    图片

    AGI探索:视频生成点燃世界模型,空间智能统⼀虚拟和现实

    2024年,AI技术在多元方向持续突破,视频生成、世界模型、具身智能和空间智能等技术推动了人类对AGI的探索。

    视频生成方面,扩散模型在多任务中取得显著成果,已成为视频⽣成的主流技术路径。尤以DiT(Diffusion Transformer)模型最受瞩目。

    在世界模型领域,研究者们致力于开发能够模拟和理解真实世界的模型,核心在于通过学习大量数据,使模型能够自然涌现新的行为和决策能力

    与世界模型密不可分的还有具身智能。今年起,具身智能逐渐从概念走向落地,玩家们纷纷推出⾃⼰的⾸款⼈形机器⼈,同时开始在灵巧⼿自由度、控制精度和感知技术上发力,持续攻克技术难题。

    空间智能,则是一个与世界模型和具身智能都紧密相关的概念。空间智能指的是机器在三维空间和时间中感知、推理和⾏动的能⼒,其野望在于将空间计算操控虚拟世界的本领和具⾝智能触达现实世界的能⼒结合起来。

    图片

    产品视角

    AI应用格局:第⼀轮洗牌结束,聚焦20赛道5大场景

    为了更好地从数据维度观察国内产品的现状,量子位智库选取了400余款具有代表意义的产品进行研究。

    图片

    从细分赛道来看,这400款产品可以具体划分为20个品类——AI智能助⼿AI陪伴AI相机AI写作综合类套件AI修图AI视频AI教育AI⾳乐/⾳效AI设计AI⽣图AI搜索AI图⽰AI总结AI翻译,各赛道已分别产生代表产品进而再细分,并呈现出不同的发展特点。

    其中,AI智能助⼿是表现最突出的AI原⽣类产品,也是国内⼤模型⾃研⼚商技术实⼒的最直观体现。目前来看,AI智能助手赛道内部已经出现了明显的梯队划分,豆包取得了断层式领先。

    AI陪伴虽然广受关注,但目前整体增长乏力,星野、猫箱等Top产品和Killer APP之间仍有相当距离。

    AI搜索则已经成为新的业务布局重点,既包括秘塔AI搜索等原生AI搜索,也包括类似纳米搜索、夸克浏览器的AI加强搜索和知乎直达、小红书达芬奇等业务AI搜索。

    如果以具体使用场景划分,可以分为:重在整体效率提升的全使⽤场景、整体数据表现最优的⼯作提效、2025年有望显著突破的创意⽣成、面临严峻合规挑战的休闲娱乐和⽇常⽣活等。

    AI应用竞争:多领域竞速运营大于技术,AI助手兵家必争

    为了更好地还原国内AI产品的现状,量子位智库从用户规模新增速度用户活跃用户粘性四⼤⻆度进行了数据统计。

    目前,APP端和Web端均尚未出现比肩互联⽹时代现象级破圈之作的产品,且整体来看和海外同类型产品相差5倍以上。

    在APP端,⽬前还没有产品能够拿出全维度的亮眼表现,市场缺乏诞生杀手级产品的场景。

    截⾄2024年10⽉,共56款产品的历史下载量超百万,8款产品历史下载量超千万,夸克和豆包的历史总下载量已过亿。

    而从单月新增来看,夸克、豆包和Kimi智能助手月增长可达到千万级,10款产品可达百万级;DAU方面,夸克DAU超过2600万,豆包、Kimi、天天跳绳和文小言DAU超百万;用户粘性方面,夸克和叨叨三日留存率超过30%。

    在Web端,AI智能助⼿赛道外的所有赛道都基本处于停滞状态,AI搜索、AI写作、AI⽣图等赛道甚⾄出现了头部产品数据下滑、或是下滑后回升乏力的情况。

    用户规模方面,月总访问量超千万的共7款产品,包括夸克、腾讯文档、百度文库、Kimi智能助手、文心一言、豆包和通义。

    而在用户活跃度上,共3款产品——夸克、Notion和百度文库的MAU超过千万,19款产品MAU超过百万。仅有14款产品人均每月访问超过5次,13款产品平均访问时长超过10分钟。

    在数据统计基础上,「量子位智库AI 100」通过综合100和原生100两张榜单提名了国内优秀的AI产品。

    图片
    图片

    AI应用增长:AI+X赋能类产品大干快上,原生AI爆款难求

    当前,AI产品可被划分为以AI为底层设计逻辑的AI原⽣类产品、在原有互联⽹产品上深度嵌⼊AI功能的AI+X产品、基于外接API微创新的套壳类产品和将多个产品/模型API集中拼凑的集合站类产品

    图片

    从数据来看,由于和业务流程融合得更为紧密、需求识别明确等原因,AI+X类产品⽬前的整体数据表现显著优于AI原生类产品,并以办公软件和内容平台为重点布局领域。

    对办公软件⽽⾔,续写、改写、命题写作等不同程度的AI写作功能,以及针对论⽂、⼩说等不同题材的AI总结功能基本成为标配。

    其中,主要业务为提供模板及参考内容的素材库类产品和编辑器形态的办公软件表现更为突出,代表产品为百度⽂库和WPS AI。由于AI⽣成效果会直接影响产品的核⼼使⽤体验,此类产品相对更强调具体功能的精准度。

    而在内容平台中,AIGC⼤多从三个⽅向共同发⼒:基于平台内容的AI搜索、⽤于带动UGC的AI⽣成功能及模板,还有⻔槛进⼀步降低的内容创作⼯具。

    基于此,量子位智库对AI原生类产品提出了场景融合简化用户体验品牌信任和推广三大建议。