各有关单位:
为贯彻落实市委、市政府关于人工智能产业发展和数据要素市场化配置改革工作部署,促进人工智能语料数据开放和交易,根据《深圳市打造人工智能先锋城市的若干措施》(深工信规〔2024〕13号)和深圳市市级财政专项资金有关管理规定,我局制定了《深圳市人工智能语料券专项资金操作规程》,现予以印发。
深圳市政务服务和数据管理局
2025年6月26日
深圳市人工智能语料券专项资金操作规程
第一章 总 则
第一条 为落实《深圳市打造人工智能先锋城市的若干措施》(深工信规〔2024〕13号,以下简称《若干措施》),进一步规范本市人工智能语料券专项资金的组织实施和监督管理,促进语料开放共享和交易,推动数据要素市场建设,依据市级财政专项资金有关管理规定等,结合本市实际,制定本规程。
第二条 本规程适用于市政务和数据主管部门组织实施的语料券专项资金管理活动,是市政务和数据主管部门组织实施语料券专项资金发放、制定申报指南的重要依据。
第三条 语料券专项资金是指市政务和数据主管部门为支持企业购买非关联方语料或企业按照相关要求开放语料的活动(以下简称“购买或开放语料活动”),由市级财政预算安排的具有专门用途的资金。语料券专项资金的发放具体包括语料采购资助和语料数据开放奖励两种方式。
前款所称语料采购资助,是指对企业通过数据交易所购买非关联方语料进行人工智能大模型研发和应用的活动,予以一定比例的资助。语料数据开放奖励,是指对企业通过深圳市公共数据开放平台开放符合要求的语料的活动,予以一定额度的奖励。
第四条 语料券专项资金的组织实施,应当遵循精准施策、公开透明、程序规范的原则,实行总额控制、自愿申报、规范审核、加强监管的闭合式管理模式。
第五条 市政务和数据主管部门负责制定和发布语料券专项资金的申报指南,并组织申请、受理、审核与核准等工作。
第六条 市政务和数据主管部门根据工作需要,依法依规委托提供专项审计、专家评审、数据合规等服务的第三方机构,协助开展事务性、辅助性以及专业化工作。
受委托的第三方机构应按约履责,按规定做好相关信息的安全管理和保密工作。
第二章 发放标准
第七条 市政务和数据主管部门每年设置最高5000万元作为语料券专项资金,具体发放金额根据当年度专项资金预算安排确定。
第八条 语料券专项资金按以下标准发放:
(一)语料采购资助
1.对于当年度符合条件的申报企业,每年按不超过语料采购总费用30%,最高200万元予以资助。语料采购总费用以直接用于语料数据采购的费用为准。具体资助金额根据语料采购总费用、数据量、应用成效等维度综合打分评定。
2.应用成效可以参考数字深圳联合创新中心(人工智能实验室)等平台或市场成效验证结果。
3.采购语料应用的项目获得省级以上人工智能类、科学技术进步类奖项,或者获得省级以上人工智能、科学技术相关创新平台资格认定的,可适当予以加分。
4.申报企业获得创新型中小企业、专精特新中小企业、专精特新“小巨人”中任意一个认定的,可适当予以加分。
(二)语料数据开放奖励
1.对于当年度符合条件的申报企业,每年按照下列标准进行奖励:
(1)申报企业在申报期限内累计开放语料数据规模达到以下标准之一(满足各类型中的任意一项数量即可,其他类型数据可以参照以下类型并根据实际情况评定),给予不超过40万元的奖励:
通用类,预训练文本类数据不低于10万条、标注文本类数据不低于1万条、指令集/图片类数据不低于1万组/张、音频/视频类数据不低于100小时、结构化数据不低于10万条;具身智能类,多模态数据不少于1万条(至少包含文本、RGB、深度三个模态)、动作与运动控制数据不少于1万条、人类行为数据不少于1万条、仿真场景不少于2000个、数字资产模型不少于1万个。
(2)申报企业在申报期限内累计开放语料数据规模达到以下标准之一(满足各类型中的任意一项数量即可,其他类型数据可以参照以下类型并根据实际情况评定),给予不低于40万元,最高100万元的奖励:
通用类,预训练文本类数据不低于6000万条、标注文本类数据不低于60万条、指令集/图片类数据不低于60万组/张、音频/视频类数据不低于2000小时、结构化数据不低于1000万条;具身智能类,多模态数据不少于5万条(至少包含文本、RGB、深度三个模态)、动作与运动控制数据不少于5万条、人类行为数据不少于5万条、仿真场景不少于1万个、数字资产模型不少于10万个。
2.奖励金额根据企业年度开放语料的数据量、质量、更新频率、应用成效等维度综合评定。
3.应用成效可以参考数字深圳联合创新中心(人工智能实验室)等平台或市场成效验证结果。
第三章 申报条件和申报材料
第九条 申报企业应当符合以下条件:
(一)申报企业为在深圳市内(含深汕特别合作区,下同)实际从事生产经营活动的企业及其控股子公司,以及该企业依法设立的分公司;
(二)申报2025年度语料券专项资金的企业应于2024年1月1日至2025年9月30日期间签署语料采购合同或完成语料数据的开放;申请2026年度语料券专项资金的企业应于2025年9月30日至2026年9月30日期间签署语料采购合同或完成语料数据的开放;
(三)企业采购或开放的语料应有明确、清晰、合理的适用场景;
(四)用于申报语料采购资助和语料开放奖励的数据,应当通过合规评估,申报企业应当提交数据交易所或第三方专业机构出具的数据合规报告;
(五)法律法规规章规定的其他条件。
第十条 除满足本规程第九条规定的申报条件外,申报语料采购资助的企业,应当同时满足以下条件:
(一)申报企业应当从事人工智能大模型研发和应用相关业务;
(二)申报企业应当通过数据交易所完成语料采购;
(三)申报企业采购语料用于开展人工智能大模型研发和应用的实施地应当在深圳市内,且该研发和应用项目不属于政府投资建设或购买服务项目。
第十一条 语料券每年度申报一次,由市政务和数据主管部门发布申报指南。申报企业应当在本规程规定的申报时限内,一次性提交当年度语料采购或开放的相关材料。
申报单位应当按照申报指南具体要求提交材料,对所提交材料的真实性、完整性和合规性负责,不得弄虚作假、套取专项资金。
申报单位应当配合相关部门完成监督、审计和统计等工作,并按要求开展问题整改。
第十二条 申报企业不可就同一购买或开放语料活动向有关部门多头申报。
第十三条 申报企业实施语料采购和开放活动,应当符合国家安全、商业秘密、个人隐私等相关法律法规规章要求,并依法采取保护措施。涉及个人隐私、个人信息和商业秘密的语料,申报企业应当取得权利主体的合法授权。如语料涉及科技伦理、科技安全等敏感领域,申报企业应当严格执行法律法规规章和相关科技伦理规定,做好风险防范。
第十四条 申报企业根据申报条件提交材料,包括但不限于:项目申请书、语料合规评估确认相关文件、生产经营和项目实施地说明、关联方允许开放语料的授权材料、语料采购或开放情况佐证材料、应用成效佐证材料(如有)、材料真实性承诺书等,具体以申报指南为准。
第四章 组织实施
下一篇: 【申报通知】国知局开展“人工智能+”知识产权信息公共服务应用场景建设有关事项通知
