详情

优秀的大模型,离不开领先的技术架构。
去年7月,腾讯混元文生图团队就明确了基于DiT架构的模型方向。
(DiT是基于Transformer的扩散模型架构,是Sora、Stable Diffusion 3 也选用的关键技术。)
今年初,腾讯混元文生图完成了模型架构的全面升级,相比上一代整体效果提升超过20%。
碰上古诗词、民间俚语、传统建筑等中国元素,又或者「红烧狮子头」「老婆饼」「鱼香肉丝」等特色词汇,容易出现较大的理解偏差。
中文原生的腾讯混元文生图,母语就是中文:

通过对汉语字符系统、文化内涵的深度学习,对国风元素和中文复杂性有更深刻的理解。
文生图提示词:请将“杞人忧天”的样子画出来

