新快报讯 1月21日,腾讯混元宣布开源3D生成大模型2.0版本,并上线业界首个一站式3D内容AI创作平台—混元3D AI创作引擎,开发者可在GitHub、Hugging Face等技术社区下载混元3D 2.0模型,用户也可以直接在混元3D AI创作引擎上体验。对比1.0版本,2.0版本也依然同时支持文、图生3D的能力,并在生成效果上得到显著提升,在几何结构上更加精细,纹理色彩更加丰富。
据了解,腾讯混元上线的3D AI创作引擎,包含了基础模型生成、3D功能矩阵、3D编辑、3D生成工作流、创作素材库等多种功能。既支持大众爱好者生成UGC 3D内容,也助力游戏开发、设计建模等专业领域的3D生产管线,大幅提升3D内容创作效率,面向不同应用场景提供可低成本定制的解决方案。
在基础模型生成方面,创作引擎同时支持文生及图生3D。其中,输入中/英文提示词,描述主体内容、特征、风格等,就能快速生成4个高质量3D模型,同时,也支持上传单图即生成3D模型。效果上,可以选择不同纹理风格进行生成,同时支持PBR贴图,通过模拟物理特性可生成更逼真的材质贴图效果。在3D功能矩阵方面,创作引擎涵盖了丰富的3D建模、编辑及驱动等能力,包括3D动画生成、3D纹理生成、草图生3D、3D人物生成、3D小游戏创作等。
值得一提的是, 混元3D AI创作引擎还支持设计3D生成工作流,呈现3D创作管线核心流程。通过模块化的节点设计搭建,帮助专业用户在游戏开发、动画制作等领域快速搭建3D生成工作流,其中包含3D角色生成与3D道具生成。用户仅需加载模版,根据个人需求输入提示词或上传图片,调整节点生成参数,即可一键生成具有特定风格和特征的3D资产,进一步降低专业用户使用门槛,大幅改进3D创作管线效率。
混元3D生成大模型1.0在去年11月全面开源,是业界首个同时支持文字、图像生成3D的开源大模型。2.0版本也依然同时支持文、图生3D的能力,此外,通过将几何、纹理解耦生成,2.0版本还在生成效果上得到显著提升,在几何结构上更加精细,纹理色彩更加丰富。在定性评估方面,从整体满意度、3D 物体质量和指令遵循三个维度进行用户主观评估,结果显示,Hunyuan3D-2.0 在生成质量上优于当前最先进的开源模型。
据了解,在实际应用上,混元 3D 生成大模型此前也已经开始应用于UGC 3D创作、商品素材合成、游戏3D资产生成等司内业务及场景。比如,混元3D生成能力也开始应用于腾讯内部游戏业务,其生成3D质量已能满足部分游戏3D资产标准,包括几何布线合理性、贴图准确性与骨骼蒙皮合理性等,据统计,通过混元3D创作平台的助力,游戏业务3D资产制作时间成本可从5-10天级别下降到分钟级。此前,腾讯地图也已基于腾讯混元3D大模型,发布了自定义3D导航车标功能,支持用户创作个性化的 3D 导航车标,相比传统的3D车标重建方案速度提升了91%,有效提升了用户使用体验。