新快报讯 2024年第一个工作日起,兵马俑、马斯克以及各地网友跳科目三和网红舞的视频就陆续在国内社交媒体和朋友圈刷屏。这些大约10秒左右的视频都不是真人出镜,均由大模型生成,这种低门槛的「跳舞」方式引发了网友的广泛体验,掀起了一波斗舞潮。各路网友金句频出:AI治愈了我的四肢不协调、科目三的风吹到了考古界、再也不用担心跳科目三崴脚……
据悉,这是阿里云通义千问APP上线的免费功能,在通义千问APP内输入“通义舞王”、“全民舞王”等口令后,即可进入体验页面。用户按照提示要求上传照片后,十几分钟即可生成神形兼备的舞蹈视频,生成的视频能较好地保留原形象的面部表情、身材比例、服装以及背景等特征。目前,通义千问首批为用户提供了科目三、蒙古舞、划桨步、鬼步舞等12种热门舞蹈模板。
该功能背后的算法为阿里通义实验室自研视频生成模型Animate Anyone。根据公开论文显示,Animate Anyone集成了多项创新技术,可高度还原人物、表情及服装细节。在相同数据集的测试下,Animate Anyone的性能表现显著优于国内外同类模型。早在去年11月底,Animate Anyone便在推特、Youtube等海外社交媒体平台爆火,相关视频播放量超1亿,是近期大模型领域最受欢迎的大模型算法之一。
今年9月,通义千问成国内首批通过备案的大模型,通义千问APP上线后功能持续升级,目前可提供文本对话、语音对话、翻译、PPT大纲助手、小红书文案、视频生成等几十项功能。