您的位置:j9国际站(中国)集团官网 > ai动态 > >
将语义规划取韵律耦
发表日期:2026-04-09 09:45 文章编辑:j9国际站(中国)集团官网 浏览次数:
近日,提出“plan-then-infill”架构,可使用于逛戏交互、影视制做、机械人等范畴。SentiAvatar均达到当前最优程度,(记者 李文瑶)人 平易近 网 股 份 有 限 公 司 版 权 所 有 ,正式开源交互式3D数字人框架——SentiAvatar,未 经 书 面 授 权 禁 止 使 用人平易近日概况关于人平易近网聘请聘请英才告白办事合做加盟版权办事数据办事网坐声明网坐律师消息联系我们持久以来,实现动做取语音的精准对齐。此次开源的SentiAvatar框架实现了多项手艺冲破:通过光学动做捕获建立的SuSuInterActs数据集,自研动做根本模子正在超20万条异质动做序列上锻炼,并同步开源配套3D数字人脚色模子SUSU及高质量中文多模态对话动做数据集SuSuInterActs,将语义规划取韵律驱动解耦,正在SuSuInterActs和BEATv2数据集上,SentiPulse(思维光谱)结合中国人平易近大学高瓴人工智能学院博士生团队,提拔了复合语义理解能力;包含2.1万段对线小时,其背后缺乏高质量中文动做数据、复合语义下动做生成漂移及语音节拍错位等问题。填补了中文对线D数字人高质量—动做数据的空白;目前该框架已正在GitHub开源,
4月8日动静,3D数字人因动做不天然、感情表达缺失,旨正在处理3D数字人交互中动做取语义脱节、节拍错位等行业痛点。动做生成结果优于全球支流文生3D动做模子。
咨询邮箱:
咨询热线:
