AI工具导航

腾讯混元发布并开源语音数字人模型HunyuanVideo - Avatar，助力视频创作

作者： aigall四顾

发布时间： 2025-05-28 15:48

2025年5月28日，腾讯混元发布并开源语音数字人模型HunyuanVideo-Avatar，该模型由腾讯混元视频大模型与腾讯音乐天琴实验室MuseV技术联合研发，为视频创作者带来新的视频生成能力，能根据用户上传的人物图像与音频，生成自然生动的视频。

模型发布及研发背景

2025年5月28日，腾讯混元发布并开源语音数字人模型HunyuanVideo-Avatar。此模型由腾讯混元视频大模型（HunyuanVideo）及腾讯音乐天琴实验室MuseV技术联合研发。

模型功能特点

HunyuanVideo-Avatar支持头肩、半身与全身景别，以及多风格、多物种与双人场景。面向视频创作者，它提供高一致性、高动态性的视频生成能力。用户上传人物图像与音频后，该模型会自动理解图片与音频，例如人物所在环境、音频蕴含的情感等，让图中人物自然地说话或唱歌，生成包含自然表情、唇形同步及全身动作的视频。

工具分类

腾讯混元发布并开源语音数字人模型HunyuanVideo - Avatar，助力视频创作

模型发布及研发背景

模型功能特点

百度智能云千帆平台、文小言APP接入DeepSeek-R1-0528模型

2025AI开发者大会(7月11日-7月12日)

2025全球人工智能技术大会(6月7日-6月8日)

快手可灵AI推出2.1系列模型：性价比高、速度快、质量提升

字节跳动上线AI产品“剪小映”App，功能适合小白用户但有局限

DeepSeek R1模型小版本试升级已完成！优化了这些方面

中国人民大学与蚂蚁集团联合推出多模态大语言模型LLaDA-V，性能优异将开源

腾讯混元发布并开源语音数字人模型HunyuanVideo - Avatar，助力视频创作

秘塔AI推出“极速”模型，响应速度达400 tokens/秒，实现AI搜索“秒回”

2025世界人工智能大会（7 月 26 日至 7月28 日）

工具分类

腾讯混元发布并开源语音数字人模型HunyuanVideo - Avatar，助力视频创作

模型发布及研发背景

模型功能特点

相关文章

面壁智能CEO李大海：端侧AI不等于端侧模型，大模型将更强更小

DeepSeek R1模型小版本试升级已完成！优化了这些方面

Anthropic研究发现Claude大模型会提前谋划、决策摇摆且撒谎

2025全球人工智能技术大会(6月7日-6月8日)

OpenAI更新GPT-4o文生图功能，引发行业变革与版权质疑

2025世界人工智能大会（7 月 26 日至 7月28 日）

百度智能云千帆平台、文小言APP接入DeepSeek-R1-0528模型

2025AI开发者大会(7月11日-7月12日)

2025全球人工智能技术大会(6月7日-6月8日)

快手可灵AI推出2.1系列模型：性价比高、速度快、质量提升

字节跳动上线AI产品“剪小映”App，功能适合小白用户但有局限

DeepSeek R1模型小版本试升级已完成！优化了这些方面

中国人民大学与蚂蚁集团联合推出多模态大语言模型LLaDA-V，性能优异将开源

腾讯混元发布并开源语音数字人模型HunyuanVideo - Avatar，助力视频创作

秘塔AI推出“极速”模型，响应速度达400 tokens/秒，实现AI搜索“秒回”

2025世界人工智能大会（7 月 26 日至 7月28 日）