中国科技网

AI
手机 电脑 数码 智车 AI 苹果 直播
当前位置: 首页 > AI > 正文

Character AI 推出 AvatarFX 大模型:AI 实现静态转动态,让图片角色开口讲话

2025-04-24 09:47:12 来源:IT之家 A+A-

4 月 23 日消息,ChARacter.AI 公司今天(4 月 23 日)在 X 平台发布推文,宣布推出 AvatarFX 模型,能够让静态图片中的人物“开口说话”。

用户只需上传一张图片并挑选一个声音,平台即可生成会说话、会移动的形象。这些形象还能展现情感,呈现出令人惊叹的真实感和流畅度。

公司表示,这得益于一种名为“SOTA DiT-based diffusion video generation model”的先进 AI 模型。该模型经过精心训练,结合音频条件优化技术,能高效生成高质量视频。附上演示视频如下:

AvatarFX 的技术亮点在于其“高保真、时间一致性”的视频生成能力。即便面对多角色、长序列或多轮对话的复杂场景,它也能保持惊人的速度和稳定性。与 OpenAI 的 Sora 和 Google 的 Veo 等竞争对手相比,AvatarFX 并非从零开始或基于文本生成视频,而是专注于将特定图片动画化。

这种独特的工作流程为用户提供了新颖体验,但也带来了潜在风险。用户可能上传名人或熟人照片,制作看似真实的虚假视频,引发隐私和伦理争议。

(责任编辑:Diy92)

推荐阅读 相关文章

传OpenAI拟扩员至8000人 年底从4500人增加

有消息称OpenAI计划在今年底前将员工规模从目前的约4500人扩充至8000人,扩员重点集中在模型安全、多模态研发...[详细]

2026-03-28 09:34:26

马斯克宣布Grok Computer智能体即将上线

马斯克日前在社交平台宣布,xAI开发的Grok Computer智能体即将上线,定位为具备自主任务执行与多工具调用能力的...[详细]

2026-03-28 09:34:26

MiniMax高峰期限流 MiniMax M2.7模型热度超预期

MiniMax官方确认,因M2.7模型在近期高峰时段用户请求量远超预期,已启动临时限流措施以保障服务稳定性。M2.7模...[详细]

2026-03-28 09:34:26

小米MiMo大模型联合多Agent框架 首周限免开放

小米发布MiMo大模型并与自研多Agent框架深度整合,首周面向开发者与特定用户限免开放。MiMo在多轮对话、跨模...[详细]

2026-03-28 09:34:26

美团开源LongCat大模型 Flash-Prover 刷新SOTA

美团近日宣布开源LongCat大模型及其配套Flash-Prover推理验证框架,LongCat在多项长文本理解与生成任务中刷新...[详细]

2026-03-28 09:34:26

月之暗面回应KimiK2.5 Cursor使用并感谢马斯克发声

月之暗面就KimiK2.5在Cursor编辑器的使用情况作出回应,确认该模型已支持在Cursor中调用并完成代码生成、补全...[详细]

2026-03-29 10:52:06

软银拟在美建AI数据中心 全球最大投660亿美元

软银集团宣布计划在美国建设全球规模最大的AI数据中心,总投资额约660亿美元,选址聚焦电力资源丰富且网络延迟...[详细]

2026-03-29 10:52:06

WordPress.com接入AI智能体 可代写及优化SEO

WordPress.com日前宣布接入AI智能体功能,支持为用户代写博客文章并自动优化搜索引擎排名要素。该智能体基于...[详细]

2026-03-29 10:52:06

彭博社称马斯克派xAI工程师争夺xAI OpenAI客户

彭博社报道,马斯克已派遣旗下xAI的工程师团队主动接触部分OpenAI的企业客户,试图以算力优惠与定制化模型服务...[详细]

2026-03-29 10:52:06

美国男子用AI诈骗写歌+机器人刷量骗千万美元版税被抓

美国执法部门日前逮捕一名男子,其利用生成式AI创作歌曲并借助机器人账号在流媒体平台大量刷播放量,以此骗取超...[详细]

2026-03-29 10:52:06

联系方式

商务QQ:19667318