都给我开口说话！MakeItTalk的神奇魔法让你和蒙娜丽莎对话_手机新浪网

link之家

链接快照平台

相关文章推荐

烦恼的核桃 · 学科竞赛分享 | 关于第一届中传网络安全大赛的通知· 1 月前 ·

失落的啄木鸟 · 华为VR ...· 1 月前 ·

好帅的丝瓜 · ROG 幻14 (G14) ...· 1 月前 ·

冲动的西瓜 · 2024云栖大会｜阿里云无影AI云电脑亮相 ...· 3 周前 ·

讲道义的热水瓶 · 应用宝官网-全网最新最热手机应用游戏下载· 2 周前 ·

细心的拖把 · How to register an ...· 7 月前 ·

愉快的铁链 · 重复生成文档，StreamWriter出现下 ...· 1 年前 ·

乐观的蚂蚁 · kaggle实战—泰坦尼克（五、模型搭建-模 ...· 1 年前 ·

瘦瘦的海豚 · Oracle正则表达式（REGEXP_）相关 ...· 1 年前 ·

个性的电池 · Background concurrent ...· 1 年前 ·

尽管在技术上取得了无数的成就，但是创造逼真的面部动画仍然是计算机图形学的挑战。

一是整个面部表情包含了完整面部各部分之间的相互关系，面部运动和语音之间的协同是一项艰巨的任务，因为面部动态在高维多重影像中占主导地位，其中头部姿势最为关键。

二是多个说话人会有不同的说话方式，控制嘴唇一致，不足以了解说话的人的性格，还要表达不同的个性。

针对上述问题，Yang Zhou博士和他的团队提出了一种具有深度结构的新方法「 MakeItTalk」。

这是一种具有深度架构的新方法，只需要一个音频和一个面部图像作为输入，程序就会输出一个逼真的「说话的头部动画」。

下面，我们就来看看，MakeItTalk的是如何让图片「说话」的。

（5）嘴唇的大小和形状随着眼睛、鼻子和头部的运动而扩大，这取决于谁说了这个词，也就是说话人身份。

（6）最后，为了生成转换后的图像， MakeItTalk采用了两种算法进行标记到图像的合成:

对于非真实感的图像，如画布艺术或矢量艺术，一个特定的畸变方法是在 Delaunay triangulation 的基础上部署；

对于真实感图像，构建一个图像到图像的转换网络(与 pix2pix 相同) ，直接转换自然人脸。

最后，混合所有的图像帧和音频共同生成头部动画。

作者简介

该项目的作者本科毕业于上海交通大学电子工程系，然后在乔治亚理工学院获得了硕士学位，现在是马萨诸塞大学阿默斯特分校计算机图形学科学研究小组的一名计算机科学博士生。

推荐文章

烦恼的核桃 · 学科竞赛分享 | 关于第一届中传网络安全大赛的通知

1 月前

失落的啄木鸟 · 华为VR Glass眼镜PC模式体验：VR数据线助力画质提升 - OFweek VR网

1 月前

好帅的丝瓜 · ROG 幻14 (G14) 10小时续航攻略 -风扇静音/锁频_幻14 10小时续航攻略

1 月前

冲动的西瓜 · 2024云栖大会｜阿里云无影AI云电脑亮相体验大幅升级_用户_晓颖_终端

3 周前

讲道义的热水瓶 · 应用宝官网-全网最新最热手机应用游戏下载

2 周前

细心的拖把 · How to register an attached property - WPF .NET | Microsoft Learn

7 月前

1 年前

乐观的蚂蚁 · kaggle实战—泰坦尼克（五、模型搭建-模型评估）_kaggle 模型评价-CSDN博客

1 年前

瘦瘦的海豚 · Oracle正则表达式（REGEXP_）相关函数_ITPUB博客

1 年前

个性的电池 · Background concurrent copying GC freed 107384(8MB) AllocSpace objects, 0(0B) LOS objects, 49% 原因記錄_Zhang CL的博客-CSDN博客

1 年前