NVIDIA释放大量新的Deepfake工具,以使变焦呼叫更少

科技作者 / 姓名 / 2025-06-29 13:46
"
NVIDIA释放大量新的Deepfake工具,以使变焦呼叫更少  对指数的未来感兴趣?加入我们的Xpotential社区,通过我们Xpotential Aca

NVIDIA释放大量新的Deepfake工具,以使变焦呼叫更少

  对指数的未来感兴趣?加入我们的Xpotential社区,通过我们Xpotential Academy的课程来证明自己的未来证明,连接,观看主题演讲或浏览我的博客。

  Deepfakes最初是一种使用人工智能(AI)来创建诱骗和愚弄人的面孔的合成模拟的一种非常昂贵的方式。但是现在,他们已经发展成为最新的热门企业通信工具,以至于任何拥有相机和免费应用程序(例如Zao)的人都可以将它们的相似之处放入好莱坞大片中,假装在视频通话中是埃隆·马斯克(Elon Musk),除此之外。

  So, as the world goes DeepFake mad and continues to find new and better ways to use AI to create synthetic content that includes everything from art, blogs, books, games, music, to videos, it’s no surprise that Nvidia have been ratcheting up interest in the space with several innovations, and even though it’s latest one isn’t as exciting as some DeepFake foolery, like David Beckham’s malaria advert, Nvidia’s latest innovation, code namedMaxine的目标是帮助您在所有la脚的低点,粒状,视频通话中看起来更好。

  亲自查看一些很酷的功能!

  Maxine实际上带有许多功能,但最初引起我的注意的是其新的AI辅助视频压缩工具。您是否曾经想过自己的脸?还是将自己的脸变成虚拟聊天头像,然后使用像Kizuna AI这样的虚拟YouTuber中常见的Facerig工具进行动画动画?因为从本质上讲,这是该工具所做的,所有这些都以减少带宽并(也许)提高视频流质量的最终目标。

  本质上,这个新的视频压缩工具不是不断地向与您聊天的人发送视频数据,而是向他们发送了您的脸部静态图片,然后阅读您的嘴唇,眼睛,脸颊和其他关键面部特征的动作,以使用AI在另一端进行动画图片。NVIDIA给出了一个视频流的示例,每帧使用近100kb与AI压缩流相比,每帧仅使用0.12kb,这意味着大小差异约为1,000倍。结果是对您实际说话的实际情况大多是现实的描述,但是通过网络发送的数据少得多。强调“大部分”。

  AI如何缩放工作

  因为压缩工具实际上不是发送视频,而是在为静态图片进行动画,所以它必须做出一些猜测,从而导致牙齿,模糊的边缘和某些动作的动画风格之类的感觉。您是否值得一些不可思议的山谷图像值得,这取决于您,但这确实感觉就像是外星人在Nvidia的示例视频中穿着皮肤西装。

  假设这些扭结能够解决,我们最终可以生活在视频聊天本质上使用我们自己脸的计算机产生的传真的未来仍然感到很奇怪……我们将使用相同面孔的实际视频进行​​操作。而且,像深击一样,这确实提出了有关潜在模仿的问题。我可以给某人蒂姆·库克(Tim Cook)的照片,然后将我的面部动作映射到他的脸上吗?但是,鉴于目前将其定位为以开发人员为中心的工具,而不是面向消费者的工具,公司可能会认为现实主义的权衡值得以提高绩效。

  当然,Maxine不仅会停止重新创建您的脸。这也是有希望的AI驱动的“增强”,例如脸部重新动画。这里的概念很简单。假设您将目光聚焦在监视器屏幕的某个角落上,或者将头向侧面倾斜,以便您可以查看第二个显示器。就像上面概述的AI视频压缩一样,面部重新动作将使用静止的参考图像和您的面部运动数据来调整您在相机上的外观,以使您似乎直接看着屏幕,而眼睛则集中在其中心上。

  NVIDIA的示例视频表明,这仍然有一段路要走,因为重新动画的面部质量明显低于输入数据,并且随着移动到中心的速度而定一点。它还具有与AI视频压缩工具相同的不可思议的山谷质量。但是,假设这一切都可以解决,我可以看到类似的事情对需要在会议期间需要多任务的工人,甚至是处理过度积极进取的虚拟学习软件的学生,因为他们不直接在屏幕上看。

  在不那么令人不安的范围内,Maxine还承诺AI辅助视频升级,这可以帮助那些没有最好的网络摄像头的人,以及与RTX Voice降低噪音和NVIDIA广播的自动框架相似的功能。NVIDIA的演示视频还简要展示了现场语言翻译的工具以及将面部动作映射到卡通化身的工具,这可能有助于抵消Maxine AI AI压缩和面部重新动画工具的不可思议的山谷性质。我们目前对这些功能不了解,但是无论某人是否是开发人员,它们似乎都会真正有所帮助。

  就目前而言,Nvidia Maxine并没有直接向消费​​者出现。取而代之的是,NVIDIA向第三方公司提供免费的云访问权限,然后可以使用它来改善自己的软件。这可能是很好的,因为在本地运行这些工具时,您自己的RTX卡可以提高性能,因此将它们保持在云上,这将使它们更容易被普通人访问,并且将进一步使它们正常化。尽管如此,通信公司Avaya是目前唯一宣布使用Maxine的合作伙伴,因此不要期望看到这些功能很快就会在缩放电话中弹出。

  除了所有的笑话之外,由于工作中的工作仍然是许多行业的新常态,因此看到像NVIDIA这样的公司加紧尝试使这些空间变得更加容易,更专业并不奇怪,即使这意味着他们必须先穿过Uncanny Valley。

分享到
声明:本文为用户投稿或编译自英文资料,不代表本站观点和立场,转载时请务必注明文章作者和来源,不尊重原创的行为将受到本站的追责;转载稿件或作者投稿可能会经编辑修改或者补充,有异议可投诉至本站。

热文导读