谷歌的文本到图像人工智能可以提供逼真的图像

人工智能2022-05-27 11:24:52
最佳答案 在人工智能再次成为科技界焦点的时代,谷歌推出了它的 text-ti-image AI 生成器,可以根据文本输入为您提供图像。它是由 Google Brain

在人工智能再次成为科技界焦点的时代,谷歌推出了它的 text-ti-image AI 生成器,可以根据文本输入为您提供图像。它是由 Google Brain 团队创建的 Imagen AI 系统,如果要相信 Google 和一堆样本图像,它可以生成“逼真的图像和深度的语言理解”。” 下面来看看细节。

这是 Imagen AI 可以做什么!

顾名思义,这份工作并不难。您需要做的就是输入您想看到的内容,并在读取大量数据后根据它的理解,Imagen 将为您生成图像。

Imagen 网站展示了一些用例,我们看到的内容令人印象深刻。Imagen 结合了大型转换器语言模型来理解文本和扩散模型,以创建高质量的图像。

输出看起来相当准确,与其他文本到图像的 AI 模型竞争激烈,例如 OpenAI 流行的 DALL-E(甚至有后继者)、VQ-GAN+CLIP 和潜在扩散模型。谷歌甚至有证据。它为此引入了一个名为 DrawBench 的基准工具,其数据认为 Imagen 是更好的工具。

谷歌还透露,在 COCO 上,Imagen 能够实现 7.27 的 COCO FID,人类评估者发现结果“与参考图像相当”。

但是您应该知道,此类 AI 系统提供的示例图像通常被认为是最好的,而那些出错的图像仍然隐藏在幕后。因此,考虑最好的谷歌人工智能模型可能还为时过早。

人工智能模型也有它的一组警告,谷歌并没有避免强调。AI 可以用作恶意活动的工具,例如创建贬损内容或虚假图像,因此,人们仍然无法尝试使用它。此外,人工智能可能容易产生各种社会偏见。

Imagen 网站上写道,“ Imagen在生成描绘人物的图像时表现出严重的局限性。我们的人工评估发现,在对不描绘人物的图像进行评估时,Imagen 获得了显着更高的偏好率,这表明图像保真度下降。初步评估还表明,Imagen 编码了几种社会偏见和刻板印象,包括对生成肤色较浅的人的图像的总体偏见,以及描绘不同职业的图像与西方性别刻板印象保持一致的趋势。“

因此,可以肯定地说 Imagen 仍然需要一些工作才能正常工作。尽管如此,对于有趣的部分,Imagen 感觉是一个不错的选择,如果您打算看到任何愚蠢和不真实的东西,也许 Imagen 可以提供帮助。您对 Google 的文字转图像 AI 有何看法?请在下面的评论中告诉我们。

免责声明:本文由用户上传,如有侵权请联系删除!