OpenAI的这个新工具可以通过文本输入创建逼真的图像

广告

创建和修改逼真数码照片的过程将变得更加简单。

OpenAI是微软旗下一家位于旧金山的人工智能公司,该公司最近宣布开发了一种人工智能系统,该系统可以获取物体或场景的描述,并自动生成非常逼真的图像。此外,该系统使用户能够使用简单的工具和文本修改轻松更改图像。

然而,DALL-E 2远非完美无缺。在复杂的环境中,该技术有时无法呈现细节。例如,一些灯光和阴影效果可能关闭,或者两个本应不同的项目的边界合并了。在理解“绑定属性”方面,它也不如其他一些多模式人工智能应用程序。

该程序被称为DALL-E 2,它是OpenAI在2021年初首次推出的DALL-E系统的改进版本。最初的DALL-E只能以卡通风格渲染图片,通常是在简单的背景上。新的DALL-E 2可以产生高分辨率的照片,具有照片质量的背景,景深效果,逼真的阴影,阴影和反射。

OpenAI的员工阿里斯·康斯坦丁尼迪斯(Aris Konstantinidis)使用该工具创建了一只戴着红色大手帕骑摩托车的熊猫的图像。

OpenAI的另一位员工、研究和产品高级副总裁米拉·穆拉蒂(Mira Murati)演示了这项技术,他使用dal - e2从以下文本中构建了一张图像:“一大家子老鼠舒适地戴着帽子在壁炉边的微距离35mm胶片摄影。”

DALL-E 2还简化了图像编辑。在需要更改的图像部分周围画一个方框,并在自然语言指令中定义修改。

此外,OpenAI声称,它已采取措施限制该软件的能力,试图从人工智能的训练数据中删除攻击性或种族主义照片,并对人工智能生成的图像应用基于规则的过滤器和人类内容评估

该工具通过等待列表向有限数量的用户推出。我们很高兴能够得到这个工具并进行测试。

广告

留下回复

你的电邮地址将不会公布。