以假乱真的 AI 生成式图片,AI 自己分辨不出来了。
(资料图片)
这张马斯克和机器人女友的照片,5 个鉴别器里有 2 个都觉得是真的:
还有这张人类和 3 米巨人的合照,居然 5 个鉴别器一致判断为真:啊这,AI 鉴别器似乎不太靠谱的亚子。这就是《纽约时报》最近做的一项测试,他们找来了市面上五个常见的 AI 鉴别器,分别喂给它们 100 多张照片做测试。
结果发现,AI 鉴别器不仅会把 AI 照片错认成真的,也会把真实照片划定为 AI 生成的。
而且不同鉴别器之间的水平差距也不小。
具体表现如何?一起来看
加点颗粒(Grain)就能骗过鉴别器
在这项测试中一共使用了 5 个 AI 鉴别器,分别是:
Umm-maybe
Illuminarty
A.I or Not
Hive
Sensity
测试的内容包括 AI 和人类创作的图片,分别喂给每个鉴别器,看它们会怎样判断。
使用的 AI 创作工具包括 Midjourney、Stable Diffusion、Dall-e 等。
《纽约时报》主要展示了这样几个例子。包含 5 张 AI 创作的图片,以及 2 张真人拍的照片。
从统计结果来看,五个鉴别器中只有Hive全部判断正确。
Umm-maybe 的表现最差,只判断对了两张图。
举例来看,这张照片是 AI 生成的,听说还在 2 月的一场摄影比赛中拿下大奖,这道题就难倒了大部分鉴别器。但这张纯 AI 生成的照片,就没有逃过大部分鉴别器的法眼。对于人类创作的照片,AI 鉴别器的正确率比较高,两张照片都只有 Umm-maybe 鉴别器判断错误。此外他们还专门测试了艺术画,发现大部分 AI 鉴别器能判断出这是真人画的。对比另一幅 AI 创作的,同样也是四个鉴别器判断正确。(Umm-maybe 啊……是真的不太行)
值得一提的是,如果对 AI 图像进行一些加工处理,AI 鉴别器会失效。比如这张 Nike 男的照片,一开始有 4 个鉴别器判断它是 AI 生成的。
但如果给图片加一些颗粒,AI 鉴别器就会将这张图片的 AI 含量从 99%,判断为仅有 3.3%。最后,我们也测试了一些能上手实测的鉴别器(Umm-maybe、Illuminarty、A.I or Not)。结果显示,对于 " 马斯克在苏联 " 这张图,Umm-maybe 觉得它有 85% 的概率是人类创作的。
Illuminarty 觉得它是 AI 创作的概率仅有 5.4%。只有 A.I or Not 确定了它是 AI 生成的。AI 鉴别的判断标准是啥?那么 AI 到底是怎么鉴别真伪的?
普遍来说,它们和人类的判断标准不太一样,人类一般以图像内容的合理性为依据,而 AI 更多是从图像的参数入手,比如像素的排列方式、清晰度、对比度等。
所以这就解释了开头那张巨人照片,为啥所有鉴别器都觉得很真。
在 AI 画画大火一年多以后,如今市面上已经出现了非常多鉴别器。有的就是直接放在 Hugging Face 上供大家免费使用,有的则是已经成立公司,只提供 API 接口形式。
比如 Hive 就是一家提供商业解决方案的公司,从如上的测试结果可以看到,Hive 的表现效果也是最好的,几乎都能判断正确。
而在这之前他们的主要业务是为平台网站提供数据审核服务,图像视频文字都支持,服务的平台有 Reddit、Quora 等。
参考链接:
https://www.nytimes.com/interactive/2023/06/28/technology/ai-detection-midjourney-stable-diffusion-dalle.html