Нейросети, которые генерируют картинки, в последнее время поистине творят чудеса. Midjourney, Dall-e и всевозможные их аналоги по текстовому описанию создают полноценные фото, которые очень сложно отличить от реальных. Более того, уже были прецеденты, когда сгенерированное фото побеждало на конкурсе фотографов. Так немецкий фотограф Борис Эльдагсен был объявлен победителем Sony World Photography Award благодаря снимку “Псевдоамнезия: Электрик”, сгенерированному нейросетью. Но это вовсе не значит, что сгенерированные фотографии вообще нельзя отличить от настоящих. Хорошая новость заключается в том, что при должной внимательности выявить работу искусственного интеллекта может каждый, в чем вы далее можете убедиться сами.
Нейросети допускают много артефактов
Нейросети обучаются создавать реалистичные изображения, просматривая огромное количество реальных фото. Сивэй Люу, профессор компьютерных наук и инженерии в Университете Буффало, считает, что это является главной их “ахиллесовой пятой”. ИИ знают только то, что уже видели на других снимках, при этом не понимают принципа формирования тех или иных деталей, не знают физику. Поэтому при генерации снимков допускают много артефактов.
Чтобы заметить эти артефакты, нужно лишь внимательно присмотреться к снимку, а еще лучше — увеличить его, тогда все огрехи будут бросаться в глаза. К примеру, если речь идет о фото человека, обращать внимание следует на мелкие детали — очки, головные уборы, украшения, одежду, пряди волос, брови и т.д.
К примеру, посмотрите на фото этого молодого человека в наушниках, созданное нейросетью Bing. На первый взгляд ничего необычного, но если присмотреться, то сразу становится понятно, что перед нами сгенерированная фотография. В первую очередь бросается в глаза провод, который идет не к наушнику, а куда-то за шею. Левый наушник почему-то больше чем правый, как будто он к нам ближе, хотя парень сидит прямо. Правая бровь, хоть и затемнена, но сгенерирована тоже неестественно.
Неестественные руки и глаза в сгенерированных фото
У всех нейросетей плохо получается генерировать глаза, руки и пальцы. На каких-то фото они получаются лучше, на каких-то хуже, но в любом случае можно заметить артефакты. Иногда на руке может быть шесть пальцев, при этом руки могут быть разного размера. Причем это касается всех нейросетей, включая аналоги Midjourney, о которых мы рассказывали ранее.
Что касается глаз, то чаще всего зрачки смотрят в разном направлении. Кроме того, нейросети часто создают тени странной формы в центре глаза. Также искусственному интеллекту сложно правильно воспроизводить блики и тени. Это особенно хорошо заметно,
если на изображении есть окно или отражающая поверхность. Свет или тень могут быть там, где их быть не должно.
В качестве примера рассмотрим фото Бориса Эльдагсена, которое победила на фотоконкурсе. Если вы обратите внимание на глаза женщины, которая стоит ближе к нам, то заметите, что зрачки смотрят в разном направлении. Также обратите внимание на пальцы на ее левом плече. Один из них неестественно завернут, как будто палец сломан. Кроме того, руки расположены вообще неестественно, что хорошо заметно на фото ниже. Хотя, если смотреть на фото в целом, оно смотрится вполне естественно, выполнено в стиле снимков первой половины прошлого века.
Надо сказать, что существуют нейросети, такие как StyleGAN, которые обучены генерировать исключительно лица людей. Они отлично справляются со своей задачей и обычно не имеют вышеперечисленных недостатков, однако сгенерированные ими фото всегда обрезаны по шею. В жизни люди так никогда не фотографируются, кроме как на документы. Это тоже является характерной особенностью, на которую стоит обращать внимание.
Нейросети игнорируют законы физики и геометрию
Многие синтетические изображения также неестественную гладкость там, где должна быть текстура. Линии, которые должны быть прямыми, могут быть слегка изогнутым. Иногда нейросеть игнорирует законы гравитации — какие-то предметы, которые должны падать или свисать, просто парят в воздухе.
Вот, к примеру, сгенерированное фото праздничного застолья в ресторане. На первый взгляд оно безупречно. Но если вы присмотритесь внимательнее, то заметите кривые тарелки и очень странные бокалы с шампанским. То же самое касается и второго фото. Таким образом, присматриваясь к деталям, можно заметить на сгенерированных фото много огрехов ИИ.
Но, имейте в виду, что технологии развиваются семимильными шагами. Те советы, которые мы даем сегодня, могут быть неактуальными уже завтра. Поэтому самый лучший способ выявить фейковое фото — проверить его источник.
Нет комментарий