С момента своего дебюта генеративный искусственный интеллект (ИИ) окружен слухами о том, что его творческие способности уже превзошли человеческие. Недавнее исследование, опубликованное в журнале International Journal of Human-Computer Interaction, однако, предлагает более детальный взгляд на проблему. Авторы работы обнаружили, что хотя ИИ превосходно справляется с созданием разнообразных интерпретаций неоднозначных изображений, люди по-прежнему воспринимают работы, сделанные человеком как более креативные, а значит такие системы как ChatGPT от OpenAI, Llama от Meta и Google Bard по-прежнему нам уступают. Тем не менее их стремительная разработка и внедрение легли в основу дискуссии о влиянии ИИ-инструментов на общество, Интернет и труд. Вот почему по мере того, как ИИ продолжает развиваться и выполнять задачи, традиционно возложенные на людей, растет обеспокоенность по поводу вытеснения человеческого труда, последствий для образования и этических аспектов контента, создаваемого ИИ.
ИИ меняет Интернет
На протяжении десятилетий поиск информации в Интернете означал поиск в поисковых системах, таких как Google и Yandex и переход по предлагаемым ими ссылкам. Поиск был основным инструментов поиска информации причем настолько, что мало кто вообще об этом задумывался. Стоит ли говорить, что ситуация изменилась после триумфа генеративных ИИ-систем – поиск информации в сети теперь находится под управлением ИИ, что значительно упрощает процесс, так как искать ответы просто переходя по ссылкам теперь не нужно.
Звучит и выглядит здорово, однако Интернет тем временем заполняется контентом сомнительного качества, созданным с помощью искусственного интеллекта. Это, в свою очередь, ухудшает результаты поиска и делает традиционный поиск информации в сети не таким полезным и эффективным. Последствия этого сдвига могут быть серьезными, так как привычные поисковые системы могут быть практически полностью заменены на новые с внедренными ИИ-инструментами.
Еще одна проблема, связанная с приходом ИИ в глобальную паутину, как уже упоминалось выше, заключается в производстве и качестве контента – с помощью ChatGPT, как известно, сегодня можно делать все что угодно – создавать записи в блогах, писать музыку, песни, стихи и даже общаться с друзьями, членами семьи и противоположным полом.
Однако нельзя не признать очевидное – современный ИИ впечатляюще хорош в написании контента, даже несмотря на то, что ему не хватает индивидуальности, характера и личного опыта. Как видите, ИИ уже активно меняет Интернет – от поисковых систем до социальных сетей и рабочих приложений и продолжит делать это как в ближайшем, так и отдаленном будущем.
ИИ и творчество
Любой разговор о качестве контента в сети не обходится без искусственного интеллекта, а споры о том, что умные системы уже превзошли человека в таких областях как искусство, не утихают. Но как в действительно обстоят дела с креативностью того же ChatGPT? Исследователи отмечают, что из-за быстрого развития генеративных ИИ-систем, они уделяют большое внимание текущим возможностям этого ноу-хау по сравнению с производительностью людей.
В работе, недавно опубликованной в журнале International Journal of Human-Computer Interaction ученые стремились эмпирически исследовать текущее состояние творческих способностей ИИ по сравнению с человеческими.
В более общем плане нам было интересно понять, как современные ИИ-системы изменят восприятие креативности людьми и какое социальное воздействие могут оказать на общество и культуру, – объясняет один из авторов исследования Симон Грассини из Университета Бергена.
Чтобы изучить сравнительные творческие способности искусственного интеллекта и человека, авторы работы использовали «Задание на интерпретацию фигур» (FIQ), целью которого является интерпретация неоднозначных абстрактных фигур. Задание предназначено для оценки дивергентного мышления – когнитивного процесса, который включает в себя выработку множества уникальных решений или идей в ответ на проблему (что отличается от конвергентного мышления, которое фокусируется на поиске единственного правильного решения).
Важно отметить, что FIQ – это недавно разработанный тест, а значит, что тестируемая в ходе исследования система искусственного интеллекта (ChatGPT-4) не могла получить оптимальных результатов в обучающих данных до 2021 года. Но так как FIQ является мультимодальным тестом и требует как восприятия неоднозначного визуального образа, так и создания творческой текстовой интерпретации изображений, он позволил ученым оценить способность ИИ «придумывать» оригинальные творческие решения, а не просто извлекать ответы из имеющейся памяти.
В исследовании приняли участие 279 носителей английского языка, набранных с помощью онлайн-платформы, из которых 256 прошли тестирование. Этих участников попросили дать два разных толкования каждой из четырех неоднозначных фигур. Цель состояла в том, чтобы дать толкования, которые были бы настолько семантически отличными друг от друга, насколько это возможно. Участникам было дано 30 секунд на то, чтобы описать интерпретации каждого изображения, гарантируя, что они ответят в соответствии с ограниченным временем, которое соответствовало реальным творческим заданиям.
Параллельно с этим был протестирован чат-бот с искусственным интеллектом ChatGPT-4, интерпретирующим те же данные, что и испытуемые. ИИ было предложено генерировать ответы различной длины (одно, два или три слова), чтобы имитировать ответы людей (это было сделано для обеспечения объективного сравнения реакций человека и ИИ). Сеансы ИИ проводились несколько раз, чтобы собрать достоверный набор данных об интерпретациях, сгенерированных системой.
Как оценить креативность?
Чтобы оценить креативность, коллегия из одиннадцати судей, которые не имели представления о том, чьи именно интерпретации они оценивали (испытуемых или ИИ), оценила каждый ответ по шкале от 0 до 2. Оценка 0 указывала на базовый или нетворческий ответ, 1 – на творческий ответ, а 2 – на исключительно творческую интерпретацию. Судьями были студенты-психологи, которые оценивали ответы в рамках своей исследовательской подготовки или в обмен на зачет.
Как впоследствии обнаружили авторы работы, ChatGPT-4 был искусен в создании семантически разнообразных идей и продемонстрировал свою способность мыслить по-разному в разных контекстах. «ИИ продемонстрировал более высокий уровень гибкости в генерировании интерпретаций по сравнению с людьми», – говорится в статье.
Одним из удивительных аспектов было то, насколько хорошо языковая модель искусственного интеллекта работала с точки зрения генерации семантически разнообразных интерпретаций неоднозначных визуальных образов. Показатели гибкости ИИ, основанные на анализе семантической дистанции, были в среднем выше, чем у человека, что подчеркивает способности больших языковых моделей, – сказал Грассини в интервью PsyPost.
Однако, несмотря на способности ИИ, судьи в целом воспринимали ответы, данные людьми, как более креативные. Это говорит о том, что существуют аспекты креативности, которые выходят за рамки простого семантического разнообразия и, вероятно, связаны с богатством человеческого опыта и нюансами интерпретации символов.
Кроме того, ответы людей, набравших наибольшее количество баллов, превзошли лучшие ответы ИИ – в то время как ChatGPT выдал более узкий диапазон ответов, люди продемонстрировали более широкий спектр идей, что способствовало их более высоким показателям креативности.
ИИ преуспел в создании семантически разнообразных интерпретаций неоднозначных визуальных образов, однако, когда судьи субъективно оценивали креативность результатов работы ИИ по сравнению с ответами людей, они, как правило, воспринимали человеческие реакции как более креативные в целом, – объясняет Грассини.
Результаты работы свидетельствуют о том, что, хотя искусственный интеллект обладает развитыми способностями в создании разнообразных творческих идей и очень хорошо выполняет заданные инструкции, человеческая креативность по-прежнему выигрывает, по крайней мере, в том, как она воспринимается субъективно.
Исследование также подчеркивает значительный прогресс в развитии больших языковых моделей и их текущие ограничения по сравнению с человеческими когнитивными способностями, когда речь заходит о творческих задачах, требующих мультимодальной обработки данных и неограниченного воображения.
Ограничения и выводы
Новое исследование, каким бы новаторским не казалось, имеет ограничения и сосредоточено только на одном типе творческих заданий, связанных с неоднозначными визуальными образами, которые могут не распространяться на другие области творчества. Кроме того, отключение обучающих данных ИИ в сентябре 2021 года означает, что он, возможно, не был полностью оптимизирован для задачи FIQ, которая была разработана позже.
Отметим, что ранее проведенные исследования также показали интересные результаты – в одной из работ ИИ превзошел среднестатистического человека в тесте на творческое мышление. Еще одно исследование показало, что искусственный интеллект набрал высший балл по креативному мышлению, используя задание на дивергентное мышление, которое измеряло количество и уникальность идей, генерируемых в ответ на подсказки.
Этот тип задач подчеркивает способность генерировать самые разнообразные идеи – область, в которой способность ИИ использовать обширные наборы данных и эффективность его алгоритмов дают ему преимущество перед обычным человеком.
Так или иначе, долгосрочная цель исследователей этой области заключается в лучшем понимании когнитивных механизмов, которые лежат в основе креативности человека и того, как она соотносится с реализацией креативности в системах искусственного интеллекта. Дальнейшие исследования могут пролить свет на уникальные преимущества человеческого познания в сравнении с подходами ИИ (и наоборот).
Нет комментарий