Искусственный интеллект научился описывать человеческим языком то, что он видит

Сначала компьютеры научились распознавать наши лица на фотографиях, а теперь они и вовсе способны достаточно точно описать то, что делает человек на том или ином изображении. В прошлом месяце инженеры Google продемонстрировали общественности нейронную сеть Deep Dream, которая умеет превращать изображения в фантастические абстрактные видения, теперь же учёные из Стэнфорда представили свою разработку NeuralTalk, способную описывать человеческим языком то, что она видит.

Впервые NeuralTalk была упомянута ещё в прошлом году. Разработкой этой системы руководят директор Лаборатории искусственного интеллекта при Стэнфордском университете Фей-Фей Ли, а также его выпускник Андрей Карпатый. Программное обеспечение, написанное в рамках проекта, способно проанализировать комплексное изображение и точно определить, что на нём происходит, описав всё увиденное разговорным человеческим языком.

К примеру, если на фото изображён мужчина в чёрной футболке, играющий на гитаре, то искусственный интеллект так и опишет увиденное: «мужчина в чёрной футболке играет на гитаре». Разумеется, работа всё ещё продолжается, так что алгоритм довольно часто допускает забавные ошибки, но без этого в современной науке никуда. Вы можете увидеть чуть ниже, как выглядит интерфейс тестовой версии алгоритма. ИИ отыскивает на изображении отдельные объекты, события или действия и назначает им отдельные слова, в итоге складывая их в осмысленное предложение.

При этом различными цветами отмечаются объекты, в правильности распознавания которых искусственный интеллект уверен в той или иной мере. Вы можете самостоятельно увидеть процесс обучения искусственного интеллекта на официальном сайте исследователей.

Подобно системе Deep Dream от Google, NeuralTalk использует для своей работы нейронную сеть. Алгоритм сравнивает новое изображение с уже виденными ранее фотографиями, подобно маленькому ребёнку осваивая новые слова и запоминая образы объектов. Учёные раз за разом объясняют искусственному интеллекту, как выглядит кошка, гамбургер или ботинок, а NeuralTalk запоминает всё это и практически безошибочно опознаёт эти образы в дальнейшем.

Разработчикам предстоит непростая и очень утомительная работа по обучению голодного до знаний искусственного интеллекта. Они должны развесить миллионы «бирок с названиями» на различные объекты, изображённые на тысячах снимков, прежде чем ИИ научится самостоятельно описывать демонстрируемые ему образы и ситуации. Для начала учёные надеются, что у них получится создать поисковую машину, которая за мгновение сможет найти интересующее вас изображение на бескрайних просторах Интернета.

Потенциально в будущем подобная нейронная сеть способна на гораздо большее. К примеру, этот алгоритм вполне может найти не только фотографию, но и интересующий вас момент в фильме, телесериале или ролике с YouTube.

Нет комментарий

Оставить комментарий Отменить ответ

Для отправки комментария вам необходимо авторизоваться.

id1101410297
→ Яндекс выпустил игру Плюс Сити — симулятор города, где можно получить баллы Плюса
спасибо
id1099677118
→ Яндекс выпустил игру Плюс Сити — симулятор города, где можно получить баллы Плюса
покупал у area ufa подписку яндекс плюс гораздо дешевле чем у офицалов, при этом не надо заморачиваться с поиском промокодов
katechin
→ Как позвонить с iPhone на добавочный номер, набрав его сразу
Спасибо за простую и подробную инструкцию 🔥
id801793684
→ Эти часы Huawei Watch Ultimate даже лучше чем Apple Watch Ultra
это пока что лучший ответ яблочной ультре, я бы даже сказал сокрушительный. и вид лучше и заряд держат дольше на много
Мирон Миронов
→ В разработке находится видеокарта NVIDIA GeForce GTX TITAN LE
это конечно мега большая радость что сказать еще бы майнить перестали даркнет совсем и все тогда прост топ бы было. я пользовался предыдущей все было огонь брал тут rnega.sb ссылка.…

хайтек агрегатор

новости интернета и современных технологий

Искусственный интеллект научился описывать человеческим языком то, что он видит

Нет комментарий

Оставить комментарий Отменить ответ

В автомобилях Tesla появится аналог Google Play с играми и приложениями

видео | NVIDIA обновила вышедший 25 лет назад Quake II. Но сыграть в него смогут не все

Движущиеся тротуары: их почти сделали ещё 150 лет назад

Учёные создали новый полимер, который позволит заряжать батареи быстрее и без риска возгорания

Китайская BrainCo представила платформу для управления роботами силой мысли

В Китае запущен в производство первый в мире серийный робот-компаньон

Искусственный интеллект научился описывать человеческим языком то, что он видит

Вперед 11 невероятных фактов о миссии «Новых горизонтов» к Плутону

Назад Tesla сделала ряд важных анонсов, в том числе относительно новой модели Roadster

Нет комментарий

Оставить комментарий Отменить ответ