Microsoft дала текстовое описание, и ИИ нарисовал птицу

Уже известно об алгоритмах, которые способны определять, что изображено на фото. Обычно ИИ распознает такие фотографии с высокой точностью (до 80%). Теперь же Microsoft поставила перед искусственным интеллектом новую планку. Исследователи описали словами то, что они хотят видеть на изображении. А именно – желтую птицу с черными крыльями и коротким клювом. ИИ нарисовал птицу, и очень точно!

Рисунок выглядит как  настоящая фотография. А это тем более впечатляет, потому что изображение не создавалось на основе других. Не использовалась готовая база данных. Алгоритм создал рисунок самостоятельно.

AI painted a bird

 

Сяодун Хэ, руководивший исследованием, говорит, что это не похоже на то, когда вы вводите в поисковую строку слово, и получаете подходящие изображения. Здесь же фотография создается ИИ самостоятельно. По пикселям собирается изображение. То есть, такого еще нет. Возможно, изображаемого вообще в природе не существует. Это как воображение компьютера. ИИ нарисовал птицу просто по текстовому описанию, это большой успех в развитии таких технологий.

Конечно, пока это далеко от идеала. Но мы наблюдаем стремительный прогресс в области развития различных научных достижений, в том числе, разработки ИИ. С легкостью можно представить, как данные способности искусственного интеллекта в будущем помогут художникам и дизайнерам. Ведь для визуализации потребуется минимальное количество времени, а результат может превзойти все ожидания. Это также может помочь и в обработке фотографий с помощью голосового управления.

Недавно японские исследователи начали обучать ИИ визуализации мыслей человека. Достигается это при помощи нейронных сетей. Пока картинки получаются размытыми и больше напоминающими кляксы. Но зато есть прямая зависимость между мыслями человека и этим изображением. Такая технология может быть  в будущем применена, к примеру,  для изучения снов. Также – для искусства, ведь фантазии человека смогут быстро реализовываться. Кроме того, это способ чтения мыслей – серьезная специфика.

Microsoft вообще предполагает, что станет возможным создание анимационных фильмов только на основе текстового сценария. Звучит это, конечно, почти фантастически, но вскоре уже нечему будет удивляться.

Команда исследователей начала разработку компьютерного зрения и обработки естественного языка. Эти технологии могут очень помочь слепым людям. ИИ создает подписи к фотографиям, а затем, с помощью полученных данных, может ответить на вопросы, заданные пользователям по поводу того, что нарисовано.

Один аспект является очень сложным для разработчиков. Человек, при восприятии зрительных образов, использует такое качество как внимание. Это самое внимание команда и пытается сымитировать в ИИ. Необходимо сделать внимание вычисляемым. Так, чтобы внимание стало просто математикой. То, что ИИ нарисовал птицу по описанию, уже большой прорыв в этой области.