Microsoft дала текстовий опис, і ШІ намалював птицю

Уже відомо про алгоритми, які здатні визначати, що зображено на фото. Зазвичай ШІ розпізнає такі фотографії з високою точністю (до 80%). Тепер же Microsoft поставила перед штучним інтелектом нову планку. Дослідники описали словами те, що вони хочуть бачити на зображенні. А саме — жовту птицю з чорними крилами і коротким дзьобом. ШІ намалював птицю, і дуже точно!

Малюнок виглядає як справжня фотографія. А це тим більше вражає, тому що зображення не створювалося на основі інших. Чи не використовувалася готова база даних. Алгоритм створив малюнок самостійно.

ШІ намалював птицю

Сяодун Хе, який керував дослідженням, говорить, що це не схоже на те, коли ви вводите в пошуковий рядок слово, і отримуєте відповідні зображення. Тут же фотографія створюється ШІ самостійно. За пикселям збирається зображення. Тобто, такого ще немає. Можливо, зображуваного взагалі в природі не існує. Це як уява комп’ютера. ШІ намалював птицю просто по текстовому опису, це великий успіх у розвитку таких технологій.

Звичайно, поки це далеко від ідеалу. Але ми спостерігаємо стрімкий прогрес в області розвитку різних наукових досягнень, в тому числі, розробки ШІ. З легкістю можна уявити, як ці можливості штучного інтелекту в майбутньому допоможуть художникам і дизайнерам. Адже для візуалізації потрібно мінімальну кількість часу, а результат може перевершити всі очікування. Це також може допомогти і в обробці фотографій за допомогою голосового управління.

Нещодавно японські дослідники почали навчати ШІ візуалізації думок людини. Досягається це за допомогою нейронних мереж. Поки картинки виглядає розмитою і більше нагадують плями. Але зате є пряма залежність між думками людини і цим зображенням. Така технологія може бути в майбутньому застосована, наприклад, для вивчення снів. Також — для мистецтва, адже фантазії людини зможуть швидко реалізовуватися. Крім того, це спосіб читання думок — серйозна специфіка.

Microsoft взагалі передбачає, що стане можливим створення анімаційних фільмів тільки на основі текстового сценарію. Звучить це, звичайно, майже фантастично, але незабаром уже нічому буде дивуватися.

Команда дослідників почала розробку комп’ютерного зору і обробки природної мови. Ці технології можуть дуже допомогти сліпим людям. ШІ створює підписи до фотографій, а потім, за допомогою отриманих даних, може відповісти на питання, задані користувачам з приводу того, що намальовано.

Один аспект є дуже складним для розробників. Людина, при сприйнятті зорових образів, використовує таку якість як увага. Це саме увагу команда і намагається зімітувати в ШІ . Необхідно зробити увагу обчислюваним. Так, щоб увага стала просто математикою. Те, що ШІ намалював птицю за описом, вже великий прорив в цій області.