Microsoft gab eine Textbeschreibung und die AI zeichnete einen Vogel

Ich kenne bereits die Algorithmen, die bestimmen können, was auf dem Foto dargestellt ist. Normalerweise erkennt AI solche Fotos mit hoher Genauigkeit (bis zu 80%). Jetzt hat Microsoft vor künstlicher Intelligenz einen neuen Balken gesetzt. Forscher beschrieben in Worten, was sie auf dem Bild sehen möchten. Nämlich – ein gelber Vogel mit schwarzen Flügeln und einem kurzen Schnabel. AI hat einen Vogel gemalt und sehr genau!

Das Bild sieht wie ein echtes Foto aus. Und das ist umso beeindruckender, weil das Bild nicht auf der Grundlage anderer erstellt wurde. Die fertige Datenbank wurde nicht verwendet. Der Algorithmus hat die Zeichnung selbst erstellt.

AI hat einen Vogel gemalt

Xiaodong Er, der die Forschung leitete, sagt, dass dies nicht so ist, wenn man ein Wort in den Suchstring eingibt und die entsprechenden Bilder erhält. Hier wird das Foto allein von der KI erstellt. Das Bild wird durch Pixel gesammelt. Das heißt, das ist noch nicht. Vielleicht existiert das Dargestellte überhaupt nicht in der Natur. Es ist wie die Vorstellung eines Computers. AI hat den Vogel einfach per Textbeschreibung gemalt, das ist ein großer Erfolg in der Entwicklung solcher Technologien.

Natürlich ist dies alles andere als ideal. Aber wir sehen rasche Fortschritte bei der Entwicklung verschiedener wissenschaftlicher Errungenschaften, einschließlich der Entwicklung von AI. Mit Leichtigkeit können Sie sich vorstellen, wie diese Fähigkeiten der künstlichen Intelligenz in der Zukunft Künstlern und Designern helfen werden. Schließlich benötigt die Visualisierung ein Minimum an Zeit und das Ergebnis kann alle Erwartungen übertreffen. Dies kann auch bei der Verarbeitung von Fotos mithilfe der Sprachsteuerung hilfreich sein.

Vor kurzem begannen japanische Forscher, KI-Visualisierung von menschlichen Gedanken zu lehren. Dies wird mit Hilfe von neuronalen Netzen erreicht. Während die Bilder verschwommen sind und eher an Blots erinnern. Aber es besteht eine direkte Beziehung zwischen den Gedanken des Menschen und diesem Bild. Eine solche Technologie kann in Zukunft zum Beispiel für das Studium von Träumen verwendet werden. Auch – für die Kunst, weil die Phantasie eines Menschen schnell realisiert werden kann. Darüber hinaus ist dies eine Art, Gedanken zu lesen – eine ernsthafte Besonderheit.

Generell geht Microsoft davon aus, dass Animationsfilme nur auf Basis eines Textskriptes erstellt werden können. Es klingt natürlich fast phantastisch, aber bald wird es nichts mehr zu überraschen geben.

Das Forscherteam begann mit der Entwicklung einer Computer Vision und Verarbeitung natürlicher Sprache. Diese Technologien können blinden Menschen sehr helfen. Die KI erstellt Bildunterschriften für Fotos und kann dann mithilfe der empfangenen Daten Fragen beantworten, die den Benutzern über das, was gemalt wird, gestellt werden.

Ein Aspekt ist für Entwickler sehr schwierig. Wenn der Mensch visuelle Bilder wahrnimmt, benutzt er solche Qualität als Aufmerksamkeit. Dies ist die größte Aufmerksamkeit des Teams und versucht, in AI zu simulieren. Es ist notwendig, Aufmerksamkeit berechenbar zu machen. So wird die Aufmerksamkeit zur Mathematik. Die Tatsache, dass AI einen Vogel nach Beschreibung malte, ist bereits ein großer Durchbruch in diesem Bereich.