DALL-E        zurück ]      [ Stichworte ]      [ Die Hyper-Bibliothek ]      [ Systemtheorie ]         [ Meine Bücher ]
 

Als DALL-E bezeichne ich ein von OpenAI entwickeltes KI-Programm, mit welchem Bilder zu Beschreibungen erstellt werden.

Es verwendet eine 12-Milliarden-Parameter-Version des GPT-3-Transformationsmodells, um natürlichsprachliche Eingaben zu interpretieren (z. B. "eine grüne Ledertasche in Form eines Fünfecks" oder "eine isometrische Ansicht eines traurigen Wasserschweins") und entsprechende Bilder zu erzeugen. Es kann sowohl Bilder von realistischen Objekten ("ein Buntglasfenster mit dem Bild einer blauen Erdbeere") als auch von Objekten erzeugen, die in der Realität nicht existieren ("ein Würfel mit der Textur eines Stachelschweins"). Sein Name ist ein Portmanteau aus WALL-E und Salvador Dalí.

Viele neuronale Netze sind in der Lage, realistische Bilder zu erzeugen. DALL-E ist jedoch in der Lage, sie anhand von Aufforderungen in natürlicher Sprache zu erzeugen, die es "versteht [...] und selten ernsthaft versagt".

OpenAI hat den Quellcode für beide Modelle nicht veröffentlicht, obwohl ein "Controller" von DALL-E auf der Website von OpenAI zur Verfügung steht, auf der die Ausgabe einer begrenzten Auswahl von Beispiel-Prompts eingesehen werden kann. Open-Source-Alternativen, die auf kleineren Datenmengen trainiert wurden, wie DALL-E Mini, wurden von anderen veröffentlicht.

bild bild
Bilder, die von DALL-E produziert wurden, wenn die Textaufforderung "eine professionelle, qualitativ hochwertige Illustration einer Giraffen-Drachen-Chimäre. eine Giraffe, die einen Drachen imitiert. eine Giraffe aus Drachen" gegeben wurde.
(Bild)quelle: Wikipedia

 
[ Roland Meyer @bildoperationen ]
off-topc zu: Erstens: Sprache und Bild.
Es geht dabei nicht um die Differenz, sondern um eine Art Gleichsetzung. So, als könnte als könnte man sagen, was auf einem Bild ist, oder zu etwas Gesagtem ein Bild machen. Im Essay wird diese Problematik aufgehoben in Bedingungen des relativen Gelingens.
Umgangssprachlich: Kannst Du mir ein "Bild von Dir" geben, wobei "Bild" wörtlich im Sinne von Technobild gemeint ist. Was aber siehst Du von mir auf eine Fotographie? Was davon, was ich über mich sagen würde?
 
[wp]