OpenAI, die Firma hinter ChatGPT, hat eine weitere LLM bzw. generative KI veröffentlicht: OpenAI Sora. Eine generative KI die auf Basis von ›Prompts‹ (also Text) bis zu 60 Sekunden lange Videos produzieren kann. Über die Kinderkrankheiten sollte man hinwegsehen, die werden schnell ausgebügelt sein. Die Ergebnisse sind beeindruckend und erschreckend zu gleich: Wofür soll das gut sein, außer für die Disruption des Stock-Video-Marktes und dem Erstellen von Fakes und Desinformation?
Dafür:
Es geht OpenAI, und anderen KI-Firmen, darum, den Sprung von Generative AI (GAI) zu Artificial General Intelligence (AGI) zu schaffen: Weg von Algorithmen, die nur raten und nicht denken können, hin zu einer »echten« KI, die selbst denkt. Und dafür braucht es Trainingsdaten. Jede Menge Trainingsdaten. Denn KIs bzw. LLMs sind langsame Lerner und auch wenn YouTube jeden Tag mit mehr Videos bestückt wird, als man noch gucken kann, sind die Daten nicht gut für Trainings verwertbar, denn es fehlen Beschreibungen, Meta-Daten und Kontexte; und hier helfen GAIs die die Beschreibung durch einen Prompt erhalten, dann Texte, Bilder oder Videos erzeugen und Feedback durch User, ob das Ergebnis dem Wunsch bzw. dem Prompt entspricht.
Der Weg zur »echten«, selbstdenkenden KI ist sicherlich noch lang, aber der Weg dorthin wird noch mit einigen erschreckenden Überraschungen und Werkzeugen aufwarten.
Dieser Beitrag erschien zuerst im untitled-Newsletter 01 am 01.03.2024.