[ Jump to content ]

arne.xyz

delivered in beta


Tag: ai

ImmoScout24 bietet nun bei Innenraum-Photos die Möglichkeit per ✨KI✨ den Raumstil zu ändern – die Ergebnisse sehen im Moment bei Photos noch eher dürftig aus:

Screenshot von einem Innenraum-Photo in der Photo-Gallerie von ImmoScout24. Unter dem Photo ist ein Button mit der Beschriftung "Raumstiel mit KI ändern", links daneben der Hinweis "Beta".
Screenshot ImmoScout24, 01.01.2025.
Screenshot von der Photo-Gallerie bei ImmoScout24, nachdem der Button "Raumstil mit KI ändern" gedrückt wurde: Über dem Bild ist ein Schieberegler, mit dem sich zwischen dem Original und dem KI-generiertem Bild hin- und her wechseln lässt. Das KI-generierte Bild zeigt den gleichen Raum, nur unwesentlich verändert, die Stühle in der Mitte des Raumes sind deutlich entstellt, die Fußbeine enden im Nichts. Unter dem Bild gibt es nun mehrere Schaltflächen mit denen sich die Raumstile ändern lassen: industriell, maritim, modern, skandinavisch.
Screenshot ImmoScout24, 01.01.2025.

Augenscheinlich kommt das KI-Modell mit 3D-Renderings besser zurecht, was ein guter Hinweis auf die verwendeten Trainingsdaten ist:

Screenshot eines Renderings statt eines Photos, dass durch die ImmoScout24-KI bearbeitet wurde. Hier sind die Unterschiede zwischen den Raumstilen deutlicher und die Möbel sehen nicht »kaputt« aus.
Screenshot ImmoScout24, 01.01.2025.

Grundsätzlich finde ich das einen interessanten Anwendungszweck für solche bildgebende Algorithmen. Und die Ergebnisse, die auch andere Tools wie z. B. ReRender, ArchiVinci oder mnml.ai mit Architektur-Renderings liefern, sind schon sehr beeindruckend; nur dass das Generieren eines KI-Renderings deutlich schneller geht, als das von 3D-Modellen – und zudem kann schneller mit verschiedenen Stilen und Licht-Szenarien gespielt werden.

OpenAI, die Firma hinter ChatGPT, hat eine weitere LLM bzw. generative KI veröffentlicht: OpenAI Sora. Eine generative KI die auf Basis von ›Prompts‹ (also Text) bis zu 60 Sekunden lange Videos produzieren kann. Über die Kinderkrankheiten sollte man hinwegsehen, die werden schnell ausgebügelt sein. Die Ergebnisse sind beeindruckend und erschreckend zu gleich: Wofür soll das gut sein, außer für die Disruption des Stock-Video-Marktes und dem Erstellen von Fakes und Desinformation?

Dafür:

It's for training data for AGI-1. You'd think enough video exists in the world but it's actually not well labeled for AI to understand. In this way they can create memories from infinite lives AND store all the concepts used to generate them. They'll use people to help tune which data is good (thumbs up the good generations) and then it all gets fed into the next gen AI that can truly think.
via @nrose bei Threads am 2024-02-15, 22:19.

Es geht OpenAI, und anderen KI-Firmen, darum, den Sprung von Generative AI (GAI) zu Artificial General Intelligence (AGI) zu schaffen: Weg von Algorithmen, die nur raten und nicht denken können, hin zu einer »echten« KI, die selbst denkt. Und dafür braucht es Trainingsdaten. Jede Menge Trainingsdaten. Denn KIs bzw. LLMs sind langsame Lerner und auch wenn YouTube jeden Tag mit mehr Videos bestückt wird, als man noch gucken kann, sind die Daten nicht gut für Trainings verwertbar, denn es fehlen Beschreibungen, Meta-Daten und Kontexte; und hier helfen GAIs die die Beschreibung durch einen Prompt erhalten, dann Texte, Bilder oder Videos erzeugen und Feedback durch User, ob das Ergebnis dem Wunsch bzw. dem Prompt entspricht.

Der Weg zur »echten«, selbstdenkenden KI ist sicherlich noch lang, aber der Weg dorthin wird noch mit einigen erschreckenden Überraschungen und Werkzeugen aufwarten.


Dieser Beitrag erschien zuerst im untitled-Newsletter 01 am 01.03.2024.

Hallo erlesene Leserschaft,

und willkommen zur ersten Ausgabe des untitled-Newsletters! Ich freue mich sehr, dass ihr euch mit mir auf diese etwas ungewisse Reise begebt. In der letzten Woche bin ich meine gespeicherten Notizen, Links, Screenshots, Instagram-, Threads-, Mastodon- und Bluesky-Posts durchgegangen – oh my, wie viel kann man eigentlich in einem Monat anhäufen?! – und kompiliere euch daraus die, aus meiner Sicht, interessantesten Dinge aus dem Spannungsfeld von Design, Philosophie, Technologie, Umwelt(schutz) und Urbanismus/Architektur.

Continue