KI-Podcast Folge 16

"Algorithmischer Fotografie zu Deepfake-Erkennung: KI-Bild- und Videomodelle entwickeln sich gerade in einem Tempo, bei dem selbst Profis kaum hinterherkommen: Midjourney korrigiert seinen Kurs, ChatGPT Image 2 holt überraschend auf, und aus China kommen neue Videomodelle wie Wan 2.7 und Happy Horse. Gleichzeitig wird sichtbar, dass diese kreative Explosion teuer ist — in Geld, Rechenleistung, Energie und neuen Nutzungslimits. Die Folge diskutiert außerdem, warum KI-Bilder Fotografie, Journalismus und Wettbewerbe unter Druck setzen. Boris erklärt, warum Joan Fontcubertas „algorithmische Fotografie“ keinen Sinn macht. Im Gespräch mit Christoph Behl von "It’s Real" geht es schließlich darum, wie wir in einer Welt perfekter synthetischer Bilder wieder Vertrauen schaffen können: durch Detektion, Provenienzdaten und neue „Trust Zones“ für echte Bilder.

Im KI-Podcast unterhalten sich Dr. Jürgen Scriba, Leiter der Arbeitsgruppe "Technischer Fortschritt" / Deutscher Fotorat und Boris Eldagsen (Mitglied der Arbeitsgruppe) mit wechselnden Gästen über aktuelle Auswirkungen von KI auf Fotografie.

https://itsreal.media/de/about

HIGHLIGHTS:
00:08 - Rückblick auf April/Anfang Mai: Die EU-Guidelines zur juristischen Definition von Deepfakes fehlen weiterhin. Bis dahin wird praktisch weiter getestet, wie Deepfakes und synthetische Medien entstehen.
00:31 - Bei KI-Bildmodellen gab es große Bewegung: Midjourney 8.1 korrigiert viele Schwächen von Version 8.0. Die neue Architektur bietet mehr Kontrolle und bringt zugleich wieder mehr vom alten „Midjourney-Feeling“ zurück.
02:17 - ChatGPT Image 2 wird neu bewertet: In der Beta war es enttäuschend, inzwischen liegt es in vielen Use Cases fast gleichauf mit Nano Banana 2. Schwächen bleiben Zensur, höhere Kosten und langsamere Verarbeitung.
04:53 - In praktischen Bildtests zeigt sich: ChatGPT Image 2 überzeugt bei Bildrestauration, Lichtübertragung, Pose-Transfer und komplexen Bildkombinationen. Nano Banana 2 ist stärker bei Realismus, Farbpaletten und manchen Stilübertragungen. Seedream bleibt bei Face-Swap vorn.
12:41 - Im Videobereich bringt Alibaba gleich zwei Modelle: Wan 2.7 und Happy Horse. Beide kommen aus unterschiedlichen Alibaba-Labs; Happy Horse zielt stärker auf Talking Heads, Short Drama und menschliche Figuren. Die Abgrenzung der Modelle bleibt aber unscharf.
15:51 - Die Kostenfrage wird immer sichtbarer: KI-Infrastruktur, Tokenverbrauch und Rechenleistung explodieren. Nutzer merken das an Limits, langsameren Diensten und teuren Pro-Tarifen. Der Energie- und Ressourcenverbrauch wird zu einem zentralen Problem.
21:07 - KI-Bilder tauchen zunehmend in Fotowettbewerben auf. Beispiele aus Hasselblad- und Naturfoto-Wettbewerben zeigen, wie schwer Jury und Publikum echte Fotos von synthetischen oder manipulierten Bildern unterscheiden können.
24:03 - Taylor Swift versucht, ihr Gesicht rechtlich per Trademark zu schützen. Nachträgliche Lichtveränderung in Fotos bald Standard wird. Für Fotografen verschiebt sich damit eine Kernkompetenz: Lichtsetzung kann zunehmend nachträglich simuliert werden.
30:00 - Es folgt eine philosophische Debatte: Sind KI-generierte Bilder Fotografie? Boris widerspricht Joan Fontcubertas These von „algorithmischer Fotografie“ und argumentiert, KI-Bilder seien Teil eines größeren Metamediums: Latent Space.
40:47 - Unser Gast Christoph Behl erklärt, wie sein Unternehmen KI-generierte und manipulierte Bilder erkennt. It’s Real gewann eine SPRIND-Challenge zur Deepfake-Detektion und arbeitet mit einem multisignalen Ansatz.
47:56 - Die Detektion basiert nicht nur auf Pixelanalyse, sondern auch auf semantischen Mustern: Bildsprache, Symmetrie, Texturen, Rauschen, Frequenzen, Entropie und typische KI-Artefakte werden kombiniert. Ziel ist nicht nur „Fake oder echt“, sondern ein belastbares Vertrauenssignal.
55:09 - An Beispielen zeigt "It’s Real", wie komplett generierte Bilder, authentische Bilder und teilweise manipulierte Bilder unterschieden werden. C2PA-Provenienz wird ebenfalls geprüft, reicht aber allein nicht aus, weil viele Bilder keine oder fehlerhafte Metadaten haben.
58:01 - Zielgruppen sind breiter als geplant: Medien, Bildagenturen, Behörden, Polizei, Militär, Versicherungen und E-Commerce interessieren sich für Bildprüfung. Besonders relevant sind Betrug, Desinformation, Bildarchive und journalistische Verifikation.
1:03:04 - Der Begriff „Deepfake“ wird kritisch gesehen, weil er juristisch und praktisch unscharf ist. Statt alles KI-generierte zu labeln, schlägt Christoph vor, stärker das Echte zu zertifizieren: Trust Zones, Provenienzdaten und geprüfte Authentizität.
1:07:14 - Provenienzdaten werden als künftig ebenso wichtig wie die Bilddatei selbst beschrieben. Archive, historische Bilder und ältere Bestände brauchen neue Formen der Zertifizierung.
1:09:41 - Fazit: Vertrauen in Bilder wird künftig aktiv hergestellt werden müssen — technisch, juristisch und kulturell.

Zurück zur Übersicht

Vorheriger Artikel
Fotorat-Diskussion bei der Triennale der Photographie Hamburg Nächster Artikel
KI-Podcast Folge 15