KI-Podcast - Folge 11

Zum Jahresende zeigt sich eine massive Beschleunigung der generativen KI: Drei Jahre nach ChatGPT ist der Markt fragmentierter und professioneller geworden. Im Bildbereich setzt sich das chinesische Modell Seedream 4.5 gegen Googles Nano Banana Pro durch, vor allem durch höhere Prompt-Treue und bessere Eignung für professionelle Workflows, während Detailverliebtheit allein nicht mehr reicht. Mit Flux 2 und Z-Image versuchen zwei Open Source Modelle dazu aufzuschließen. Bei Video-KI eskaliert der Wettbewerb mit neuen Editing-, Audio- und Cameo-Funktionen, wobei Google (Veo) aktuell vorne liegt, die chinesische Modellen von Kling (O1 und 2.6) aber mit weniger Zensur aufholen. Runway veröffentlich Gen 4.5. Parallel verschieben sich die Grundfragen: Urheberrecht, Regulierung, journalistisches Vertrauen und kulturelles Erbe werden zur eigentlichen Frontlinie – nicht die nächste Modellversion. Im KI-Podcast unterhalten sich Dr. Jürgen Scriba, Leiter der Arbeitsgruppe "Technischer Fortschritt" / Deutscher Fotorat und Boris Eldagsen (Mitglied der Arbeitsgruppe) mit wechselnden Gästen über aktuelle Auswirkungen von KI auf Fotografie.

LINKS

Symposium des Deutschen Fotorates, Hamburg, 21.11.2025 https://www.youtube.com/live/MYxDe9I2...

HIGHLIGHTS


1. Einstieg & zeitlicher Rahmen
0:083:57 | Rückblick auf November/Dezember, 3 Jahre ChatGPT / generative KI. 2. Markt, Geschichte, Machtverhältnisse
4:035:48 | Black Forest Labs: 3-Mrd-Bewertung, europäische Grundlagenarbeit, Substanz vs. Marketing. 3. Bild-KI: neue Modelle & erste Einordnung
5:486:27 | FLUX 2: Gutes Open-Source-Modell - aber schwächer als Konkurrenz.
6:226:27 | Microsoft MAI: angekündigt, noch ungetestet.
6:277:16 | Nano Banana Pro (Google) vs. Seedream 4 → 4.5 (ByteDance).
7:228:29 | Z-Image Turbo (Alibaba): Open Source, lokal, offline, schnell, wenig Zensur. 4. Video-KI: Eskalation Ende Nov / Anfang Dez
8:439:01 – Runway 4.5 angekündigt, ab Mitte Dezember verfügbar
9:0810:25 – Kling Omni (O1): nachträgliches Video-Editing per Prompt & Referenz.
10:2511:02 – Vergleich zu Sora 2 Cameo / Veo: Deepfake-Potenzial, erste Demos.
11:1512:32 – Kling 2.6: Video + Ton + Sprache + Musik (stark bei Musik, schwach bei Schauspiel).
12:3212:59 – Zwischenfazit Video: Veo 3.1 vorne, Kling holt auf, Zensur als Faktor. 5. Geopolitik & Zensur
12:3913:55 – Chinesische Modelle: günstiger, weniger zensiert, Open-Source-Strategie als Marktangriff.
13:5514:01 – Persönliches Nutzungsfazit: Bild = China vorn, Video = China schließt auf. 6. Großer Bild-Modell-Vergleich: Nano Banana Pro vs. Seedream 4.5
14:1015:33 – Style- & Color-Transfer: Prompt-Verständnis als Schwachstelle.
15:3316:28 – Renaissance des Textprompts beim Prompt Editing.
16:3418:20 – Corporate / Auftrags-Usecases: Seedream stabiler, Nano Banana detailverliebt.
18:2020:31 – Anatomie- & Pose-Fehler (dritte Hände, Collagen-Look).
20:4422:14 – Komplexe Bildkombinationen: Seedream 4.5 deutlich verbessert.
22:2723:53 – Rollen-Prompts („Du bist Helmut Newton“): Referenztreue vs. Stilfreiheit. 23:5925:30 – Usecase Werbung 7. Fazit Bild-KI
25:3526:16 – Fehlende Regler (Prompt-Treue vs. Weirdness).
26:1629:06 – Vorhergehender Test (Portrait in Alter, Stil anpassen): Nano Banana Pro vs Seedream 4.0
29:06 – Klares Jahresfazit: Seedream 4.5 aktuell bestes Modell für Prompt Editing. 8. Strategische Positionierung der Player
29:1329:52 – OpenAI: Masse, Gamification, Social.
29:5931:32 – Google: professionelle Tools, Infografiken, strukturierte Prompts. 9. Kreativer Prozess & Bewertung
32:1033:47 – Google-Ansatz: KI evaluiert eigenen Output gegen Prompt.
33:4735:33 – Kernproblem: Automatisierung vs. Mittelmaß.
36:0036:39 – China-Studie: Juniors → Ideen, Seniors → Bewertung & Feinschliff.
36:5038:10 – Kreativität, Stil, Vorhersehbarkeit, Comedy-Experimente. 10. UNESCO & kulturelles Erbe
38:3039:08 – Mitarbeit in UNESCO-Arbeitsgruppe: KI-Werke & Weltkulturerbe. 11. Urheberrecht & Rechtspolitik
39:3041:57 – Provokation: „Entertaste = Auslöser“ → menschliche Autorschaft.
41:5742:49 – Gefahr juristischer Scheinpräzision (Prompt-Länge, Iterationen).
43:2144:27 – USA vs. EU: Deregulierung, Zölle, Machtkampf.
45:0545:36 – GEMA vs. OpenAI: Präzedenzfall Trainingsdaten.
46:0547:02 – Historischer Exkurs: Fake-Image-Debatte schon 1912. 12. Journalismus, Vertrauen, Regulierung: Das Symposium des Fotorates
47:2049:33 – AI Act & „Deepfake“-Kennzeichnung: Begrifflich und praktisch problematisch.
49:3350:28 – Branchenreaktionen (Werbung, Amazon).
50:3451:15 – Vertrauensverlust: „Ich glaube euch kein Bild mehr.“
51:5652:46 – Konsequenz: Provenienz, Signaturen, Verifikation.
53:0254:53 – Vision: Foto-„Reservate“, redaktionelle Standards, Vertrauen statt Label-Inflation. 13. Schluss & Ausblick
55:1355:52 – Abschied & Cliffhanger: Januar wird noch voller.

INFO

Dr. Jürgen Scriba leitet die Arbeitsgruppe "Technischer Fortschritt" des Deutschen Fotorats. Er studierte Physik und Informatik in Hamburg und München, wo er in experimenteller Halbleiterphysik promovierte. Er war im Wissenschaftsjournalismus als Redakteur bei den Nachrichtenmagazinen Spiegel und Focus tätig, bevor er ein Biotech-Startup mitgründete und als COO bis zum Verkauf an einen japanischen Lifescience-Konzern leitete. Danach arbeitete er als Fotograf im Bereich Industriefotografie und Video. Er war elf Jahre Geschäftsführer der Deutschen Fotografischen Akademie und arbeitet derzeit als Elektronikentwickler im Orgelbau neben seiner künstlerischen Fotoarbeit (https://aussendienst.photography).

Boris Eldagsen studierte Bildende Kunst und Philosophie in Köln, Mainz, Prag und Hyderabad. Seit 2000 wurden seine Foto- und Medienarbeiten in internationalen Institutionen und Festivals gezeigt und ausgezeichnet. Seit 2004 unterrichtet er Ideenlehre, Kreativität und Fotografie an internationalen Kunsthochschulen. Boris ist einer der international anerkannten Experten für KI-generierte Bilder. Seine Absage der Sony World Photo Awards im April 2023 löste eine weltweite Debatte über die Beziehung zwischen Fotografie und KI-generierten Bildern („Promptografie“) aus. Er war der “Posterboy der KI-Debatte” (SZ) und sein Bild “PSEUDOMNESIA | The Electrician“ wurde als “the picture that stopped the world“ (The Guardian) Symbolbild einer neuen Ära. (https://www.promptwhispering.ai).

Zurück zur Übersicht