
Inhalt
Googles Gemini und Nano Banana als KI-Bildgenerator
Die Entwicklung der künstlichen Intelligenz schreitet so rasend voran, dass dieser Artikel in einigen Monaten, vielleicht schon in Wochen wieder überholt sein könnte. Die Feststellung trifft auch auf den für mich relevanten Sektor zwischen Kultur, digitalen Medien und kreativem Schaffen zu, also dort, wo uns die KI auf Grundlage von Sprache, Text, Bild und Video Routinen abnehmen und neue Möglichkeiten eröffnen kann.
Mit der Vorstellung des neuesten KI-Modells Gemini von Google ist vor einigen Wochen erneut ein Quantensprung in puncto Bildbearbeitung per KI gelungen. Offiziell handelt es sich um den Bildgenerator Gemini 2.5 Flash Image, der aber wohl aus Marketinggründen auch unter dem Namen Nano Banana für die Anwender bereitsteht. Er ist bereits in die allgemeine Gemini-Arbeitsumgebung, aber auch in Googles AI-Studio integriert und unter bestimmten Limitierungen kostenlos nutzbar.
KI-Visualisierungen verlorener historischer Gebäude
Nano Banana ist nicht nur ein gewöhnlicher Text-zu-Bild-Generator, sondern beherrscht zudem die Technik der Bild-zu-Bild-Generierung verblüffend gut. Dabei können Nutzer Fotos hochladen, die dann durch einen Prompt – also die Anweisung – zu neuen Fotos generiert werden, auch und gerade durch Kombination der Bilder, wodurch vollkommen neue Bildkompositionen entstehen.
Bei der Wiedergewinnung und Rekonstruktion von historischen Stadtbildern und Architektur bietet die KI eine sehr wertvolle und in der Umsetzung außerordentlich überzeugende Möglichkeit der Visualisierung von verlorener Baukunst, die ich im Folgenden kurz vorstellen möchte. Die Technologie ermöglicht innovative Optionen für die wissenschaftliche Betreuung von Rekonstruktionen. Die Macht der Bilder könnte zudem Türen öffnen, die bisher verschlossen blieben – sowohl bei den Entscheidungsträgern als auch bei der Aufmerksamkeit der Öffentlichkeit und der Presse. Im Gegenzug sollte man mit der neuen Technik verantwortungsvoll umgehen und nicht – wie jüngst in den sozialen Netzwerken – die Welt wahllos damit fluten, ohne bei konkreten Projekten hilfreich zu wirken.
Fallbeispiele Rekonstruktionsprojekte
Die KI-Ergebnisse sind teilweise so überzeugend und effizient umzusetzen, dass man in kürzester Zeit unzählige historische Fotografien bearbeiten lassen kann. Auch wenn es verlockend ist, diese hier alle zu präsentieren, habe ich mich letztlich auf sechs Fallbeispiele beschränkt, die ganz konkrete Rekonstruktionspläne oder -ideen zeigen und entsprechend praxisnah sind.
Beispiel: Berliner Schloss


Die Fassaden des barocken Berliner Schlosses, das von der SED 1950 gesprengt wurde, sind in den letzten Jahren rekonstruiert worden. Nicht wiedererrichtet worden ist das auf der Schlossfreiheit stehende Kaiser-Wilhelm-Nationaldenkmal mit seinen Kolonnadenreihen. Heute entsteht an dieser Stelle das Einheitsdenkmal, dessen Bau allerdings ins Stocken geraten ist.
Beispiel: Bornplatzsynagoge in Hamburg


Die Synagoge am Hamburger Bornplatz ist von den Nationalsozialisten in der Reichspogromnacht zerstört worden. Seit einigen Jahren gibt es einen Beschluss zum Wiederaufbau. Auch eine Rekonstruktion der äußeren Architektur wird in Betracht gezogen.
Beispiel: Schauspielhaus Frankfurt


Das Frankfurter Schauspielhaus in Formen zwischen Historismus und Jugendstil ist im Krieg schwer beschädigt und in Teilen in einen Nachkriegsbau integriert worden. Im Zuge der neuerlichen Pläne eines Neubaus werden auch Stimmen laut, die auf Grundlage der vorhandenen Reste den historischen Bau rekonstruieren wollen.
Beispiel: Pellerhaus in Nürnberg


Das Pellerhaus in Nürnberg gehörte bis zu seiner Zerstörung im Zweiten Weltkrieg zu den bedeutendsten Renaissancebauten im Profanbau Deutschlands. Dank der Initiative Nürnberger Bürger konnte der grandiose Hof in den vergangenen Jahren rekonstruiert werden. Über die mögliche Rekonstruktion der Fassade zum Egidienplatz wird bis heute gestritten. Es gibt erhebliche Widerstände.
Beispiel: St. Ansgarii in Bremen


Der markante, stadtbildprägende Westturm der Ansgarii-Kirche ist im Krieg von Bomben getroffen worden und eingestürzt. 1959 wurde auch die Kirchenruine abgetragen und ein Konsumtempel an ihrer Stelle errichtet. Eine beträchtliche Lücke im historischen Stadtgefüge Bremens! Anregungen zur Rekonstruktion sind immer wieder vorgetragen worden.
Beispiel: Carolabrücke in Dresden


Die Dresdner Carolabrücke über die Elbe ist aufgrund von Materialermüdung im September letzten Jahres eingestürzt. Es handelte sich um ein 1971 zu DDR-Zeiten errichtetes Bauwerk. Bis zum Krieg stand dort eine historistische Brückenkonstruktion. Seit dem Einsturz wird über das Wann und Wie des Wiederaufbaus diskutiert.
Anleitung mit Prompt und Upscaler
Ganz konkret würde ich empfehlen, mit einem simplen Prompt wie „Bringe das Bild in die Gegenwart, in Farbe.“ zu starten. Häufig überzeugt das erste Ergebnis bereits. In manchen Fällen musste ich allerdings mit weiteren Anweisungen nachbessern. In den obigen Fallbeispielen habe ich zum Beispiel die Straßenbahn vor dem Frankfurter Schauspielhaus deutlich kürzen oder Fahrzeuge vor dem Berliner Schloss entfernen lassen. Gelegentlich sind Objekte ins Bild geraten, die anachronistisch wirkten. Wenn die Ausgabe auch nach mehreren Arbeitsschritten nicht überzeugt, kann man die Anwendung von vorn beginnen.
Das Resultat lässt sich wirklich sehen, wird aber je nach Vorlage meist in einer Auflösung zwischen 1000 und 1200 Pixeln pro Achse ausgegeben. Sollten höhere Auflösungen benötigt werden, empfehle ich das Skalieren des Bildes, ebenfalls per KI. Auch hier gibt es diverse Anbieter mit vollmundigen Versprechen, die jeder individuell testen sollte. Nach meinen Erfahrungen liefern Upscayl und Upscale.media gute Ergebnisse, wobei man ersteres auch als Desktop-Software installieren kann und damit keinerlei Limits bei der Menge der verarbeiteten Fotos fürchten muss.
Wie wichtig es ist, auch andere Prompts oder Tools auszuprobieren, zeigt das hiesige Titelbild, das einen Screenshot einer typischen Vorher-Nachher-Ansicht zeigt, wie sie mittlerweile auf vielen Websites zu finden ist. Gemini ist an der Erstellung mehrfach gescheitert, weil es immer versuchte, das historische Bild mit modernen Elementen zu versehen, obwohl ich eindeutig darauf hinwies, dass es unverändert übernommen werden soll. ChatGPT von OpenAI hat die Aufgabe dagegen mit Bravour gleich zu Beginn gelöst.
Urheberrecht bei KI
Zuletzt kurze Worte zum Urheberrecht: KI-Leistungen genießen in Europa und Deutschland keinen Urheberrechtsschutz. Ausnahmen können dann gegeben sein, wenn die geistige Schöpfung durch die Prompts derart umfangreich ist, dass sie selbst Werkcharakter besitzt. Dies dürfte aber in unseren Beispielen nicht gegeben sein. Zu beachten ist allerdings, dass die historischen Bildvorlagen frei von Urheberrechten sind. Konkretes hierzu ist in einem meiner Artikel nachzulesen.