Transkript anzeigen (falls vorhanden)

0:00:00–0:00:04
Aber ich bin es nicht, nein ich bin es nicht, nein ich bin es nicht.
0:00:05–0:00:08
Ah, okay, das war ein Anfängerspieler.
0:00:09–0:00:15
Ich sage es nochmal, Mathiel sagt bye bye und ich sage hello.
0:00:15–0:00:20
Hahaha, Radio Stadtvist, komm her. Hahaha.
0:00:21–0:00:27
Vor allem sage ich auch, hello Kevin, are you there? Hello, I'm here.
0:00:27–0:00:30
Yeah, that's nice. Aber wir machen es nicht in Englisch, oder?
0:00:30–0:00:35
Oder sollen wir mal eine ganze Sendung aus unerfindlichen Gründen einfach in Fremdsprachen machen?
0:00:37–0:00:43
We never tried that. No, we haven't. International success for nerd funk.
0:00:43–0:00:51
Nerd funk is the new hot shit in the western hemisphere. Ja, genau.
0:00:51–0:01:00
Ja, weisst du was? Ich habe ja gelesen, Spotify experimentiert mit ihrem Whisper.
0:01:00–0:01:05
Das ist die Software, die wir auch brauchen, um unseren Podcast zu transkribieren.
0:01:05–0:01:10
Sie lassen diese auf ihre Podcasts los und übersetzen sie.
0:01:10–0:01:21
Dann generieren sie mit einer KI die Übersetzung, sodass es so klingt, als ob sie sprechen würden, die ursprünglich gesprochen haben.
0:01:22–0:01:28
Also die Stimmen werden übersetzt und imitiert und dann kommt ein Podcast raus,
0:01:28–0:01:33
der in einer anderen Sprache so klingt, als ob er übersetzt worden wäre.
0:01:33–0:01:38
Meinst du, das ist dann unser Durchbruch in den USA und in äh...
0:01:40–0:01:44
Nein, ich glaube nicht. Nur an der Sprache jetzt ja nicht.
0:01:44–0:01:47
Aber ich habe mir das letztes Jahr überlegt,
0:01:48–0:01:51
weil ich höre, es gibt so einen YouTube-Kanal,
0:01:52–0:01:58
der so Remixes macht, der nimmt irgendwie Beach Boys, aber nein, er nimmt Johnny Cash
0:01:58–0:02:02
und hinterlegt aber den Text von Barbie Girl von Aquazo.
0:02:02–0:02:04
Also so, recht witzig.
0:02:05–0:02:11
Und dann habe ich mir überlegt, wie lange geht es, bis du Lieden einfach übersetzen kannst.
0:02:12–0:02:14
Einfach sagen, übersetz mir das. Ja.
0:02:15–0:02:17
Weil, möglich, relativ einfach.
0:02:18–0:02:21
Und du kannst einfach sagen, ich hätte das englische Lied jetzt gerne auf Deutsch.
0:02:22–0:02:25
Es wird wahrscheinlich ein bisschen komisch, weil dann teilweise die Sachen nicht aufgehen,
0:02:25–0:02:31
so von den ganzen Texten her. Aber grundsätzlich müsste es gehen.
0:02:32–0:02:34
Ja, oder dass du auch sagen kannst, mach mir jetzt diesen Song,
0:02:34–0:02:38
Wie wenn der andere den Song aufgenommen hat.
0:02:38–0:02:42
Also mach mir irgendwie... Genau, das macht eben der YouTuber.
0:02:43–0:02:48
Der macht genau das. Das ist recht schräg. Aber ich glaube, es gibt wirklich auch eine Kai, die das schon macht.
0:02:48–0:02:52
Ich weiss jetzt nicht auswendig, wie sie heisst. Ich kann noch schauen, ob ich sie finde.
0:02:52–0:02:54
Aber es ist schon irgendwie...
0:02:54–0:02:58
Ein bisschen seltsam, oder? Irgendwie...
0:02:58–0:03:00
Ist nichts mehr wie früher.
0:03:03–0:03:08
Es ist nichts mehr wie früher. Warte mal, wie heisst...
0:03:09–0:03:13
Ich habe nachgeschaut, wie das Ding heisst. Wo das macht...
0:03:14–0:03:21
Die KI... Weisst du, vor allem... Wenn du der bist, der so einen Song gemacht hat...
0:03:21–0:03:25
Ich sage mal, du wärst Bob Dylan. Und dann kommt einer hin und nimmt...
0:03:25–0:03:33
Sagen wir deinen Song Like a Rolling Stone oder so... und du dann so durch den Mangel drehen,
0:03:34–0:03:38
dass es dann klingt, wie wenn er den Gölä singen würde.
0:03:38–0:03:41
Wer gibt es noch, den man nehmen könnte?
0:03:42–0:03:46
Den man plagen könnte? Es gibt ein paar, die man plagen könnte.
0:03:46–0:03:52
Ja, genau. Wahrscheinlich macht dir das schon einen dicken Hals.
0:03:52–0:03:56
Würdest du jetzt, wenn du ein Musiker wärst und du bist stolz auf den einen Song
0:03:56–0:04:01
und findest auch, der sollte, Schon wenn du ihn in irgendeiner Coverversion hörst, findest du es so ein bisschen...
0:04:01–0:04:05
Ja, eigentlich war er schon gut, so wie ich ihn gemacht habe.
0:04:05–0:04:09
Wir müssten ihn jetzt nicht noch coveren und so, sondern wir könnten ihn so sein lassen.
0:04:09–0:04:14
Und dann kommt aber einer und tut ihn dann mittels KI dann so...
0:04:14–0:04:18
Jeder kann hingehen und jeder kann ihn so...
0:04:18–0:04:22
Dann findest du halt... Ja, das ist Serge Gainsbourg. Oh, ich würde... Ich...
0:04:22–0:04:27
Ich finde, alle Songs, die es gibt, müssten von Serge Gainsbourg interpretiert werden.
0:04:27–0:04:33
Ich sollte hier schnell einen Link in die Doc kopieren, den wir jetzt anspielen können, den ich super finde.
0:04:34–0:04:38
Das ist der, den ich meine. Können wir das live machen?
0:04:39–0:04:43
Ich probiere es mal, ich muss da... ich habe schon das Ding offen.
0:04:43–0:04:47
Also jetzt wird da... in einer Minute bringen wir es vielleicht hin.
0:04:47–0:04:55
Also... Man kann es ja auch anspielen. Ausser dass ich mich jetzt zuerst noch mit meinem Google Doc anmelden müsste.
0:04:55–0:04:57
Das ist jetzt natürlich ein bisschen...
0:04:58–0:05:01
Ah, jetzt... Das hättest du eh müssen. Jetzt will er auch noch mein Passwort...
0:05:01–0:05:03
Okay, also wenn ich das schaffe...
0:05:04–0:05:06
Ich bin... Ich habe... Ich habe ein neues Telefon
0:05:06–0:05:09
und habe noch nie das Google Docs gebraucht. Aber... Aber jetzt...
0:05:09–0:05:14
Sehe ich... Sehe ich deinen Link, hä? Machen wir ihn auf. Jetzt kommt sicher noch zuerst die Werbung.
0:05:15–0:05:21
Aber... Oh ja, das ist jetzt natürlich noch... Also ich probiere es mal. Einen Augenblick. Da.
0:05:22–0:05:26
Ich bin ein Barbie-Mädchen in einem Barbie-Werld.
0:05:26–0:06:21
Music.
0:06:21–0:06:27
Ich lasse das scheissen. Und wenn ihr die Pre-Show gehört habt, dann habt ihr jetzt Johnny Cash auf Abwege gehört.
0:06:28–0:06:32
Aber es ist eine gute Einstimmung für das, was wir... Es ist eigentlich eine gute Einstimmung.
0:06:33–0:06:43
Weil wir sind in der Pre-Show zum Schluss gekommen, dass mit dieser KI eigentlich nichts bleibt wie bis anhin. Alles wird anders.
0:06:43–0:06:52
Und eben auch das mit diesen Bildern. Ich glaube wir müssen auch mal über Musik sprechen, was KAI im Musikbereich macht.
0:06:52–0:07:01
Es gibt ja auch so Text-zu-Musik-Generatoren, wo du sagst, ich hätte gerne einen Song in diesem Stil und er sollte singen.
0:07:01–0:07:06
Also so Lyrics kannst du glaube ich noch nicht reinmachen, aber er klingt dann ungefähr so.
0:07:06–0:07:11
Und da müssen wir mal damit experimentieren. Aber heute geht es eigentlich um Text-zu-Bild-Generatoren.
0:07:12–0:07:26
Die sind vor einem Jahr zum ersten Mal aufgekommen und heute sind sie leistungsfähig, sie sind kreativ, man kann sie im Alltag brauchen, man kann sie für allerhand schabbernacken oder sinnvolle Sachen einsetzen.
0:07:26–0:07:28
Und wir diskutieren darüber.
0:07:28–0:07:33
Wir haben vor etwa 5 Wochen eine Sendung gemacht über Fotografie, wie die unter die Räder kommt.
0:07:34–0:07:40
Aber jetzt, wenn wir noch ein bisschen mehr wirklich an dieses Ding gehen und sagen,
0:07:40–0:07:46
diese Faszination, oder du hast ja in unserer letzten Sendung gesagt,
0:07:46–0:07:49
dass die dich wirklich faszinieren und mir geht es auch so.
0:07:49–0:07:58
Und warum faszinieren die sich dann eigentlich? Was machst du damit und was erlebst du dabei?
0:07:58–0:08:01
Also ich glaube, bei mir hat es einfach angefangen ausgewundert,
0:08:01–0:08:03
ein Gewunder, um mal zu schauen... Nein, das stimmt nicht.
0:08:05–0:08:08
Zuerst war es ein Gewunder. Zuerst einfach mal so...
0:08:09–0:08:11
Das ist jetzt auch schon ein Moment her, wo die ersten
0:08:11–0:08:14
Bildgeneratoren gekommen sind, dann habe ich das einfach mal ausprobiert und geschaut,
0:08:15–0:08:19
was passiert, und dann aber wie nicht so einen Zweck dafür gefunden. Beziehungsweise
0:08:19–0:08:22
der Zweck war dann, ich muss für den Kunden eine Homepage machen, ich brauche irgendwelche
0:08:23–0:08:26
Bildentwürfe von der Idee her, also mache ich die schnell mit der KUI.
0:08:27–0:08:31
Das war es eigentlich. Nachher hat es eigentlich angefangen mit dem neuen Photoshop wieder.
0:08:32–0:08:33
Dort habe ich es dann wieder.
0:08:33–0:08:39
Auf eine andere Art einsetzen. Also dann auch für die Bearbeitungen,
0:08:39–0:08:45
für die Arbeiten, die du machst, wir haben auch schon darüber gesprochen, dass du Bilder vergrössern kannst,
0:08:45–0:08:48
rundherum, Sachen dazu erfinden,
0:08:49–0:08:54
oder auch Elemente austauschen, so setzt du es dann ein.
0:08:54–0:08:59
Genau, das ist so ein bisschen das, was ich dann herausgefunden habe.
0:08:59–0:09:01
Es ist noch praktisch und es ist noch einfach und gut.
0:09:02–0:09:09
Ich brauche sie auch schon ziemlich gerne und wirklich so vor allem für mein Blog zum Beispiel, wenn ich einen Blogpost mache.
0:09:09–0:09:19
Früher, ich habe mir irgendwann einmal in den Kopf gesetzt, dass jedes Blogpost noch so ein Bild braucht und das habe ich jahrelang bereut,
0:09:19–0:09:27
weil es ist mühsam, weil viele von diesen Themen kannst du einfach schlecht illustrieren, dann suchst du irgendwie so ein Symbolbild.
0:09:27–0:09:34
Natürlich, als Hobbyblogger brauchst du kostenlose Bilder, da gibt es das Unsplash oder das Pexels,
0:09:34–0:09:44
wo diese Plattformen, wo so Stockfotos, sagt man denen, nicht weil sie mit dem Stock gemacht wurden,
0:09:44–0:09:47
sondern weil sie quasi auf Halden liegen.
0:09:47–0:09:49
Man könnte sagen Haldenbilder.
0:09:50–0:09:57
Meistens hat es nichts, was so richtig passt. passt, nimmst du etwas, das so halb passt und bist eigentlich nicht so richtig zufrieden.
0:09:57–0:10:04
Aber jetzt mit diesen Generatoren kannst du etwas machen, was genau exakt passt zu diesem
0:10:04–0:10:11
Thema. Früher hättest du einen anstellen müssen, der eine Illustration macht und das
0:10:11–0:10:15
hat jedes Mal 500 Franken gekostet. Und das ist schon grossartig.
0:10:16–0:10:21
Ja, das finde ich extrem spannend. Also die Interpretation von dem Text, den ich eingibe,
0:10:21–0:10:24
halt sehr gut funktioniert, also da auch wieder.
0:10:25–0:10:30
Umso genauer ich definiere, was ich haben möchte, umso genauer kommt das Resultat heraus.
0:10:30–0:10:32
Und er versteht das recht gut.
0:10:32–0:10:35
Ja, ich glaube, darüber müssen wir dann auch noch reden. Also ein bisschen tippmässig.
0:10:35–0:10:41
Ich würde noch, um wirklich ein Gespür zu bekommen, wie schnell das ging, eben vor einem Jahr,
0:10:41–0:10:44
gerade so im September 2022,
0:10:44–0:10:51
habe ich ein paar von diesen Generatoren der ersten Generation vorgestellt.
0:10:51–0:11:02
Und die waren alle noch recht gruselig. Die Menschen sahen halb so aus wie Menschen, sie waren immer so eckig, hatten einen leicht deformierten Eindruck
0:11:02–0:11:05
und es kam nicht immer das heraus, was man wollte.
0:11:05–0:11:14
Dann aber schon im März kam das mit Journey 5 heraus, das hat dann schon wirklich recht realistische oder sehr realistische Resultate gebracht.
0:11:15–0:11:20
Meistens hatten die Leute dann auch die richtige Anzahl Finger, das war ja so...
0:11:20–0:11:23
Das war das erste Problem.
0:11:23–0:11:32
Genau. Es ist immer noch ab und zu noch ein sechster Finger irgendwo oder es sind nur vier oder einer steht etwas schräg ab oder so, das gibt es immer noch.
0:11:33–0:11:48
Aber man hätte dann auch so diesen Stil machen können. Machen wir eben ein Foto im Stil der Fotografie der 1950er Jahre oder von irgendwie hyperrealistisch oder Fantasy-Style oder wie auch immer.
0:11:49–0:11:52
Dann im März ist schon bereits das Adrobe Firefly gekommen.
0:11:52–0:12:02
Das ist das von Adobe und das hat dann eben noch ganz viel neben dem Text zu Bild noch ganz viele andere Möglichkeiten gehabt.
0:12:03–0:12:10
Du konntest 3D zu Bild machen zum Beispiel. Du konntest anhand von Text Muster generieren lassen.
0:12:10–0:12:14
So wo du zum Beispiel dann nahtlos in einen Hintergrund packen kannst.
0:12:15–0:12:19
Text zu Pinsel. Also in Photoshop tut man gerne mit Pinsel malen.
0:12:19–0:12:23
Und dann konntest du beschreiben, wie dieser Pinsel aussehen soll.
0:12:23–0:12:28
Oder du konntest Skizzen machen. Noch nicht alle dieser Sachen funktionieren wirklich, aber
0:12:28–0:12:32
es sind alle so angedacht, du kannst ein Skizzen machen und er macht dir ein fertiges Bild daraus.
0:12:32–0:12:36
Oder auch Texte zu Schriftzeugen. Du kannst sagen, wie diese Schrift aussehen soll.
0:12:37–0:12:42
Und er macht so kunstvolle Schriftzeuge, die dann auch als Logo funktionieren.
0:12:42–0:12:45
Dann im April der Microsoft-Designer, wo du sagen konntest,
0:12:45–0:12:54
Okay, ich will jetzt nicht nur Bilder, sondern ich will zum Beispiel einen Flyer, einen Buchkoffer, eine Grusskarte, einen Social-Media-Build-Post.
0:12:54–0:12:55
Du konntest ihn beschreiben.
0:12:55–0:13:02
Im Mai dann der Photoshop mit KI-Features, im September das Adobe Firefly ist offiziell lanciert.
0:13:02–0:13:08
Und jetzt im Oktober dann das DALI 3 und der Microsoft Image Creator, über den wir letzte Woche auch ein bisschen gesprochen haben.
0:13:08–0:13:15
Also nochmals ein Schritt mehr Realismus, grösseres Verständnis für abstrakte Motive.
0:13:15–0:13:19
Es ist einfach atemberaubend, wie schnell das jetzt gegangen ist.
0:13:19–0:13:23
Ich glaube, das ist allgemein mit den K1-Phänomenen, die passieren.
0:13:23–0:13:25
Man spricht jetzt darüber und jetzt...
0:13:26–0:13:30
Ist es auch wichtig, dass man genau diese Versionsschritte jetzt verfolgt.
0:13:30–0:13:33
Weil jetzt ist eben innerhalb eines Jahres mega viel gegangen.
0:13:34–0:13:36
Und alle haben immer noch das Gefühl, die KI ist mega weit weg.
0:13:36–0:13:40
Und irgendwann wird es einfach ein Teil des Alltags. Und es ist einfach da und es funktioniert.
0:13:40–0:13:46
Und dann checken wir nicht mehr, das ist jetzt KI, sondern jetzt wird es wahrscheinlich, also ich meine,
0:13:46–0:13:54
jetzt wo es auf Bing ist, nehme ich an, viel mehr Leute werden das einfach mal per Zufall treffen, finden und ausprobieren.
0:13:55–0:14:00
Und dann kommt die Überlegung, aber gar nicht mehr so unbedingt Oh, das ist jetzt K.I.
0:14:00–0:14:09
Ja Ja, es wandert ins nächste Microsoft Windows rein Also im Windows 11 rein hast du dann den Copilot.
0:14:09–0:14:17
Der dann normal in dem Windows eingebaut ist und der dann allenfalls auch mit deinen Dateien interagieren kann
0:14:17–0:14:30
und auf deiner Festplatte herumneuseln und so deine Mails lesen Das ist aus Datenschutz-Überlegungen problematisch.
0:14:30–0:14:34
Es kommt dann ins Office ein, im Google Docs wird es auftauchen.
0:14:34–0:14:43
Ich glaube, in einem Jahr musst du dann anfangen aufzuzählen, wo es eigentlich noch nicht drin ist.
0:14:43–0:14:59
Ich würde auch sagen, wenn du gestalterisch tätig bist und dich nur für Technik interessierst, dann hast du diese Text-to-Bild-Generatoren mitbekommen.
0:15:00–0:15:06
Ich würde sagen, du brauchst sie wahrscheinlich auch irgendwo und sei es nur für Inspiration vielleicht.
0:15:06–0:15:12
Vielleicht, dass du doch etwas selber machst, aber das spielst du und ich meine allein für das sind sie grossartig.
0:15:12–0:15:20
Wenn du eine Idee hast, dass du dann eigentlich einen fertigen Entwurf bekommst und dann,
0:15:20–0:15:28
und vielleicht müssen wir jetzt dann doch gleich schon mal darauf losgehen, wie man dann auch gute Resultate bekommt.
0:15:28–0:15:35
Ich glaube, am Anfang habe ich immer den Fehler gemacht. Ich hatte das Gefühl, ich muss auf den ersten Klapf etwas Gutes heranbringen.
0:15:35–0:15:41
Aber die Kunst ist einfach mal anfangen und das dann noch ein bisschen verfeinern
0:15:41–0:15:46
und damit arbeiten, bis du irgendwo dorthin kommst, wo du hin willst.
0:15:46–0:15:47
Ist das auch so deine Erfahrung?
0:15:48–0:15:54
Ja, voll. Ich glaube, mit dem Immer-Wieder-Machen bekommt man Erfahrungen darüber,
0:15:54–0:15:56
wie man damit umgehen muss.
0:15:56–0:16:01
Aber bei mir ist es oft auch, es sind zwei oder drei Anläufe, bis ich dann so in die Richtung komme.
0:16:03–0:16:10
Was mir eigentlich nie geholfen hat, ist so, du kommst bei mit Journey, kommst du vier Bilder rüber, dann kannst du auf das Bild klicken, dann kommst du noch mal vier rüber und so.
0:16:10–0:16:15
Das hat mir nie geholfen irgendwie, es entfernt sich dann immer mehr von dem, was ich eigentlich wollte.
0:16:15–0:16:20
Also ich bin dann oft besser gelaufen. Das heisst einfach gesagt, ich gebe es nochmal neu ein und umschreibe es nochmal,
0:16:21–0:16:23
und komme dann vielleicht auf ein besseres Resultat.
0:16:24–0:16:35
Am Anfang habe ich auch ganz abstrakte Dinge verlangt. Ich wollte mal schauen, was der mit solchen Ideen macht.
0:16:35–0:16:41
Also mit solchen Prompts. Man nennt sie Prompts oder das, was man unterbreitet.
0:16:41–0:16:47
Dann habe ich gesagt, mach mir ein Matterhorn aus Schokolade mit Schlagrahmen oben drauf.
0:16:47–0:16:58
Dann kam etwas raus, das mich nur halb befriedigte. Oder das andere, das ist vielleicht noch ein besseres Beispiel, habe ich gesagt, mach mir oder so.
0:16:59–0:17:06
Es gibt den Buchtitel «Träumt Androiden von elektrischen Schafen? Do Androids Dream of Electric Sheep?»
0:17:06–0:17:10
Das ist von Philip K. Dick, einem bekannten Science-Fiction-Roman.
0:17:11–0:17:14
Ich fand, das sei ein gutes Motiv und sagte zuerst einfach das.
0:17:14–0:17:22
Dann hattest du einen Android, manchmal ein Schaf, manchmal sah das Schaf aus wie ein Android.
0:17:22–0:17:28
Und es war nicht so richtig befriedigend. Ich dachte, das ist einfach die K.E.
0:17:28–0:17:30
Ich verstehe mich nicht.
0:17:30–0:17:34
Aber man muss es dann wirklich auch präziser beschreiben.
0:17:35–0:17:38
Sagen wir, wir machen ein Figurchen, das aussieht wie ein Android.
0:17:38–0:17:46
Und der hat so eine Art Sprech- oder Traumblasen am Kopf. Und in dieser Blase hat es das Schaf.
0:17:46–0:17:55
Und dann wollte er das nie so richtig elektrisch machen. Ich habe mir immer überlegt, wie könnte man sehen, dass das elektrisch aussieht und dann muss man halt sagen,
0:17:55–0:18:01
das Schaf glüht irgendwie oder das leuchtet oder das sieht pixellig aus oder irgendwie.
0:18:01–0:18:08
Musst du dir dann noch ein bisschen selber überlegen, wie du das machst, dass er den Effekt, den du vielleicht möchtest haben,
0:18:08–0:18:10
wirklich so macht, wie du ihn möchtest haben.
0:18:10–0:18:16
Also Android-Scheibe hat er nicht gecheckt, in diesem Fall. Das wäre jetzt das, was ich eingeben hätte.
0:18:17–0:18:25
Also der Android macht den gut, oder kannst du mir auch einfach sagen, ich mache ja viel so, wenn ich dann KI tue mit ähm...
0:18:26–0:18:33
So als Roboter symbolisieren. Du kannst auch sagen, mach einen Roboter und dann macht der Roboter das
0:18:33–0:18:36
und dann kannst du, äh, tut er, äh,
0:18:36–0:18:42
tut er das eigentlich sehr gut so symbolisieren und eben manchmal, und das musste ich ein wenig lernen,
0:18:42–0:18:45
musst du es einfach dann noch konkreter beschreiben.
0:18:46–0:18:53
Und was ja auch jetzt der neueste Trick ist, du kannst dann auch Text, also Normalika einsetzen,
0:18:53–0:18:59
um dir einen guten Prompt zu machen, den du dann in der BilderQI verwendest.
0:18:59–0:19:04
Da bekommst du eigentlich fast einen Knopf über dein Hirn, wenn du das so überlegst.
0:19:05–0:19:11
Ja, die Maschine versteht, was die Maschine versteht und du musst der ersten Maschine sagen, was sie
0:19:11–0:19:14
dich verstehen soll. Das sind eigentlich nur noch Übersetzer.
0:19:15–0:19:20
Ja, aber es ist irgendwie... Auf eine Art finde ich es extrem faszinierend
0:19:20–0:19:22
Und auf eine andere Seite finde ich,
0:19:23–0:19:28
aber wie explodiert das nicht irgendwann mal und pflügt uns einfach um die Ohren?
0:19:28–0:19:31
Es wird so sehr metahaft, oder?
0:19:32–0:19:37
Ja, ich glaube, das wird sicher passieren, dass irgendwann alles nicht mehr funktioniert.
0:19:37–0:19:44
Ich meine, jetzt sind so viele Zahnräder ineinander, dass wahrscheinlich niemand mehr einen Überblick hat, was genau passiert.
0:19:44–0:19:49
Und dann läuft eins nicht mehr. Ein Zahnräder. Und dann war das eigentlich.
0:19:50–0:19:52
Und das wird irgendwann kommen.
0:19:53–0:19:57
Hast du noch so Tipps, wie man so einen Prompt gut hinbekommt?
0:19:57–0:20:03
Dass er dann wirklich das macht. Wie gehst du daran hin? Du tastest dich daran hin?
0:20:03–0:20:05
Hast du irgendeinen Trick, der gut funktioniert?
0:20:06–0:20:12
Nein, gar nicht. Aber ich bin über das auf etwas gekommen, wo ich nicht wusste, dass es das gibt.
0:20:12–0:20:21
Und zwar gibt es im Sinne von, kann man sich etwas bildlich vorstellen, gibt es verschiedene Kategorien von Menschen.
0:20:21–0:20:24
Es gibt die, die... Stell dir einen Apfel vor.
0:20:25–0:20:33
Ja. Es sind die, die sich den Apfel vorstellen können, mit den Schattierungen, mit den Reflektionen der Sonne, mit den Farben, mit all dem.
0:20:33–0:20:38
Aus dem Kopf, die brauchen kein Bild für das, und können das so im Kopf visualisieren.
0:20:38–0:20:41
Und es gibt Menschen, die das scheinbar gar nicht können.
0:20:41–0:20:47
Also, stell dir einen Apfel vor, es ist blank, nix. Und dann gibt es die Abstufungen.
0:20:47–0:20:56
Und ich glaube, das ist die Schwierigkeit, dass ich vorher sehr präzise wissen muss, was ich jetzt von ihm will. Also nur schon,
0:20:57–0:21:01
wenn ich ihm sage, die Sonne kommt von vorne oder die Sonne kommt von hinten,
0:21:01–0:21:03
dann macht das etwas mit dem Bild.
0:21:03–0:21:04
Und das muss ich ihm aber sagen.
0:21:05–0:21:06
Und dann kommt es gut.
0:21:07–0:21:12
Und dort das Verständnis haben von was passt mir jetzt nicht an diesem Bild?
0:21:12–0:21:14
Und was muss ich ihm jetzt sagen?
0:21:14–0:21:19
Das finde ich ist so ein bisschen die Kunst, die man dann herausfinden muss.
0:21:19–0:21:23
Ja, ich habe mir das anders vorgestellt. Ja, definiere anders.
0:21:23–0:21:27
Es ist wie, du musst etwas auf die einfachste mögliche Art erklären.
0:21:27–0:21:33
Und ich glaube, das ist das Schwierige, dass man sich die Vorstellung aufbauen kann, wie möchte ich es überhaupt.
0:21:33–0:21:38
Und da kommt es ja wieder spannend an den ganzen Bildgeneratoren.
0:21:38–0:21:46
Ich kann ja dann auch sagen, im Stil des Fotografen so, oder im Stil des Maler so.
0:21:46–0:21:51
Und dann versteht er auch wieder. Ich kann sagen, im Stil von Van Gogh und er versteht, was ich ihm sagen will.
0:21:51–0:21:55
Aber auch dort muss ich schon wieder eine klare Vorstellung haben, wie soll es dann sein.
0:21:56–0:22:08
Genau, das ist so und wir reden ja eigentlich dann auch noch ein bisschen darüber, ob das Kunst ist, was da entsteht und wer eigentlich der Künstler ist, also das ist vielleicht die entscheidende Frage dann vor allem auch.
0:22:08–0:22:16
Und ich glaube wirklich, es ist tatsächlich so, man muss halt verbal irgendwie gut drauf sein.
0:22:16–0:22:22
Und das ist schon eine Leistung, etwas, das du im Kopf hast, auf das Wesentliche einzudampfen,
0:22:22–0:22:35
weil du ja auch nicht eine 5-seitige Beschreibung in das Chat-GPT oder in den Tally 3 oder in das Microsoft Image Creator einschieben willst,
0:22:35–0:22:38
sondern du willst ja dann doch einigermassen kurz.
0:22:38–0:22:41
Das heisst, du musst es wirklich prägnant auf den Punkt bringen.
0:22:41–0:22:46
Und das, merke ich, ist gar nicht so einfach. Also gerade, wenn du so etwas im Kopf hast.
0:22:46–0:22:50
Und dann, wenn man sich noch überlegt, wenn er dann das macht,
0:22:50–0:22:54
dann nimmt er ja das, was eigentlich am wahrscheinlichsten ist.
0:22:54–0:22:56
Wir haben auch schon darüber gesprochen.
0:22:56–0:22:59
Das sind so Wahrscheinlichkeitsmaschinen.
0:23:00–0:23:06
Und durch das maschinelle Lehren finden sie heraus, was die beste Lösung ist,
0:23:06–0:23:10
die für dieses Problem passen könnte.
0:23:10–0:23:18
Also diejenigen, die nach den riesigen Datenmengen, die sie zur Verfügung haben, wenn die statistisch auswerten,
0:23:18–0:23:20
am ehesten auf dieses Problem passen.
0:23:21–0:23:27
D.h., du hast wahrscheinlich immer das, was am ehesten dem Menschheitsgeschmack entspricht
0:23:27–0:23:30
oder dem, worauf diese Maschine trainiert wurde.
0:23:30–0:23:36
Wenn du etwas Spezielles willst, musst du genau das Spezielle herauskitzeln können.
0:23:38–0:23:43
Ja. Und dann muss ich aber eben sehr genau wissen, was ich überhaupt will.
0:23:43–0:23:49
Kann man eigentlich den Geduldsfaden von künstlicher Intelligenz überspannen?
0:23:49–0:23:56
Nein, ich will es nicht. Nein, ich will es ein bisschen ja. Das ist irgendwann so und dann fertig. Jetzt musst du zahlen. Jetzt scheisst es mich an.
0:23:56–0:23:59
Ich glaube, das kommt irgendwann mal. Also bei Bing zum Beispiel ist es so,
0:23:59–0:24:04
da musst du, glaube ich, nach 10 oder 12 Fragen am Punkt angekommen sein,
0:24:04–0:24:08
weil dann sagt er, er beantworte nichts mehr.
0:24:08–0:24:16
Denn die Erfahrung zeigt, dass je länger es geht, desto grösser wird die Gefahr, dass er völlig entgleist.
0:24:16–0:24:24
Man spricht ja auch von Halluzinationen oder dass er ausfällig wird oder dich anfängt zu beleidigen
0:24:24–0:24:28
oder irgendwie unflätig zurückgibt.
0:24:28–0:24:33
Ich glaube, die Gefahr wird grösser, je länger die Interaktion dauert.
0:24:33–0:24:39
Und darum ist diese etwas beschränkt. Ist vielleicht bei den Bildgeneratoren auch so,
0:24:39–0:24:45
dass man irgendwann sagt, wenn du es jetzt noch nicht hast, dann musst du dir einfach etwas anderes einfallen lassen.
0:24:45–0:24:50
Aber du, Kevin, mit welchen Generatoren arbeitest du am liebsten?
0:24:50–0:24:51
Was sind deine Favoriten?
0:24:52–0:25:01
Das ist eine schwierige Frage, denn ich nutze alle, aber mehr zum Ausprobieren, wo ich bessere Resultate bekomme.
0:25:01–0:25:05
Das kann ich dir im Falle gar nicht so genau sagen.
0:25:05–0:25:13
Ich habe lange mit Mid-Journey Sachen gemacht, habe aber herausgefunden, Mid-Journey ist oft zu fantastisch, das ist zu wenig realistisch.
0:25:13–0:25:19
Ich kann das nicht so genau sagen. Das ist dann die nächste Kunst, die man beherrschen muss,
0:25:19–0:25:23
nämlich die richtige KI für das richtige Ding.
0:25:24–0:25:30
Und ja, ich habe auch mit Mitjourney angefangen, dann hat er mir aber dort irgendwie dann häufig gesagt,
0:25:30–0:25:36
ich muss jetzt warten, weil ich ein Freeloader war oder mache ich es jetzt nicht.
0:25:36–0:25:45
Dann habe ich das Adobe Firefly während der Beta-Phase intensiv gebraucht und ich mag den Stil eigentlich noch,
0:25:45–0:25:49
Wenn du es mehr künstlerisch und nicht realistisch haben möchtest,
0:25:49–0:25:52
dann hat es einen gewissen typischen Stil, den mir noch gefällt.
0:25:52–0:25:58
Und jetzt im Moment bin ich wirklich mit dem Microsoft Image Creator,
0:25:58–0:26:04
das ist der, der schon auf DALI 3 basiert, am Experimentieren.
0:26:04–0:26:10
Und der versteht schon nochmal irgendwie, also gerade so abstrakte Sachen, schon nochmal besser.
0:26:10–0:26:14
Und dem kannst du Sachen entlocken, wenn du es wirklich nur ein bisschen gut beschreibst.
0:26:14–0:26:18
Die sind wirklich einfach fantastisch. Das ist unglaublich, finde ich.
0:26:19–0:26:24
Ja, das ist spannend. Firefly habe ich interessanterweise eben gar nicht genutzt.
0:26:24–0:26:27
Oder eben nur sehr kurz, weil mir der Stil eben gar nicht gepasst hat.
0:26:28–0:26:33
Da habe ich gefunden, das ist nichts für mich. Kann ich wieso nicht einsetzen?
0:26:33–0:26:38
Also gerade, weil ich halt viele Webseiten mache und dann trotzdem halt irgendwo das Foti-realistische brauche,
0:26:38–0:26:43
habe ich dann gemerkt, der ist nicht das Richtige, das ist mir zu künstlerisch.
0:26:43–0:26:52
Ja, das verstehe ich. Also da braucht man auch wirklich ein bisschen das Gespür dafür.
0:26:52–0:26:57
Und jetzt noch die Frage, die ich schon angedeutet habe, wer ist denn aus deiner Sicht der Künstler?
0:26:58–0:27:01
Ist das derjenige, der den Prompt schreibt oder ist das derjenige, der das Bild macht?
0:27:02–0:27:06
Oder ist es irgendwie so eine Kombination aus beidem?
0:27:07–0:27:09
Was heisst derjenige, der das Bild macht? Also die Maschine.
0:27:10–0:27:15
Der Herr K.I. Ja, oder die Frau Mitschön. Der Mitschön.
0:27:16–0:27:23
Ich glaube, ich bin am Punkt, dass ich sage, dass die K.I. Generatoren eigentlich nur ein Pinsel sind.
0:27:25–0:27:29
Ich bin, glaube ich, dort. Das Problem ist, nein, es ist eigentlich nicht das Problem.
0:27:29–0:27:34
Ich glaube, der, der das ansetzt, sich das überlegt, die Texte formuliert,
0:27:34–0:27:39
das schreibt und dann das Bild generieren lässt, ich glaube, das ist der Künstler.
0:27:40–0:27:45
Ja. Nicht K.I. Ich bin genau zum gleichen Schluss gekommen, als ich mir das überlegt habe.
0:27:45–0:27:50
Zuerst fand ich, nein, sie können Kunst, weil ich würde das selber nie hinbringen,
0:27:50–0:27:53
aber sie sind einfach gut im Imitieren,
0:27:53–0:27:56
Das muss man schon sagen. Sie haben nichts von dem selber erfunden.
0:27:56–0:28:03
Und wenn du sagst, was den Künstler ausmacht, das ist die Idee, der Geistesblitz. Und die...
0:28:03–0:28:07
Der göttliche Funken, sagt man ja manchmal auch. Einfach die Inspiration.
0:28:07–0:28:10
Und ich bin auch auf eine andere Art noch dazu gekommen.
0:28:10–0:28:14
Ich habe, das habe ich schon gebloggt, aber noch nicht veröffentlicht,
0:28:14–0:28:21
mir überlegt, kann ich mir eigentlich von dieser KI zum Beispiel Ideen geben lassen, über was ich bloggen könnte?
0:28:22–0:28:29
Ja, eh. Das ist ja schwierig. Aber nur so banale Sachen sind rausgekommen. Und es ist...
0:28:30–0:28:33
Es hat nichts gebracht. Also genau, wenn du sagst, die Inspiration,
0:28:33–0:28:37
wenn ich sie nach Inspiration frage, dann überzeugt sie mich überhaupt nicht.
0:28:37–0:28:43
Aber wenn ich die Inspiration habe und dann mit dieser Kai aus dieser Idee etwas mache, dann
0:28:43–0:28:45
kommt es besser heraus.
0:28:45–0:28:49
Und dann gibt es etwas. Und das heisst aber, dass ich der Künstler bin
0:28:49–0:28:55
schon ein sehr leistungsstarker Pinsel zur Verfügung haben.
0:28:55–0:28:57
Ja, das ist so.
0:28:58–0:29:05
Ich glaube auch hier, alles was Kai macht, könnte ich ja auch mit Photoshop machen.
0:29:05–0:29:07
Oder so. Ich brauche die Fähigkeiten.
0:29:07–0:29:12
Das heisst, ich muss die Schritte machen, ich muss Photoshop lernen, ich muss die Bilder zusammensuchen,
0:29:12–0:29:17
ich muss mir das Bild ausdenken und dann muss ich Photoshop können, dann kann ich das alles zusammenbasteln
0:29:17–0:29:19
und dann komme ich zum gleichen Resultat.
0:29:20–0:29:24
Es nimmt mir einfach diese Arbeit weg, von dem ganzen Photoshop-Wissen,
0:29:24–0:29:27
dass ich einfach sagen kann, okay, ich kann es jetzt über Text machen.
0:29:27–0:29:31
Und jetzt kommt die Frage von Kunst. Das ist natürlich dann das andere.
0:29:31–0:29:46
Ist die Kunst jetzt gleich wertvoll, ich nehme jetzt mal den Begriff, wie wenn einer hinsitzt und sagt, ich habe jetzt ein Bild mit Photoshop gemacht und 100 Stunden dafür gehabt.
0:29:47–0:29:53
Jetzt muss man anfangen zu interpretieren, was ist jetzt genau Kunst. Ist ein Fleck an der Wand Kunst?
0:29:53–0:29:57
Und dort finde ich, passiert etwas Spannendes.
0:29:57–0:30:04
Es ist jetzt einfach ein Werkzeug mehr auf dem Markt. Und jetzt kann man interpretieren, wie man möchte.
0:30:04–0:30:10
Ich glaube, du hast schon recht. Wenn ich in der Lage wäre, so ein Kunstwerk von Hand zu machen,
0:30:10–0:30:17
also auch auf der Leinwand oder so, und dann eben halt das selber malen mit allem, was dazu gehört,
0:30:17–0:30:23
und dann jemand kommt und sagt, Ich habe ein Kunstwerk gemacht, ich hatte einfach die Idee,
0:30:23–0:30:27
habe sie formuliert, es hat 5 Minuten gedauert und dann ist das rausgekommen.
0:30:27–0:30:36
Dann würde ich schon sagen, es müsste irgendwo, rein aus Fairnessgründen, so ein bisschen eine Abstufung geben zwischen denen,
0:30:36–0:30:40
die wirklich den ganzen Prozess beherrschen und zwischen, sagen wir jetzt,
0:30:40–0:30:47
so wichtige Dauer wie wir, die dann halt einfach clever sind dabei,
0:30:47–0:30:50
die technischen Möglichkeiten auszuschöpfen, oder?
0:30:50–0:30:55
Aber das muss man wahrscheinlich dann gesellschaftlich auch noch so ein bisschen aushandeln, denke ich.
0:30:57–0:31:02
Ich glaube auch. Auch hier, ich kann ein Bild malen, das mir sehr viel Aufwand, oder?
0:31:02–0:31:06
Ich kann einen guten Drucker nennen, ich kann es drücken, für einen Laien sieht das genau wie ich aus.
0:31:06–0:31:07
Ja, ja.
0:31:07–0:31:13
Ja, wird wahrscheinlich ein spannender Weg. Aber auch hier, ich glaube,
0:31:13–0:31:19
das ist schon da, das wird schon genutzt. Und wir wissen das einfach gar nicht oder haben es gar nicht auf dem Radar.
0:31:19–0:31:21
Aber das ist alles schon passiert.
0:31:21–0:31:24
Ich könnte mir eben auch vorstellen, dass es dann wirklich so eine Gegenbewegung gibt
0:31:24–0:31:31
und wieder diese Leute kommen und sagen, jawohl, ich lasse mir jetzt gerade darum ein Portrait in Öl malen von mir
0:31:31–0:31:37
und das hänge ich mir an die Wand und das finde ich toller als all diese Magical Avatars,
0:31:38–0:31:41
die du dir anhand von Selfies generieren lassen kannst.
0:31:41–0:31:46
Oder das Handwerk und das komplett analoge, wie immer wir ihn ja gesehen haben,
0:31:46–0:31:52
es hat immer diese analoge Bewegung gegeben und mit dieser rechne ich dann auch hier absolut,
0:31:52–0:31:56
die kommt oder vielleicht ist sie schon hier auch.
0:31:57–0:32:03
Wo dann die Leute sagen, ich kaufe das Gebäude nur, wenn du bei mir in der Stube das malst und ich sehe, dass du es gemalt hast.
0:32:03–0:32:10
Genau, ja genau. In stundenlanger Arbeit. Es gibt nichts Homeoffice. Präsents zählt.
0:32:10–0:32:19
Genau. Nur wenn du da bist, ist es wertvoll. Und man sitzt dann wieder hin, so wie das vor 200-300 Jahren war, wenn der Portraitmaler gekommen ist.
0:32:19–0:32:25
Du sitzt wieder hin und lässt dich porträtieren und darfst dich nicht bewegen, 10 Stunden lang.
0:32:25–0:32:30
Und du findest es aber grossartig. Mhm, weil dann hat es einen Wert.
0:32:30–0:32:41
Genau. Ja, ich glaube es absolut, dass sie so sein wird. Und vielleicht noch abschliessend, was mich wirklich stört an diesen Generatoren ist,
0:32:41–0:32:45
dass sie einen zensurieren, dass sie einen nicht machen lassen, was man will.
0:32:45–0:32:50
Und dass man, sobald man irgendwie sagt irgendetwas nur so in Anflüge,
0:32:50–0:32:54
vielleicht könnte ich erotisch werden, dass sie einem sagen, das darfst du nicht machen.
0:32:54–0:32:58
Und ich würde sagen, wenn die Kunst das machen will, gehört das halt einfach auch dazu.
0:32:58–0:32:59
Findest du nicht, Kevin?
0:33:00–0:33:03
Nun, ich wollte letztens etwas machen und das wollte er nicht.
0:33:03–0:33:07
Und was war das? Das war nichts Gefährliches.
0:33:08–0:33:10
Aber er hatte das Gefühl, weil...
0:33:11–0:33:15
Weil Dedeen das Wort hatte und dann dachte er gleich, oh nein, das mache ich nicht.
0:33:15–0:33:17
Und Kenner der Generatoren hat das gemacht.
0:33:17–0:33:21
Aber ich weiss nicht mehr, was es war. Schade. Genau. Egal.
0:33:22–0:33:30
Aber das ist vielleicht auch gut, sobald wir so ein Werkzeug zur Verfügung haben, wissen wir ja eh nicht wie blöd, dass wir damit umgehen sollen.
0:33:30–0:33:36
Dann ist es wieder gut, dann kommt wieder der alte Kommunist, wo ich bin, der sagt, nein es ist schon gut, wenn die Leute einfach nicht alles können.
0:33:36–0:33:40
Wenn man einfach sagt, nein, das gibt es jetzt nicht. Nein, das ist gut, das gibt es nicht.
0:33:44–0:33:54
Music.

Vor einem Monat haben wir gefragt, ob wir bald alle unsere Kameras wegschmeissen. Der Grund dafür ist – natürlich – die Revolution bei der künstlichen Intelligenz. Die Text-zu-Bild-Generatoren verwandeln jede Idee innert Sekunden in ein Motiv, ohne dass man dafür seinen Fotoapparat zücken oder gar ein Stativ oder eine Leuchte aufstellen müsste.

Heute erfolgt der zweite Teil der Sendung: Wir stürzen uns auf die Bildgeneratoren, erklären ihren Fortschritt, wie man sie nutzt und wie wir sie einsetzen. Und natürlich kommen wir auch nicht um die Frage herum, ob das nun eigentlich Kunst ist, was der Computer da erzeugt: Müssen wir uns als kreative Geister von diesen Maschinen bedroht fühlen? Oder ist es nur halb so wild – und sind sie einfach ein neues Werkzeug, das etwas schlauer ist als die, die wir bislang benutzt haben?

Die Links zur Episode

Preshow

Der rasante Fortschritt der Bildgeneratoren

Tipps

Ist das Kunst?

Beitragsbild: Microsoft Image Generator zum Prompt «A small child at the beach with a small toy shovel, who builds a huge, artistic sandcastle.»

Veröffentlicht von Matthias

Nerd since 1971.

Beteilige dich an der Unterhaltung

2 Kommentare

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert