#101 Gemini von Google - neue Maßstäbe bei künstlichen Intelligenz
Shownotes
Heute sprechen wir ausführlich über Googles neuestes KI-Modell mit dem Namen Gemini.
Gemini ist ein bahnbrechendes KI-Modell von Google, das sich durch Multimodalität auszeichnet. Es kann nahtlos Text, Bilder, Audio, Video und Code verarbeiten und kombinieren. Dadurch eröffnen sich völlig neue Möglichkeiten für komplexe Aufgaben.
Gemini bietet spannende Potenziale, wie die Verbesserung der Marktdatenanalyse, die Erstellung von Marketinginhalten und sogar die Recherche von Quellen für Studenten. Die Integration von Gemini in Marketingprozesse wird neue Horizonte eröffnen und den Wettbewerbsvorteil für diejenigen erhöhen, die KI in ihren Prozessen anwenden.
Wir sprechen aber darüber, wer die Gewinner und die Verlierer dieser Entwicklung sein werden.
Google Bard: hier geht´s zu BARD
SEO-Club: Klick, wenn du endlich Clever Ranken willst
Web: ALSA digital GmbH Web: Texten mit künstlicher Intelligenz
Hier geht´s zur Facebook-Seite von Simone
Hier geht´s zur Facebook-Seite von Frank
LinkedIn: Simone Sarodnick
LinkedIn: Frank Sarodnick
Impressum
ALSA digital GmbH Geschäftsführer: Frank Sarodnick Erkrather Str. 401 40231 Düsseldorf Tel.: +49 211 54570869 E-Mail: info@alsa-digital.de
Registergericht: Amtsgericht Düsseldorf Registernummer: HRB 92178 Umsatzsteuer-Identifikationsnummer gemäß § 27a UStG: DE341199181
Transkript anzeigen
00:00:03: Vor ein paar Tagen hat Google seine neue KI mit dem Namen Gemini
00:00:07: vorgestellt. Gemini wird als Googles bisher
00:00:10: mächtigstes KI-Modell beschrieben und könnte wirklich ein
00:00:14: ernsthafter Konkurrent für OpenAI´s ChatGPT sein.
00:00:18: Gemini ist viel mehr als nur ein weiterer KI-Chatbot.
00:00:23: Es stellt den Beginn einer absolut neuen Ära dar, weil es
00:00:26: viel komplexere Aufgaben erledigen kann. Aber
00:00:30: ist Gemini wirklich so gut und was sind die Möglichkeiten von
00:00:33: Gemini? Darüber sprechen wir im heutigen Podcast.
00:00:37: Aber zuerst möchte ich nochmal einen kleinen Rückblick auf
00:00:41: die KI werfen. Und zwar, Du
00:00:45: erinnerst dich sicherlich noch, dass vor einem Jahr ChatGPT
00:00:49: in unser Leben getreten ist. ChatGPT ist die
00:00:53: künstliche Intelligenz, die endlich für alle zugänglich war.
00:00:56: Jeder konnte das mal ausprobieren und es war ein
00:01:00: regelrechter Boom eröffnet worden. Dabei muss man
00:01:03: natürlich erinnern, dass KI schon seit vielen Jahrzehnten
00:01:07: entwickelt wird, aber vor genau einem Jahr
00:01:10: war das eben der Allgemeinheit zugänglich. Und da
00:01:14: begann eigentlich ein Wettrissen zwischen den großen
00:01:18: Unternehmen Microsoft, Google und auch
00:01:22: Facebook. Google zog dann im März
00:01:26: 2023 nach und veröffentlichte seine
00:01:29: KI BART. ChatGPT
00:01:33: wurde dann weiterentwickelt mit ChatGPT 4.0.
00:01:37: Es wurde ein sehr, sehr gutes KI-Modell mit vielen
00:01:40: Möglichkeiten und auch Fehler wurden ausgemerzt
00:01:44: dafür, wo KI eigentlich immer auch für kritisiert
00:01:47: wurde. Allerdings wurde ChatGPT 4.0
00:01:51: auch kostenpflichtig. Irgendwann kam
00:01:55: auch Meta noch mit ins Rennen und entwickelte seine
00:01:59: eigene KI und hat diese auf dem Markt. Also wie man
00:02:02: sieht, es findet ein regelrechtes Wettrüsten statt.
00:02:06: Und jetzt ist neu Google wieder am Start
00:02:10: mit der KI Gemini. Und Frank hat sich das
00:02:14: mal ein bisschen näher angeschaut. Und Frank, was kannst du zu
00:02:18: dieser neuen KI sagen und was bedeutet das
00:02:21: für uns als Marketer? Gemini
00:02:25: ist wirklich ja erst seit zwei Tagen im Moment
00:02:28: aktuell auf dem Markt. Das heißt, ich konnte mir erst mal ein paar Sachen angucken.
00:02:33: Und es ist eine unglaublich
00:02:37: neue Art, wie man an das ganze Thema herangeht.
00:02:42: Gemini ist anders als das, was wir bisher kennen.
00:02:46: Gemini wurde nämlich von Anfang an auf Multimodalität
00:02:51: entwickelt. Was bedeutet das? Das bedeutet,
00:02:54: dass das nahtlose Zusammenspiel zwischen Text,
00:02:58: Bildern, Audio, Video und Code
00:03:02: gewährleistet ist. Das bedeutet, dass
00:03:05: Gemini als künstliche Intelligenz
00:03:09: sowohl Text als auch Codierung, Audio, Bild und Video
00:03:13: verallgemeinern kann, nahtlos verallgemeinern kann,
00:03:17: verstehen kann, verarbeiten und letztendlich
00:03:21: auch kombinieren kann. Das bedeutet, dass Gemini
00:03:24: aus diesen verschiedenen Bereichen etwas
00:03:28: zusammenfassen kann oder auch kreieren kann. Ich gebe vielleicht
00:03:32: mal ein ganz kleines Beispiel. Gimini wurde
00:03:35: darauf trainiert, diese Texte, Bilder, Audios und so weiter
00:03:39: gleichzeitig zu erkennen und zu verstehen. Deshalb
00:03:42: kann es bestimmte Informationen einfach
00:03:46: wesentlich besser verarbeiten und Fragen zu komplexen Themen
00:03:50: auch beantworten. Komplexe Themen, komplizierte Zusammenhänge.
00:03:54: Und aus diesem Grund kann man mit Gemini natürlich wunderbar komplexe
00:03:58: Themen wie Mathematik oder Physik erklären. Und da reicht es, wenn
00:04:02: man sich eine Handskizze macht, die hoch lädt und dann fragt, wie ist hier
00:04:05: dieser Zusammenhang oder eben ganz konkret ein physikalisches oder mathematisches
00:04:09: Problem. Das Thema der Codierung,
00:04:13: also wenn ich wirklich Programmcode schreiben möchte, das
00:04:16: ist in Gemini auch sehr, sehr stark hinterlegt, möchte ich aber jetzt nicht
00:04:20: ins Detail eingehen, weil ich da nicht der Experte bin. Ich weiß nur,
00:04:24: dass dort die Möglichkeit besteht, Programmiersprachen
00:04:28: wie Python oder Java, C++ und so weiter zu
00:04:32: erklären und eben auch den Code entsprechend zu generieren. Habe ich aber
00:04:35: selber noch nicht ausprobiert, muss ich dazu sagen.
00:04:39: Wenn wir mal an das Thema gehen, was
00:04:42: wir jetzt damit machen können als Marketer, Also jetzt nicht als Programmierer,
00:04:46: sondern eben als Marketer. Da muss man sich auch
00:04:50: wirklich frei machen von den bisherigen Regeln. Und man kann wirklich
00:04:53: beispielsweise Marktdaten komplett analysieren,
00:04:57: kann aus den Marktdaten, die vorhanden sind, Trends und
00:05:01: bestimmte Erkenntnisse herausziehen, dann die Arbeit wiederum
00:05:05: besser zu machen oder eben das Marketing anzupassen.
00:05:09: Natürlich kannst du auch logischerweise die Marketinginhalte
00:05:13: erstellen, Marketinginhalte wie Textbilder und so
00:05:16: weiter. Das macht, was man ja jetzt auch schon macht. Eine der Stärken
00:05:20: von Gemini liegt auch darin, dass sie unglaublich gut Text
00:05:23: verarbeiten kann. Das bedeutet zum Beispiel kann
00:05:27: Gemini wirklich Bibliotheken durchforsten und für
00:05:31: Studenten beispielsweise eine gesamte Recherche machen, eine
00:05:35: Quellenrecherche machen. Und kann diese Datenbanken
00:05:38: durchforsten und die aktuellen und wichtigen und relevanten
00:05:42: Inhalte, Quellenangaben herausfiltern. Das war hier
00:05:46: auf einem der Videos auf der Gemini Webseite zu sehen.
00:05:49: Unheimlich spannend, gerade wenn man davon ausgeht, wie viel Daten man dort
00:05:53: sehr schnell verarbeiten kann und Gemini diese Daten auch versteht
00:05:57: und auch interpretieren kann und auch in den richtigen Zusammenhang bringen kann.
00:06:01: Ich glaube, dass wir die richtigen Möglichkeiten von Gemini erst dann sehen, wenn
00:06:05: es wirklich online richtig vorhanden ist und wenn man damit genauso wieder spielen
00:06:09: kann, wie bisher mit Chatshippity, dass man einfach mal sagt, ich probiere mich
00:06:12: da mal aus, ich gehe in den Dialog, Ich arbeite jetzt tatsächlich mit
00:06:16: der KI. Das wird halt mega spannend, auch gerade für
00:06:19: Marketer, für Leute, die Konzepte entwickeln, für
00:06:23: Leute, die kreative Prozesse haben, wo man sagt, ich hole
00:06:26: mir die KI einfach hinzu als
00:06:31: zusätzlichen Input, als zusätzliche Information, als zusätzliche
00:06:34: kreativen Part. Da wird es dann halt richtig interessant. Im Moment sieht
00:06:38: es wirklich so aus, als wenn Gemini dieses erfüllen kann, weil
00:06:42: es eben multimodular aufgebaut ist und übergreifend über
00:06:46: die verschiedenen Bereiche die Sachen erfassen kann.
00:06:49: Das sind natürlich spannende Aussichten, gerade in Bezug auch auf die
00:06:53: Google-Suche. Da bin ich wirklich gespannt,
00:06:58: wie so eine Suchergebnisliste bei Google in Zukunft aussehen
00:07:01: wird. Kann ich denn Gemini schon ausprobieren
00:07:05: oder wo kann ich das mal einsehen, wie das funktioniert?
00:07:09: Also derzeit ist ja von Google das Sprachmodell
00:07:13: BART, das ist ja öffentlich zugänglich. Den Link
00:07:17: stelle ich auch gerne in die Show Notes. Da kann man BART
00:07:20: eigentlich schon ausprobieren und
00:07:24: dort ist auch schon Gemini, soweit ich das sehen kann, da
00:07:28: sind schon die Ansätze zu sehen. Was ich beispielsweise mit BART
00:07:32: durchaus machen kann, ich kann halt mal ein mathematisches Problem
00:07:35: abfotografieren, also handschriftlich aufzeichnen, kann es abfotografieren,
00:07:39: kann es hochladen und kann BART die Aufgabe stellen,
00:07:43: löse dieses mathematische Problem. Und BART ist tatsächlich in der
00:07:47: Lage, das habe ich gerade ausprobiert, aus dieser Handskizze
00:07:52: die mathematischen Lösungen zu entwickeln, Hinweise sogar zu geben, wie
00:07:55: man es machen könnte über zwei, drei Wege, dann die korrekte
00:07:59: Antwort auch zu liefern. Also aus dem Bild mit einer Handskizze
00:08:03: von mir ein mathematisches Problem zu lösen auf mehreren
00:08:06: Wegen. Das funktioniert. Es ist auf jeden Fall eine spannende
00:08:10: Sache und Google wäre ja nicht Google, wenn diese ganzen
00:08:14: Sachen im Hintergrund nicht doch schon irgendwo mit einfließen.
00:08:18: Also sprich, die Vernetzung zwischen Google Docs
00:08:22: und YouTube und sonst irgendwas, die läuft vielleicht schon
00:08:25: im Hintergrund und es hat noch nicht ganz offiziell
00:08:29: kommuniziert. Aber es wird jetzt sehr, sehr schnell gehen. Also man muss immer die
00:08:33: Augen offen halten und am Puls der Zeit bleiben.
00:08:36: Der Fortschritt geht so voran mit so sieben
00:08:40: Meilen Stiefeln und mit so einer Geschwindigkeit, das ist atemberaubend.
00:08:44: Ich bin mal gespannt, was dann auch OpenAI macht,
00:08:48: inwiefern die auch nachziehen. Also das
00:08:52: Wettrennen ist im vollen Gange. Oh ja, das ist es,
00:08:55: absolut. Aber eine Frage habe ich
00:08:59: noch. Wer wird denn in dieser ganzen Entwicklung
00:09:03: Verlierer sein und wer wird in dieser ganzen Entwicklung Gewinner
00:09:07: sein? Oder wird es Gewinner geben und wird es auch Verlierer geben?
00:09:10: Was meinst du dazu? Ja,
00:09:16: Das ist eine gute Frage. Es wird natürlich Verlierer und Gewinner geben.
00:09:20: Es hängt jetzt davon ab, auf welcher Ebene wir das Ganze betrachten. Es ist natürlich
00:09:24: auch eine philosophische Frage. Wer wird gewinnen? Wer wird verlieren?
00:09:27: Aber das mal auf die Ebene der Nutzer runterzubrechen. Ich
00:09:31: denke, es werden die Leute verlieren, die sich vielleicht
00:09:35: wirklich nur auf eine einzige Software konzentrieren und
00:09:38: dort auch nur mit einer Software arbeiten möchten.
00:09:42: Und es werden diejenigen gewinnen, die sich auch
00:09:46: mit neu auf den Markt kommenden Modellen beschäftigen,
00:09:49: die letztendlich da auch offen für sind. Wo sind die nächsten Schritte?
00:09:53: Was gibt es alles noch? Was wird noch passieren? Und die dafür auch
00:09:57: offen sind. Wenn ich das auf die
00:10:01: Anwender-Software einmal runterbreche, kann ich mir vorstellen,
00:10:05: dass die Verlierer diejenigen sind, auch dort wieder,
00:10:09: die sich auf ein einziges Sprachmodell konzentrieren, also sprich
00:10:13: die vielleicht KI und AI vorne drauf schreiben, aber letztendlich
00:10:17: lediglich OpenAI angebunden haben. Und
00:10:21: Gewinner werden die Tools sein, die mit
00:10:24: mehreren Sprachmodellen arbeiten, beziehungsweise mit
00:10:28: mehreren KIs, muss man ja schon sagen, die
00:10:32: nicht nur die Anbindung hinten an diese KIs haben, sondern
00:10:36: das Ganze auch noch sehr harmonisch und nutzerfreundlich zu einem
00:10:39: Paket schnüren, sodass man dann als Marketer
00:10:43: wirklich sowohl Text als auch Bild im Marketing
00:10:46: verwenden kann, beispielsweise. Nur mal als Beispiel genannt. Und da wäre für
00:10:50: mich ganz klar jetzt schon der Gewinner die Software Jasper,
00:10:54: die ja bereits jetzt drei Sprachmodelle angebunden hat
00:10:57: und dementsprechend auch von der gesamten Nutzerfreundlichkeit,
00:11:02: von den Möglichkeiten weit vorne liegt gegenüber einer
00:11:06: Software, die nur an Open AI angebunden ist.
00:11:10: Letztendlich kann ich mir vorstellen, nachdem, was ich bisher so gesehen
00:11:14: habe, dass Künstliche Intelligenz in
00:11:18: einem kurzen Zeitabstand sehr gut integriert sein
00:11:21: wird in viele Prozesse, in viele Software, sodass wir es kaum noch
00:11:25: bemerken werden, wo die KI wirklich arbeitet und sie
00:11:29: wird für uns sehr normal werden. So wie eben auch
00:11:32: Computer oder Handy oder Cloud. Wird auch KI mehr oder
00:11:36: weniger irgendwann normal werden? Wir werden uns damit beschäftigen
00:11:40: und ich hoffe, dass wir alle doch eher die Gewinner sind und
00:11:43: nicht auf der Verliererseite stehen. Egal, wie man das Ganze jetzt
00:11:47: definiert. Na interessant ist ja auch, dass wir uns hier über
00:11:51: KI unterhalten, über Integration von KI in
00:11:54: bestimmte Prozesse. Ich muss gerade an meinen Alltag
00:11:58: denken und sage mir, in manchen Prozessen ist ja noch
00:12:02: nicht mal eine Automation eingebaut, sprich
00:12:06: teilweise bei Behörden oder so. Da wird ja viel
00:12:09: auch noch per Fax und Papier und Formular verarbeitet,
00:12:13: da muss erst mal über Automation gesprochen werden, bevor wir über KI
00:12:17: sprechen. Und gerne wird das ja auch
00:12:21: in einen Topf geworfen und verwechselt. Also da,
00:12:25: wo nur ganz normale mathematische Modelle hinterlegt
00:12:28: sind, die automatisch irgendwas ganz schnell ausrechnen, Das ist ja
00:12:32: noch lange keine KI. Also da muss
00:12:36: man auch, also nicht vorsichtig sein, aber letztendlich ist das
00:12:39: ja alles irgendwo zur Verbesserung
00:12:43: und zur Steigerung der Effizienz von Prozessen und so
00:12:47: da. Ob das jetzt eine KI dahinter ist oder nur eine Automation.
00:12:51: Jedenfalls, wenn man das alles positiv betrachtet,
00:12:55: die Entwicklung und auch die Gefahren, sich der
00:12:59: Gefahren bewusst ist und sich diesen Gefahren stellt, dann
00:13:02: kann das letztendlich in der Gesamtentwicklung eine sehr
00:13:06: positive Sache sein. Gebe ich dir völlig recht
00:13:09: und man kann das ja auch nachlesen. Google hat eben auch bei
00:13:13: Gemini über das ganze Thema Verantwortung und Sicherheit,
00:13:17: haben die sich da auch einen Kopf gemacht, wie man das Ganze eben auch
00:13:21: verantwortungsvoll und insbesondere sicher gestalten kann. Aber
00:13:24: ich gebe dir natürlich recht, nicht jede Software, wo KI draufsteht, ist KI
00:13:28: drin. Und KI einzusetzen, muss
00:13:32: man eben auch erstmal vernünftig digitalisieren und die Leute auch
00:13:35: dort heranführen, ohne dass sie gleich Angst bekommen, dass
00:13:39: sie substituiert werden, ersetzt werden und am Ende auf
00:13:43: der Straße stehen. Ich glaube, dass es Jobs geben wird, die
00:13:46: substituiert werden. Ja, das ist gerade mit den Schritten, wie das im
00:13:50: Moment passiert, wird das so sein. Aber es wird auch die
00:13:54: Möglichkeit geben, dass sich Leute anders entwickeln.
00:13:57: Andere Jobs werden kommen Und es wird sich auch dort dann
00:14:01: alles beruhigen. Und es wird alles sehr vernünftig über die Bühne gehen, da bin ich
00:14:05: auch ziemlich sicher. Und wenn ich sage, es wird sich ändern, meine ich natürlich auch,
00:14:09: es wird sich auch in unserer Arbeit etwas ändern. Also insbesondere in dem Bereich
00:14:12: der Suchmaschinenoptimierung wird natürlich logischerweise
00:14:16: Gemini von Google sehr tief mit eingreifen und
00:14:20: auch das werden wir logischerweise in unserem
00:14:23: SEO Club clever ranken nochmal zum Thema machen
00:14:27: weil genau darum geht es ja bei Google oben zu stehen und
00:14:31: clever zu ranken, also clever sichtbar zu sein, mehr
00:14:34: Sichtbarkeit bei Google zu haben. Gemini wird uns mit
00:14:38: Sicherheit da helfen und uns unterstützen. Wenn
00:14:41: du einmal deine Webseite richtig nach vorne bringen willst, mehr Sichtbarkeit
00:14:45: bei Google haben willst, mehr Leads, mehr Besucher und letztendlich
00:14:49: auch mehr Umsatz haben willst, dann bist du gerne herzlich eingeladen
00:14:53: einmal in unseren SEO-Club zu kommen. Wir zeigen dir, was du tun musst,
00:14:57: damit deine Webseite bei Google sichtbarer wird. Den Link zum
00:15:00: SEO-Club findest du natürlich in den Shownotes oder auch auf unserer
00:15:04: Webseite www.alsa-digital.de.
00:15:09: Und damit sind wir für heute, für diese Folge auch schon am Ende.
00:15:13: Und ich verabschiede mich ganz menschlich und ohne KI und sage
00:15:16: tschüss und auf Wiedersehen. Und ich verabschiede mich auch und sage
00:15:20: tschüss bis zur nächsten Woche.