#101 Gemini von Google - neue Maßstäbe bei künstlichen Intelligenz

Shownotes

Heute sprechen wir ausführlich über Googles neuestes KI-Modell mit dem Namen Gemini.

Gemini ist ein bahnbrechendes KI-Modell von Google, das sich durch Multimodalität auszeichnet. Es kann nahtlos Text, Bilder, Audio, Video und Code verarbeiten und kombinieren. Dadurch eröffnen sich völlig neue Möglichkeiten für komplexe Aufgaben.

Gemini bietet spannende Potenziale, wie die Verbesserung der Marktdatenanalyse, die Erstellung von Marketinginhalten und sogar die Recherche von Quellen für Studenten. Die Integration von Gemini in Marketingprozesse wird neue Horizonte eröffnen und den Wettbewerbsvorteil für diejenigen erhöhen, die KI in ihren Prozessen anwenden.

Wir sprechen aber darüber, wer die Gewinner und die Verlierer dieser Entwicklung sein werden.

Google Bard: hier geht´s zu BARD


SEO-Club: Klick, wenn du endlich Clever Ranken willst

Web: ALSA digital GmbH Web: Texten mit künstlicher Intelligenz

Hier geht´s zur Facebook-Seite von Simone

Hier geht´s zur Facebook-Seite von Frank

LinkedIn: Simone Sarodnick

LinkedIn: Frank Sarodnick


Impressum

ALSA digital GmbH Geschäftsführer: Frank Sarodnick Erkrather Str. 401 40231 Düsseldorf Tel.: +49 211 54570869 E-Mail: info@alsa-digital.de

Registergericht: Amtsgericht Düsseldorf Registernummer: HRB 92178 Umsatzsteuer-Identifikationsnummer gemäß § 27a UStG: DE341199181


Transkript anzeigen

00:00:03: Vor ein paar Tagen hat Google seine neue KI mit dem Namen Gemini

00:00:07: vorgestellt. Gemini wird als Googles bisher

00:00:10: mächtigstes KI-Modell beschrieben und könnte wirklich ein

00:00:14: ernsthafter Konkurrent für OpenAI´s ChatGPT sein.

00:00:18: Gemini ist viel mehr als nur ein weiterer KI-Chatbot.

00:00:23: Es stellt den Beginn einer absolut neuen Ära dar, weil es

00:00:26: viel komplexere Aufgaben erledigen kann. Aber

00:00:30: ist Gemini wirklich so gut und was sind die Möglichkeiten von

00:00:33: Gemini? Darüber sprechen wir im heutigen Podcast.

00:00:37: Aber zuerst möchte ich nochmal einen kleinen Rückblick auf

00:00:41: die KI werfen. Und zwar, Du

00:00:45: erinnerst dich sicherlich noch, dass vor einem Jahr ChatGPT

00:00:49: in unser Leben getreten ist. ChatGPT ist die

00:00:53: künstliche Intelligenz, die endlich für alle zugänglich war.

00:00:56: Jeder konnte das mal ausprobieren und es war ein

00:01:00: regelrechter Boom eröffnet worden. Dabei muss man

00:01:03: natürlich erinnern, dass KI schon seit vielen Jahrzehnten

00:01:07: entwickelt wird, aber vor genau einem Jahr

00:01:10: war das eben der Allgemeinheit zugänglich. Und da

00:01:14: begann eigentlich ein Wettrissen zwischen den großen

00:01:18: Unternehmen Microsoft, Google und auch

00:01:22: Facebook. Google zog dann im März

00:01:26: 2023 nach und veröffentlichte seine

00:01:29: KI BART. ChatGPT

00:01:33: wurde dann weiterentwickelt mit ChatGPT 4.0.

00:01:37: Es wurde ein sehr, sehr gutes KI-Modell mit vielen

00:01:40: Möglichkeiten und auch Fehler wurden ausgemerzt

00:01:44: dafür, wo KI eigentlich immer auch für kritisiert

00:01:47: wurde. Allerdings wurde ChatGPT 4.0

00:01:51: auch kostenpflichtig. Irgendwann kam

00:01:55: auch Meta noch mit ins Rennen und entwickelte seine

00:01:59: eigene KI und hat diese auf dem Markt. Also wie man

00:02:02: sieht, es findet ein regelrechtes Wettrüsten statt.

00:02:06: Und jetzt ist neu Google wieder am Start

00:02:10: mit der KI Gemini. Und Frank hat sich das

00:02:14: mal ein bisschen näher angeschaut. Und Frank, was kannst du zu

00:02:18: dieser neuen KI sagen und was bedeutet das

00:02:21: für uns als Marketer? Gemini

00:02:25: ist wirklich ja erst seit zwei Tagen im Moment

00:02:28: aktuell auf dem Markt. Das heißt, ich konnte mir erst mal ein paar Sachen angucken.

00:02:33: Und es ist eine unglaublich

00:02:37: neue Art, wie man an das ganze Thema herangeht.

00:02:42: Gemini ist anders als das, was wir bisher kennen.

00:02:46: Gemini wurde nämlich von Anfang an auf Multimodalität

00:02:51: entwickelt. Was bedeutet das? Das bedeutet,

00:02:54: dass das nahtlose Zusammenspiel zwischen Text,

00:02:58: Bildern, Audio, Video und Code

00:03:02: gewährleistet ist. Das bedeutet, dass

00:03:05: Gemini als künstliche Intelligenz

00:03:09: sowohl Text als auch Codierung, Audio, Bild und Video

00:03:13: verallgemeinern kann, nahtlos verallgemeinern kann,

00:03:17: verstehen kann, verarbeiten und letztendlich

00:03:21: auch kombinieren kann. Das bedeutet, dass Gemini

00:03:24: aus diesen verschiedenen Bereichen etwas

00:03:28: zusammenfassen kann oder auch kreieren kann. Ich gebe vielleicht

00:03:32: mal ein ganz kleines Beispiel. Gimini wurde

00:03:35: darauf trainiert, diese Texte, Bilder, Audios und so weiter

00:03:39: gleichzeitig zu erkennen und zu verstehen. Deshalb

00:03:42: kann es bestimmte Informationen einfach

00:03:46: wesentlich besser verarbeiten und Fragen zu komplexen Themen

00:03:50: auch beantworten. Komplexe Themen, komplizierte Zusammenhänge.

00:03:54: Und aus diesem Grund kann man mit Gemini natürlich wunderbar komplexe

00:03:58: Themen wie Mathematik oder Physik erklären. Und da reicht es, wenn

00:04:02: man sich eine Handskizze macht, die hoch lädt und dann fragt, wie ist hier

00:04:05: dieser Zusammenhang oder eben ganz konkret ein physikalisches oder mathematisches

00:04:09: Problem. Das Thema der Codierung,

00:04:13: also wenn ich wirklich Programmcode schreiben möchte, das

00:04:16: ist in Gemini auch sehr, sehr stark hinterlegt, möchte ich aber jetzt nicht

00:04:20: ins Detail eingehen, weil ich da nicht der Experte bin. Ich weiß nur,

00:04:24: dass dort die Möglichkeit besteht, Programmiersprachen

00:04:28: wie Python oder Java, C++ und so weiter zu

00:04:32: erklären und eben auch den Code entsprechend zu generieren. Habe ich aber

00:04:35: selber noch nicht ausprobiert, muss ich dazu sagen.

00:04:39: Wenn wir mal an das Thema gehen, was

00:04:42: wir jetzt damit machen können als Marketer, Also jetzt nicht als Programmierer,

00:04:46: sondern eben als Marketer. Da muss man sich auch

00:04:50: wirklich frei machen von den bisherigen Regeln. Und man kann wirklich

00:04:53: beispielsweise Marktdaten komplett analysieren,

00:04:57: kann aus den Marktdaten, die vorhanden sind, Trends und

00:05:01: bestimmte Erkenntnisse herausziehen, dann die Arbeit wiederum

00:05:05: besser zu machen oder eben das Marketing anzupassen.

00:05:09: Natürlich kannst du auch logischerweise die Marketinginhalte

00:05:13: erstellen, Marketinginhalte wie Textbilder und so

00:05:16: weiter. Das macht, was man ja jetzt auch schon macht. Eine der Stärken

00:05:20: von Gemini liegt auch darin, dass sie unglaublich gut Text

00:05:23: verarbeiten kann. Das bedeutet zum Beispiel kann

00:05:27: Gemini wirklich Bibliotheken durchforsten und für

00:05:31: Studenten beispielsweise eine gesamte Recherche machen, eine

00:05:35: Quellenrecherche machen. Und kann diese Datenbanken

00:05:38: durchforsten und die aktuellen und wichtigen und relevanten

00:05:42: Inhalte, Quellenangaben herausfiltern. Das war hier

00:05:46: auf einem der Videos auf der Gemini Webseite zu sehen.

00:05:49: Unheimlich spannend, gerade wenn man davon ausgeht, wie viel Daten man dort

00:05:53: sehr schnell verarbeiten kann und Gemini diese Daten auch versteht

00:05:57: und auch interpretieren kann und auch in den richtigen Zusammenhang bringen kann.

00:06:01: Ich glaube, dass wir die richtigen Möglichkeiten von Gemini erst dann sehen, wenn

00:06:05: es wirklich online richtig vorhanden ist und wenn man damit genauso wieder spielen

00:06:09: kann, wie bisher mit Chatshippity, dass man einfach mal sagt, ich probiere mich

00:06:12: da mal aus, ich gehe in den Dialog, Ich arbeite jetzt tatsächlich mit

00:06:16: der KI. Das wird halt mega spannend, auch gerade für

00:06:19: Marketer, für Leute, die Konzepte entwickeln, für

00:06:23: Leute, die kreative Prozesse haben, wo man sagt, ich hole

00:06:26: mir die KI einfach hinzu als

00:06:31: zusätzlichen Input, als zusätzliche Information, als zusätzliche

00:06:34: kreativen Part. Da wird es dann halt richtig interessant. Im Moment sieht

00:06:38: es wirklich so aus, als wenn Gemini dieses erfüllen kann, weil

00:06:42: es eben multimodular aufgebaut ist und übergreifend über

00:06:46: die verschiedenen Bereiche die Sachen erfassen kann.

00:06:49: Das sind natürlich spannende Aussichten, gerade in Bezug auch auf die

00:06:53: Google-Suche. Da bin ich wirklich gespannt,

00:06:58: wie so eine Suchergebnisliste bei Google in Zukunft aussehen

00:07:01: wird. Kann ich denn Gemini schon ausprobieren

00:07:05: oder wo kann ich das mal einsehen, wie das funktioniert?

00:07:09: Also derzeit ist ja von Google das Sprachmodell

00:07:13: BART, das ist ja öffentlich zugänglich. Den Link

00:07:17: stelle ich auch gerne in die Show Notes. Da kann man BART

00:07:20: eigentlich schon ausprobieren und

00:07:24: dort ist auch schon Gemini, soweit ich das sehen kann, da

00:07:28: sind schon die Ansätze zu sehen. Was ich beispielsweise mit BART

00:07:32: durchaus machen kann, ich kann halt mal ein mathematisches Problem

00:07:35: abfotografieren, also handschriftlich aufzeichnen, kann es abfotografieren,

00:07:39: kann es hochladen und kann BART die Aufgabe stellen,

00:07:43: löse dieses mathematische Problem. Und BART ist tatsächlich in der

00:07:47: Lage, das habe ich gerade ausprobiert, aus dieser Handskizze

00:07:52: die mathematischen Lösungen zu entwickeln, Hinweise sogar zu geben, wie

00:07:55: man es machen könnte über zwei, drei Wege, dann die korrekte

00:07:59: Antwort auch zu liefern. Also aus dem Bild mit einer Handskizze

00:08:03: von mir ein mathematisches Problem zu lösen auf mehreren

00:08:06: Wegen. Das funktioniert. Es ist auf jeden Fall eine spannende

00:08:10: Sache und Google wäre ja nicht Google, wenn diese ganzen

00:08:14: Sachen im Hintergrund nicht doch schon irgendwo mit einfließen.

00:08:18: Also sprich, die Vernetzung zwischen Google Docs

00:08:22: und YouTube und sonst irgendwas, die läuft vielleicht schon

00:08:25: im Hintergrund und es hat noch nicht ganz offiziell

00:08:29: kommuniziert. Aber es wird jetzt sehr, sehr schnell gehen. Also man muss immer die

00:08:33: Augen offen halten und am Puls der Zeit bleiben.

00:08:36: Der Fortschritt geht so voran mit so sieben

00:08:40: Meilen Stiefeln und mit so einer Geschwindigkeit, das ist atemberaubend.

00:08:44: Ich bin mal gespannt, was dann auch OpenAI macht,

00:08:48: inwiefern die auch nachziehen. Also das

00:08:52: Wettrennen ist im vollen Gange. Oh ja, das ist es,

00:08:55: absolut. Aber eine Frage habe ich

00:08:59: noch. Wer wird denn in dieser ganzen Entwicklung

00:09:03: Verlierer sein und wer wird in dieser ganzen Entwicklung Gewinner

00:09:07: sein? Oder wird es Gewinner geben und wird es auch Verlierer geben?

00:09:10: Was meinst du dazu? Ja,

00:09:16: Das ist eine gute Frage. Es wird natürlich Verlierer und Gewinner geben.

00:09:20: Es hängt jetzt davon ab, auf welcher Ebene wir das Ganze betrachten. Es ist natürlich

00:09:24: auch eine philosophische Frage. Wer wird gewinnen? Wer wird verlieren?

00:09:27: Aber das mal auf die Ebene der Nutzer runterzubrechen. Ich

00:09:31: denke, es werden die Leute verlieren, die sich vielleicht

00:09:35: wirklich nur auf eine einzige Software konzentrieren und

00:09:38: dort auch nur mit einer Software arbeiten möchten.

00:09:42: Und es werden diejenigen gewinnen, die sich auch

00:09:46: mit neu auf den Markt kommenden Modellen beschäftigen,

00:09:49: die letztendlich da auch offen für sind. Wo sind die nächsten Schritte?

00:09:53: Was gibt es alles noch? Was wird noch passieren? Und die dafür auch

00:09:57: offen sind. Wenn ich das auf die

00:10:01: Anwender-Software einmal runterbreche, kann ich mir vorstellen,

00:10:05: dass die Verlierer diejenigen sind, auch dort wieder,

00:10:09: die sich auf ein einziges Sprachmodell konzentrieren, also sprich

00:10:13: die vielleicht KI und AI vorne drauf schreiben, aber letztendlich

00:10:17: lediglich OpenAI angebunden haben. Und

00:10:21: Gewinner werden die Tools sein, die mit

00:10:24: mehreren Sprachmodellen arbeiten, beziehungsweise mit

00:10:28: mehreren KIs, muss man ja schon sagen, die

00:10:32: nicht nur die Anbindung hinten an diese KIs haben, sondern

00:10:36: das Ganze auch noch sehr harmonisch und nutzerfreundlich zu einem

00:10:39: Paket schnüren, sodass man dann als Marketer

00:10:43: wirklich sowohl Text als auch Bild im Marketing

00:10:46: verwenden kann, beispielsweise. Nur mal als Beispiel genannt. Und da wäre für

00:10:50: mich ganz klar jetzt schon der Gewinner die Software Jasper,

00:10:54: die ja bereits jetzt drei Sprachmodelle angebunden hat

00:10:57: und dementsprechend auch von der gesamten Nutzerfreundlichkeit,

00:11:02: von den Möglichkeiten weit vorne liegt gegenüber einer

00:11:06: Software, die nur an Open AI angebunden ist.

00:11:10: Letztendlich kann ich mir vorstellen, nachdem, was ich bisher so gesehen

00:11:14: habe, dass Künstliche Intelligenz in

00:11:18: einem kurzen Zeitabstand sehr gut integriert sein

00:11:21: wird in viele Prozesse, in viele Software, sodass wir es kaum noch

00:11:25: bemerken werden, wo die KI wirklich arbeitet und sie

00:11:29: wird für uns sehr normal werden. So wie eben auch

00:11:32: Computer oder Handy oder Cloud. Wird auch KI mehr oder

00:11:36: weniger irgendwann normal werden? Wir werden uns damit beschäftigen

00:11:40: und ich hoffe, dass wir alle doch eher die Gewinner sind und

00:11:43: nicht auf der Verliererseite stehen. Egal, wie man das Ganze jetzt

00:11:47: definiert. Na interessant ist ja auch, dass wir uns hier über

00:11:51: KI unterhalten, über Integration von KI in

00:11:54: bestimmte Prozesse. Ich muss gerade an meinen Alltag

00:11:58: denken und sage mir, in manchen Prozessen ist ja noch

00:12:02: nicht mal eine Automation eingebaut, sprich

00:12:06: teilweise bei Behörden oder so. Da wird ja viel

00:12:09: auch noch per Fax und Papier und Formular verarbeitet,

00:12:13: da muss erst mal über Automation gesprochen werden, bevor wir über KI

00:12:17: sprechen. Und gerne wird das ja auch

00:12:21: in einen Topf geworfen und verwechselt. Also da,

00:12:25: wo nur ganz normale mathematische Modelle hinterlegt

00:12:28: sind, die automatisch irgendwas ganz schnell ausrechnen, Das ist ja

00:12:32: noch lange keine KI. Also da muss

00:12:36: man auch, also nicht vorsichtig sein, aber letztendlich ist das

00:12:39: ja alles irgendwo zur Verbesserung

00:12:43: und zur Steigerung der Effizienz von Prozessen und so

00:12:47: da. Ob das jetzt eine KI dahinter ist oder nur eine Automation.

00:12:51: Jedenfalls, wenn man das alles positiv betrachtet,

00:12:55: die Entwicklung und auch die Gefahren, sich der

00:12:59: Gefahren bewusst ist und sich diesen Gefahren stellt, dann

00:13:02: kann das letztendlich in der Gesamtentwicklung eine sehr

00:13:06: positive Sache sein. Gebe ich dir völlig recht

00:13:09: und man kann das ja auch nachlesen. Google hat eben auch bei

00:13:13: Gemini über das ganze Thema Verantwortung und Sicherheit,

00:13:17: haben die sich da auch einen Kopf gemacht, wie man das Ganze eben auch

00:13:21: verantwortungsvoll und insbesondere sicher gestalten kann. Aber

00:13:24: ich gebe dir natürlich recht, nicht jede Software, wo KI draufsteht, ist KI

00:13:28: drin. Und KI einzusetzen, muss

00:13:32: man eben auch erstmal vernünftig digitalisieren und die Leute auch

00:13:35: dort heranführen, ohne dass sie gleich Angst bekommen, dass

00:13:39: sie substituiert werden, ersetzt werden und am Ende auf

00:13:43: der Straße stehen. Ich glaube, dass es Jobs geben wird, die

00:13:46: substituiert werden. Ja, das ist gerade mit den Schritten, wie das im

00:13:50: Moment passiert, wird das so sein. Aber es wird auch die

00:13:54: Möglichkeit geben, dass sich Leute anders entwickeln.

00:13:57: Andere Jobs werden kommen Und es wird sich auch dort dann

00:14:01: alles beruhigen. Und es wird alles sehr vernünftig über die Bühne gehen, da bin ich

00:14:05: auch ziemlich sicher. Und wenn ich sage, es wird sich ändern, meine ich natürlich auch,

00:14:09: es wird sich auch in unserer Arbeit etwas ändern. Also insbesondere in dem Bereich

00:14:12: der Suchmaschinenoptimierung wird natürlich logischerweise

00:14:16: Gemini von Google sehr tief mit eingreifen und

00:14:20: auch das werden wir logischerweise in unserem

00:14:23: SEO Club clever ranken nochmal zum Thema machen

00:14:27: weil genau darum geht es ja bei Google oben zu stehen und

00:14:31: clever zu ranken, also clever sichtbar zu sein, mehr

00:14:34: Sichtbarkeit bei Google zu haben. Gemini wird uns mit

00:14:38: Sicherheit da helfen und uns unterstützen. Wenn

00:14:41: du einmal deine Webseite richtig nach vorne bringen willst, mehr Sichtbarkeit

00:14:45: bei Google haben willst, mehr Leads, mehr Besucher und letztendlich

00:14:49: auch mehr Umsatz haben willst, dann bist du gerne herzlich eingeladen

00:14:53: einmal in unseren SEO-Club zu kommen. Wir zeigen dir, was du tun musst,

00:14:57: damit deine Webseite bei Google sichtbarer wird. Den Link zum

00:15:00: SEO-Club findest du natürlich in den Shownotes oder auch auf unserer

00:15:04: Webseite www.alsa-digital.de.

00:15:09: Und damit sind wir für heute, für diese Folge auch schon am Ende.

00:15:13: Und ich verabschiede mich ganz menschlich und ohne KI und sage

00:15:16: tschüss und auf Wiedersehen. Und ich verabschiede mich auch und sage

00:15:20: tschüss bis zur nächsten Woche.