Blog

Skillbyte Podcast #1: Künstliche Intelligenz – Funktionsweise und Anwendungsbeispiele aus der Praxis

In diesem Podcast geht es um das Thema: Künstliche Intelligenz – Funktionsweisen und Anwendungsbeispiele aus der Praxis.

// Teil 1 //
– Was ist künstliche Intelligenz überhaupt?
– Was ist Hype und was ist technische Innovation? Wie trennt man zwischen Hype und praktischer Anwendbarkeit für mein Unternehmen?

// Teil 2 //
– Anwendungsbeispiele aus der Praxis
1. Chatbots zur Reperaturannahme, Erkenntnissgewinn und Produktentwicklung
2. Klassifikation von Video-Rohmaterial bei multinationalen Medienunternehmen
3. GravityCV.com – Erkennung von strukturierten Daten in unstrukturierten Word/PDF Dateien für die automatisierte Datenübernahme

Abonnieren Sie diesen Podcast und besuchen Sie uns auf https://www.skillbyte.de

Feedback und Fragen gerne an podcast@skillbyte.de

Maurice: Herzlich willkommen zum ersten Podcast. Das ist heute eine Premiere des Skillbyte Podcast. Der Skillbyte Podcast # 1 und unser heutiges Thema ist künstliche Intelligenz: Funktionsweise und Anwendungsbeispiele aus der Praxis. Und, ja, ich bin hier heute mit Masiar.

Masiar: Hallo Maurice.

Maurice: Hallo Masiar. Und, ja zusammen sind wir… betreuen wir die Softwareentwicklung bei Skillbyte, beziehungsweise die Big Data Sparte bei Skillbyte und möchten heute ein bisschen über das Thema künstliche Intelligenz sprechen, was ja, ich glaube, das kann man unumwunden sagen, in der letzten Zeit sehr, sehr häufig in den Medien aufgetreten ist in diversen positiven wie negativen Kontexten. Und auch von Kundenseite oder Kooperationspartnerseite sehr oft an uns herangetragen wurde.

Masiar: Ja, genau. Also was man merkt, ist, dass viele Kunden verunsichert sind, beziehungsweise die Themen gar nicht auseinander halten können. Also künstliche Intelligenz ist ein sehr weiter Begriff. Weitere Begriffe, wie Machine Learning spielen eine Rolle und man weiß eigentlich nicht, was die einzelnen Begriffe bedeuten und letztendlich was für einen selber wichtig im Unternehmen ist oder was man davon einsetzen kann. Künstliche Intelligenz sind nicht nur unbedingt Roboter, da denkt man sofort natürlich an Robotik oder selbstfahrende Autos, aber künstliche Intelligenz ist viel mehr. Was wir versuchen wollen, ist hier die Begrifflichkeit ein bisschen auseinanderzuziehen und ein paar Fallbeispiele zu nennen oder zu zeigen, wo welcher Begriff hinpasst und wie man das… und welchen Fallbeispiel man auf das eigene Unternehmen beziehen kann. 

Maurice: Das ist ja dann sicherlich auch der Wert für unsere Zuhörer. Was konkret mache ich mit dem Thema künstliche Intelligenz? Wir können einfach einmal anfangen und definieren, was künstliche Intelligenz, also du hast das gerade schon gesagt, das ist ein sehr weiter Begriff, für einen selber bedeutet. Künstliche Intelligenz oder KI, AI im englischsprachigen Kontext, ist für mich persönlich, bezeichnet das, teilweise auch sehr alte Technologien oder Algorithmen. Wo es einfach darum geht, die klassische Softwareentwicklung, da programmiert man quasi die Befehle direkt herunter und hinterher hält sich das Programm stoisch an die Befehle und führt die einfach nacheinander aus. Und wenn es zum Beispiel zu einem Fehler kommt oder zu einer Entscheidung kommt, dann kann man hinterher nachvollziehen, okay das und das ist der Programmablaufplan und deshalb ist diese Entscheidung von der Software getroffen worden oder deshalb ist dieser Fehler passiert. Bei künstlicher Intelligenz, für mich persönlich sind das, man programmiert nicht mehr Software, sondern man hat Datensets. Also zwei oder zehntausende Bilder wo Hunde und Katzen drauf sind oder man gibt einem Algorithmus dieses Datensample oder 90 % dieses Datensamples, damit er lernt, was macht einen Hund aus, was macht eine Katze aus. Und kann dann später auf Bildern, die der Algorithmus nicht kennt, dann eine Vorhersage treffen, ist da ein Hund oder eine Katze drauf. Und wenn der Algorithmus sich entscheidet, da ist ein Hund drauf oder eine Katze drauf, das kann richtig und das kann falsch sein, dann kann man nicht mehr sagen, okay aufgrund dieser und jener Programmverzweigung hat er sich für Hund oder Katze entschieden. Sondern auf Basis seines Wissens oder seiner antrainierten Entscheidung hat er, ist die Funktion, die Straffunktion so entstanden, dass sie sich für Hund oder Katze entscheiden muss. Das ist für mich der Schlüsselunterschied in diesen Technologien. 

Masiar: Ah, ja, interessant. Also im Prinzip, dass du letztendlich eine Software, ein Datenmodell erstellst, das mit unvorhergesehenen Daten zurechtkommt. Das heißt, bei der Software, wie du sagtest, läuft das Ganze nach einem ganz bestimmten Schema von A-Z ab. Und jetzt mit dieser künstlichen Intelligenz kann die Software jetzt auch mit, ich sag mal, Situationen umgehen, die er vorher nicht gekannt oder gesehen hat.

Maurice: Genau, bei klassischer Softwareentwicklung ist es ja häufig so, man spezifiziert ein Format, ein Datenformat, ein Bildformat oder sonst irgendetwas und dann werden alle Bilder in genau diesem Format gespeichert. Oder alle Texte genau in diesem Format umgewandelt nach vorher festgelegten Regeln. Und jetzt ist es halt so, ich trainiere auf mir bekannten Samples einen Algorithmus, der dann hinterher unbekannte oder mir auch unbekannte Testdaten von der Welt zugespielt bekommt und dann seine Entscheidung auf Basis seines Wissens trifft. Und das kann auch, dieses Wissen oder diese Auswahl der Testsamples, das unterliegt natürlich auch Fehleinschätzungen. Also es ist zum Beispiel, vor einigen Wochen habe ich das in der Zeitung gelesen, dass, da gibt es einen Feldversuch in Amerika, wo die Rückfallwahrscheinlichkeit von Straftätern vorhergesagt werden sollte und diesen Algorithmus, ja der Algorithmus hat halt Menschen mit dunkler Hautfarbe benachteiligt.

Masiar: Oh mein Gott.

Maurice: Ja, ja, das heißt genau die Vorurteile, die die Menschen sozusagen haben oder die in diesen Testsamples jetzt drinstecken, ja, die nehmen natürlich auch die Maschinen oder diese Algorithmen dann eben an, sodass man sehr genau aufpassen muss, was man da denn hinein füttert am Anfang.

Masiar: Da fällt mir auch ein Beispiel ein. Microsoft hat ja einen Bot mit künstlicher Intelligenz auf Foren losgelassen, um zu lernen. Und nach einem Monat lernen war der Bot quasi ein Rassist oder ein Rechtsradikaler und man hat den sofort abgeschaltet, weil er sich dieses Verhalten angeeignet hat. Also das kann auch ganz schön nach hinten losgehen.

Maurice: Was waren das für Foren? Also ganz normale Foren oder irgendwelche Foren, die erwarten lassen, dass das Verhalten so….

Masiar: Das weiß ich gar nicht, aber kann man noch im Netz mit Sicherheit nachlesen oder… das ging auf jeden Fall nach hinten los, die haben den Bot sofort abgeschaltet.

Maurice: Okay. Ja, aber das Beispiel zeigt genau das worauf ich hinauswill oder ja, man muss sehr genau aufpassen. Nur weil man dann glaubt, also gerade… da wird ja auch sehr viel künstliche Intelligenz als Allheilmittel für allen möglichen Problemen und Kontexts beworben von großen Cloud-Anbietern gerade, da muss man schon sehr genau hingucken. Es ist eine Lösung für Vieles oder man kann viele technische Probleme dadurch verbessern, aber ich glaube auch, dass man da sehr vorsichtig sein muss.

Masiar: Für mich ist das Thema wie folgt oder ich sehe es wie folgt. Also es gibt ja dieses Machine Learning. Damit fing ja im Prinzip alles an. Diese künstliche Intelligenz ist auch nicht neu, also das ist im Prinzip eine sehr alte Technologie oder Algorithmik. Ich habe selbst meine Diplomarbeit in dieser Richtung geschrieben. Also das Thema ist sehr alt. Also ich habe meine Diplomarbeit vor ungefähr 25 Jahren geschrieben, insofern, das ist nichts Neues. Das hat halt nun eine Renaissance erlebt oder ist jetzt gerade so ge-hyped worden, weil die Berechnung sehr kostenintensiv ist und inzwischen ist Hardware so günstig geworden, dass man parallel dieses Lernen, was ja die eigentliche Zeit kostet, zur gleichen Zeit auf vielen, vielen Maschinen und auf Grafikkarten ausführen kann. Deswegen ist das jetzt so interessant. Aber das Machine Learning an sich ist eigentlich keine künstliche Intelligenz, das hat eher mit linearer Algebra zu tun. Beispiel eine Suchmaschine. Wenn ich eine Suchmaschine habe und gebe einen Begriff ein und ich bekomme eine Liste von Ergebnissen, dann steckt dahinter Machine Learning oder lineare Algebra. Nämlich der legt im Prinzip das, was ich eingebe, in die Suchmaschine als auch alle Dokumente die er gespeichert hat in einen n-dimensionalen Raum. Und die Eingabe wird quasi vektorisiert und dieser Vektor wird auch in diesen Raum projektiert und mit linearer Algebra, also Cosinus und Winkeln, wird berechnet, wie nah der eingegebene Suchbegriff zu den Dokumenten passt. Dann wird ein Ranking erstellt und dann wird das, was am meisten passt, ganz oben ausgegeben. Das heißt wir nutzen Machine Learning jeden Tag und hinter vielen, vielen Funktionalitäten, was wir im Web haben steckt Machine Learning. Oder ein anderes Thema ist, wenn du viele Dokumente, viele E-Mails, stell dir vor 100 -150,000 oder eine Million E-Mails und du möchtest die E-Mails klassifizieren. Sind das Bestellungen, die die Kunden eingeben oder sind es Beschwerden? Mal ganz einfache Beispiele. Und das System versteht gar nicht, ist das eine Bestellung oder ist das eine Beschwerde, sondern es lernt anhand dieser vielen Dokumente, dass bestimmte Wörter zusammen häufig vorkommen. Und er clustert quasi diese Dokumente in zwei Teile und weiß aber den Kontext nicht, die Bedeutung kennt er nicht. Ein Mensch muss sagen, okay, das, was du jetzt hier zusammen gefasst hast auf der einen Seite, sind Order-E-Mails und das, was du hier zusammen gefasst hast, sind zum Beispiel Beschwerde-E-Mails. Das basiert aber alles auf Wahrscheinlichkeitsrechnung und linearer Algebra, hat also sehr, sehr wenig mit künstlicher Intelligenz zu tun. Künstliche Intelligenz spielt dann eine Rolle, wo man versucht das menschliche Gehirn nachzuempfinden. Nämlich mithilfe von Neuronen. Das menschliche Hirn ist ja ein assoziativ Computer, ein assoziativ Supercomputer der gelernt hat Dinge zu abstrahieren auf Basis von Lernen. Das heißt, stell dir vor ein kleines Kind auf der Herdplatte packt und in dem Moment merkt, oh, das tut weh, das mach ich nicht nochmal. Das heißt, eine eigene Erfahrung oder die Erfahrung von Außen, wenn zum Beispiel Eltern sagen ‚geh da nicht hin sonst fällst du runter‘. Oder ‚geh da lang, da bist du sicher‘. Das heißt, dieses Lernen, das nimmt das Kind auf und wird mit der Zeit immer, ich sag mal, intelligenter und denkt über vorher Gelerntes nicht mehr nach. Das ist dann intus. Und so funktioniert für mich auch künstliche Intelligenz. Tatsächlich, es gibt Neuronen, die miteinander, ich sag mal, verschachtelt werden und die mit der Zeit etwas lernen. Beispiel Bilderkennung. Ein Bild, ein zweidimensionales Bild einer Katze wird auch quasi in einen Eingangsvektor gepackt, das heißt alle Farbwerte, die so ein Bild beinhaltet, werden encodiert und in so eine Rolle ans Netz gespeist. Und macht man das mit 100,000 oder 5 Millionen Katzenbildern, dann lernt dieses System irgendwann und irgendein Mensch muss natürlich sagen, ‚pass auf, das ist ein Katzenbild, und zwar eine Katze, die dich von vorne anschaut.‘ ‚Das ist ein Katzenbild, wo die Katze von hinten zu sehen ist.‘ Von der Seite, groß, klein, diese Farbe, jene Farbe, möglichst viele, je mehr, desto besser. Und irgendwann lernt das System zu abstrahieren, das heißt welche sogenannten Features oder Merkmale machen eine Katze aus. Ganz ähnlich wie ein Mensch lernt. Was macht denn für uns eine Katze aus? Die spitzen Ohren, die kleine Nase, der Schnurrbart oder die Schnurrbarthaare, der Schwanz, all diese Merkmale sind für uns Abstraktion, wenn wir das nächste Mal eine Katze in freier Wildbahn sehen, sagen wir, ‚ja, das ist eine Katze.‘ Und ganz genauso funktioniert das mit der künstlichen Intelligenz. Wobei das natürlich sehr, sehr weit weg ist von dem was der Mensch eigentlich als Intelligenz bezeichnet, denn da fehlen zum Beispiel auch Emotionen drin. So ein Deep-Learning Modell, wie man es nennt, Deep-Learning, weil es mehrere Schichten dieser neuronalen Layers sind, also wie das menschliche Gehirn funktionieren, die haben keine Emotionen, die sagen ‚Katze ja‘, ‚Katze nein‘. Wenn du dem sagst, ‚töte die Katze‘, sagt ein Mensch, da kommt dieser Niedlichkeits-Faktor oder diese Emotion ins Spiel, wo du sagst, ‚hey stopp, nein ich töte keine Katze.‘ Ein Computer hat diese Emotion nicht. Letztendlich verwertet er diese Daten und der Mensch sagt ihm, was du mit diesen Daten machst. Ganz, ganz krasses Beispiel, was immer wieder verwendet wird, ist bei selbstfahrenden Autos. Wenn du in einer Situation bist, wo du auf eine Personengruppe zufährst, viel zu schnell, was macht die künstliche Intelligenz dann? Entscheidest du dich in die Gruppe zu halten, zu bremsen, Bremsen sind kaputt, funktionieren nicht, die andere Möglichkeit ist rechts runter, rechts runter bedeutet aber einen Abgrund runter, also im Prinzip deinen eigenen Tod. Diese Ethik, diese Emotion kennt die Maschine nicht, das heißt, irgendein Mensch muss ihm dann beibringen was zu tun ist in diesen Situationen. Und das ist genau diese Ethik Diskussion um künstliche Intelligenz, wobei ich finde ganz ehrlich diese Diskussion in Deutschland, bevor wir die Technologie eigentlich ganz verstanden haben, reden wir schon über kontrollieren und regulieren und das ist eigentlich der falsche Weg. Aber das ist vielleicht Thema eines anderen Podcast.

Maurice: Ja, das geht sehr weit. Ich meine das ist natürlich schon wichtig, dass man sich da Gedanken macht, aber das Verständnis was möglich ist und wie es funktioniert, das sehe ich auch. Also bevor man etwas reguliert muss man es verstehen. Oder Verständnis sollte immer der erste Schritt sein, bevor man anfängt da direkt die Daumenschrauben anzuziehen.

Masiar: Ich meine, wenn man versteht, dass solche Modelle, also künstliche Intelligenz letztendlich auf Daten basieren, das heißt, vielen Daten, wo ein Mensch gesagt hat, das ist so, das ist eine Katze und das ist ein Hund, damit die Maschine lernen kann. Man hört ja in den Nachrichten, hast du vielleicht auch mitbekommen, dass Google und Amazon Mitarbeiter bei Alexa mithören. Das wird auch in den Medien so, ich sag mal, an die Wand gemalt wie den Teufel, wenn man aber versteht, dass die Daten das Wichtige sind, dann versteht man vielleicht auch den Hintergrund. Also das Privatleben der Leute interessiert Amazon oder Google null Komma null. Darum geht es gar nicht. Sondern die wollen einfach validieren, ‚hey das, was du verstanden hast, Alexa, war das jetzt richtig, war das wirklich das, was der Mensch sagen wollte?‘ Und dann sagen sie eben ja oder nein, das wars, die wollen den Algorithmus verbessern und nicht in die Wohnzimmer hören, was der eine oder andere macht. Das interessiert keine Sau.

Maurice: Das wollen vielleicht Amazon und Facebook nicht aber die Geheimdienste in den Ländern in denen sich Amazon und Facebook dann befinden. Aber das ist wieder auch eine… ich meine da, wenn man so weit geht, dann ist man vor nichts sicher. 

Masiar: …vor nichts sicher, genau.

Maurice: Weil der könnte auch genauso gut dein Telefon anzapfen.

Masiar: Die haben, glaube ich, ganz andere Möglichkeiten.

Maurice: Also wie ist denn das, wir haben es ja eingangs schon erwähnt, das ist ja schon ein Dickicht, dieser KI Bereich. Und für unsere Zuhörer, glaube ich, ist ganz wichtig zu unterscheiden, was ist denn Hype und was ist jetzt wirklich praktische Anwendbarkeit. Also wir haben ja jetzt auch Beispiele noch aus der Praxis, die wir erzählen können, wo konkret etwas umgesetzt wurde, aus dem Thema KI aber, ich glaube, das ist ganz wichtig, weil da sehr viel… auch ja, die Passwort-Sau durchs Dorf getrieben wird.

Masiar: Leider ja, das spielt halt immer eine Rolle. Immer wo es um eine neue Technologie geht übertreiben es die Firmen natürlich. Ja, weil sie ihre Produkte verkaufen wollen, Dienstleistungen verkaufen wollen. Nichtsdestotrotz ist, also meine persönliche Meinung ist, dass künstliche Intelligenz, damit meine ich jetzt diese gesamte Wolke, ja, Machine Learning, künstliche Intelligenz, Agent Based Learning, was auch immer, wirklich unseren Alltag verändern wird. Es wird wirklich große Umwälzungen geben. Allein, wenn du daran denkst selbstfahrende Autos. Wenn man 5 Jahre, 10 Jahre weiterdenkt, das ist die Prognose von vielen führenden auch Forschungsinstituten und Universitäten, die sagen, das autonome Fahren wird in 5 bis 10 Jahren Mainstream sein. Das wird so viel verändern. Allein im Job-Markt, was es da bedeutet, denke an die ganzen Taxifahrer, denke an die Busfahrer und so weiter und so fort. Also es wird das Bild der Innenstädte verändern. Das sind so große Umwälzungen allein in diesem Bereich. Von den ganz anderen Sachen mal abgesehen. Wenn du an die ganzen Chatbots denkst. Ich weiß nicht, ob du es mitbekommen hattest, da war auch… doch, haben wir letztens uns doch drüber unterhalten, wo ein Google-Bot, eine Diskussion, also hat angerufen in einem Friseursalon und hat einen Termin gemacht für einen Haarschnitt. Und die Dame auf der anderen Seite konnte gar nicht unterscheiden oder konnte nicht sagen, ist das jetzt ein Mensch oder eine Maschine. Jetzt denk dir das mal 5 Jahre weiter. Es wird sich sehr, sehr viel verändern. Insofern glaube ich nicht, bei diesem Thema, dass es ein Hype ist. Man muss sich mit dem Thema auseinandersetzen, sonst fallen wir hintenan und die anderen laufen uns davon.

Maurice: Ja, das ist ja auch so ein… man hat irgendwann, durchbricht man diese Schallmauer oder hat diesen Durchbruch und kann das eigene Gesicht auf jeden Prominenten glaubhaft setzen. Oder du kannst die prominente Stimme zusätzlich zu dem Prominenten Gesicht animieren, dass du ein glaubhaftes Video erstellst. Und das wird gerade in, ich sag mal Ländern, wo die Regierung vielleicht nicht so gefestigt ist, wird das ein Riesenproblem werden. Also, ich sag mal, du könntest ja irgendwie den Politiker des Landes irgendetwas sagen lassen und das bei Facebook teilen und das so… die Leute aufhetzen und für deine Kampagne dann benutzen. Und die Leute, wenn die nicht wissen, es gibt diese Möglichkeit, dass das Video gefälscht ist und die Fälschung ist super gut und das kann mit diesen Technologien gemacht werden, dann fallen die auf diesen Taschenspielertrick, sag ich mal, herein. Das ist so wie heute der Enkeltrick per Telefon. Die Leute haben immerhin gelernt, wenn das Telefon klingelt, dann muss nicht immer jemand nettes anrufen und genauso muss man lernen nicht nur, weil Text gedruckt ist oder weil ich ein Video sehe, was scheinbar den Tatsachen entspricht, muss das wirklich echt sein. Also da wird die Medienkompetenz noch ordentlich mit wachsen müssen, das glaube ich auch.

Masiar: Da sehe ich aber auch die Regierung in der Pflicht das zu fördern, dieses Wissen, diese Erziehung drumherum. Statt nur Angst zu machen, da jetzt die Technologie verteufeln, sollte man lieber… weil, die wird kommen, egal wie wir uns dagegen stemmen, die Technologie wird kommen und uns überrumpeln, wenn wir nicht vorbereitet sind. Deswegen besser erziehen, den Leuten erklären und mitnehmen anstatt Angst zu machen, weil da ist keinem geholfen. 

Maurice: Das stimmt, das sehe ich genauso.

Masiar: Weil, die hat viele, viele Vorteile, ja, wir haben einige Projekte gemacht, wie zum Beispiel für eine große Elektronikkette in Deutschland, die neue Dienstleistungen finden wollten, was sie im Store verkaufen können. Um hier jetzt einmal auf eine, ich sag mal, auf ein wirtschaftliches Beispiel zu kommen, wie man das verwenden kann. 

Maurice: Ja genau, das finde ich super.

Masiar: Und wir sind dann hingegangen, haben zum Beispiel sämtliche Diskussionsforen, wo es um Hard- und Software geht, haben uns da für Probleme von Smartphones, haben wir gescraped. Gescraped heißt also quasi, wir haben ein Programm geschrieben, was auf diese Webseiten, auf diese Foren geht, sich den Inhalt extrahiert, aufbereitet und analysiert und haben versucht herauszufinden, was ist das Thema oder das größte Problem, wo sich die Leute am meisten darüber unterhalten. Und dann haben wir festgestellt, dass das ein bestimmtes Thema ist. In dem Falle waren es Backups von Mobildaten bei einem Telefonwechsel oder wenn das Telefon kaputtgeht. Und diese Firma hat dann aus diesem, weil es wusste, was die Leute wirklich beschäftigt, hat ein Dienstleistungsprodukt drumherum gebaut und das in ihren Stores angeboten, was ein Riesenerfolg war. Also und das war ein sehr, sehr einfaches Projekt. Das war innerhalb von vier Tagen erledigt, ja, aber man sieht daran, was man alles damit machen kann. Und das ist ein sehr simples Beispiel eigentlich.

Maurice: Ja, aber man hätte ja wahrscheinlich aus den Informationen noch weitere 2-3 ja Produkte oder Services schnüren können. Und das war erst der erste Aufschlag und das ist ja schon ein Riesenerfolg, dass man weiß was die Leute da draußen beschäftigt, wenn ich ein stationäres Geschäft habe. Weil ich muss mich ja irgendwie gerade bei Elektronikprodukten wie Mobiltelefon, das war ja dein Beispiel, muss ich mich ja irgendwie abgrenzen dann durch Service, weil sonst bestellen die Leute alles nur noch online. Also gerade in dem elektronischen Bereich, glaube ich.

Masiar: Na klar. Also, ich meine bei dem Beispiel ging es darum eine Entscheidung zu treffen, die auf Daten basiert. Ja, das heißt wir bereiten Daten so auf, in verständliche Formen, also wir visualisieren die Daten auch so, dass der Kunde sofort versteht, was diese Daten aussagen sollen und welche Chancen sich daraus ergeben. Das heißt im Prinzip KPI. KPIs die datenbasiert sind und diese Entscheidung zu treffen basierend auf Daten und nicht auf Bauchgefühle oder was man glaubt, was der Kunde braucht, sondern was der Kunde tatsächlich gesagt hat, was er braucht. Und diese Daten zu nehmen, zu verwerten und dann zur Entscheidung vorzulegen damit… das kann man zum Beispiel mit Machine Learning und künstlicher Intelligenz machen. 

Maurice: Ja, das war auf jeden Fall eine super schönes Projekt, fand ich, weil das sehr schnell einen sehr großen Erfolg erzielt hat. Leute, die im Projektgeschäft lange tätig sind wissen, dass das nicht immer so sein muss, aber das war auf jeden Fall ein, eine tolle Erfolgsgeschichte. Ja, ich selber habe ein Projekt, nicht begleitet aber mitbekommen, da ging es darum, dass bei einem großen europäischen Fernsehsender und auch einer Produktionsfirma, da gehen halt pro Sekunde etwa drei Videos ein. Rohmaterial von Nachrichtensendungen oder von Redakteuren, die überall auf der Welt eben Material zuführen auch für Beiträge, die dann in den Nachrichten gesendet werden. Und dieses Rohmaterial, da gibt es eine ganze Heerschar von Leuten, die dieses Rohmaterial sofort sichten, mit Metainformation versorgen, wo wurde es aufgenommen, wann wurde es aufgenommen, welche Personen sind zu sehen, welche Rechte gibt es für das Video, also wo darf es überall gesendet werden, welche Altersfreigabe gibt es voraussichtlich, gibt es da Gesichter drauf, für die keine Freigabe vorliegt, also die verpixelt oder weg geblendet werden müssen. Und der erste Schritt eines jeden Videos ist, dass dieses Video eben klassifiziert wird anhand des Inhaltes für, ich glaube, es gibt 11 Kategorien. Also eine Kategorie könnte zum Beispiel VIP sein, also für Stars und Sternchen, Wirtschaft, Sport, solche… um das ganz grob einzukategorisieren. Wenn du weißt, du hast ein Video, wo Angela Merkel steht und das ist mit Sport getagt, dann hast du eine andere Erwartung, als wenn das mit Politik oder Wirtschaft getagt ist. Weil sie halt auf einem Sportevent, bei dem WM-Finale, gratuliert oder so etwas. Ja, genau. Und diese Klassifikation ist der erste Schritt in dieser Metadaten Erfassung, die sehr umfangreich ist und diese 11 Keywords, die wurden eben trainiert und das Videomaterial, bei der Ankunft, hat ein System das schon vor-getagt. Also es hat beispielsweise erkannt, da ist Frau Merkel und Vladimir Putin drauf, das ist wahrscheinlich Politik und vielleicht auch Wirtschaft. Und dann wurden die sozusagen vorausgewählt und das war von, ich glaube, von 20 Leuten, die eben diese Metadaten Erfassung gemacht haben, konnten dann, ich glaube, 12 Leute also 8 Leute haben das dann weiterhin gemacht und 12 Leute konnten sich dann der erweiterten Metadaten widmen und mussten nicht mehr mit diesen klassifikations… ja mit dieser Grobklassifikation beschäftigt werden sozusagen. Konnten also qualitativ höherwertige Metadaten an die Videomaterialclips dran schreiben, als das vorher möglich war. Weil sie jetzt eben mehr Zeit hatten, weil der Computer sozusagen schon die Vorauswahl trifft. Und das hat zu einem relativ hohen Grad, also ich glaube, am Beginn war die Quote, lag die irgendwie bei 89 % und später wurde es nochmal verbessert, da lag sie bei über 95 %, hat diese Klassifikation geklappt. Und das ist natürlich auch eine Riesenveränderung oder Verbesserung der Wertschöpfungskette, weil da werden jetzt keine Leute arbeitslos, weil die können natürlich andere sinnvolle Sachen machen, aber die Metadaten zu dem vorhandenen Videomaterial werden einfach umfangreicher und können eben besser verschlagwortet werden und das Material wird einfach wertvoller, das Archivmaterial, wenn man so möchte.

Masiar: Das hast du, glaube ich, etwas sehr Wichtiges gesagt, finde ich. Nämlich, dass man nicht immer Sorge haben muss, also an diesem Beispiel sieht man es super, dass dann der Computer oder der Algorithmus Menschen ersetzt. Es hilft ihm einfach sich auf wesentlich wichtigere Dinge zu konzentrieren, weil das, ich sag mal, die nullachtfünfzehn Arbeit oder dass die Standardarbeit quasi von einem Computer erledigt wird und man dann höherwertige Arbeit machen kann.

Maurice: Meinem Eindruck nach, fand das Team das sogar gut, weil es sich jetzt nicht mehr mit diesen, ich sag mal, diesen Dummy Aufgaben beschäftigen muss, sondern eben dann wirklich gucken kann, oder eben diese kniffligen Fälle zugespielt bekommen. Da ist Frau Merkel und Vladimir Putin sind auf irgendeinem Sportevent und der Computer weiß nicht, ja ist das jetzt Politik, ist das Wirtschaft, ist das Sport, ist das vielleicht alles, wo dann wirklich menschliche Intelligenz notwendig ist, wo man sich den Clip vielleicht auch kurz angucken muss und entscheiden muss. ‚Ah, okay die treffen sich am Rande vom Sportevent halt zufällig‘ und besprechen irgendetwas‘, das ist eher Politik oder ’sie stehen auf dem Siegerpodest und überreichen bei den Olympischen Spielen in Russland irgendeinen Preis‘, dann ist es definitiv… hat das dann Sportcharakter. Genau. Und da ist dann doch der Mensch gefragt, weil die Maschine da nicht… vielleicht ist das in ein paar Jahren möglich, da die Quote weiter zu verbessern, aber es wird immer streitbare Fälle geben. Ein anderes Beispiel habe ich jetzt gestern gelesen, ganz witzig. Ein etwas kritisches Beispiel. Und zwar ist es wohl so, dass Frauen im Internet häufig ungefragt Fotos von männlichen Geschlechtsteilen per private Message zugeschickt bekommen. Bei Facebook, bei Twitter und so weiter. Und es wird ein neuronales Netz trainiert, was entscheiden kann, ist das ein Dick-Pic oder nicht. Und wenn du mal überlegst, wie viele Menschen tagtäglich, es gibt ja auch bei den Social Networks überall diesen Meldebutton, ja. Wenn du da draufdrückst, wird das ja irgendwem vorgelegt, der dann entscheiden muss, ist das… kann man das Bild zulassen oder nicht. Wie viel, wenn das funktioniert, wie vielen Menschen man erspart sich durch Heerscharen von Dick-Pics zu graben den ganzen Tag. Und sich dann vielleicht anderen Sachen zuwenden zu können, das ist ja, da ist das Potenzial riesig, sowohl wirtschaftlich durch Einsparung als auch auf der Schonung der menschlichen Psychologie, will ich das mal nennen, ja…

Masiar: Ja absolut.

Maurice: …dass einfach ein System da das erkennen kann.

Masiar: Ein weiteres Beispiel ist bei dem Thema, also das Thema an sich heißt Predictive Analytics, das heißt aufgrund von bestehenden Daten oder eingehenden Daten der Vergangenheit kann ich Aussagen über die Zukunft treffen. Sehr häufig wird das eingesetzt, ich sag mal, im Industriesektor um vorherzusagen, wann ein bestimmtes Teil eventuell kaputtgehen könnte, weil es langsam anfängt Muster aufzuweisen, die darauf hindeuten, dass ein bestimmtes Teil defekt ist. Und das hilft der Industrie Milliarden einzusparen, wenn diese Systeme mitlaufen, mit der Zeit lernen und merken, okay, welche Datenmuster, wie zum Beispiel bestimmte Sensoren, Temperatur, Leitfähigkeit, was auch immer einen Fehler bedeuten. Ja und das wird quasi über Branchen hinweg oder in derselben Branche geteilt, diese Daten, sodass jeder davon profitieren kann und man viel schneller merkt, bevor ein Gerät kaputtgehen kann und es vielleicht zu einem Ausfall von bestimmten Systemen kommen kann. Was wiederum hilft Millionen einzusparen.
 
Maurice: Ja, da ist ein Riesenpotenzial gerade bei Industrie, da oft kleinste Veränderungen in der Ausschussware hinten haben ja einen Rieseneinfluss auf das Ergebnis dann.

Masiar: Wenn du mal an Industrie 4.0 denkst, also jetzt mit 5G, wo die Kommunikation zwischen vielen einzelnen Geräten viel schneller wird oder fast in Echtzeit möglich ist und all diese Geräte miteinander Daten austauschen, kommunizieren. Denke an das vernetzte Auto. Welche Datenmengen auf uns zuströmen. All diese Daten auszuwerten und Vorhersagen zu treffen über, keine Ahnung, über Staus, über Unfälle, über was auch immer, das sind Riesenfelder, die sich da auftun.
 
Maurice: Ja. Also was ich immer denke, was so zum Himmel schreiend ineffizient ist, das hat jetzt unbedingt gar nichts mit KI zu tun, aber also so eine ganz normale Straßenkreuzung mit einer Ampel, ne. Wie viel Zeit stehst du an einer Ampel? Es ist rot, entweder als Fußgänger oder als Autofahrer und du siehst es kommt kein Auto von rechts und links und du könntest eigentlich fahren.
  
Masiar: Kenn ich.

Maurice: Also ich lebe in einer Großstadt. Wenn ich jedes Mal, bei jeder roten Fußgängerampel das abwarten würde, glaube ich, würde ich am Tag nicht viel Strecke zurücklegen können. So und das ist ein Problem. Also jetzt nehmen wir die Fußgänger vielleicht mal raus, aber die Autos, in dem Moment wo die Autos kommunizieren können, ‚liebe Ampel ich fahre mit Tempo 50 auf dich zu,‘ kann die Ampel, weil sie das Umfeld kennt, eine Entscheidung treffen ‚okay, außer dir, liebes Auto, fährt aber kein anderer hier auf diese Ampel zu, du fahr einfach durch, solange du 50 fährst.‘ Und dann könnte der Verkehr, wenn an einer Kreuzung so netzartig quasi immer durchgeführt werden, wenn die Leute kein Gas geben dürfen oder nicht bremsen dürfen oder die Ampel sozusagen für diese Kreuzungssektion die Kontrolle übernimmt und einfach den Autostrom steuert. Was das für einen Boost darstellen würde, das man ich mir gar nicht auszurechnen. Natürlich wird es, geht das nur bis zu einem gewissen Grad, dann brauchst du wieder die normale Ampel oder das normale Vorgehen an einer Ampel aber ansonst ist das… wäre diese Verbesserung alleine würde so viele tausend Wartestunden und Liter Sprit sparen unglaublich.

Masiar: Na ja, Elon Musk sagt ja sogar, dass man, wenn das Auto vernetzt ist und es selbstfahrende Autos gibt, dass man gar keine Ampeln mehr braucht.
Maurice: Ja, genau. Das wäre der nächste Schritt sozusagen, dass man die Ampeln abbaut, also ich denke mir heute auch, die meisten Leute haben ein Navigationsgerät, wenn der deutsche Staat sagen würde, passt auf wir schenken euch allen ein Navigationsgerät und bauen alle Schilder ab, oder fast alle Schilder ab, da wird der mit so einem riesen Plus da herausgehen, das, glaube ich…

Masiar: Definitiv.

Maurice: Der deutsche legendäre Schilderwald ist ja bekannt. Ein Beispiel finde ich, das ist noch ganz wichtig, dass wir das hier erwähnen sollten. Und das ist das von unserem eigenen Produkt, eigenes Skillbyte Produkt gravitycv.com. Und vielleicht, weil du dich intensiver damit beschäftigt hast, möchtest du kurz erzählen, wie aus unstrukturierten Daten KI eingesetzt wird, diese unstrukturierten Daten in strukturierte Daten zu überführen.

Masiar: Ja, also wir setzen bei gravitycv.com KI oder Machine Learning auf zwei Ebenen ein. Das eine ist… also erst mal kurz zu gravitycv.com, du kannst dort ein online CV führen, managen und verteilen. Und das erste oder die erste Herausforderung, wenn du dich in dem Tool registrierst ist, okay, wo fange ich an, wie gebe ich meine Daten ein, weil die meisten werden schon ein bestehendes CV einen Lebenslauf in Word oder PDF Format haben. Und es gibt viele verschiedene Formate, der eine macht Tabellen, der andere schreibt einfach untereinander her und wir haben ein System trainiert, wo wir hunderttausende von Lebensläufen dem System zugeführt haben und das System hat mit der Zeit gelernt, das sind Kontaktinformationen, das ist eine Projekthistorie, das ist ein Zeitraum für eine Projekthistorie, das sind Skills, und das heißt du kannst in jedweder Form dein CV hochladen als PDF oder Word. Und das System hat eine Genauigkeitsquote von 90 bis 95 %, das heißt der erkennt mit 90 % Wahrscheinlichkeit alle die relevanten Informationen und überführt diese unstrukturierten Daten aus Word oder PDF in ein strukturiertes Format, sodass du es dann quasi wiederum online nutzen kannst um es einem Vermittler oder einem Kunden zur Verfügung zu stellen.
 
Maurice: Das heißt ganz plastisch gesprochen, bei gravitycv.com, wenn man sich normal anmeldet, musste man ja jetzt seinen Namen eintragen, sein Geburtsdatum, seine Adresse, seine Skills und wenn ich aber schon einen Lebenslauf habe, im Word Format oder auch auf einer anderen großen Job Social Media Webseite, dann könnte ich das sozusagen exportieren als Word Dokument oder als PDF, lade das per gravitycv.com hoch und er erkennt, ah, hier das ist der Name, das ist die Adresse der Person, das ist das letzte Pro… oder der letzte Arbeitgeber dieser Person und füllt das quasi schon… das ist dann vor ausgefüllt. Aber der Nutzer kann dann natürlich noch, wenn dir irgendwie ein Tippfehler auffällt oder so etwas kann er da noch eingreifen und das dann noch korrigieren, ja.

Masiar: Genau. Das ist die erste Ebene. Die zweite Ebene ist, wir, ähnlich wie bei diesen Foren, ja, wo wir die Produkte herausgefunden haben, scrapen wir alle relevanten deutschen Stellenbörsen. Und was wir dann machen, ist aus diesen Jobbeschreibungen die Skills herausfiltern. Das heißt wir haben ein System entwickelt, was erkennt, was ein Skill ist, also sprich jetzt vom IT Umfeld, ja, weil, das ist eine relativ komplexe Geschichte und wir mussten natürlich die Domäne ein bisschen einschränken. Da wir uns im IT Sektor bewegen haben wir ein Modell trainiert, was erkennt, was zum Beispiel Java ist. Er weiß, Java ist eine Programmiersprache. Er weiß, dass zum Beispiel Linux ein Betriebssystem ist. Und was jetzt passiert, es ist ganz spannend, auch wenn es für uns oder für einen, der sich in dieser IT Geschichte ein bisschen auskennt sehr trivial ist, aber für eine Maschine ist es halt eben nicht trivial, zum Beispiel, wenn du in einer Jobbeschreibung was von red hats liest also einer bestimmten Linux Distribution oder SUSE oder Debian, dann weiß das System, dass es sich letztendlich um Linux handelt. Warum ist das interessant? Weil, wenn auf der anderen Seite wir CVs haben, beziehungsweise User Profile haben im System, dann können wir dem User eine Jobbeschreibung oder einen Job als passend darstellen, wenn dort Linux erwähnt ist. Also beim User ist zum Beispiel red hat erwähnt, er hat geschrieben, ‚ich habe Red Hat administriert‘ und in der Jobbeschreibung steht, ‚wir suchen einen Linux Administrator‘, dann weiß das System, aha, Linux oder red hat ist ein Linux System und kann die beiden matchen. Sehr einfach gesprochen.
 
Maurice: Das heißt es entstehen so Ontologien von Technologien, dass man quasi den ganzen Stack dann erkennt.

Masiar: Richtig, also wir haben quasi das Domänenwissen um IT Begriffe in ein mathematisches Modell gesteckt, wo wir dann das Matching zwischen diesen beiden ermöglichen können. Weil letztendlich als IT Freiberufler, falls uns welche zuhören, die werden genau wissen was wir meinen. Man wird tagtäglich bombardiert von Recruiter Kollegen, die einem sehr unpassende oder un-relevante Projekte vorschlagen. Ich habe letztens, weil ich irgendwo in meinem Profil Projektleitung stehen hatte, weil ich das mal kurze Zeit gemacht habe, hat mir einer ein Architektenprojekt angeboten, Bauleitung. Weil da, weil er gesagt hat, okay aha, Projektleitung – Projektleitung, für ihn war das ein Match, das könnte zum Beispiel mit unserem Algorithmus nicht passieren. 

Maurice: Softwarearchitekt ist Architekt. Ja.
 
Masiar: Ja. Das ist kein Witz. Passiert. Ja. Und ich bin mir sicher, dass andere Kollegen, die jetzt gerade zuhören, auch viele Storys erzählen können. 

Maurice: Ja, das glaube ich auch. Da wird auch, ich glaube dieses Recruitment funktioniert auch momentan einfach mit dem Wasserschlauch Prinzip.
 
Masiar: Total.

Maurice: Da wird, wenn eine Stelle irgendwo offen ist oder eine Projektanfrage irgendwo offen ist, wird aus allen Kanälen gefeuert und das ist der Grund warum, ja die Menschen so viele unangemessene Projekte oder… unangemessen sind sie ja nicht, also die Skills passen dann vielleicht nicht zu dem Skill Set, was die Person hat oder die Firma hat oder was der Festangestellte dann eben liefern kann, weil es eben einfach an alle per E-Mail rausgeschickt wird. 

Masiar: Ja. Aber ich finde, das Problem ist ja viel subtiler, selbst wenn zum Beispiel bei mir in dem Profil, ich habe vor 25 Jahren als Werkstudent ABAP programmiert, also eine Programmiersprache für SAP und ich werde heute noch angeschrieben von Vermittlern, ’stehen sie für ein ABAP Projekt zur Verfügung?‘. Also das ist absolut nicht mehr relevant für mich und in meinem CV, ne? Und – das heißt, was ich sagen will, das Recruiting heute ist sehr rückständig, also da gab es irgendwie kaum Fortschritte. Und was wir jetzt als Skillbyte quasi versuchen wollen, das ist einfach ein Steckenpferd von mir, ist diese Branche komplett umzukrempeln und zu digitalisieren. Und das versuchen wir mit gravitycv.com und der künstlichen Intelligenz dahinter.
 
Maurice: Ja, ich denke, das ist, dass wir gravitycv.com am Schluss nochmal erwähnen ist doch ein toller Übergang, wie gesagt, wenn uns Leute zuhören: Ihr könnt euch gerne anmelden auf gravitycv.com, schickt uns Feedback, wie ihr zurechtkommt, ob euer hochgeladener Word und PDF Lebenslauf perfekt erkannt wurde.

Masiar: Wobei, Maurice, da muss ich sagen, diese Funktionalität kommt jetzt mit dem Relaunch im November. Da sind wir ja gerade dran, also in der Beta gibt es das schon und das. Also ausprobieren können es die Kollegen erst im November.

Maurice: Okay, ab November 2019 sollten wir vielleicht dazu sagen, damit, falls uns jemand dann später noch hört Bescheid weiß. 

Masiar: Ja. 

Maurice: Ansonsten, glaube ich, was für unsere Hörer auch interessant ist, ist der Blog von Skillbyte. Ihr könnt gerne auf www.skillbyte.de/blog vorbeischauen. Da haben wir immer viele Artikel auch zum Thema KI. Das letzte ist jetzt hier zum Thema Churn Prediction ein umfangreicher Blogartikel erschienen, aber auch zu generellen Big Data Problemen, Softwareengineering Themen und auch ja, in der letzten Zeit relativ… sind viele Artikel zum Thema DevOps aufgekommen, weil das ja auch ein sehr stark nachgefragtes Thema ist. Auch viel Unwissen im Markt oder bei den Kunden häufig, weil sie durch die Marketingabteilung der großen Hersteller doch etwas desinformiert sind oder über optimistisch informiert wurden, dass man da wirklich nochmal sagen kann, was da eigentlich geht. Ja, ich finde das immer ganz wichtig, dass man den Kunden, oder so sehe ich unsere Rolle, dass man den Kunden dann auch ehrlich zeigt, was da geht und was da nicht geht und sich nicht auf die reinen Marketingbroschüren verlässt, weil da doch sehr oft etwas übertrieben wird. So, das ist jetzt nicht speziell in der IT so. Wenn unsere Zuhörer Feedback haben, Masiar, ich denke, dann können sie einfach eine E-Mail an podcast@skillbyte.de schreiben.

Masiar: Genau.

Maurice: Und dann sind wir gespannt, was da…

Masiar: Für Feedback kommt.
 
Maurice: …was uns an Feedback erreichen wird. Genau, genau. Also abonniert auch gerne den Podcast oder gebt uns einen Daumen hoch und…

Masiar: Oder auch Daumen runter.
 
Maurice: Daumen runter, okay, wenn man Daumen runter gibt, dann aber gerne auch Feedback schreiben, was wir besser machen können und welches Thema, also wir verbessern uns ja gerne, welches Thema dann interessant ist oder, dass wir den Verbesserungsvorschlag dann auch in der nächsten Episode aufgreifen können und den, wenn er unseren Lesern hilft, dann erwähnen können, ja. Das ist doch super schön. Masiar, ich danke dir ganz herzlich für diese Session.

Masiar: Ich danke dir auch, Maurice. Vielen Dank den Zuhörern.

Maurice: Ja, vielen Dank und wir hören uns. Bis dann.

Masiar: Tschau.

Maurice: Tschau.

Maurice KnoppSkillbyte Podcast #1: Künstliche Intelligenz – Funktionsweise und Anwendungsbeispiele aus der Praxis