Was ist Data Mining? - Ein Leitfaden für Unternehmen
Von Anwendungsgebieten über Tools bis hin zu Methoden: Erfahren Sie mehr über das Potenzial von Data Mining für Ihr Unternehmen.
Daten gelten auch als Öl oder Gold des 21. Jahrhunderts. Im Zuge der seit den 1990er Jahren zunehmend voranschreitenden Datafizierung (engl. datafication: Die Entwicklung, die Welt zunehmend in berechenbare Zahlenwerte bzw. Symbole übertragen zu können) wächst der Stellenwert der Daten zunehmend (vgl. Klaus Wiegerling, 08.08.2022, trendreport.de).
Schließlich hat sich der Handel mit Daten im Zuge von Datenbrokern & Co. zu einem ganzen Markt entwickelt. Unternehmen, die ihnen zur Verfügung stehenden Daten optimal nutzen, können ein besseres Verständnis ihrer Kunden und ihrer eigenen Prozesse erlangen. Dies kann Betrieben im Zeitalter der digitalen Transformation den entscheidenden Wettbewerbsvorteil verschaffen.
Im Folgenden wollen wir uns daher näher mit dem Konzept des Data Minings befassen und aufzeigen, welche Rolle es in Zusammenhang mit der ERP-Software spielt. Zunächst muss jedoch definiert werden, worum es sich eigentlich handelt.
Inhaltsverzeichnis
- Was ist Data Mining?
- Anwendungsgebiete
- Text Mining & Web Mining
- Process Mining
- Data Mining Algorithmen
- Data Mining-Software
- Vorbereitung: KDD
- Methoden
- ERP Data Mining
- Fazit
Was ist Data Mining?
Das Data Mining beschäftigt sich mit der Anwendung statistischer Methoden, um in großen Datenbeständen Muster und Strukturen aufzudecken. Ziel ist es dabei letztlich, neue Erkenntnisse oder Trends zu finden. Große Datenaufkommen bergen das Potenzial, zahlreiche wertvolle Erkenntnisse über die Kunden und die eigenen Prozesse zu gewinnen.
Big Data und der Wert der Daten
Diese lassen sich dann nutzen, um strategisch fundierte Entscheidungen zu treffen und die eigenen Prozesse nachhaltig zu optimieren. Gleichzeitig stellen sie Unternehmen jedoch auch vor eine nicht zu unterschätzende Herausforderung. Denn: Manuell lassen sich große Datenaufkommen (Stichwort big data) in der Praxis nicht auswerten. Dazu bedarf es technischer Unterstützung.
Data Mining in Unternehmen
Im Kern geht es beim Data Mining also darum, aus bestehenden Daten neues, im statistischen Sinne gültiges, und potenziell nützliches Wissen zu ziehen. Die Anwendungsgebiete sind vielseitig und sollen im Folgenden lediglich exemplarisch dargestellt werden.
Künstliche Intelligenz und Maschinelles Lernen
Eng verwandt ist es zudem mit Künstlicher Intelligenz (KI, engl. artificial intelligence; AI) und dem maschinellen Lernen. Im Gegensatz zu KI geht es jedoch nicht darum, bekannte Muster zu erlenen und wiederkehrend darauf zu reagieren. Stattdessen liegt der Fokus konkret auf der Identifizierung neuer Muster.
Mögliche Anwendungsgebiete in Unternehmen
Traditionell findet das Data Mining vor allem in verwandten Bereichen der Informatik Anwendung. Zunehmend gewinnt es jedoch auch in der Industrie von Bedeutung. So kann es beispielsweise Teil bzw. Grundlage von Entscheidungsunterstützungssystemen bilden.
Decision Support Systems (DSS): Entscheidungsunterstützungssysteme
Diese Systeme ermitteln für operative und strategische Aufgaben relevante Informationen. Sie bereiten sie auf und stellen sie übersichtlich zusammen, um menschlichen Entscheidungsträgern bei der Entscheidungsfindung unter die Arme zu greifen.
Prozessanalyse und -Optimierung
Darüber hinaus kann der Ansatz auch bei der Analyse und Optimierung von Prozessen zum Einsatz kommen. So lassen sich beispielsweise Zusammenhänge zwischen einzelnen Prozessgrößen untereinander ermitteln, was Unternehmen bei der Steuerung und Optimierung von Prozessen hilft.
Marketing
Im Marketing lässt es sich für unterschiedliche Aufgaben einsetzen. Dazu zählen beispielsweise die Marktsegmentierung, die Erstellung von Kundenprofilen, die Zielgruppen-Auswahl oder die Analyse von Warenkörben im E-Commerce. Auch im Bereich Business Intelligence (BI) lässt es sich nutzen, um den Wert vorhandener Daten bestmöglich auszuschöpfen.
Analyse von Produktdaten
Auch lassen sich Produktdaten unter Zuhilfenahme von Data Mining Ansätzen analysieren. Insbesondere bei der Wartung und Instandhaltung fallen Daten aus dem Produktlebenszyklus an, die sich mittels Data Mining analysieren lassen. Genutzt werden können die Erkenntnisse dann zur Weiterentwicklung des Produktes. Auch können sie ihren Beitrag zur Generierung von Innovationen beitragen.
Finanzsektor
Im Bereich Finance lässt sich das Data Mining beispielsweise im Rahmen der Rechnungsprüfung zur Betrugserkennung einsetzen. Klassisch kommt es auch beim Kreditscoring zur Bestimmung von Ausfallwahrscheinlichkeiten zum Einsatz.
Anwendungsbereiche Online
Doch auch im World Wide Web findet es Anwendung. So lässt es sich beispielsweise bei der gezielten Erkennung von Cyber-Angriffen nutzen. Ferner lässt sich das Nutzerverhalten mit dem sogenannten Web-Usage-Mining analysieren. Auch die Netzwerkanalyse in Social Media kann sich das Data Mining zu Nutze machen.
Text Mining und Web Mining
Schließlich kommt hier auch das Text Mining; eine bestimmte Unterform für die Analyse großer Textbestände; zum Einsatz. Das Text Mining kommt beispielsweise im akademischen Umfeld zur Identifizierung von Plagiaten zum Einsatz. Es kann jedoch auch zur Klassifizierung von Texten genutzt werden.
Beim Web Mining geht es um die Erkennung von Ausreißern oder Clustern im Netz. Dazu werden nicht nur die Websites selbst, sondern auch ihre Beziehungen zueinander (Hyperlinks) unter die Lupe genommen. Im Web Mining erheben sich beispielsweise aufgrund der sich stetig verändern Inhalte neue Herausforderungen.
Process Mining
Verwandt ist auch der Begriff des Process Mining. Das Process Mining bezeichnet eine Technik, bei der mittels vorhandener Daten Geschäftsprozesse rekonstruiert und ausgewertet werden können. Vorhandene Daten aus der bestehenden IT-Infrastruktur werden im Process Mining genutzt, um Geschäftsprozesse zu rekonstruieren und analysieren.
Process Mining im Prozessmanagement
Es handelt sich somit um eine Technik aus dem Bereich des Prozessmanagements, welche im operativen Teil des Unternehmens Geschäftsprozesse verbessern soll. Das Process Mining lässt sich grundsätzlich überall dort einsetzen, wo einzelne Schritte eines Prozesses so in einem System gespeichert werden, dass die Chronologie und Zusammengehörigkeit der Schritte nachvollziehbar ist.
Data Mining Algorithmen
Das Data Mining bietet Unternehmen, die es sich zu Nutze machen wollen, unterschiedliche Algorithmen. Ein Algorithmus besteht dabei aus einer Reihe von Berechnungen und Heuristiken (Lösungsansätzen und -Methoden), mittels welcher aus Daten ein Modell erstellt wird. Dazu werden vom Algorithmus zunächst die bereitgestellten Daten analysiert, um Trends und Muster zu suchen.
Das Modell
Mit den Ergebnissen definiert der Algorithmus dann die optimalen Parameter zum Erstellen des Mining-Modells. Diese Parameter werden dann für das ganze Data-Set übernommen. So lassen sich ausführliche Statistiken und aussagekräftige Muster extrahieren, die Unternehmen in unterschiedlichen Bereichen von Nutzen sind (vgl. learn.microsoft.com, 13.03.2023).
Beispiele
Aufgrund der Vielzahl von Algorithmen würde eine ausführliche Beschreibung jedes einzelnen an dieser Stelle zu weit gehen. Ein gängiges Beispiel für einen Data Mining Algorithmus ist jedoch ganz klassisch die lineare Regression, die dem ein oder anderer noch aus der Statistik bekannt sein mag. Auch Entscheidungsbäume (decision trees) oder Clustering-Algorithmen wie beispielsweise K-Means sind gängige Beispiele (vgl. Laurenz Wuttke, 13.03.2023, datasolut.com).
Data Mining-Software
Unternehmen haben die Möglichkeit, gesonderte Software für das Data Mining zu beziehen. Hierbei handelt es sich um Tools, mittels derer unterschiedliche Arten bestehender Datenbestände systematisch analysiert werden können. Dies kann Unternehmen beispielsweise bei der Erschießung neuer Märkte helfen. Am Markt finden sich sowohl kostenpflichtige als auch kostenfreie Open-Source-Lösungen.
Zahlreiche Tools stehen zur Verfügung
Tools wie RapidMiner Studio, Teradata, KNIME, Orange oder SAS Enterprise Miner sind nur einige Beispiele für Lösungen, die Unternehmen beziehen können, um das größtmögliche Potenzial aus den eigenen Daten zu ziehen.
Oracle Data Mining
Bei Oracle Data Mining handelt es sich um eine Funktionalität, welche in den Kern der Oracle-Datenbank integriert ist. Auf diese Weise wird keine externe Software benötigt und die Daten müssen nicht migriert werden (vgl. oracle.com, 12.03.2023).
Vorbereitung: Knowledge Discovery in Databases (KDD)
Bevor das eigentliche Data Mining beginnen hat, bedarf es bestimmter Vorbereitungsschritte. So müssen zunächst die Daten ausgewählt werden, die es zu analysieren gilt.
CRM- und ERP-Datenbanken als Datenquellen
Unternehmenssoftware wie CRM- oder ERP-Systeme sind hier eine gute Anlaufstelle. In der ERP-Software werden beispielsweise alle relevanten Unternehmensdaten zu Geschäftsprozessen zentral verwaltet. Die ERP-Datenbank bietet somit einen guten Ausgangspunkt. Dann gilt es, die Daten entsprechend aufzubereiten. Erst im Anschluss kann das eigentliche Data Mining beginnen.
Knowledge Discovery in Databases
Die Bezeichnungen Data Mining und Knowledge Discovery in Databases (KDD) werden häufig synonym verwendet. Tatsächlich umfasst KDD jedoch ebene jene vorbereitenden Schritte (data preparation), während sich das Data Mining streng genommen nur auf die Analyse der ausgewählten und aufbereiteten Daten bezieht.
KDD lässt sich in die folgenden Phasen unterteilen:
- Bereitstellung von Hintergrundwissen für den jeweiligen Fachbereich,
- Formulierung und Definition der eigentliche Ziele der Wissensfindung,
- Auswahl der Daten,
- Bereinigung der Daten,
- Datenreduktion (beispielsweise durch Transformationen= Konvertierung von Daten in bestimmte Formate),
- Auswahl eines Modells, in welchem das gefundene Wissen repräsentiert werden soll,
- Das eigentliche Data Mining und
- die Interpretation des gewonnenen Wissens.
Data Mining: Methoden
Bevor das eigentliche Data Mining beginnen kann, gilt es demnach noch eine Reihe von Schritten zu beachten. Sind die Daten ausgewählt, bereinigt und transformiert, und ist ein Modell ausgewählt, kann der eigentliche Data Mining Prozess beginnen. Hier gibt es nun unterschiedliche Methoden. Einige dieser werden an dieser Stelle exemplarisch vorgestellt.
Prognose
Im Rahmen einer Prognose geht es darum, nach Mustern in einer numerischen Zielvariable zu suchen. Prognosen kommen beispielsweise zum Einsatz, um den zukünftigen Umsatz vorauszusagen (vgl. Laurenz Wuttke, 13.03.2023, datasolut.com).
Klassifikation
Bei der Klassifikation handelt es sich um die Suche nach Mustern anhand eines Klassifikationsmerkmals. Ein Beispiel hierfür ist die Modellierung einer Produkaffinität (vgl. Laurenz Wuttke, 13.03.2023, datasolut.com).
Assoziation und Sequenz
Im Rahmen einer Abhängigkeitsentdeckung geht es darum, Muster zu suchen, bei denen einzelne Elemente in Beziehung oder Abhängigkeit zueinander stehen. Ein mögliches Anwendungsbeispiel ist die Warenkorbanalyse im Bereich des Customer Relationship Managements im E-Commerce (vgl. Laurenz Wuttke, 13.03.2023, datasolut.com).
Segmentierung und Clustering
Bei Segmentierung und Clustering geht es im Kern um das Finden von Segmenten und Gruppen in einem Datenbestand. Ein klassisches Beispiel hierfür findet sich ebenfalls im Bereich des CRM, bzw. spezifischer im Marketing: Die Kundensegmentierung. Eine Kundensegmentierung mithilfe von Data Mining ermöglicht Unternehmen eine Optimierung von Marketing-Maßnahmen und -Kampagnen für eine gezieltere und somit effektivere Kundenansprache (vgl. Laurenz Wuttke, 13.03.2023, datasolut.com).
ERP Data Mining
Die Grundlage für jedes Data Mining-Vorhaben ist eine solide Datenbasis. Diese kann mithilfe einer ganzheitlichen ERP-Software, die die Daten unterschiedlicher Abteilungen und Geschäftsbereiche in sich zusammenführt, geschaffen werden. Mithilfe einer einheitlichen Softwarelösung für ERP, CRM und Co. erhalten Unternehmen eine einheitliche Datenbasis.
Anwendungsbeispiel Vertrieb
Für den Vertrieb bedeutet das beispielsweise, dass sich mittels Data Mining gezielt nicht ausgeschöpfte Vertriebspotenziale, Verkaufstrends, oder das Risiko der Kundenabwanderung (Churn) zum Mitbewerber extrahieren und analysieren lassen (vgl. qymatix.de, 11.05.2020). Vom Data Mining bis zum Business Process Mining bieten sich demnach für Unternehmen zahlreiche Anwendungsmöglichkeiten im eigenen Betrieb.
Fazit: Die vielseitigen Einsatzbereiche des Data Mining in Unternehmen
Zusammen mit Künstlicher Intelligenz und Machine Learning bietet das Data Mining Unternehmen so eine wichtige Möglichkeit, das größtmögliche Potenzial vorhandener Daten auszuschöpfen. Es kann somit sowohl im Bereich Business Intelligence (BI) zur Optimierung der eigenen Prozesse, als auch im Customer Relationship Management (CRM) zur verbesserten und profitableren Kundenansprache eingesetzt werden.
Starten Sie Ihre ERP-Auswahl
Finden Sie das richtige ERP-System für Ihr Unternehmen
Was ist der Single Point of Truth (SPOT)?
Der Single Point of Truth ist ein wichtiger Begriff aus der Softwaretechnik. Worum es sich handelt und warum er für jedes Unternehmen von Bedeutung ist.
Lesen Sie weiterOLAP-Würfel: Definition, Beispiele, Anwendungsbereiche
OLAP Cubes sind in den Bereichen Business Intelligence und Datenanalyse sehr gebräuchlich. Wie Sie sie für Ihr Unternehmen arbeiten lassen, erfahren Sie hier.
Lesen Sie weiterDer große BI-Tool-Vergleich
Von OLAP bis ERP-Schnittstelle: Beim Vergleich von BI-Software sollten Sie die folgenden Funktionen und Eigenschaften beachten.
Lesen Sie weiter