Text Mining und Data Mining im Zeitalter von Big Data

Text Mining – Wissen aus unstrukturierten Quellen

Text Mining, oder auch in den Schreibweisen Textmining oder Text-Mining bekannt, ist ein Verfahren um Informationen aus unstrukturierten Texten zu erhalten.

Mit Hilfe von linguistischen (sprachwissenschaftlichen), statistischen und mathematischen Verfahren werden durch das Text Mining gezielt Muster und Strukturen gefunden und Informationen extrahiert.

Text Mining Informationen Erklärungen von Averbis

Das Wort Mining in der Bezeichnung Text Mining entstand aus einer Analogie zum Bergbau. Ähnlich wie beim Bergbau muss auch beim Text Mining zunächst sehr viel unstrukturiertes Rohmaterial geschürft, freigesetzt und verarbeitet werden. Als Ergebnis erhält man wertvolles Edelmetall oder eben gewinnbringendes Wissen.

Warum Text Mining?

Das Zeitalter Big Data führt zu einer enormen Zunahme an digitalen Informationen. Speicher ist heute günstig und kein begrenztes Medium mehr. Während sich das Wissen bislang auf wenige Quellen verteilte, steigt mithilfe der technischen Möglichkeiten auch die Anzahl der Textdokumente und Speicherorte rasant an.

Dies jedoch führt zu einem eklatanten Problem:

Was bis dato einzig dem Verstand des Menschen vorbehalten war – Textinhalte und Zusammenhänge zu verstehen – ist aufgrund der Masse an Informationen ohne technische Hilfe heute nicht mehr zuverlässig möglich.

Hier unterstützen hochprofessionelle Text Mining Softwarelösungen. Sie helfen überall dort, wo Daten und Information in Textdokumenten, und nicht in Datenbanken vorliegen. Wikipedia Text Mining

Wählen Sie einen Cluster aus:

Geography Organisation Concept Date Currency

Tuesday, March 26. 2013 -AusAID Australia and the World
Bank´s Global Environment Fund (GEF)
reached an agreement
to give the government of Kiribat US$5 million to install solar
panels around
the country capital, located on the Tarawa atoll.
According to Business Desk of the Brunei Times, AusAID promised
AU$3.2 million in funding, while GEF promised US$1 million.
The country was the first in the Pacific to make a deal
with the World Bank.

Beispiel Text Mining

Beim Analyse-Verfahren des Text Minings werden implizite Informationen gezielt explizit gemacht. Beziehungen zwischen den Informationen werden mithilfe von Algorithmen strukturiert und damit auswertbar gemacht.

Links sehen Sie schematisch und beispielhaft das Verfahren eines Text MiningsProbieren Sie einmal aus!

Alle relevanten Informationen werden nach der Auswahl markiert und sind somit schnell für den Informationssuchenden erfassbar.

Unterschied Text Mining und Data Mining

Beim Text Mining liegen die Informationen und Daten in Textdokumenten vor. Beim Data Mining hingegen sind Daten bereits schon strukturiert und komprimiert in einer Datenbank verfügbar. Text Mining ist folglich mit dem Data Mining verwandt. Für die Differenzierung ist hauptsächlich die Quelle der Informationen und der Grad der Strukturierung entscheidend. Text Mining befasst sich hauptsächlich mit unstrukturierten Daten, während Data Mining oftmals auf strukturierte Quellen zurückgreifen kann.

Text Mining (Vereinfachte Darstellung)

  • Fragestellung

  • Auswahl geeigneter Textdokumente

  • Aufbereitung der Informationen & Strukturierte Extraktion

  • Ergebnispräsentation

Data Mining (Vereinfachte Darstellung)

  • Fragestellung

  • Auswahl der Daten

  • Verarbeitung der Daten

  • Validierung & Evaluation

  • Ergebnispräsentation

Anbieter für Text Mining Software & Text Mining Tools – Wo liegen die Unterschiede?

Reine Text Mining-Lösungsanbieter

Die Lösungen werden ausschließlich für die Analyse und Strukturierung von Daten in Textdokumenten verwendet.

Indirekte Lösungsanbieter

Bestehende Applikationen (z.B. Data Mining-Lösungen) werden um Text-Mining Tools erweitert.

Teil-Anbieter

Anbieter, welche mittels additiver Funktionalitäten aus dem Bereich Text Mining ihr originäres Kerngeschäft noch erweitern.

Beispiel Anwendungsfall für Text Mining

Text Mining in der Healthcare Branche

Bedingt durch den sehr restriktiven Umgang mit Gesundheitsdaten steht die Pharmaindustrie und die medizinische Forschung vor großen Herausforderungen. Beispielsweise müssen zur Prognose von Krankheitsverläufen oder der Wirksamkeit von Medikamenten unzählige Quellen unstrukturierter Daten konsolidiert werden.

Hier unterstützt das Analyse-Verfahren Text Mining: Aus immensen Mengen an unstrukturierten Texten, Erhebungen und Dokumentationen können genaue Daten und folglich wertvolles Wissen extrahiert werden. Wissen, welches eine bessere Versorgung und Prognose der Patienten und somit ein gesünderes Leben ermöglicht.

Beispiel Radminer Bericht zu Radminer: ÄrzteZeitung

Text Mining in der Forschung

Finden Sie hier einen Auszug der aktuellen Forschungsprojekte, in denen unter anderem auch das Analyse-Verfahren Text Mining zum Einsatz kommt:

Forschung averbis semcare
Forschung averbis semvoice
Forschung averbis eu CASES
Forschung averbis cloud4health

Wenn Ihr Unternehmen wüsste, was es eigentlich schon weiß!

Daten sind die Grundlage jeglicher Strategien, Planungen, Reports und letzten Endes aller Entscheidungen im Unternehmen. Mehr als 80% der geschäftsrelevanten Informationen eines Unternehmens sind in unstrukturierten Daten verborgen.  Täglich kommen neue Informationen in Form von unstrukturierten Textdokumente hinzu. Die manuelle Zusammenführung der Informationen erfordert enorme Aufwände und erhöht die Fehlerquote.

Ein Potential, welches heute in der Regel völlig brach liegt.

Professionelles und effizientes Text Mining versetzt Unternehmen in die Lage, Informationen zu erhalten, welche Ihnen bislang verborgen waren.

Schnellverfügbares Wissen über die Kunden, die Wettbewerber und die Märkte wird in den herrschenden Verdrängungsmärkten immer wichtiger.

Dieses Wissen und dessen Management ist der wichtigste Erfolgsfaktor und die entscheidenste Ressource in einem erfolgreichen Unternehmen.

Sie möchten Antworten mithilfe von Text Mining erhalten?
Sprechen Sie mit uns!