Machine Learning

Automatische Klassifikation
von Dokumenten

Die Dokumenten- oder Text-Klassifikation von Information Discovery ermöglicht die einfache Klassifikation von Dokumenten mit statistischen Verfahren aus dem Bereich Künstlichen Intelligenz.

Wir bieten Klassifikations- und Clustering-Techniken auf der Grundlage moderner Text Mining und maschineller Lernverfahren an.

Dadurch können Anwendungsszenarien wie Sentiment-Analyse, Content-Monitoring, Technologie-Kategorisierung, Predictive Coding, Clustering, Alerting und Dokumenten-Recherche in wenigen Schritten umgesetzt werden.

Anwender benötigen kein tiefgreifendes Verständnis über statistische Lernverfahren. Sie können unsere Services sowohl über eine leistungsfähige grafische Oberfläche als auch über Web-Services verwenden. Die Methoden des maschinellen Lernens unterstützen Information Professionals bei komplexen Annotations- und Klassifikationsarbeiten.

Im Unterschied zu regelbasierten Verfahren, bei denen für jede mögliche Entscheidung eine Regel definiert werden muss, lernen Computer bei maschinellen Lernverfahren aus den Beispielen und Erfahrungen der Experten. Das System wird antrainiert und lernt. Anschließend treffen sie eigenständige Vorhersagen auf neuen, bisher unbekannten Dokumenten.

Die automatische Kategorisierung von großen Datenmengen  mit einer hohen Anzahl hierarchischer Kategorien bei hoher Vorhersagequalität erfordert eine ausreichende Anzahl von Lerndaten. Das Konzept des aktiven Lernens (engl. „Active Learning“) minimiert den Aufwand der manuellen Erstellung dieser Daten durch intelligentes Daten-Sampling und iteratives überwachtes Lernen.

Beispiel Hotelbewertung

averbis Document Classification Data

Beispiel Patentanalyse

Sie wünschen eine Demo?

Case Study