AUTOMATISCHE DOKUMENTENKLASSIFIZIERUNG
Dokumentenklassifizierung: Artikel und Textdokumente werden zur Indexierung automatisch anhand eines frei definierbaren Kategoriensystems klassifiziert. Beispielsweise können Agenturmeldungen so automatisch den jeweiligen Ressorts (z.B. „Wirtschaft“, „Politik“) zugewiesen werden.
FLEXIBLE KONZEPTERKENNUNG DURCH TERMINOLOGIEN
Konzepterkennung durch den Einsatz von Terminologien: Dabei ist die Lexikonstruktur flexibel und ermöglicht die Aufnahme von Synonymen und verschiedenen Attributen, die für die Annotation eine Rolle spielen. Der Lexikonabgleich kann auf zusammenhängenden oder getrennten Textblöcken durchgeführt werden („Innovationsfähigkeit“ vs. „Fähigkeit zur Innovation“).
PRÄZISE IDENTIFIKATION
Erkennung von Entitäten durch die rein statistische Verrechnung von etlichen unterschiedlichen Informationen und Merkmalen aus Kontextwörtern. Somit werden präzise Personen- und Produktnamen, Organisationen oder geografische Angaben identifiziert.
ANALYSE & MINING
Sentiment-Analyse und Opinion-Mining: Qualitative Werturteile werden in Texten zuverlässig erkannt und auf Satzebene ausgewertet. Averbis – Text Mining in Perfektion.
AUTOMATISCHE KLASSIFIKATION VON DOKUMENTEN
Die Dokumenten- oder Text-Klassifikation von Information Discovery ermöglicht die einfache Klassifikation von Dokumenten mit statistischen Verfahren aus dem Bereich Künstlichen Intelligenz.
Wir bieten Klassifikations- und Clustering-Techniken auf der Grundlage moderner Text Mining und maschineller Lernverfahren durch Natural Language Processing an.
Dadurch können Anwendungsszenarien wie Sentiment-Analyse, Content-Monitoring, Technologie-Kategorisierung, Predictive Coding, Clustering, Alerting und Dokumenten-Recherche in wenigen Schritten umgesetzt werden.
Einfach & Schnell
Anwender benötigen kein tiefgreifendes Verständnis über statistische Lernverfahren. Sie können unsere Services sowohl über eine leistungsfähige grafische Oberfläche als auch über Web-Services verwenden. Die Methoden des maschinellen Lernens wie z.B. Natural Language Processing und Deep Learning unterstützen Information Professionals bei komplexen Annotations- und Klassifikationsarbeiten.
Im Unterschied zu regelbasierten Verfahren, bei denen für jede mögliche Entscheidung eine Regel definiert werden muss, lernen Computer bei maschinellen Lernverfahren aus den Beispielen und Erfahrungen der Experten. Das System wird antrainiert und lernt. Anschließend treffen sie eigenständige Vorhersagen auf neuen, bisher unbekannten Dokumenten.
Die automatische Kategorisierung von großen Datenmengen mit einer hohen Anzahl hierarchischer Kategorien bei hoher Vorhersagequalität erfordert eine ausreichende Anzahl von Lerndaten. Das Konzept des aktiven Lernens (engl. „Active Learning“) minimiert den Aufwand der manuellen Erstellung dieser Daten durch intelligentes Daten-Sampling und iteratives überwachtes Lernen. Weitere Infos zu Machine Learning.
INTELLIGENTE SUCHE
Durch die Integration spezieller Komponenten bietet die Suchmaschine eine umfassende Behandlung sprachlicher Phänomene. Selbst Phrasen, Synonyme oder einzelne Bestandteile zusammengesetzter Wörter werden erkannt und Laien- und Expertensprache aufeinander abgebildet („Blinddarmentzündung“, „Entzündung des Blinddarms“, „Appendizitis“, „entzündeter Appendix“ etc.)
FACETTIERTE SUCHE
Um große Treffermengen sinnvoll einzugrenzen, zeigt die Suchmaschine dem Nutzer verwandte Suchbegriffe an, welche mit einer Suchanfrage semantisch assoziiert sind.
AUTOMATISCHE EMPFEHLUNGEN
Auf der Basis von Textähnlichkeiten errechnet die Suchmaschine automatisch Empfehlungen für Artikel, die für den Benutzer ebenfalls von Relevanz sein können.
FLEXIBLES RECHTEMANAGEMENT
Bestehende Konzepte zum Rechtemanagement (bspw. LDAP-Benutzergruppen) können übernommen werden. Dabei unterstützt die Lösung sowohl das Abspeichern der Berechtigungen im Suchindex als auch die Abfrage bestehender Berechtigungsdienste.
WEBBASIERTER EDITOR
Über einen webbasierten Editor lassen sich vorhandene Terminologien und sonstige Begriffskataloge importieren, editieren und zur Informationsextraktion und Verschlagwortung nutzbar machen.
MEHRSPRACHIG
Mehrsprachigkeit wird dabei ebenso unterstützt wie das Anreichern von Wort-Synonymen und Querverweisen zu anderen Terminologien.
FLEXIBEL & INTELLIGENT
Der Editor unterstützt die Eingabe von neuen Termen durch automatische Validierung und Konsistenzchecks und hilft er bei der Anreicherung mit Informationen aus verschiedenen Fremdquellen.