Information Discovery vs. Apache UIMA

INFORMATION DISCOVERY VS. APACHE UIMA

Information Discovery enthält eine vollständig in UIMA integrierte Text-Mining-Plattform. Sie bietet zahlreiche Annotatoren für die inhaltliche Analyse von Texten. Die Annotatoren sind mehrsprachig und können Texte in vielen Sprachen analysieren. Unsere Annotatoren sind je nach Anwendungsszenario regelbasiert oder basieren auf maschinellen Lernverfahren.

Alle trainierbaren Verfahren enthalten Werkzeuge zum Erzeugen neuer Modelle für neue Sprachen und neue Genres. Neben Standard-Modellen basierend auf Zeitungstexten bieten wir biomedizinische Modelle für die Verarbeitung von Forschungsliteratur, Patenten und medizinischen Texten.

Framework

Framework	Information Discovery	Apache UIMA
UIMA Java Framework	ja	ja
UIMA C++ Framework	ja	ja
UIMA Default Viewers & Tooling	ja	ja
PEAR Packaging Facilities	ja	ja
UIMA-AS Scaleout Framework	ja	ja
UIMA-AS in the Cloud	ja	nein

Infrastructure

Framework	Information Discovery	Apache UIMA
Simple Server (UIMA REST service)	Add-On	Add-On
Generic Typesystem	ja	nein
Web-based Annotation Client	ja	nein
Scripting Language for Pipeline Configuration	ja	nein

Core Components

Framework	Information Discovery	Apache UIMA
Collection Readers (CR)
Simple File Reader	ja	Add-On
XMI Reader	ja	Add-On
Generic XML Reader	ja	nein
Generic Database Reader	ja	nein
Annotators
Tika Anneintator	ja	Add-On
Document Zoning	ja	nein
Language Detection	ja	nein
Document Classification	ja	nein
Sentence Splitting, Rule Based	ja	Add-On
Sentence Splitting, Trainable	ja	nein
Tokenization, Rule Based	ja	Add-On
Tokenization, Trainable	ja	nein
Part-Of-Speech Recognition	ja	nein
Shallow Parsing / Chunking	ja	nein
Stemming	ja	Add-On
Morphological Analyis	ja	nein
Decompounding	ja	nein
Stopword Recognition	ja	Add-On
Invariant Recognition	ja	nein
Acronym and Abbreviation Resolution	ja	nein
Regular Expression Annotator	ja	Add-On
Lemmatizer, Lexicon Based	ja	nein
Concept Recognition	ja	Add-On
Named Entity Recognition, Trainable	ja	nein
Concept Disambiguation	ja	nein
Keyword-Extraction, Controlled and Uncontrolled	ja	nein
Evaluation Modules	ja	nein
Table Format Recognition	ja	nein
UIMA Default Annotators (HMM Tagger, BSF Annotator, Alchemi, OpenCalais)	Add-On	Add-On
Drools Annotator	ja	nein
Relation Extraction, Trainable	ja	nein
CAS Consumer (CC)
XML Writer	ja	Add-On
Lucene CAS Indexer (Lucas)	ja	Add-On
Solr CAS Consumer (Solrcas)	ja	nein
DB Writer	ja	nein
Flow Controller
Document Language Flow Controller	ja	nein
Document Category Flow Controller	ja	nein

Biomedical Components

Framework	Information Discovery	Apache UIMA
Medline Reader	ja	nein
Biomedical Sentence Splitter	ja	nein
Biomedical Tokenizer	ja	nein
Negation Annotator	ja	nein
Number Annotator	ja	nein
Disease Annotator	ja	nein
Anatomy Annotator	ja	nein
Drug Annotator	ja	nein
Gene Tagger (Uniprot, EntrezGene)	ja	nein
ChemSpot Annotator	ja	nein

Finden Sie Antworten in Ihren Daten

Gerne präsentieren wir Ihnen unsere Produkte und erstellen für Sie einen Demonstrator auf Basis Ihrer ausgewählten Datenbestände.

Kontaktieren Sie uns