INFORMATION DISCOVERY VS. APACHE UIMA
Information Discovery enthält eine vollständig in UIMA integrierte Text-Mining-Plattform. Sie bietet zahlreiche Annotatoren für die inhaltliche Analyse von Texten. Die Annotatoren sind mehrsprachig und können Texte in vielen Sprachen analysieren. Unsere Annotatoren sind je nach Anwendungsszenario regelbasiert oder basieren auf maschinellen Lernverfahren.
Alle trainierbaren Verfahren enthalten Werkzeuge zum Erzeugen neuer Modelle für neue Sprachen und neue Genres. Neben Standard-Modellen basierend auf Zeitungstexten bieten wir biomedizinische Modelle für die Verarbeitung von Forschungsliteratur, Patenten und medizinischen Texten.
Framework | Information Discovery | Apache UIMA |
UIMA Java Framework | ja | ja |
UIMA C++ Framework | ja | ja |
UIMA Default Viewers & Tooling | ja | ja |
PEAR Packaging Facilities | ja | ja |
UIMA-AS Scaleout Framework | ja | ja |
UIMA-AS in the Cloud | ja | nein |
Framework | Information Discovery | Apache UIMA |
Simple Server (UIMA REST service) | Add-On | Add-On |
Generic Typesystem | ja | nein |
Web-based Annotation Client | ja | nein |
Scripting Language for Pipeline Configuration | ja | nein |
Framework | Information Discovery | Apache UIMA |
Collection Readers (CR) | ||
Simple File Reader | ja | Add-On |
XMI Reader | ja | Add-On |
Generic XML Reader | ja | nein |
Generic Database Reader | ja | nein |
Annotators | ||
Tika Anneintator | ja | Add-On |
Document Zoning | ja | nein |
Language Detection | ja | nein |
Document Classification | ja | nein |
Sentence Splitting, Rule Based | ja | Add-On |
Sentence Splitting, Trainable | ja | nein |
Tokenization, Rule Based | ja | Add-On |
Tokenization, Trainable | ja | nein |
Part-Of-Speech Recognition | ja | nein |
Shallow Parsing / Chunking | ja | nein |
Stemming | ja | Add-On |
Morphological Analyis | ja | nein |
Decompounding | ja | nein |
Stopword Recognition | ja | Add-On |
Invariant Recognition | ja | nein |
Acronym and Abbreviation Resolution | ja | nein |
Regular Expression Annotator | ja | Add-On |
Lemmatizer, Lexicon Based | ja | nein |
Concept Recognition | ja | Add-On |
Named Entity Recognition, Trainable | ja | nein |
Concept Disambiguation | ja | nein |
Keyword-Extraction, Controlled and Uncontrolled | ja | nein |
Evaluation Modules | ja | nein |
Table Format Recognition | ja | nein |
UIMA Default Annotators (HMM Tagger, BSF Annotator, Alchemi, OpenCalais) |
Add-On | Add-On |
Drools Annotator | ja | nein |
Relation Extraction, Trainable | ja | nein |
CAS Consumer (CC) | ||
XML Writer | ja | Add-On |
Lucene CAS Indexer (Lucas) | ja | Add-On |
Solr CAS Consumer (Solrcas) | ja | nein |
DB Writer | ja | nein |
Flow Controller | ||
Document Language Flow Controller | ja | nein |
Document Category Flow Controller | ja | nein |
Framework | Information Discovery | Apache UIMA |
Medline Reader | ja | nein |
Biomedical Sentence Splitter | ja | nein |
Biomedical Tokenizer | ja | nein |
Negation Annotator | ja | nein |
Number Annotator | ja | nein |
Disease Annotator | ja | nein |
Anatomy Annotator | ja | nein |
Drug Annotator | ja | nein |
Gene Tagger (Uniprot, EntrezGene) | ja | nein |
ChemSpot Annotator | ja | nein |
Finden Sie Antworten in Ihren Daten
Gerne präsentieren wir Ihnen unsere Produkte und erstellen für Sie einen Demonstrator auf Basis Ihrer ausgewählten Datenbestände.