MANTRA (Multilingual Annotation of Named Entities and Terminology Resources Acquisition) will provide multilingual terminology and semantically annotated multilingual corpora (e.g. patents). This is intended to improve access to scientific information in multilingual documents. The MANTRA project wants to generate translations of words and phrases, especially with the help of parallel corpora and various alignment methods. A large number of such parallel corpora are available for this in the biomedical domain on which MANTRA focuses.
Project partners will tap into these multilingual document collections to generate terms and concepts in different languages. This is to complement the landscape of available biomedical vocabularies (such as Medical Subject Headings (MeSH)).
MANTRA (Multilingual Annotation of Named Entities and Terminology Resources Acquisition) wird mehrsprachige Terminologien und semantisch annotierte mehrsprachige Korpora (z.B. Patentschriften) bereitstellen. Hierdurch soll der Zugang zu wissenschaftlichen Informationen in mehrsprachigen Dokumenten verbessert werden. Das MANTRA-Projekt möchte dabei insbesondere unter Zuhilfenahme von Parallel-Korpora und verschiedenen Alignment-Methoden Übersetzungen von Wörtern und Phrasen generieren. Hierfür stehen in der biomedizinischen Domäne, auf die sich MANTRA konzentriert, eine große Menge solcher Parallel-Korpora zur Verfügung.
Die Projektpartner werden diese mehrsprachigen Dokumentenkollektionen erschließen, um Terme und Konzepte in verschiedenen Sprachen zu generieren. Hierdurch soll die Landschaft der verfügbaren biomedizinischen Vokabularien (wie z.B. Medical Subject Headings (MeSH)) ergänzt werden.