![]() | Lemmatizer |
Das Lemmatizer-Tool "Morphisto" wird verwendet, um eine morphologische Analyse deutscher Wortformen durchzuführen, bspw. um die in Wörterbüchern verwendete Grundform eines Wortes zu finden (Beispiel: Das Lemma der 3. Person Präsens "ist" wäre "sein"). Es sind komplexere Abfragen, wie morphologisch-syntaktische Analysen über Anzahl, Geschlecht, Fall, Modus und Person eines Wortes möglich.
Der Benutzer kann komplette Dateien mit der entsprechenden Funktion lemmatisieren oder interaktiv das Tool zum lemmatisieren einzelner Wortanalysen verwenden. Der Befehl "historische Suche" wird verwendet, um morphologisch-syntaktische Informationen historischer Wortformen zu sammeln und zu verwalten. TextGrid verwendet SFST (Stuttgart Finite State Library) für die morphologische Analyse neuhochdeutscher Wörter.
Die linguistische Annotation kann auch in eine TEI/XML enkodierte Datei integriert sein. Wenn die Eingabedatei in Tokens übersetzt und einzelne Tokens geschlossen in <w> Tags sind, fügt der Lemmatizer die einzelnen Lemma Attribute mit <w> Tags automatisch hinzu, das unterstützt das Lemma und Teile von Sprachinformationen. Das Ergebnis ist eine valide XML Datei, welche für weiterführende Prozesse verwendet werden kann.
Weitere Informationen finden Sie hier:
R2.3: User's Manual TextGrid-Tools (Seiten 62-67)




