Name: Password:
<< zurück

Die Verarbeitung von Sprache in Suffix Trees wird vor allem zum Information Retrieval genutzt, aber auch für die automatische Übersetzung lässt sich diese Datenstruktur gut nutzen. Sprachen, deren Wortstellung im Satz variabel verschoben werden kann, ohne die Satzbedeutung zu ändern, bereiten jedoch Probleme bei der Verarbeitung in Suffix Trees.
Die Arbeit ist in drei Teile geteilt: Der erste Teil besteht aus einer allgemeinen Beschreibung von Suffix Trees in der Computerlinguistik mit den wichtigsten Algorithmen und Komprimierungsverfahren. Im zweiten Teil werden die klassischen Sprachtypen und die Problematik der Einteilung in isolierende, flektierende, agglutinierende und inkorporierende Sprachen besprochen und die Funktionsweise von Sprachen mit flexibler Wortstellung beleuchtet. Der dritte Teil widmet sich schließlich der Suche nach geeigneten Lösungsansätzen für die Verarbeitung von Sprachen mit freier Wortstellung in Suffix Trees.

Schlüsselwörter: Suffix Trees, Wortstellungstypologie

pdf herunterladen

Achtung: In der ursprünglichen Version war ein Fehler: Martin Kay hat die beschriebenen Komprimierungsverfahren lediglich beschrieben, nicht selbst entwickelt. Wem sie tatsächlich zuzuschreiben sind, konnte ich leider nicht in Erfahrung bringen. - Januar 2012

Literatur


Bussmann, Hadumod (Hrsg.). 2002. Lexikon der Sprachwissenschaft. Stuttgard: 3. aktual. u. erw. Aufl., Kröner.
Donalies, Elke. 2005. Die Wortbildung des Deutschen – Ein Überblick. (Studien zur Deutschen Sprache, 27.) Tübingen: Narr.
Engel, Ulrich, et. al. 1999. Deutsch­-polnische kontrastive Grammatik. Heidelberg: Groos.
Hajdu, Péter, Domokos, Péter. 1987. Die uralischen Sprachen und Literaturen. Budapest: Buske.
Humboldt, Wilhelm von. 1836. Über die Kawi­-Sprache auf der Insel Java. Berlin: Königliche Akademie der Wissenschaften.
Jäger, Gerhard. 2006. Morphologische Sprachklassifikation. http://www2.sfs.uni­-tuebingen.de/jaeger/lehre/ws0607/sprachenDerWelt/morphologischeTypologie.ppt 30. Dez. 2009.
Jakob, Melanie. 2010. Suffix Trees: Simple Algorithm and Applications. http://www.bio.ifi.lmu.de/webfm_send/2083 30. Aug. 2010.
Jung, Dagmar. 2010. „Layers of Classification within the Athabaskan verb.“ (Handout). unveröffentlicht.
Kay, Martin. 2003. Substring alignment using Suffix Trees. http://www.stanford.edu/~mjkay/CYCLING.pdf 30. Dez. 2009.
Kay, Martin. 2004 Aligning Sentence Parts. http://www.stanford.edu/class/linguist139p/ICON.pdf 30. Dez. 2009.
Koktová, Eva. „Word order and typology.“ In: PALEK, Bohumil (Hrsg.). 1996. Typology: prototypes, item orderings and universals. (Acta Universitatis Carolinae: Philologica, 1996,3/4). Prag.
Lehmann, Christian. 2010. Morphologie und Syntax. http://www.christianlehmann.eu/ling/lg_system/grammar/morph_syn/index.html 30. Aug. 2010.
López, Justo Fernández. 2009. Sprachtypologie. http://culturitalia.uibk.ac.at/hispanoteca/Lexikon%20der%20Linguistik/sp/SPRACHTYPOLOGIE%20%20%20Tipolog%C3%ADa%20de%20las%20lenguas.htm 30. Dez. 2009
Mithun, Marianne. „Is Basic Word Order Universal?“ In: Payne, Doris L. (Hrsg.). 1992a. 15­-61
Nelson, Mark. 1996. Fast String Searching With Suffix Trees. http://marknelson.us/1996/08/01/suffix-trees/ 30. Dez. 2009
o'Grady, William, et al (Hrsg.). 1997. Contemporary Linguistics. An Introduction. London (u. a.): Longman.
Payne, Doris L. (Hrsg.). 1992a. Pragmatics of word order flexibility. (Typological studies in language, 22). Amsterdam (u. a.): Benjamins.
Payne, Doris L. 1992b „Introduction“ In: Payne, Doris L. (Hrsg.). 1992a. 1-­13.
Phinney, Archie. 1934. Nez Percé Texts. (Columbia University Constributions to Anthropology, 25). New York: Columbia University Press.
Rude, Noel. „Word Order and Topicality in Nez Perce“ In: Payne, Doris L. (Hrsg.). 1992a. 193­-208.
Steinbergs, Alexandra. „The classification of language.“ In: o'Grady, William, et al (Hrsg.). 1997. 372-­415.
Ukkonen, Esko. 1995. „On­-line construction of suffix trees.“ Algorithmica. 14:249­-260.
Werner, Agnes. 2003. Die Wortstellung in polnischen Deklarativsätzen mit transitiven und ditransitiven Verben und ihre Bedeutung für die Informationsstruktur. http://www.uni­-potsdam.de/u/slavistik/wsw/seminararbeiten/Werner_Informationsstruktur.pdf 30. Dez. 2009
Wikipedia. IR. „Information Retrieval.“ 30. Dez. 2009. http://de.wikipedia.org/w/index.php?title=information_retrieval&oldid=84390634
Wikipedia. LS. „Landau­-Symbole.“ 10. Aug. 2010. http://de.wikipedia.org/w/index.php?title=Landau­-Symbole&oldid=77677633
Wikipedia. PT. „Patricia­-Trie.“ 28. Jul. 2010. http://de.wikipedia.org/w/index.php?title=Patricia­-Trie&oldid=77161936
Wikipedia. Sb. „Suffixbaum.“ 30. Dez. 2009. http://de.wikipedia.org/w/index.php?title=Suffixbaum&oldid=68604491
Wikipedia. T. „Trie.“ 25. Apr. 2010. http://de.wikipedia.org/w/index.php?title=Trie&oldid=73587048

<< zurück