Quantitative Untersuchungen zu den bosnischen, kroatischen und serbischen Texten mit Hilfe der Computerlinguistik und der Texttechnologie

Diplomarbeit aus dem Jahr 2004 im Fachbereich Russistik / Slavistik, Note: 1,0, Universität Wien (Institut für Slawistik), Sprache: Deutsch, Abstract: In dieser Studie werden die computerunterstützten Korpusanalysen mit der zu diesem Zweck erstellten und frei zugänglichen Webapplikation 'plivac.net/linguistik' behandelt. Der Schwerpunkt liegt in den quantitativen Untersuchungen eines über 3 Millionen Zeichen großen Textkorpus, der gleichmäßig bosnische, kroatische und serbische Texte umfasst. Mithilfe der Webapplikation wurden verschiedene quantitative Untersuchungen durchgeführt und ausgewertet. Die Arbeit umfasst fünf Hauptkapitel. Im ersten wird die Webapplikation vorgestellt und ihre Funktionsweise anhand eines konkreten Beispiels unter die Lupe genommen. Im Kapitel Phonetik werden die Phoneme des Gesamtkorpus nach akustischen und artikulatorischen Merkmalen untersucht und die Ergebnisse graphisch dargestellt und erläutert. Drei weitere Kapitel die Phonemhäufigkeit, die Wortlänge und die Satzlänge befassen sich mit den Verteilungen nach verschiedenen Textarten und nach dem Jat-Reflex, wonach die ijekawischen und ekawischen Texte untereinander verglichen werden. Die gewonnenen Erkenntnisse bekräftigen die These über die Existenz einer Sprache der serbokroatischen oder der kroatoserbischen, die infolge der Staatsbildungsprozesse nach dem Zerfall Jugoslawiens und der Dominanz der politischen gegenüber linguistischen Kriterien zur Spaltung dieser in vier nationale Sprachen Bosnisch, Kroatisch, Serbisch und zuletzt auch Montenegrinisch führte. Anhand der Untersuchungsergebnisse lässt sich eine Schlussfolgerung ziehen, dass die sprachlichen Unterschiede der Textkorpora vielmehr von der Textsorte abhängen als von der geographischen Lage ihres Ursprungs.