Erstellung annotierter Textcorpora mit WebLicht. Computerlinguistik als Sprachwissenschaft

Studienarbeit aus dem Jahr 2014 im Fachbereich Germanistik - Linguistik, Note: 2,0, Universität Paderborn, Sprache: Deutsch, Abstract: In dieser Arbeit gehen wir näher auf die Analyse verschiedener geschriebener Texte ein, die im sozialen Netzwerk ¿Facebook¿ veröffentlicht wurden. Die Texte stammen von Personen die einen Facebook-Account privat nutzen, Organisationen oder auch Personen die in der Öffentlichkeit stehen wie zum Beispiel Politiker oder Musiker. Analysiert werden die verschiedenen Texte und Aussagen mit dem Programm WebLicht, mit dem man Textkorpora annotieren kann. Zunächst beschäftigen wir uns mit den Funktionen und der Benutzerfunktionalitäten des Programmes. Die Funktionalitäten bestehen aus verschiedenen Werkzeugen, welche die Texte zunächst tokenisieren und im Nachhinein auf grammatikalischer und semantischer Ebene annotieren und analysieren. Durch unsere Beschreibung der Benutzerfunktionen soll der Nutzer den Aufbau des Programmes nachvollziehen können und individuell Anwendbarkeit WebLichts verstehen. Die Untersuchungen veranschaulicht, wie die Theorien von Textanalysen insbesondere von WebLicht auf die Praxis umsetzbar sind. Die Besonderheit in dieser Ausarbeitung ist die Analyse von ¿Facebook Texten¿, die oft grammatikalische oder orthografische Fehler enthalten. Darüber hinaus wird auch oft von ¿Slang¿ Ausdrücken und Emoticons Gebrauch gemacht. In diesem Zusammenhang ist das Ziel herauszustellen wie gut WebLicht informelle Texte erschließen kann. Gibt es bestimmte Muster nach denen WebLicht (fehlerhaft) analysiert und interpretiert? In welchen Bereichen weist WebLicht Fehlerpotentiale auf und wie lassen sich diese systematisieren?

Verwandte Artikel