Wie misst man Textqualität im digitalen Zeitalter? Neue Fragen – neues Methodenspektrum

Andrea Abel, Jennifer Frey & Angelika Storrer
12.09.2018, 11.00 Uhr-11.20 Uhr, S06 XX, Symposium III

Schreibprodukte in sozialen Netzwerken entsprechen nicht immer den normativen Erwartungen, die man an redigierte Texte in der Presse, der Wissenschaft oder der Belletristik heranträgt. Ob und wie sich das interaktionsorientierte, multimodale Kommunizieren in digitalen Medien langfristig auf das normgerechte Verfassen monologischer Texte auswirkt, ist eine häufig gestellte Frage, zu der es bislang zum Deutschen noch wenig empirisch fundierte Ergebnisse gibt (vgl. Beißwenger 2015, Dürscheid/Fricke 2016, Storrer 2017). Auch ist noch wenig erforscht, ob und wie sich normative Erwartungen und Urteile zur angemessenen Sprachwahl verändern. Die angewandte Linguistik, insbesondere die Teilbereiche Schreibforschung und -didaktik, Text-, Korpus- oder Soziolinguistik, stehen gemeinsam mit angrenzenden Disziplinen der empirischen Sozialforschung sowie der computerlinguistisch informierten Bildungsinformatik vor der Herausforderung, diese Lücke zu füllen und die Entwicklungen bzw. Wandelprozesse methodisch angemessen und solide zu beschreiben. Weiterhin müssen Ansätze zur Bewertung von Textqualität (z.B. Sieber 2006, Fritz 2008), die sich an monologischen, schriftlichen Texten orientieren, mit Blick auf das multimodale, vernetzte und teilautomatisierte Schreiben in digitalen Medien erweitert werden.

Das Projekt „Wie misst man Textqualität im digitalen Zeitalter?“ („MIT.Qualität“) stellt sich diesen Herausforderungen in zwei Arbeitsbereichen. Im Bereich „Modellbildung und Kategorienfindung“ soll ein Modell zur Qualitätsbewertung digitaler Kommunikation entstehen, das auf „traditionellen“ Ansätzen aufsetzt und diese mit Blick auf das Schreiben in sozialen Medien erweitert. Im Bereich „Methodenexploration“ zielt das Projekt darauf ab, am Beispiel von Fallstudien Messmethoden für die verschiedenen Qualitätsdimensionen zu erarbeiten und die Methoden beispielhaft am Bereich „Kohärenz und Kohäsion“ zu explorieren.

In unserem Vortrag stellen wir unseren Ansatz und erste Ergebnisse des Projekts vor; passend zum Thema des Symposiums wird der Fokus auf der dabei eingesetzten Kombination von Methoden und ihrer Reflexion liegen.

Der Arbeitsbereich „Modellbildung und Kategorienfindung“ wertet als Quellen zur „Entdeckung” neuer Kategorien Ratgeberliteratur zur erfolgreichen Netzkommunikation sowie entsprechende Leitlinien in sozialen Medien (Netikette, Chatikette, Wikiquette etc.) aus. In einem Workshop wird zudem Feedback von ExpertInnen aus der Wissenschaft einerseits und aus dem Social-Media-Bereich andererseits eingeholt.

Anhand einer Fragebogenerhebung befragen wir SprecherInnen, um einen Eindruck der Angemessenheit konkreter Bausteine in Texten zu erhalten. Dieser Teil des Projekts dient weiterhin dazu, die in den ExpertInnen-Workshops gewonnenen Erkenntnisse mit den intuitiven Einschätzungen einer breiteren Basis, die sich aus der Gemeinschaft aller SprecherInnen des Deutschen zusammensetzt, abzugleichen. Im Sinne der Methodenreflexion ist dieser Projektteil insofern interessant, weil die Befragungen von linguistischen Laien Ergebnisse hervorbringen können, die mit den Einschätzungen von linguistischen und Social-Media-ExpertInnen konvergieren, in bestimmten Fällen aber nicht immer deckungsgleich sein müssen.

Im Arbeitsbereich „Methodenexploration“ widmen sich zwei Fallstudien der kontrastiven Analyse des Gebrauchs sprachlicher Mittel zur Herstellung von Kohärenz in traditionellen und Social-Media-Texten anhand von Konnektoren (wie weil, eh, sprich) und text- sowie interaktionsorganisierenden Phrasemen (wie im Folgenden, ich meine) (vgl. Stein 2007). Dazu werden korpuslinguistische Methoden der automatischen Extraktion von Daten aus geeigneten Korpora angewandt, d.h. aus CMC-Korpora (DIDI: Frey et al. 2016), Wikipedia (Margaretha/Lüngen 2014, Storrer in Druck/2018), L1-Lernerkorpora (KoKo: Abel et al. 2016) und Zeitungskorpora (DEREKO - IDS). Zudem werden relevante linguistische Phänomene manuell in Subkorpora annotiert. Eine dritte Fallstudie schließlich befasst sich mit automatischen Methoden zur Bewertung von Textqualität. Dazu werden holistische Textqualitätsbewertungen in einem automatischen Textklassifizierungssystem modelliert und damit in Beziehung stehende sprachliche Merkmale kritisch bewertet. (vgl. Crossley et al. 2014)

 

Literatur
Abel, Andrea/Aivars Glaznieks/Lionel Nicolas/Egon W. Stemle (2016): An extended version of the KoKo German L1 Learner corpus. In: Corazza, Anna/Montemagni, Simone/Semeraro, Giovanni (Hg): Proceedings of the Third Italian Conference on Computational Linguistics CLiC-it 2016. 5-6 December 2016, Napoli. Torino: Academia University Press, 13-18.

Beißwenger, Michael (2015): Sprache und Medien: Digitale Kommunikation. Studikurs Sprach- und Textverständnis. E-Learning-Angebot der öffentlich-rechtlichen Universitäten und Fachhochschulen und des Ministeriums für Innovation, Wissenschaft und Forschung (MIWF) des Landes Nordrhein-Westfalen. [Erweiterte Vorabversion, bereitgestellt vom Verfasser]. Online: http://www.michael-beisswenger.de/pub/beisswenger_digikomm_preview.pdf. (11.02.2018).

Crossley, Scott/Kyle, Kristopher/Varner, Laura/McNamara, Danielle (2014): The importance of grammar and mechanics in writing assessment and instruction: Evidence from data mining. In: Stamper, John/Pardos, Zachary/Mavrikis, Manolis/McLaren, Bruce (Hg.): Proceedings of the 7th International Conference on Educational Data Mining (EDM 2014), 4-7 July 2014, London, 300-303.

Dürscheid, Christa/Fricke, Christina (2016): Schreiben digital. Wie das Internet unsere Alltagskommunikation verändert. Stuttgart: Kröner.

Frey, Jennifer-Carmen/Aivars Glaznieks/Egon W. Stemle (2016): The DiDi Corpus of South Tyrolean CMC Data: A multilingual corpus of Facebook texts. Corazza, Anna/Montemagni, Simone/Semeraro, Giovanni (Hg): Proceedings of the Third Italian Conference on Computational Linguistics CLiC-it 2016. 5-6 December 2016, Napoli. Torino: Academia University Press, 157-161.

Fritz, Gerd (2008): Bessere Texte schreiben. Überlegungen zur Textqualität aus der Sicht einer dynamischen Texttheorie. In: Sprache und Literatur 39 (102), 75-105.

Margaretha, Eliza/Lüngen, Harald (2014): Building Linguistic Corpora from Wikipedia Articles and Discussions. In: Journal of language Technology and Computational Linguistics 29 (2), 59-82. http://www.jlcl.org/2014_Heft2/3MargarethaLuengen.pdf. (27.03.2018).

Sieber, Peter (2008): Kriterien der Textbewertung am Beispiel Parlando. In: Janich, Nina (2008) (Hrsg.): Textlinguistik. 15 Einführungen. Tübingen, 271-290. 

Stein, Stephan (2007): Mündlichkeit und Schriftlichkeit aus phraseologischer Perspektive.” In: Burger, Harald et al. (Hg.): Phraseology. An International Handbook of Contemporary Research. Vol. 1. (Handbooks of Linguistics and Communication Science; 28.1). Berlin – New York: De Gruyter, 220-236.

Storrer, Angelika (2017): Internetbasierte Kommunikation. In: Deutsche Akademie für Sprache und Dichtung; Union der deutschen Akademien der Wissenschaften (Hg.): Vielfalt und Einheit der deutschen Sprache. Zweiter Bericht zur Lage der deutschen Sprache. Tübingen: Stauffenburg, 247-282.

Storrer, Angelika (in Druck/2018): Web 2.0: Das Beispiel Wikipedia. In: Birkner, Karin/Janich, Nina (Hg.): Handbuch Text und Gespräch. (Handbücher Sprachwissen HSW Band 5). Berlin – Boston: De Gruyter, 397-417.