MoCoDa2 (Mobile Communication Database): ein Forschungs- und Lehrkorpus zur Sprache und Interaktion in mobiler Messaging-Kommunikation

Michael Beißwenger, Marcel Fladrich, Wolfgang Imo & Evelyn Ziegler
13.09.2018, Poster-Session

Das Poster präsentiert die für Forschung und Lehre nutzbare Ressource „Mobile Communication Database2“ (MoCoDa2) vor, die zweierlei bereitstellt:

a) eine Datenbank, ein Web-Frontend und ein Prozedere für die Sammlung von Mobile-Messaging-Interaktionen, mit der Interaktionsausschnitte spendenbasiert erfasst, mit Metadaten angereichert, pseudonymisiert, um Beschreibungen zu enthaltenen Mediendateien ergänzt sowie anschließend sprachtechnologisch aufbereitet werden. In dieser Funktion kann MoCoDa2 genutzt werden, um in linguistischen Lehrveranstaltungen zu verdeutlichen, welche Aufbereitungsschritte erforderlich sind, um sprachliche Rohdaten in eine Form zu überführen, die für Dritte sinnvoll als empirische Grundlage für korpusbasierte qualitative und quantitative Untersuchungen nutzbar sind.

b) ein (stetig wachsendes und erweiterbares) Korpus mit pseudonymisierten Mobile-Messaging-Interaktionen, das um Metadaten und Annotationen angereichert ist und über ein Recherche-Frontend abgefragt werden kann.

MoCoDa2 wird als freie Ressource für die linguistische und sprachdidaktische Forschung und Lehre sowie für den Unterricht an Schulen und für die Förderung sprachlicher Kompetenzen im Kontext „Deutsch als Fremdsprache/Deutsch als Zweitsprache (DaF/DaZ)“ zur Verfügung gestellt. Die konzeptionellen Vorarbeiten und die Entwicklung von MoCoDa2 wurden im Förderprogramm „Infrastrukturelle Förderung für die Geistes- und Gesellschaftswissenschaften“ durch das Ministerium für Kultur und Wissenschaft des Landes Nordrhein-Westfalen unterstützt. Neben der Bereitstellung auf einem Projektserver sollen die gespendeten Daten perspektivisch auch in die CLARIN-D-Sprachressourceninfrastrukturen und in die Korpussammlung des Deutschen Referenzkorpus (DeReKo) am Institut für Deutsche Sprache/Mannheim (IDS) integriert werden, um dort vergleichend mit vorhandenen Textkorpora und anderen Korpora digitaler Kommunikation analysiert werden zu können.

Die Posterpräsentation wird um eine Live-Demo ergänzt, in der das Procedere für die Einbeziehung der Spenderinnen und Spender bei der Erfassung und Aufbereitung der Korpusdaten sowie die Abfrage der Korpusdaten vorgeführt wird bzw. selbst erprobt werden kann. Das Projektteam freut sich über Kontakt mit Anwenderinnen und Anwendern, die interessiert sind, MoCoDa2 in eigenen Forschungsprojekten und Lehrveranstaltungen einzusetzen und den weiteren Ausbau der Datenbank mit Datenspenden zu unterstützen.

Mehr über MoCoDa2: http://mocoda2.de/