Korpus

06.06.2017 -  

Pl. Korpora [engl. corpus, frz. corpus, russ. лингвистический корпус] (lat. corpus ‘Körper’)

Auch: Textkorpus.

1. Nach dem Zufallsprinzip oder mit Blick auf ein bestimmtes Thema planvoll und systematisch zusammengestellte Sammlung einer hohen, aber begrenzten Anzahl von Texten (→ Text), Äußerungen, bestimmten sprachlichen Phänomenen oder Ähnlichem (gesprochen oder geschrieben), die als Material für sprachwissenschaftliche Untersuchungen dienen sollen. Das K. kann dabei der Ermittlung und Beschreibung sprachlicher Regularitäten oder auch der Erfassung relativ unerforschter Sprachen bzw. als Ausgangsbasis zur Überprüfung von Hypothesen und Theorien dienen. Korpora können z.B. wichtige Hilfsmittel in der Lexikographie, der maschinellen bzw. maschinengestützten Übersetzung aber auch bei der Erstellung von Sprachlehrmaterialien sein. Neue Bedeutung hat das K. und das Verfahren seiner Erstellung bei der Erforschung der gesprochenen Sprache der Gegenwart erlangt. Aufgrund neuentwickelter Technologien sind nicht nur auditive Aufnahmen möglich, sondern auch Videoaufzeichnungen, die es ermöglichen, ebenfalls alle relevanten parasprachlichen und nonverbalen Merkmale und auch Sprecher- und Hörersignale zu dokumentieren. Dies stellt die Transkriptoren vor neue Herausforderungen, denn sie müssen alle Merkmale in eine Notation überführen. Zu der komplexen Aufzeichnung solcher Gespräche schlagen z.B. Henne/Rehbock (2001) die Form einer Partitur vor (→ Transkription). Problematisch sei neben der komplexen Notation aber auch die Aufzeichnung als solche. Im strengen Sinne spontan erzeugte, natürliche Reden bzw. Gespräche in verschiedenen Situationen als Textgrundlage für Analysen zu erhalten, gestalte sich schwierig, denn besonders bei Videoaufnahmen wüssten die Teilnehmer in der Regel, dass Untersuchungsmaterial erhoben wird (Beobachter-Paradoxon).

2. I.e.S. eine digitale Zusammenstellung von Textmaterial. Das Internet bietet der Linguistik eine neue Ausgangslage in Bezug auf sprachwissenschaftliche Forschungsfragen. Denn es ermöglicht sehr große digitale Textdatenbanken (z.B. wortschatz.uni-leipzig.de, www.dwds.de). Dabei schafft das Internet zum einen neue Perspektiven in Bezug auf den quantitativen Aspekt, indem es eine nahezu unendlich große Menge von Sprachdaten beinhaltet, und zum anderen in Bezug auf den qualitativen Aspekt, weil es Daten zu Varietäten (→ Varietät), zu Varianten innerhalb von Textsorten (→ Textsorte), den Zugriff auf Texte verschiedener Zeitpunkte oder Zeiträume usw. bietet. So kann sich das K. im Internet aus verschiedenen Textsorten wie persönlichen Homepages, Verwaltungs- und Gesetzestexten wissenschaftlichen Abhandlungen, Werbung, Dienstleistungsangeboten bis hin zu Zeitungs- und Zeitschriftenarchiven zusammensetzen und ist somit äußerst vielschichtig. H. Bickel bewertet diese Möglichkeit positiv, da sie einen systematischen Bezug zur verschriftlichten Sprachwirklichkeit herstelle. Außerdem erleichtere das Internet den Zugriff auf Datenmengen, weil es eine unentgeltliche und dezentralisierte Nutzung von Textdatenbanken ermöglicht.

Lit.: Bickel, H., Das Internet als linguistisches Korpus. In: Linguistik Online 28/3.2006. https://bop.unibe.ch/linguistik-online/article/view/612/1052. M./Vogel, F., Korpuspragmatik: thematische Korpora als Basis diskursanalytischer Analysen. 2012. Henne, H./Rehbock, H., Einführung in die Gesprächsanalyse. 42001. Keibel, H./Kupietz, M./Perkuhn, R., Korpuslinguistik. 2012. Lemnitzer, L./Zinsmeister, H., Korpuslinguistik. Eine Einführung. 2006. Lender, W., Computereinsatz in der angewandten Linguistik: Konstruktion und Weiterverarbeitung sprachlicher Korpora. 1993. ABR

Letzte Änderung: 01.10.2024 - Ansprechpartner: Webmaster