Hauptinhalt

Structural analysis of dialect maps usingmethods from spatial statistics

by Jonas Rumpf, Simon Pickl, Stephan Elspaß, Werner König and Volker Schmidt

ABSTRACT: In diesem Beitrag wird ein neues Verfahren zur objektiven und automatischen Analyse von Sprachkarten vorgestellt. Anders als bisherige dialektometrische Verfahren zielt es vorerst nicht auf die Einteilung und Analyse von Dialekten anhand von großen Korpora von Merkmalskarten ab, sondern auf die quantitative Beurteilung von strukturellen Eigenschaften einzelner Merkmalskarten, die von der klassischen Dialektometrie weitgehend ignoriert werden. So soll unsere Methode es ermöglichen, Merkmalskarten zu vergleichen und in ihnen bestimmte Strukturen zu finden, anstatt sie zu kumulieren. Dazu werden mittels räumlich-statistischer Methoden für alle Varianten des betreffenden Merkmals im gesamten Untersuchungsgebiet Intensitäten, das heißt die erwarteten Auftretenshäufigkeiten, geschätzt. Durch eine Kombination der erhaltenen Intensitätsfelder ergeben sich Flächenkarten, die als Grundlage für die weitere Analyse dienen. Dabei werden verschiedene Charakteristiken, wie zum Beispiel die Gesamtlänge der Grenzen zwischen den Gebieten unterschiedlicher Varianten, herangezogen, um objektive Aussagen über die „Homogenität“, „Komplexität“ und „Kompaktheit“ von Gebieten bzw. Karten treffen zu können. Die Ergebnisse dieses Verfahrens werden exemplarisch anhand einiger Karten aus dem SBS vorgestellt und interpretiert.
Theoretische Grundlage für diese Vorgehensweise ist die Annahme, dass die Belege eines Sprachatlas Stichproben sind, die im Einzelfall nicht zwangsläufig zu hundert Prozent valide sind. So ist es vorstellbar, dass eine Gewährsperson an einem Ort eine andere Antwort gegeben hat, als es der Großteil der anderen möglichen Gewährspersonen getan hätte, hätte man die gesamte zu untersuchende Bevölkerungsschicht befragt. Die Validität der Belege kann aber eingeschätzt werden, wenn man die umliegenden Orte betrachtet: Haben alle dieselbe Antwort gegeben, so ist die Validität als hoch einzuschätzen; haben alle eine abweichende Antwort gegeben, so ist der Beleg in Frage zu stellen. Dabei ist die Bedeutung der anderen Orte für die Bewertung eines Beleges umso höher, je näher sie ihm sind, da geographische Nähe in Beziehung steht zu dem sprachlichen Kontakt, der zwischen ihnen stattfindet. (Die geographische Nähe ist natürlich nur einer von vielen Faktoren, doch der einzige, der objektiv und einfach zu quantifizieren ist. Der Einfluss von Verkehrswegen, Territorien, landschaftlichen Gegebenheiten u. ä. muss deshalb vorerst unberücksichtigt bleiben.) So kann ausgehend von den gegebenen Belegen – mit statistischen Methoden – für jeden Ort geschätzt werden, welche Variante die am wahrscheinlichsten zu erwartende ist, auch wenn der jeweilige Beleg tatsächlich ein anderer ist. So werden Flächenkarten generiert, die Ausreißer automatisch ausgleichen, die Dominanz der jeweils wahrscheinlichsten Varianten durch die Farbgebung darstellen und dadurch die tatsächliche linguistische Situation angemessener wiedergeben als die unmittelbar auf den Stichproben basierenden Punktsymbolkarten.
Grundlage für die Analyse ist eine Datenbank, die das Auftreten der verschiedenen Varianten an den Belegorten des Untersuchungsgebiets enthält. Sie wird zunächst nach den einzelnen Varianten separiert, so dass für jede Variante eine so genannte Vorkommenskarte generiert werden kann, die nur verzeichnet, wo die Variante auftritt und wo nicht. Abhängig von der räumlichen Verteilung einer Variante wird nun für jeden Ort die Intensität der Verteilung geschätzt, die sich als Auftretenswahrscheinlichkeit der betreffenden Variante interpretieren lässt. Im nächsten Schritt werden die Intensitätsfelder der Varianten (siehe Abb. 2) zu einer Flächenkarte vereint (siehe zum Beispiel Abb. 3), indem jeder Ort der Fläche zugerechnet wird, deren Variante die höchste Intensität an diesem Ort aufweist, das heißt deren Auftreten dort am ehesten zu erwarten ist.
Die so erzeugten Flächenkarten können auf verschiedene Weise hinsichtlich ihrer strukturellen Eigenschaften untersucht werden: Die Länge der Grenzlinien zwischen den Flächen kann als eine Maßzahl für die Komplexität der Karte betrachtet werden, die Intensitäten geben – gemittelt – Aufschluss über die kleinräumige Homogenität einer Karte. Weitere Maßzahlen sind vorstellbar, einige davon werden kurz vorgestellt. Insgesamt bietet das vorgestellte Verfahren die Möglichkeit, Karten von sprachlichen Merkmalen quantitativ und nach einheitlichen Maßstäben nach ihren Struktureigenschaften zu beurteilen, um so Aufschluss darüber zu gewinnen, nach welchen Gesetzmäßigkeiten sich bestimmte Merkmale räumlich entwickeln.
In erster Linie aber sollen die ermittelten Werte die Basis für weitere Forschung, die über die Analyse von Einzelkarten hinausgeht, sein. So können etwa bestimmte Hypothesen bezüglich Sprachgrenzen und -gebieten überprüft werden, indem getestet wird, ob vorgegebenen Strukturen wie Flüssen oder Territorialgrenzen eine statistisch signifikante Anzahl an Sprachgrenzen entspricht, die in einem größeren Korpus von Merkmalskarten bestimmt wurden. Des Weiteren können einfach kumulative Vorkommenskarten von linguistisch definierten Merkmalsgruppen wie Romanismen oder Standardismen erzeugt werden, um so auf einfache Weise horizontale oder vertikale Einflussbereiche festzustellen. Beim typologischen Vergleich der Karten wird es möglich herauszufinden, inwieweit vergleichbare sprachliche Erscheinungen auch vergleichbare Verbreitungsmuster zeigen; bzw. umgekehrt, was vergleichbare Verbreitungsmuster auch sprachlich gemeinsam haben.