Projektskizze

Das Projekt

Das Projekt erstellt für den Ortspunkt Greifswald ein linguistisch annotiertes Korpus, das die Überlieferung der volkssprachigen Texte in der Stadt vom 14. -17. Jahrhundert in ihrer tatsächlichen Breite modelliert. Der Ortspunkt Greifswald ist bislang linguistisch unerschlossen.

Das Korpusdesign geht vom Text-Raum der Stadt aus. Es berücksichtigt die Strukturen der Referenzkorpora ReN und ReF, um die Voraussetzung für übergreifende sprachwissenschaftliche Auswertungen zu schaffen.Die Korpustexte werden linguistisch auf den Ebenen der Flexionsmorphologie, der Wortbildungsmorphologie, der Lexik, der Syntax und der Texte selbst annotiert. Die linguistischen Annotationen berücksichtigen die Annotationsebenen der Referenzkorpora ReN und ReF, gehen jedoch deutlich über die Erschließung der Referenzkorpora hinaus.

Für die Korpustexte und die Annotationen wird eine online verfügbare und abfragbare Plattform erstellt. Die Auswertung der Texte soll auch über das Recherche- und Visualisierungstool ANNIS ermöglicht werden.

 

Der Text-Raum der Stadt: Materialität, Medialität, Multilingualität

Das Projekt setzt bei der Rekonstruktion der historischen Sprach- und Textrealität in der Stadt an. Es versteht den Text-Raum der Stadt als die Vorstellung von einer Gesamtheit der Texte, die in einer Stadt in einem bestimmten Zeitraum präsent waren. Zu dieser Breite der Textüberlieferung gehören vor allem diejenigen Texte, die am Ort selbst geschrieben, gedruckt, gemeißelt, gemalt oder anderweitig produziert wurden. In zweiter Linie gehören zum Textraum einer Stadt aber auch solche Texte, die in diese Stadt geschickt wurden oder auf anderen Wegen (wie z. B. durch Ankauf oder Schenkung) in die Stadt gelangten, dort rezipiert und aufbewahrt wurden. Für den Text-Raum der Stadt sind daher die Textproduktion vor Ort, die Textaufbewahrung vor Ort und – soweit möglich – auch die rekonstruierbare Textrezeption vor Ort von Belang. Einzelne Texte können ihre Sprache (durch den Gebrauch einzelner Wörter, durch Zitate oder ganze Abschnitte) wechseln. Textsorten können Texte unterschiedlicher Sprachen umfassen. Diskursen können Texte unterschiedlicher Sprachen zugeordnet werden. Der Text-Raum der Stadt besteht daher nicht nur aus Texten einer Sprache, er ist vielmehr mehrsprachig.

 

Korpusstrukturen

Das Korpus soll den Text-Raum der Stadt Greifswald zu unterschiedlichen Zeiten in begründeten Schnitten und Gewichtungen möglichst breit abbilden. Es sind daher Korpusrasterungen für Texte vorgesehen, die in der Stadt verfasst wurden, aber auch für solche, die in die Stadt gelangten, dort aufbewahrt und rezipiert wurden.

Matrixkriterien der Korpusstruktur sind Zeitrasterungen in 50-Jahres-Schritten (in Anlehnung an die Referenzkorpora) sowie Differenzierung der Orte der Textherstellung (in der Stadt produziert, in die Stadt gelangt), der Institutionen und Akteure der Schriftlichkeit  (z. B. städtische Kanzlei, herzogliche Kanzlei, klösterliche und kirchliche Schriftlichkeit, Offizin, aber auch Prediger, Universitätslehrer, (inschriftenproduzierende) Handwerker oder (Gedichte verfassende) Bürger) sowie der Materialität und der Medialität der Texte (Handschriften, Drucke, Inschriften).

Für die einzelnen Rasterungen wird eine möglichst breite Streuung unterschiedlicher Textformen und -typen angestrebt. Den Einzeltexten werden sekundär Bezeichnungen für Textsorten zugeordnet. Für übergreifende Recherchen wird sekundär zudem jeder Text den vom ReN verwendeten Feldern der Schriftlichkeit zugeordnet. Zeitlich durchlaufende Textsorten und identifizierbare historische Diskurse werden bei der Auswahl berücksichtigt. Eine eigene Korpusschicht bilden Texte zu ausgewählten identifizierbaren städtischen Diskursen.

Das Korpus ist in einem ersten Arbeitsabschnitt für die einzelnen Rasterungen überlieferungsbezogen gewichtend im Rahmen des innersprachlichen Varietätenspektrums ausschließlich auf Texte der volkssprachig-deutschen Mehrsprachigkeit (niederdeutsche Texte, hochdeutsche Texte) bezogen. In der zweiten Phase sollen – durch Kooperation mit anderen Philologien – die Korpusstrukturen auf Textzeugnisse der weiteren relevanten Sprachen der Stadt (lateinisch, schwedisch) erweitert werden.

Die Textauswahl der Korpustexte soll dem Umfang nach 200.000 token errreichen. Dazu sollen Teiltexte mit maximal 2000 token ausgewählt werden.

 

Quellenauswahl

Insgesamt wurden über 500 Texte in Handschriften und Drucken als für den Ortspunkt Greifswald stadtsprachgeschichtlich relevant identifiziert (u. a. Urkunden, Briefe, Rechnungen, Klosterschriftlichkeit, Greifswalder Drucke, nachreformatorische Zukäufe). Die Texte werden in Greifswalder Archiven und Bibliotheken aufbewahrt (u. a. Stadtarchiv Greifswald, Universitätsarchiv Greifswald, Bibliothek des Geistlichen Ministeriums). Für die Greifswalder Inschriften wird die aktuelle Edition in der Reihe „Die deutschen Inschriften des Mittelalters und der Frühen Neuzeit“ benutzt.

Derzeit läuft die endgültige Auswahl der Korpustexte gemäß der festgelegten Korpusstrukturen.

 

Transkription und Annotation

Das Korpus soll linguistisch tief annotiert werden. Grundlegende Parameter der Transkription und der Annotation der Texte werden an den Richtlinien der Referenzkorpora ausgerichtet, um übergreifende und vergleichende Auswertungen mit den standardsetzenden Referenzkorpora zu ermöglichen.

Die Texte werden zeichengenau transkribiert. Die linguistischen Annotationen sollen die Texte auf den Ebenen der Flexions- und Wortbildungsmorphologie, der Lexik, der Syntax, der Texte und der mit ihnen realisierten Diskurse tief erschließen. Während die Bereiche der flexionsmorphologischen, lexikalischen und syntaktischen Annotationen die vergleichende Auswertung mit den Referenzkorpora ermöglichen, stellen die wortbildungsmorphologischen und die text- und diskursbezogenen Annotationen eine Innovation für historische Korpora dar.