TextGrid Sondernewsletter [21. Dezember 2009]
TextGrid erwirbt geisteswissenschaftliche Textsammlung
TextGrid hat die umfangreiche Textsammlung der Online-Bibliothek von zeno.org mit Mitteln des Bundesministeriums für Bildung und Forschung (BMBF) erworben und wird diese für die Wissenschaft und die allgemeine Öffentlichkeit bereitstellen. Diese digitale Sammlung ist die umfangreichste ihrer Art im deutschen Sprachraum und enthält Texte vom Anfang des Buchdrucks bis zu den ersten Jahrzehnten des 20. Jahrhunderts.
A) Bereitstellung für die Wissenschaft: Wie in der Pressemitteilung vom 2. Dezember angekündigt, wird TextGrid die Textsammlung in einer für die wissenschaftliche Verwendung aufgearbeiteten Form (Konvertierung in TEI, tiefere Auszeichnung für genauere Recherchen) bereitstellen. Eine erste nutzbare Teilfassung wird innerhalb von einem Jahr vorliegen. Damit dabei die Interessen der Fachdisziplinen einbezogen werden können, sind alle interessierten Kolleginnen und Kollegen eingeladen, sich an einer Abstimmung zwischen zwei zur Wahl gestellten Creative-Commons-Lizenzmodellen zu beteiligen, die die Art der Weiterverwendung und der Nachnutzung der Forschungsdaten bestimmen.
---> Zur Abstimmung über Lizenzbedingungen für die wissenschaftliche Verwendung in TextGrid (mit ausführlichen Informationen zum Abstimmungsprozess)
B) Bereitstellung für die allgemeine Öffentlichkeit: Wie in der heute veröffentlichten Kooperationserklärung bekanntgegeben, wird Wikimedia mit Unterstützung von TextGrid die Daten in ihrer jetzigen Form in Kürze unter der Lizenz Creative Commons by (Namensnennung) für die allgemeine Öffentlichkeit zur Verfügung stellen.
Zudem erfahren Sie in einem Interview mit Prof. Dr. Fotis Jannidis näheres über die Bedeutung der „Digitalen Bibliothek“ für die Wissenschaft und wie TextGrid die Daten aufbereiten wird.
Das gesamte TextGrid Team wünscht Ihnen fröhliche Weihnachten und einen guten Start ins Jahr 2010!
Inhaltsverzeichnis
Kooperationserklärung von TextGrid, Wikimedia und Creative Commons
2.347.703.384 Zeichen kulturelles Erbe frei verfügbar
TextGrid, Wikimedia und Creative Commons Deutschland[1] kooperieren, um eine umfangreiche Textsammlung für die Öffentlichkeit frei verfügbar zu machen.
Der Forschungsverbund TextGrid hat kürzlich die Texte der Online-Bibliothek zeno.org mit Mitteln des Bundesministeriums für Bildung und Forschung (BMBF) erworben[2]. Diese digitale Sammlung ist die umfangreichste ihrer Art im deutschen Sprachraum und enthält Texte vom Anfang des Buchdrucks bis zu den ersten Jahrzehnten des 20. Jahrhunderts.
TextGrid, Wikimedia Deutschland und Creative Commons Deutschland kooperieren nun, um diese Textsammlung für die Allgemeinheit frei nutzbar zu machen. Wikimedia wird die Sammlung mit Unterstützung von TextGrid in Kürze bereitstellen. Soweit sie aus gemeinfreien Inhalten besteht (insbesondere bzgl. der digitalisierten Texte selbst) wird dann eine Nachnutzung ohne Einschränkungen möglich sein. Soweit zusätzliche Erschließungsdaten enthalten sind (z.B. bibliografische Metadaten) werden diese unter der Lizenz CC-BY 3.0 de[3] stehen. Diese Lizenz erfordert hauptsächlich die Namensnennung des Lizenzgebers und ist überdies durch die Free Software Foundation als "free license" anerkannt[4].
"Durch die Wahl der Creative Commons Lizenz entsteht für jeden Nachnutzer der Texte Rechtssicherheit, da über den urheberrechtlichen Status der eigentlichen Werke hinaus dadurch auch die Frage der Leistungsschutzrechte geklärt ist und der Lizenzgeber auf sämtliche aus diesem Schutz resultierenden Rechte soweit wie möglich verzichtet", erklärt Michael Weller von der Europäischen EDV-Akademie des Rechts (Projektleitung Recht für Creative Commons Deutschland).
Jeder Internetnutzer erhält freien Zugriff auf die Dateien und kann den Datenbestand unter Berücksichtigung der Namensnennung weiterbearbeiten. Für die von der Wikimedia Foundation betriebenen Projekte entstehen neue Möglichkeiten: "Durch den freien Zugriff auf die Daten können die von der Wikimedia Foundation betriebenen Projekte wie Wikisource und Wikimedia Commons und ihre Benutzer die Werke der Textsammlung in ihrer Wissenssammlung anbieten und vernetzen", erläutert Mathias Schindler von Wikimedia Deutschland.
Von der Kooperation profitieren somit Öffentlichkeit wie Fachwissenschaft: "Nicht mehr die Digitalisierung, wie noch in den 90er Jahren, sondern die methodisch innovative Erschließung der strukturierten Datenmengen ist die Leitaufgabe der Digital Humanities. Mit der Kooperation ermöglichen wir nicht nur der Fachwissenschaft, sondern auch der allgemeinen Öffentlichkeit Zugriff auf diese Informationen", betont Dr. Heike Neuroth, TextGrid Projektleiterin an der Niedersächsischen Staats- und Universitätsbibliothek Göttingen.
TextGrid wird die Sammlung nun innerhalb der nächsten drei Jahre für die wissenschaftliche Verwendung aufbereiten (z.B. Konvertierung in TEI, tiefere Auszeichnung für genauere Recherchen) und in einer virtuellen Forschungsumgebung zusammen mit passenden Werkzeugen zur Weiterverarbeitung bereit stellen. Die fachwissenschaftlichen Communities sind zu einer Abstimmung über die gewünschten Lizenzbedingungen für ihre dann auf dieser Basis entstehenden Forschungsdaten aufgerufen[5].
[1] Projektleitung Recht für Creative Commons Deutschland, getragen von der Europäischen EDV-Akademie des Rechts (EEAR) und dem Institut für Rechtsinformatik der Universität des Saarlandes (IFRI).
[2] Pressemitteilung der Georg-August-Universität Göttingen vom 2.12.2009
[3] Creative Commons Lizenz cc-by
[4] Stellungnahmen der FSF zu den CC-Lizenztypen BY und BY-SA
[5] Abstimmung über Lizenzbedingungen für die wissenschaftliche Verwendung in TextGrid
Interview mit Prof. Fotis Jannidis zum Erwerb der Online-Bibliothek von Zeno.org
Zum Hintergrund:
Prof. Fotis Jannidis leitet seit dem Sommersemester 2009 den „Lehrstuhl für Computerphilologie und Neuere Deutsche Literaturgeschichte“ an der Universität Würzburg. Er ist seit 2006 Partner im Forschungsverbund TextGrid und Hauptverantwortlicher für die Integration der online-Bibliothek von zeno.org in TextGrid.
Welche Rolle spielt der Erwerb der Texte für Ihre Disziplin, die Literaturwissenschaft?
Fotis Jannidis: Für die germanistische Literaturwissenschaft ist diese Erweiterung des Angebots von in TextGrid verfügbaren Daten von besonderem Interesse, da die Sammlung nahezu alle wichtigen kanonisierten Werke bis zum Anfang des 20. Jahrhunderts, unter ihnen 280 Romane deutschsprachiger Autoren, und zahlreiche weitere literarhistorisch bedeutende Texte enthält.
Welche Pläne haben Sie mit der online-Bibliothek von zeno.org?
Jannidis: Wir werden die Texte schrittweise nach TEI P5 konvertieren, einem Standard, der ihre langfristige Verwendbarkeit sicherstellen soll. Besonders wichtig ist es zudem für uns, dass die komplette Sammlung dann frei zugänglich sein und zur Weiterverarbeitung beispielsweise in Editionen und Korpora zur Verfügung stehen wird.
Wieso müssen die Daten für wissenschaftliches Arbeiten aufbereitet werden?
Jannidis: In ihrer jetzigen Form ist es nicht möglich, gezielt in den Daten zu recherchieren. Man kann zwar die Suche auf einzelne Werke oder Autoren einschränken, nicht aber frei nach anderen Metadaten suchen. Für die meisten Geisteswissenschaftler ist dies jedoch sicherlich eine ebenso wichtige Form des Zugriffs auf die Texte. Man kann dann nicht nur in den Werken eines bestimmten Autors suchen, sondern auch – um ein Beispiel zu nennen – in allen Gedichten der Bibliothek, die im 18. Jahrhundert erschienen sind.
Welche andere Art der Nutzung erwarten Sie?
Jannidis: Zum einen die Lektüre, wobei Lesen sicherlich nicht die wichtigste Form der Verwendung dieser Texte ist…
Wieso nicht?
Jannidis: Im Fall von Forschungsliteratur ist die wichtigste Form der Nutzung sicherlich die Lektüre, sei es am Bildschirm oder auf dem Papier. Das gilt aber nicht unbedingt für die kanonischen Texte, von denen hier die Rede ist, da viele in wohlfeilen Ausgaben für eine bequeme Offline-Lektüre zur Verfügung stehen. Etwas anders stellt sich die Situation bei den Wörterbüchern und Lexika da, die auf diese Weise bequem zur Hand sind. Allerdings kommen die Texte auch gerade richtig für die neue Generation von digitalen Lesegeräten.
Gibt es noch weitere Nutzungsmöglichkeiten?
Jannidis: Ja, wir erwarten, dass das Weiterverwenden der Daten in eigenen Forschungskontexten zunehmend selbstverständlicher wird, etwa bei der Zusammenstellung eigener Korpora für quantitative Analysen oder der Kollationierung mit anderen Textzeugen. Editoren können die Texte auch als Grundlage einer eigenen Edition verwenden oder wichtige Kontexte für ihre editierten Texte bereitstellen und ihre Texte damit verlinken.
Viele Editoren scheuen allerdings aufgrund der Instabilität der Links derzeit vor solchen Verweisen noch zurück. Wie wollen Sie diesen Vorbehalten begegnen?
Jannidis: Alle Texte der Digitalen Bibliothek werden über persistente Internetadressen zur Verfügung gestellt, so dass langfristig stabile Verweise auf alle in TextGrid verfügbaren Texte möglich sein werden. Wir orientieren uns dabei an Standards, die schon von anderen digitalen Bibliotheken mit Erfolg eingesetzt werden.
Gibt es noch weitere Benutzer, die Sie mit den Texten ansprechen möchten?
Jannidis: Typische Interessenten an diesen Texten sind natürlich nicht nur Editoren digitaler Editionen wie Literaturwissenschaftler, Philosophen, Historiker oder Musikwissenschaftler, sondern auch beispielsweise historische Linguisten, die diachrone Korpora aufbauen, Textwissenschaftler, die mit quantitativen Verfahren Texte untersuchen wollen, Fachwissenschaftler, die nur in einem oder wenigen Texten intensiv suchen wollen, diese aber dafür vorher noch genauer aufbereiten möchten, etwa durch die Auszeichnung von Namen und Daten und natürlich allgemein alle Wissenschaftler, die größere Textmengen zur Entwicklung von Texttechnologien benötigen. Diese Texte stehen nun allen, die sich für deutschsprachige Literatur, Geschichte, Philosophie und Kultur interessieren, zur freien Verfügung. Das Internet hat bislang immer wieder positiv überrascht, da frei vorhandene Daten, Software und Dienste zu unvorhergesehenen, innovativen Zwecken verwendet wurden. Es würde uns alle sehr freuen, wenn so etwas auch mit diesen Texten geschieht.
TextGrid Newsletter
Haben Sie Fragen an das Projektteam? Dann senden Sie uns bitte eine E-Mail.
Der Newsletter wird von den TextGrid-Partnern kooperativ erstellt. Sie können ihn hier auf der Homepage abonnieren bzw. sich davon abmelden. Dort haben Sie auch Zugriff auf alle früheren Newsletter.

