TextGrid Newsletter 10 [August 2011]
Ein großer Schritt ist getan: Nach fünfjähriger Entwicklungsphase ist TextGrid ab sofort in der Version 1.0 verfügbar.
TextGrid 1.0, zusammen mit dem Digital Humanities Festakt in Göttingen am 12./13. Juli 2011, bilden die Schwerpunkte unseres aktuellen Newsletters.
Inhaltsverzeichnis:
TextGrid Version 1.0
Seit Juli 2011 ist die stabile Version 1.0 des TextGridLab zum Download verfügbar, die Forschern nun die Nutzung zahlreicher, umfassend getesteter Tools ermöglicht. Fotis Jannidis (Universität Würzburg), Andrea Rapp (TU Darmstadt) und Heike Neuroth (SUB Göttingen) stellten im Rahmen des Digital Humanities Festakts in Göttingen am 12./13. Juli 2011 die Neuerungen der nach fünfjähriger Entwicklungsphase produktionsreifen Version 1.0 vor (Videomitschnitt). Die bereits aus der Betaversion vom Juni 2010 bekannten Tools - darunter der XML-Editor, der Metadaten-Editor, der Text-Bild-Link-Editor und das Wörterbuch-Recherchetool - sind ab sofort in einer stabilen Fassung nutzbar. Neu hinzugekommen ist eine Funktion für das Management von Revisionen; umfassend erweitert wurde außerdem das Metadatenschema.
Mit dem TextGridLab erstellte Forschungsdaten lassen sich seit dem Update nun auch langfristig im TextGrid Repository publizieren und in andere digitale Publikationskontexte einbinden. Über das neue Portal des Repository sind Inhalte auch unabhängig vom TextGridLab von externen Nutzern abrufbar.
TextGrid 1.0 stieß bei schon mit der Beta-Version vertrauten Anwendern ebenso wie bei neuen Interessenten auf äußerst positive Resonanz. Nach rund 700 registrierten Zugängen zur Beta-Version verzeichnet TextGrid 1.0 jetzt schon 100 Nutzer, die die Forschungsumgebung für ihre Editionsprojekte verwenden wollen oder bereits verwenden; darunter Blumenbach online, das Texte und Materialen des Naturforschers J.F. Blumenbach zugänglich machen wird, sowie die digitale Edition der Notizbücher Theodor Fontanes im Rahmen der entsprechenden Hybrid-Edition am Deutschen Seminar der Universität Göttingen.
Umfassend dokumentiert ist die neue Version im TextGrid 1.0 Handbuch, das via Download verfügbar ist.
Bericht zum Digital Humanities Festakt in Göttingen, 12. Juli 2011
Mehr als 200 Gäste nahmen am 12./13. Juli am Festakt anläßlich der Eröffnung des Göttingen Centre for Digital Humanities (GCDH) und des Release von TextGrid 1.0 in der Paulinerkirche im Historischen Gebäude der SUB Göttingen teil. Repräsentanten aus Wissenschaft und Politik – darunter Ulrike Beisiegel (Präsidentin der Georg-August-Universität Göttingen), Wilhelm Krull (Stiftungsratsvorsitzender der Universität Göttingen), Rüdiger Eichel (Niedersächsisches Ministerium für Wissenschaft und Kultur), Herbert Jäckle (Vizepräsident der Max-Planck-Gesellschaft), Haim Gertner (Leiter des Holocaust Memorial Yad Yashem Archive, Jerusalem) Tobias Blanke (Kings College, London), Gerhard Lauer (GCDH), Juan Garces (Leiter des GCDH Göttingen) und Norbert Lossau (Direktor der Staats- und Universitätsbibliothek Göttingen) – formulierten in ihren Vorträgen die Bedeutung der Digital Humanities, deren Anwendungsbereiche, Perspektiven und Potentiale. [Videomitschnitt]
Das Göttingen Centre for Digital Humanities unterstützt und koordiniert computerbasierte Vorhaben in Forschung, Lehre und Infrastruktur in den Geistes- und Sozialwissenschaften am Forschungscampus Göttingen und darüber hinaus. Zu seinen Aufgaben gehören der Aufbau, die Förderung und Pflege von digitalen Editionen bis hin zu virtuellen Forschungsumgebungen. Seine Zielsetzung ist die Integration computerbasierter Methoden, Werkzeuge und Infrastrukturen in die Geistes- und Sozialwissenschaften. Das Zentrum wird von den entsprechenden Fakultäten der Universität Göttingen und der Staats- und Universitätsbibliothek Göttingen getragen und arbeitet eng mit der Akademie der Wissenschaften zu Göttingen, der Herzog August Bibliothek und der Max Planck Digital Library zusammen.
In seinem Keynote-Vortrag „If You Build It They Will Come”: Why Do We Need To Provide Access To Humanities Knowledgebases" lieferte Haim Gertner, Direktor des Holocaust Memorial Yad Vashem Archive, Jerusalem, ein eindrucksvolles Beispiel für die Erschließung eines auch nichtwissenschaftlichen Publikums mithilfe digitaler Technologien. [Videomitschnitt der Keynote] Die breite Nutzerschaft außerhalb akademischer Kontexte sei, so Gertner, durch die open-access-basierte Verfügbarkeit der im elektronischen Yad Vashem Archive bereitgestellten Materialien und Dokumente der Holocaust-Forschung – Biografien, Personendaten – überhaupt erst generiert: access creates audience.
Mit dem jüngst gestarteten Projekt DARIAH-DE (BMBF) und dem Digital Humanities Verbundprojekt (Nds.-MWK) präsentierten sich im Anschluß zwei Forschungsinitiativen, die den Einsatz digitaler Methoden in den Geistes-, Kultur- und Sozialwissenschaften sowie die Vernetzung auf lokaler und internationaler Ebene unterstützen. [Videomitschnitt DH-Verbundprojekt]
In seinem Vortrag "Digital Research in the arts and humanities" stellte Tobias Blanke vom King´s College London DARIAH-DE vor. [Videomitschnitt über DARIAH] Dabei handelt es sich um den deutschen Beitrag zum Projekt DARIAH (Digital Research Infrastructure for the Arts and Humanities), das den Aufbau von Forschungsinfrastrukturen in den Geisteswissenschaften zum Ziel hat.
Einen zentralen Programmpunkt des Festakts bildete der Release von TextGrid 1.0, das Forschern nun die stabile Nutzung zahlreicher, umfassend getesteter Tools ermöglicht. Fotis Jannidis (Universität Würzburg), Andrea Rapp (TU Darmstadt) und Heike Neuroth (SUB Göttingen) stellten die Neuerungen der nach fünfjähriger Entwicklungsphase produktionsreifen Version 1.0 in ihrem Vortrag "TextGrid Release 1.0" vor. [Videomitschnitt TextGrid 1.0] Eine Präsentation von Anwendungsfällen konnte während der Pausen eingesehen werden und ist ab sofort auch online abrufbar.
Parallel zum Release erschien mit dem TextGrid 1.0 Handbuch eine umfassende Dokumentation aller Tools und Services, die als Download verfügbar ist.
In der Moderation Wilhelm Krulls stellten im Anschluß an die Vorträge mit Petra Gehring (TU Darmstadt), Dieter Hogrefe (Universität Göttingen), Andrea Rapp (TU Darmstadt) und Norbert Lossau (SUB Göttingen) Wissenschaftler aus Germanistik, Bibliotheks- und Informationswissenschaft, Philosophie und Informatik auf dem Göttinger „Roten Sofa“ Herausforderungen, Chancen und Perspektiven der Digital Humanities vor. [Videomitschnitt der Podiumsdiskussion] Thema war dabei unter anderem deren (zunehmende) Anerkennung durch die scientific community. Andrea Rapp diagnostizierte im Blick darauf, wie Forschung in den Digital Humanities abgebildet, aber auch neu generiert werden kann, einen Paradigmenwechsel: erstmals seien etwa mit TextGrid solche Forschungsanfragen bedienbar, die Massendaten bewältigen müssen. Die Einbindung der Digital Humanities als computerbasierter Forschungsunterstützung in den Geistes-, Sozial- und Kulturwissenschaften bereits in das Studium formulierten mehrere Diskussionsteilnehmer als Desiderat; nur so könne die Entwicklung neuer Inhalte, ihre Verbesserung, aber auch die wissenschaftliche Akzeptanz befördert und gewährleistet werden.
Am Schluß des Festakts stand die offizielle Eröffnung des Göttingen Centre for Digital Humanities. [Video der Eröffnungsworte]
Rund 60 Teilnehmer besuchten am Folgetag Schulungen zu den einzelnen 1.0-Tools sowie Workshops zu zentralen Themen der Digital Humanities (u.a. Text Mining, Nachhaltigkeit virtueller Forschungsumgebungen) und zur durch TextGrid erworbenen online-Bibliothek zeno.org.
Berichte der Workshops am 13. Juli im Rahmen des Digital Humanities Festaktes
Die Digitale Bibliothek bei TextGrid
Ebenfalls im Rahmen des Digital Humanities Festakts präsentierten Fotis Jannidis und Katrin Betz (beide Uni Würzburg) die von www.zeno.org für TextGrid erworbene online-Bibliothek und gaben einen Überblick über die zur Aufbereitung des Datenbestandes notwendigen Arbeitsschritte. Ein Schwerpunkt lag dabei auf den Metadaten; außerdem ging es um fachwissenschaftliche Anwendungsszenarien, mithin darum, mit welchen Werkzeugen Fachwissenschaftler auf die Daten im TextGridLab zugreifen und sie weiterverarbeiten können.
Die digitale Bibliothek beinhaltet eine umfangreiche Textsammlung vom Anfang des Buchdrucks bis zu den ersten Jahrzehnten des 20. Jahrhunderts in digitaler Form. TextGrid wird diese Texte der Öffentlichkeit nicht nur zur Lektüre, sondern vor allem auch zur Weiterverarbeitung z.B. in Editionen und Korpora zur Verfügung stellen. Dafür werden die XML-Dateien während der Projektlaufzeit in ein gültiges TEI-Format konvertiert, das die Möglichkeit einer genauen Recherche über die Texte bietet. Gegenwärtig ist ein erster Teil der Texte von insgesamt 700 Autoren umfassenden Belletristik-Sammlung des zeno.org-Bestandes bei TextGrid im TEI-Format zugänglich und zum Download verfügbar. Weitere texttechnologisch erschlossene Titel u.a. aus den Bereichen Soziologie, Geschichte, Philosophie, Naturwissenschaft und Musik, aber auch Nachschlagewerke werden folgen.
Informationen zu den Beständen im Einzelnen und zur Open-Access-Lizensierung finden Sie hier.
Nachhaltigkeit virtueller Forschungsumgebungen
Am 13.07.2011 fand im Rahmen des Göttinger Digital Humanities Festakts der Workshop „Nachhaltigkeit Virtueller Forschungsumgebungen“ statt, in dem die durch stetig zunehmende Vernetzung bedingte intensivierte Nutzung digitaler Medien in der Wissenschaft neue Wege für einen stabilen und zuverlässigen Betrieb von digitalen Forschungsinfrastrukturen in den Geistes- und Kulturwissenschaften erörtert wurden.
Großen Anklang fanden hierbei die fruchtbaren Diskussionen unterschiedlichster Vertreter von Forschung, Rechenzentren und Förderern unter Moderation von Prof. Dr. Axel Horstmann. Während Prof. Dr. Uwe Schwiegelshohn (Universität Dortmund) als Vertreter der D-Grid GmbH die grundlegenden Anforderungen an eine Virtuelle Forschungsumgebung umriss, machte Frank Dickmann (Universitätsmedizin Göttingen) für das Projekt WissGrid auf die notwendigen Änderungsmöglichkeiten in der derzeitigen föderalen Förderungslandschaft angesichts einer länderübergreifenden Vernetzung heutiger Fach-Communities aufmerksam. Angesichts inzwischen mehrjähriger Erfahrungen des Deutschen Klimarechenzentrums (DKRZ) im Betrieb Virtueller Forschungsumgebungen zeigte Dr. Michael Lautenschlager die zentralen Herausforderungen in der Bewältigung großer Datenmengen vor dem Hintergrund eines politisch wie gesellschaftlich brisanten Themas auf. Aus der Sicht von TextGrid entwickelte Dr. Andreas Witt (Institut für Deutsche Sprache) die wesentlichen Eckpunkte für verschiedene Kostenszenarien einer nachhaltigen Infrastruktur, welche sowohl technische als auch organisatorische und personelle Kriterien berücksichtigte und in drei Lösungsszenarien unterschiedliche Grade einer nachhaltigen Struktur umfassten.
Die Teilnehmer der darauf aufbauenden Podiumsdiskussion, die mit Prof. Dr. Norbert Lossau (SUB Göttingen), Prof. Dr. Otto Rienhoff (UMG) sowie Dr. Frank Sander (Max Planck Digital Library) unter der Moderation von Prof. Dr. Axel Horstmann neben den Referenten auch Experten auf dem Gebiet der eSciences an einen Tisch brachte, erörterten die wesentlichen Herausforderungen und Chancen für den nachhaltigen Betrieb Virtueller Forschungsumgebungen und zeigten mögliche Lösungswege für eine organisatorische wie finanzielle Nachhaltigkeit auf. Als Kernpunkt konnte hierbei die Akzeptanz der Vorteile und Chancen bei potenziellen Nutzern herausgestellt werden: eine möglichst breite Nutzerbasis und ein stetiger Bedarf an Virtuellen Forschungsumgebungen bieten den sichersten Garant für eine dauerhafte Finanzierung eines solchen Vorhabens. Betreiber von Virtuellen Forschungsumgebungen sind daher angehalten, ihre Nutzergruppen für die Perspektive einer Nutzung zu sensibilisieren, indem sie ein klares Leistungsprofil und erkennbare Vorteile gegenüber herkömmlichen Forschungsmethoden bieten sowie durch die Modifizierung der universitären Curricula für eine Disseminierung im wissenschaftlichen Nachwuchs sorgen. Starke institutionelle Partner, eine flexible Förderpolitik des Bundes und der Länder und letztendlich eine nutzerorientierte Ausrichtung der Rechenzentren flankieren eine tragfähige Organisationsstruktur jeder Virtuellen Forschungsumgebung.
Eine große Teilnehmerzahl und eine lebhafte Diskussion haben einmal mehr bewiesen, welche Brisanz diesem Themenkomplex in Politik und Wissenschaft beigemessen wird, sodass TextGrid optimistisch ist, mit diesem Workshop den Nerv der Zeit getroffen zu haben und mit seinem bisherigen Ansatz auf einem guten Weg hin zu einer nachhaltigen Etablierung digitaler Methoden in den Geistes- und Kulturwissenschaften zu sein.
Text Mining, Controlled Vocabularies and Linked Data
Ziel dieses Workshops war, einerseits einen Überblick über die derzeitigen Aktivitäten bzgl. der Workshopthemen im TextGrid-Umfeld zu vermitteln, sowie andererseits die aktuellen Überlegungen und weiteren Planungen in einer größeren Runde vorzustellen und zu diskutieren.
Mit TEXTvre existiert ein TextGrid-Schwesterprojekt (vgl. Newsletter 08), das TextGrid als virtuelle Forschungsumgebung in das institutionelle Umfeld des King's College London einbettet und sowohl an die Bedürfnisse der dortigen Nutzer anpasst und entsprechend erweitert, als auch das TextGrid Repository in die dortige technische Infrastruktur integriert. Diesem Thema widmete sich der Beitrag "TEXTvre: Implementing An Institutional TextGrid" von Mark Hedges und José Miguel Vieira (King's College London). Ein Gutteil der hierbei eingesetzten Werkzeuge zur Textanalyse und Named Entity Recognition wird von der Universität Sheffield bzw. dem dort beheimateten GATE Projekt beigesteuert, dessen technische Lösungen (GATE Teamware, GATE Cloud) von Adam Funk (Univ. Sheffield) in seinem Workshop-Beitrag "Introducing GATECloud.net" vorgestellt wurden.
In ihrem Beitrag "The SAWS Use Case: Linking Texts across Time and Space" (Untertitel: Using TextGrid - Prospects and Proposals) widmete sich Charlotte Roueché (King's College London) den Anforderungen an eine virtuelle Forschungsumgebung, den erforderlichen Werkzeugen und semantischen Technologien, um überlieferungsgeschichtliche Zusammenhänge zwischen Texten zu modellieren. Darüber hinaus wurden, wie auch in der folgenden Diskussion, grundlegende Fragen angesprochen, die das Arbeiten mit virtuellen Forschungsumgebungen, die Anforderungen an die integrierten Werkzeuge und den generellen Umgang mit vernetzten Strukturen und online verfügbaren Forschungsdaten in den Digital Humanities betreffen – sowie die Probleme, die damit einhergehen: z.B. Nachhaltigkeit, Interoperabilität, Provenance (wer hat was wann veröffentlicht / geändert / annotiert?). Den aktuellen Planungsstand des TextGrid Text-Text-Link-Editors präsentierte Mark W. Küster (FH Worms) und stellte das derzeitige Anforderungsprofil zur Diskussion.
Abgeschlossen wurde der Workshop mit einem Double Feature: "Controlled Vocabularies and Text Mining - Use Cases at the Goettingen State and University Library". Im ersten Teil referierte Wolfgang Pempe (SUB Göttingen) unter dem Titel "Linked Open Data Cloud" über den aktuellen Implementierungsstand semantischer Technologien und Werkzeuge in TextGrid, um dann die Schritte aufzuzeigen und zur Diskussion zu stellen, die notwendig sind, um TextGrid mit der Linked Open Data Cloud zu verknüpfen. Im zweiten Teil stellte Ralf Stockmann (SUB Göttingen) den Use Case Text Mining / Mental Maps am Beispiel von eAQUA vor. Weiterhin wurde mit europeana4D ein Browser-basiertes Tool zur Visualisierung geographisch-historischer Zusammenhänge vorgestellt, das im Rahmen von EuropeanaConnect entwickelt wurde.
Schulungen: TextGrid-Grundlagen und Editoren
Einen Tag nach der Veröffentlichung der TextGrid-Version 1.0 konnten die Gäste des Digital Humanities Festaktes die neue Software im Rahmen verschiedener TextGridLab-Schulungen ausprobieren. Die interaktiven Workshops fanden regen Zuspruch: so besuchten am Vormittag allein rund sechzig TeilnehmerInnen die Grundlagen-Schulung. Nach einer kursorische Einführung in das Projekt TextGrid und seine Infrastruktur konnten im interaktiven Teil des Kurses die grundlegenden Funktionen der Basiswerkzeuge vorgestellt und von den TeilnehmerInnen erprobt werden.
Am Nachmittag fanden parallel drei weiterführende Schulungen statt, in denen die fachspezifischen Tools des TextGridLab im Mittelpunkt standen. Mit über vierzig Personen zogen der XML-Editor und das neue Metadaten-Konzept das größte Interesse auf sich. In zwei weiteren Schulungen wurde der Funktionsumfang des Text-Bild-Link-Editors erprobt sowie der noch nicht in Version 1.0 integrierte Noten-Editor erstmals der Öffentlichkeit präsentiert.
Kommende Veranstaltungen
Folgende Veranstaltungen von TextGrid bzw. mit Beteiligung von TextGrid werden in den nächsten Wochen stattfinden:
- 10.-16.10.2011: 2011 Annual Conference and Members’ Meeting of the TEI Consortium
- 26.-27.10.2011: 4th eSciDoc Days
- 12.-16.09.2011: EDIROM Summer School, Universität Paderborn
Für weitere Informationen zu vergangenen und bevorstehenden Veranstaltungen besuchen Sie bitte auch unsere Veranstaltungsseite.
Aktuelle Veröffentlichungen und Berichte
TextGrid Dokumente:
- Neu in der Pressemappe:
- Interview mit Heike Neuroth über die Nachhaltigkeit virtueller Forschungsumgebungen und die Grenzen historisch gewachsener Förderstrukturen
- Interview mit Werner Wegstein zu den Anfängen von TextGrid, zu community-Bildung und der Schönheit von TEI
- Präsentation: TextGrid Anwendungsfälle auf dem Digital Humanities Festakt (Prezi)
Verwandte Aktivitäten
DARIAH-DE – Aufbau von Forschungsinfrastrukturen für die e-Humanities
Das BMBF-geförderte Projekt DARIAH-DE ist ein Forschungsprojekt zur Entwicklung von nachhaltigen Forschungsinfrastrukturen für die Geistes- und Kulturwissenschaften. DARIAH-DE arbeitet gemeinsam mit Wissenschaftlern aus unterschiedlichen geistes- und kulturwissenschaftlichen Disziplinen, um digitale Forschungsmethoden zu entwickeln, Forschungsfragen auf neue Weise zu beantworten und neue Forschungsfragen zu etablieren. Technologische Basis dafür sind die langfristige Archivierung und Vernetzung von Forschungsdaten sowie IT-gestützte Werkzeuge zur kollaborativen Forschung auf Basis dieser Daten.
DARIAH-DE ist der deutsche Beitrag zu dem EU-ESFRI-Projekt DARIAH-EU und für die technologische, inhaltliche und organisatorische Abstimmung zwischen europäischen und deutschen Infrastrukturen sowie Forschungsnetzwerken in den Geistes- und Kulturwissenschaften verantwortlich.
NeDiMAH – Network for Digital Methods in the Arts and Humanities
Das NeDiMAH-Netzwerk hat zum Ziel, die Anwendung von computergestützten Methoden in den Geisteswissenschaften zu untersuchen. Dazu wird NeDiMAH europaweit eine zentrale Anlaufstelle für Networking und interdisziplinären Austausch von Wissenschaftlern aus den verschiedenen geisteswissenschaftlichen Fachdisziplinen mit Digital Humanities Schwerpunkt und Experten aus dem Bereich der Cultural Heritage Curation bilden. NeDiMAH wird eng mit den europäischen Infrastrukturprojekten CLARIN und DARIAH sowie mit weiteren nationalen und internationalen Initiativen zusammenarbeiten. Dabei werden thematische Arbeitsgruppen gebildet, die sich mit der Nutzung computer-basierter Methoden für die Sammlung, Erforschung, Analyse, Modellierung, Präsentation, Verbreitung und Evaluation von geisteswissenschaftlichen Forschungsmaterialien beschäftigt. Die Untersuchungsergebnisse werden kartiert sowie in eine Ontologie der IT-Methoden zusammengeführt. Die formale Kategorisierung der computergestützten Methoden in den Geisteswissenschaften soll diesen Arbeiten eine höhere wissenschaftliche Glaubwürdigkeit und Anerkennung verleihen, sowie bessere Vergleichsmöglichkeiten zwischen verschiedenen Ansätzen bieten und einen disziplinübergreifenden Austausch dieser Methoden befördern.




