TextGrid Newsletter 03 [24. Mai 2007]
Begrüßung
Wir freuen uns, Ihnen heute den dritten TextGrid-Newsletter präsentieren zu können. Auch in diesem Newsletter möchten wir Sie über die neuesten Entwicklungen rund um TextGrid informieren.
Wie gewohnt erhalten Sie alle News auch über die Homepage des Projektes unter www.textgrid.de.
Inhaltsverzeichnis
Am 1. und 2. März 2007 fand am Konrad-Zuse-Zentrum für Informationstechnologie in Berlin (ZIB) eine Zwischenbegutachtung des gesamten D-Grid-Verbundes statt. Gemeinsam mit den anderen D-Grid Projekten wurde die bisherige Arbeit des TextGrid-Konsortiums durch eine vom BMBF berufene Kommission begutachtet. Als Gutachter von TextGrid wurden Dr. Peter Wittenburg und Prof. Dr. Anke Lüdeling ausgewählt.
Das Ziel der Begutachtung bestand darin, noch vor Projektende über den aktuellen Arbeitsstand zu informieren und Themen mit Nachbesserungs- oder Steuerungsbedarf zu identifizieren. Obwohl die Laufzeit von TextGrid noch keine Notwendigkeit für eine Zwischenbegutachtung bedingte, konnte sich das Projekt erfolgreich in die Präsentationen der D-Grid Community Projekte einreihen.
TextGrid wurde durchgehend mit positiven Kommentaren von allen Anwesenden bewertet. Das TextGrid-Team wartet gespannt auf das Ergebnis der Begutachtung, welches in Kürze mitgeteilt werden soll.
Bisher wurden die textbasierten Daten der TextGrid-Community verteilt in projektbasierten Zwischenlösungen vorgehalten. Eine Integration dieser Daten in ein Community-weit zugängliches Storage-Grid wurde dringend notwendig und ist eines der grundlegenden Ziele von TextGrid. Hierbei ist vor allem eine langfristige Speicherung der Daten mit nachhaltig zugesichertem Speicherplatz notwendig. Redundante Vorhaltung der Daten ist für diese kulturhistorisch wertvollen Daten ausdrücklich erwünscht.
Ende 2006 hat eine Sonderausschüttung des BMBF den Aufbau einer neuen Netzwerk-Infrastruktur in Deutschland entscheidend vorangetrieben und TextGrid den oben genannten Zielen ein Stück näher gebracht. Auf Basis der Empfehlung des D-Grid-Steuerungsausschusses zur Sonderinvestition in
eine nachhaltige D-Grid-Infrastruktur wurden für die Grid-Communities MediGrid und TextGrid Anträge auf Sonderinvestitionen zur Beschaffung von Hardware für die Nutzung im Grid gestellt. Die Beschaffung wurde dabei von der GWDG koordiniert und durchgeführt, um so für die beiden Communities einen möglichst großen Synergieeffekt zu erzielen. Die GWDG ist deshalb besonders geeignet, weil sie die digitale Langzeitarchivierung als einen strategischen Schwerpunkt verfolgt.
Es handelt sich bei der Beschaffung um SAN-Speicherkomponenten mit einer Gesamtkapazität von 30 Terabyte, die sich die Communities teilen, sowie um ein Clustersystem bestehend aus 11 Knoten mit je zwei Intel Xeon 3.0 Ghz Woodcrest Prozessoren und je acht GB Hauptspeicher für MediGrid. Für jede Community erfolgt der Zugang über je ein zusätzliches System mit den gleichen Hardwareeigenschaften.
Auf diese Weise etabliert sich Göttingen mit dem Aufbau eines Grid-Knotens an der GWDG und diversen geplanten Veranstaltungen als aktiver Grid-Standort. Die in Göttingen angesiedelten D-Grid Projekte Instant-Grid, MediGrid und TextGrid bilden dabei den Kern des Göttinger Grid-Forums.
In diesem Zusammenhang möchten wir Sie auf GoeGrid II aufmerksam machen: Am 13. September wird die Göttinger Initiative erneut zu einer Göttinger Grid-Veranstaltung einladen, die diesmal einen praxisorientierten Schwerpunkt haben soll. Informationen zu dieser Veranstaltung werden Sie rechtzeitig unter www.textgrid.de finden.
- GES 2007
Auf der
ersten deutschen E-Science-Konferenz,
die vom 02.-04. Mai in Baden-Baden stattfand, kamen internationale
Experten aus vier verschiedenen E-Science Bereichen zusammen: Grid
Computing, Wissensvernetzung, E-Learning und Open Access.

Während der Pausen zwischen den einzelnen Vortragsblöcken konnten sich die Konferenzteilnehmer über die verschiedenen Projekte aus den vier oben genannten Bereichen informieren. Auch TextGrid war gemeinsam mit dem
Arts & Humanities Support Centre - ahessc (GB), dem
arts and humanities data service - ahds (GB), den
Data Archiving and Networked Services - DANS (NL) sowie
DARIAH (Digital Research Infrastructure for the Arts and Humanities)
auf einem e-Humanities-Informationsstand vertreten. Zahlreiche Besucher
nutzten die Gelegenheit und ließen sich über die Projektinhalte sowie
verschiedene Fragestellungen in Bezug auf zukünftige Arbeitsumgebungen,
Standardisierung, Tools sowie Sicherheitsaspekte und Lizenzfragen
informieren.
Auch die Gelegenheit, neue Kontakte zu knüpfen, wurde genutzt. Welchen Stellenwert Kooperationen und Zusammenarbeit gewinnen können, zeigt die Unterzeichnung einer Kooperationsvereinbarung zwischen der
MPDL (Max Planck Digital Library) und der
Universität Göttingen bzw.
Niedersächsischen Staats- und Universitätsbibliothek Göttingen,
die am Rande der Tagung am 03. Mai stattfand. Ziel der vertraglich
besiegelten Zusammenarbeit ist es, die Entwicklung der digitalen
Infrastruktur für die Geistes- und Kulturwissenschaften durch
gemeinsame neue Projekte und innovative Strategien voranzutreiben. Wir
berichteten bereits an anderer Stelle darüber (s.u.).
TextGrid Workshop auf der GLDV-Frühjahrstagung 2007
TextGrid veranstaltete am 12. April 2007 einen Workshop im Rahmen der diesjährigen Frühjahrstagung der Gesellschaft für Linguistische Datenverarbeitung (
GLDV), die zum Schwerpunktthema Datenstrukturen für linguistische Ressourcen und ihre Anwendungen hatte (vgl. http://www.sfb441.uni-tuebingen.de/gldv2007/).
Ziel des Workshops war, die bisherigen Ergebnisse auch in linguistischen Fachkreisen vorzustellen. In den vier Vorträgen wurde TextGrid zunächst in Bezug zu den Begriffen e-Humanities und Digital Ecosystem eingeordnet, sodann die Anforderungen der Textphilologie und Wörterbuchedition an TextGrid, sowie die entsprechenden Anforderungen der Korpuslinguistik thematisiert, um schließlich die in TextGrid verwendeten Technologien und die TextGrid-Architektur vorzustellen. Zum Einen wurde deutlich, dass TextGrid mit der Schaffung einer interdisziplinären, internationalen und vernetzten virtuellen Forschungsplattform gemeinsam mit anderen e-Humanities-Initiativen der ersten Stunde an der "Gridifizierung" der Geisteswissenschaften beteiligt ist, zum Anderen wurde die Offenheit der SOAP-basierten Plattform dargestellt, die es anderen Projekten ermöglicht, eigene Services in die TextGrid-Plattform einzubinden. Die vielen Fragen und Kommentare der Zuhörer zeugte von einem regen Interesse an TextGrid. Zum Abschluss wurde der jetzige Prototyp im Rahmen einer Life-Demo vorgestellt.
Die Webseite zum Workshop: http://www.sfb441.uni-tuebingen.de/gldv2007/textgrid-workshop.html
Der Workshop war wie folgt gegliedert:
- TextGrid als digitales Ökosystem:
eHumanities meets eScience (Marc Küster, FH Worms)
- Wie kann TextGrid die Fachwissenschaft verändern – Philologische Edition (Werner Wegstein, Universität Würzburg)
TextGrid für die Korpuslinguistik (Andrea Zielinski, IDS Mannheim)
TextGrid und Service Oriented Architecture (Peter Gietz, DAASI International GmbH)
- Diskussion über Erwartungen der Fachwissenschaften an TextGrid
- D-Grid Metadaten-Workshop
TextGrid veranstaltete zusammen mit dem DGI am 26. und 27.03.2007 an der SUB Göttingen einen Metadaten-Workshop. Ziel der gut besuchten Veranstaltung war einerseits, die unterschiedlichen Aspekte von Metadaten in D-Grid umfassend darzulegen, und andererseits gemeinsame Interessen zwischen den einzelnen Grid-Communities zu finden. Nach einem Vortrag von Tom Baker, der den augenblicklichen Stand der Metadaten-Entwicklung - insbesondere RDF und anwendungsbezogene Modellierung - thematisierte, haben einzelne Gridprojekte ihre Metadatenverwaltungen präsentiert. Hierbei stellte sich heraus, dass Metadaten im Grid auf verschiedenen Ebenen (administrative MD, MD zu Publikationen, semantische MD in Ontologien) anfallen, die mit unterschiedlichen Technologien teils redundant verwaltet werden.
Die gemeinsamen Diskussionen haben die potenzielle Nützlichkeit von community-übergreifenden Diensten zur Metadatenverwaltung, Mechanismen zum Austausch von Metadaten, sowie Best Practices und andere organisatorische Massnahmen für Interoperabilität herausgestrichen. Insbesondere wurde RDF als mögliches Mittel herausgehoben, um mehr Interoperabilität zwischen den Metadatenverwaltungen der einzelnen Grid-Projekte zu erzielen.
Die Folien zu den einzelnen Vorträgen sind unter https://indico.desy.de/conferenceTimeTable.py?confId=261 zu finden.
- D-Grid Security-Workshop
Der 2. D-Grid-Security Workshop, der am 27. und 28. März in Göttingen vom DGI und MediGrid veranstaltet wurde, war mit über 50 Teilnehmern gut besucht. Nach einem in die Gesamtproblematik einführenden Vortrag von W. Weisz (Austrian Grid) wurden in Einzelvorträgen von DGI- und Community-Grid-Vertretern verschiedene sicherheitsrelevante Fragen behandelt. Am ersten Tag dominierten hierbei die Themen VO-Management und Authentifizierungs- und Autorisierungsinfrastruktur (AAI), wobei die Föderationssoftware Shibboleth besonders hervorgehoben wurde; der Einsatz dieser Technologie in Bibliotheken wurde im Rahmen eines eigenen Vortrages beleuchtet.
Im Verlauf des ersten Tages stellte sich die Erkenntnis ein, dass obwohl die meisten Authentifizierungsprobleme bereits gelöst sind, D-Grid (wie auch Grid Computing im Allgemeinen) bei der Autorisierung noch relativ am Anfang steht.
Weitere Themen des Workshops waren Firewalls, Virtualisierungstechniken sowie die Grid-Cert für Sicherheitsvorfälle und Sicherheit im Datenmanagement. In einem Abschluss-Panel wurden einzelne Aspekte noch detaillierter diskutiert, wobei deutlich wurde, dass verschiedene Communities auch unterschiedliche Sicherheitsanforderungen haben. Im Vergleich zeigte sich, dass MediGrid und InGrid die höchsten Anforderungen an die Datensicherheit stellen.
Die Folien zu den einzelnen Vortägen sind unter http://medigrid.de/u_veranst/070327security-ws/security_ws_d.htm zu finden.
- IEEE DEST 2007
Unter der Mitwirkung von TextGrid wurde auf der diesjährigen
IEEE Digital Ecosystems Conference
in Cairns, Australien (21.-23. Februar) die Special Session 3 mit dem
Titel "e-Humanities for Digital Eco-systems: A Social, Cultural,
Economic and Political Agenda" gestaltet (
Programm).
Neben vielen australischen Vertretern waren auch zahlreiche weitere europäische Initiativen auf dieser ertragreichen und hochrangig besetzten Konferenz zu Gast.
Parallel zu reinen eBusiness-Themen im Umfeld des EU-Projekts Digital Business Ecosystems (DBE) wurden viele auch für TextGrid einschlägigere Gebiete behandelt: Trust and Reputation, Suchstrategien in sich permanent ändernden Topologien, REST-basierte Software, Kooperation, lose gekoppelter Systeme usw. Dabei wurde ein von TextGrid bereits vertretener Standpunkt bestätigt: Digitale Ökosysteme sind kein konkretes Produkt, sondern ähnlich wie Service Oriented Architectures (SOAs) ein allgemeines Paradigma.
In unseren Augen besonders erfreulich erscheint der Wunsch, die Special Session zu eHumanities zu einem dauernden Track innerhalb der Konferenz auszubauen, der dann auch auf der
nächsten Konferenz im Februar 2008 in Thailand vollwertig vertreten wäre. - Interedition
Ergebnis einer Zusammenkunft von Fachwissenschaftlern mehrerer europäischer Länder im Januar 2007 war die Absichtserklärung, gemeinsam eine Plattform für webbasierte Editionstools zu errichten (Arbeitsname Interedition).
Das Huygens-Institut übernimmt die Einrichtung einer Webseite und den Aufbau des Repositories für die Webservices. Zunächst werden gemeinsam folgende Services entwickelt:
* Tokenizer, Lemmatizer
* Name identification
* Annotation exchange
* Collation
Neben der Entwicklung von Services und Tools als ein großer Aufgabenbereich gibt es eine Reihe von Standardisierungsproblemen, die zu lösen sind. Dazu zählen die Referenz auf Text, insbesondere auf ein Werk, eine bestimmte Form des Werks und die Referenz auf bestimmte Teile des Werks.
- GoeGrid Seminar
Am 23. November 2006, fand das erste Symposium zu Göttinger Grid-Aktivitäten statt. Etwa 100 Teilnehmer, vorwiegend aus dem Umfeld von Wissenschaft und Forschung, informierten sich in der Paulinerkirche über zukunftsweisende Technologien und deren Einfluss auf den Arbeitsalltag. Auch Gäste vom Bundesministerium für Bildung und Forschung konnte der Direktor der Niedersächsischen Staats- und Universitätsbibliothek Göttingen, Dr. Norbert Lossau, begrüßen.
Weiter führende Informationen finden Sie in der
Zusammenfassung oder in den einzelnen
Beiträgen.
Veranstaltungen, an denen TextGrid eine Beteiligung plant:
- September 2007,
UK All-Hands Meeting, London
- September 2007,
D-Grid All-Hands Meeting, Göttingen
An diesem vom 10. bis 12. September stattfindenden Treffen der Community-Projekte wird auch TextGrid teilnehmen. - September 2007, Fachbeiratstreffen, Göttingen
Am 12. September tritt der TextGrid-Fachbeirat zum ersten Mal zusammen. Der Termin hatte sich auf Grund der Zwischenbegutachtung im März etwas nach hinten verschoben. - September 2007, GoeGrid II, Göttingen
An die erfolgreiche Veranstaltung vom letzten Jahr (s.o.) werden am 13. September Göttinger Community-Projekte gemeinsam mit Gastrednern einen praxisorientierten Einblick in die Aktuellen Grid-Anwendungen ermöglichen.
Internationale Veranstaltungen im Bereich e-Humanities
Digital Humanities 2007, University of Illinois, Urbana-Champaign, 2.-8. Juni 2007
eResearch Australasia, Brisbande, Australia, 26.-28. Juni 2007
DRHA07
- Digital Resources in the Humanities and Art, Dartington College of Arts, 9.-12. September 2007.- "e-Humanities
– an emerging discipline", Workshop at the
3rd IEEE International
Conference on e-Science and Grid Computing, 10.-13. Dezember 2007, Bangalore.
Der Themenfokus
"e-Science in the Arts and Humanities" des Britischen e-Science Instituts bietet eine Reihe spannender Workshops.Unter den Veranstaltungen im Juni sind:
-
Methods
and Technologies for Enabling Virtual Research Communities,
18. Juni, e-Science Institute, Edinburgh
Ontologies
and Semantic Interoperability for Humanities Data
19. Juni, e-Science Institute, Edinburgh-
Collaborative
Text Editing
20. Juni, e-Science Institute, Edinburgh
TextGrid Info
Ab sofort stehen viele Berichte und Publikationen auf der TextGrid Homepageunter "Berichte" zur Verfügung.
Haben Sie Fragen an das Projektteam? Dann senden Sie bitte eine Email an die folgende Adresse:
Der Newsletter wird von den TextGrid Partnern kooperativ erstellt.
Sie können ihn auf der TextGrid Homepage unter
Newsletter (http://www.textgrid.de/index.php?id=newsletter) abonnieren, bzw. sich davon abmelden. Dort haben Sie auch Zugriff auf alle früheren Newsletter.
Archiv
TextGrid Newsletter 01 [1. Juni 2006]
TextGrid Newsletter 02 [20. Oktober 2006]