TextGrid Newsletter 04 [22.10.2007]
Begrüßung
Wir freuen uns, Ihnen heute den vierten TextGrid-Newsletter präsentieren zu können. In diesem Newsletter möchten wir Sie über die aktuellen Entwicklungen rund um TextGrid informieren.
Wie gewohnt, erhalten Sie alle News auch über die Homepage des Projektes unter www.textgrid.de.
Inhaltsverzeichnis
TextGrid-Tools: Der Trierer Wörterbuchservice online
TextGridLab: Das zukünftige TextGrid-Service-Portal
Ergebnis der Zwischenbegutachtung
Fachbeiratstreffen
Neuigkeiten aus der Projektnachbarschaft: Interedition
Veranstaltungsberichte
Aktuelle Veröffentlichungen
TextGrid Tools: Der Trierer Wörterbuchservice online
Erster TextGrid-WebService im Einsatz
Seit einigen Wochen hat sich der erste vom TextGrid-Team entwickelte WebService im Praxis-Einsatz bewährt: Im
Trierer Wörterbuchnetz kann man über diesen Service Stichwörter in zehn Wörterbüchern gleichzeitig abfragen. Der Service läuft robust und performant, auch bei Rechts- oder Links-Trunkierung des Suchwortes oder bei großen Treffermengen. In Kürze soll eine weitere Ausbaustufe implementiert werden, die weitere Funktionalitäten umfasst. Dazu gehören unscharfe Suchen, die flexible Zusammenstellung der zu durchsuchenden Wörterbücher sowie die Festlegung der anzuzeigenden Treffermengen. Ferner sollen externe Wörterbücher über den Service eingebunden werden.
Der Service ist ebenfalls in das
TextGridLab integriert. Damit kann Textarbeit wirksam unterstützt werden: Der Nutzer kann ein Wort in seinem zu bearbeitendem Text markieren und bekommt sofort die Angabe, in welchem der angeschlossenen Wörterbücher dieses Wort als Lemma gebucht ist; mit einem Mausklick wird es nachgeschlagen.
Damit wird nicht nur modellhaft die Leistungsfähigkeit der Technologie in der konkreten Praxis, sondern auch ein entscheidender Vorteil des TextGrid-Konzepts demonstriert: Der Wissenschaftler bekommt eine flexible Arbeitsumgebung an die Hand, in die er sowohl die für seine Arbeit notwendigen Ressourcen wie auch die Werkzeuge effizient integrieren kann.
Testen können Sie diesen Service unter
www.woerterbuchnetz.de.
Das TextGridLab
Das TextGridLab (TextGridLaboratory) ist das Portal der Zukunft, für die wissenschaftliche Bearbeitung von Texten, wie z.B. Analyse, Annotation, Edition und Publikation. Hier werden
Wörterbücher (u.a. Goethe-Wörterbuch, Deutsches Wörterbuch von Jacob Grimm und Wilhelm Grimm), Werkzeuge wie z.B. Lemmatizer, Kollationierer sowie weitere Dienste (z.B. Workflow-Management) für die TextGrid-Nutzer bereitstehen.
Es basiert auf einem offenen Dienste-Netzwerk (Open-Source-Tools), das für neue Nutzergruppen einfach erweiterbar und interoperabel mit
weiteren Services, auch internationaler Initiativen ist.
Einen ersten Eindruck vom TextgridLab erhalten Sie in einer Live-Demo auf der
Demo-Seite.
Hier sehen Sie das TextgridLab in einem typischen geisteswissenschaftlichen Anwendungsszenario: "Kommentierung eines Textes"
(gespeichert in Tübingen), unter Integration von dezentral im Netz verteilten Datenstrukturen (Metadaten von der SUB Göttingen, Lemmasuche in Wörterbüchern als Dienst an der Universität Trier).
Eine Roadmap für das TextGridLab für 2008 erhalten Sie im nächsten TextGrid-Newsletter. Dort werden wir Sie über den Beginn des User Testing informieren, darüber wann es eine Beta-Version auf der Website gibt, wann und wo das TextGridLab vorgestellt wird, wann es OpenSource gestellt wird und wann es die ersten Seminare und Workshops gibt .
Diese und weitere Informationen erhalten Sie auch unter
www.textgrid.de.
Bericht vom ersten TextGrid-Fachbeiratstreffen
Im Rahmen des D-Grid-Treffens in Göttingen lud das TextGrid-Konsortium zum ersten Fachbeiratstreffen in die
Niedersächsische Staats- und Universitätsbibliothek Göttingen ein, um technisch wie organisatorisch den aktuellen Stand des Projekts vorzustellen und mit dem Fachbeirat über die Zielvorstellungen und ihre Realisierung zu diskutieren.
Höhepunkt der Technik-Diskussion war der erste öffentliche Funktionstest des zukünftigen TextGrid-Clients
"TextGridLab" in einem typischen geisteswissenschaftlichen Anwendungsszenario "Kommentierung eines Textes"
(gespeichert in Tübingen), unter Integration von dezentral im Netz verteilten Datenstrukturen (Metadaten von der SUB Göttingen, Lemmasuche in Wörterbüchern als Dienst an der Universität Trier). Weitere Diskussionspunkte betrafen Authentifizierung, Autorisierung, Metadaten, Interoperabilität und Fragen zur Benutzerschnittstelle.
Ein Kennzeichen der Geisteswissenschaften ist ihre Vielfalt, in jeder Hinsicht. Folglich beschäftigte sich die Diskussion organisatorischer Fragen vor allem mit dem "Community building" in den Geisteswissenschaften und mit allem, was damit zusammenhängt, z.B. einheitliche Datenformate, fachübergreifende Kooperation, generische Werkzeuge, Cluster von verlässlichen Langzeitrepositorien für qualitativ hochwertige Texte, Informationsmanagement und Schulung.
Nach Einschätzung des Fachbeirats hat das TextGrid-Projekt als erstes deutsches Projekt im Bereich der sich entwickelnden e-Humanities das Potential, den Weg für neue Methodologien und kollaboratives Arbeiten in den Geisteswissenschaften zu bahnen.
Weitere Informationen finden Sie auf der
Fachbeirats-Seite.
TextGrid wirkt an der Gestaltung des europäischen Projekts "Interedition" mit
Mit dem am 26.11.2007 bewilligten Projekt
Interedition aus der Förderlinie
COST wirkt TextGrid zentral an einem Kooperationsnetzwerk für die Interoperabilität und praktische Implementierung von textwissenschaftlichen Werkzeugen mit. Interedition (An Interoperable Supranational Infrastructure for Digital Editions) erstellt eine Roadmap für eine technische Infrastruktur für die Zusammenarbeit, die digitale Aufbereitung, das Editieren, Publizieren, Analysieren und Visualisieren von Material für die philologische Forschung.
Am Projekt sind Institutionen aus fünf europäischen Ländern beteiligt: das
Huygens Institute (KNAW; Koordination),
DANS,
Institute for Textual Scholarship and Electronic Editing, University of Birmingham,
Oxford Text Archive, die
Technische Universität Darmstadt, die
Niedersächsische Staats- und Universitätsbibliothek Göttingen,
CTB (KANTL),
University of Antwerp, dept. of literature studies,
l’Institut des Textes et Manuscrits Modernes.
Die Broschüre mit Porträts der einzelnen Aktionen können Sie
hier
herunterladen.
Weitere Informationen erhalten Sie auf der
Interedition-Homepage .
Ergebnis der Zwischenbegutachtung
Gemeinsam mit den anderen Projekten des D-Grid-Verbundes wurde die bisherige Arbeit des TextGrid-Konsortiums am 01. und 02. März durch eine vom BMBF berufene Kommission begutachtet. Mittlerweile liegen nun die Ergebnisse dieser Zwischenbegutachtung vor:
Insgesamt wurde TextGrid durch die Gutachterkommission als sehr gut beurteilt. Im Bereich der Geisteswissenschaften ist es bislang einzigartig und ein wichtiger Beitrag für die Grid-Community. Auch wurde angeregt, dass weitere geisteswissenschaftliche Pilotprojekte folgen mögen...
Veranstaltungsberichte
TEI Annual Members Meeting
Die diesjährige TEI-Konferenz fand vom 31.10.-02.11.2007 in Maryland (USA) statt. Das
Programm umfasste neben Vorträgen, Poster-Sessions, Präsentationen und Demo-Sessions auch Treffen von Interessengemeinschaften, Pre-Meeting-Workshops sowie die TEI-Hauptversammlung und Wahlen.
Die Tagung hat beiläufig auch die internationale Sichtbarkeit, die TextGrid erreicht hat, deutlich werden lassen. So lag den Tagungsunterlagen ein Bericht der
"American Council of Learned Societies Commission on Cyberinfrastructure for the Humanities and Social Sciences" bei, der Ende 2006 erschienen war. In Kapitel 3, das u.a. mit dem Abschnitt "Recommendations" abschließt, lautet die erste der acht Empfehlungen, in Grid-Infrastrukturen für Geistes- und Sozialwissenschaften als Gegenstand strategischer Priorität zu investieren.
In diesem Zusammenhang wird u.a. auf die Förderung von Grid-Projekten in Deutschland durch das
BMBF und auf
D-Grid eingegangen. Dabei wird explizit TextGrid erwähnt. TextGrid war auf dieser Veranstaltung mit zwei Beiträgen vertreten. So hielt Fotis Jannidis (TU Darmstadt) eine Keynote mit dem Titel
"TEI in a crystal ball", in dem er die eine Übersicht über die bisherige Entwicklung in TEI gab, Trends aufzeigte und versuchte, die zukünftige Entwicklung dieser Trends vorzuzeichnen.
Der Vortrag von Werner Wegstein (Universität Würzburg),
"TEI for the classroom", ging u.a. auf die in TextGrid entwickelten Formate wie etwa das "TextGrid TEI baseline format" vs. "project encoding" und deren Dokumentation (z.B. für Wörterbücher) ein. „Das Interesse daran ist beachtlich“, so Werner Wegstein, der gemeinsam mit dem Keynote-Speaker Fotis Jannidis viele Fragen zu TextGrid zu beantworten hatte. Beide sind mittlerweile mit einer Reihe neuer Kontakte nach Deutschland zurückgekehrt.- <philtag n=“6“>: Arbeitstreffen über Kodierungsverfahren für elektronische Texte
Auf dem Weg zum Datengrid für Geisteswissenschaftler
Bereits zum sechsten Mal veranstaltete das Kompetenzzentrum für EDV-Philologie am Institut für deutsche Philologie der Universität Würzburg einen <philtag>-Workshop. Das diesjährige internationale Arbeitstreffen zum Themenbereich ‚Elektronische Texte’ am 12. und 13. Oktober stand unter dem Motto „Text encoding: baseline & more”. Experten aus den Bereichen Philologie und Datenverarbeitung gingen der Frage nach, wie die international normsetzenden Kodierungsrichtlinien der ‚Text Encoding Initiative’ (
www.tei-c.org) anzuwenden sind. Diese Richtlinien
definieren Referenzsysteme für die unterschiedlichsten elektronischen
Texte und schaffen damit die Grundlage dafür, Texte in elektronischer
Form wie gedruckte Textausgaben zu erschließen, über Bibliotheken
öffentlich zugänglich zu machen und als kulturelles Erbe langfristig
zu sichern. In diesem Jahr beschäftigten sich die Teilnehmer
hauptsächlich mit Kodierungsproblemen von Wörterbüchern und
Texteditionen sowie den für die elektronische Kodierung erforderlichen
Werkzeugen. Denn auch die noch in Entwicklung befindliche
Grid-Technologie soll bereits jetzt in den Geisteswissenschaften
eingesetzt werden.
Die Diskussion eröffnete Lou Burnard (Oxford University Computing Services, European Editor der ‚TEI Guidelines’) mit einem Referat über den Entwicklungsstand der Version TEI P5. Als weiteren Schwerpunkt präsentierte Thorsten Vitt (Technische Universität Darmstadt) den Prototyp von ‚TextGridLab’, einen vom TextGrid-Konsortium entwickelten grid-fähigen Arbeitsplatz, der für die individuelle wie die gemeinschaftliche philologische Bearbeitung, Analyse, Annotation, Edition und Publikation von Textdaten in Philologie, Linguistik und den angrenzenden Wissenschaften konzipiert ist.
Im Rahmen des Workshops hielt Peter Robinson (Institute for Textual Scholarship and Electronic Editing, University of Birmingham) einen öffentlichen Vortrag über „Building Distributed Editions around Unified Identifiers.
In einer "Hands-On-Session" am Nachmittag, begleitet durch Laurent Romary (
Max Planck Digital Library) und Lou
Burnard, lernten die Teilnehmer, ein TEI5-Schema zu erstellen, zu
implementieren und weitere Möglichkeiten der Anpassung zu nutzen.
Diskussionsrunden zu weiteren Vorträgen aus den Bereichen der digitalen Edition und Wörterbuchcodierung rundeten die Tagung ab.
Das detaillierte Programm der Tagung finden Sie
hier. - DGI-Workshop zum Thema: Nachhaltigkeit im D-Grid
Der
vom
D-Grid Integrationsprojekt am 9. und 10. Oktober 2007 an der
Berlin-Brandenburgischen Akademie der Wissenschaften veranstaltete
Workshop erfreute sich reger Teilnahme. Neben Vertretern des DGI und
aller Community Grids waren auch Gutachter, Vertreter des
BMBF, der
DFG, des
DLR und internationale Experten anwesend.
Die Vertreter des Ministeriums (R. Jansen, H. Löwe) betonten die Zielvorgabe, Grid-Technologie langfristig für Wissenschaft, Industrie und Gesellschaft nutzbar zu machen, wiesen aber auch darauf hin, dass die D-Grid-Förderung zeitlich begrenzt ist und nach Ablauf der nächsten Förderphase ein nachhaltiger Betrieb im D-Grid gewährleistet sein muss. Hierfür muss eine Roadmap erstellt werden.
Für das DGI präsentierte Uwe Schwiegelshohn (Universität Dortmund) das Geschäftsmodell der zukünftigen D-Grid Support Einheit (DGSE) für den Betrieb der D-Grid-Kerninfrastruktur. Betrieb und Modifikation sollen in steter Rücksprache mit den Community Grids erfolgen. Als institutioneller Träger käme u.U. die Helmholtz-Gesellschaft in Betracht (Vortrag R. Maschuw, FZK).
Bei der Vorstellung der Geschäftsmodelle der einzelnen CGs wurde klar, dass, so unterschiedlich wie die Ausrichtung und die Zielgruppen der einzelnen CGs, auch deren Geschäftsmodelle und die Probleme sind, die auf dem Weg zu einem nachhhaltigen Betrieb bewältigt werden müssen. Ein kritische Rolle spielen hierbei auch die bestehenden Förderkonzepte, die normalerweise die Anschaffung und den Betrieb eigener Ressourcen (Hardware) vorsehen, nicht aber die Nutzung externer (Grid-)Ressourcen und Dienste. Der Zugriff auf Grid-Ressourcen/-Dienste wird für die Nutzer auf diese Weise erschwert. Als weiterer Hemmschuh könnten sich die im Zuge der Föderalismusreform erfolgten Änderungen im Antrags- bzw. Beschaffungswesen erweisen (W. Bröcker, DFG).TextGrid als Community Grid für die Geistes-/Textwissenschaften befindet sich in einer Pionier-Rolle. Andere Communities, insbesondere aus dem naturwissenschaftlichen Bereich, nutzen bereits seit Jahren ihre internationale Vernetzung. TextGrid baut diese Strukturen und Vernetzung von Grund auf neu auf. Die Schaffung und Erweiterung der Nutzerbasis spielt deshalb eineSchlüsselrolle im Nachhaltigkeitskonzept von TextGrid.
Abschließend referierte Dieter Kranzlmüller (Uni Linz) über die European Grid Initiative (EGI), die bestrebt ist, die nationalen Grid-Initiativen in einem gemeinsamen Framework kooperativ zu vernetzen. Hans E. Roosendaal (Uni Twente, NL) beleuchtete das Thema Nachhaltigkeit aus betriebswirtschaftlicher Sicht und moderierte die abschließende Diskussion.
Die Beiträge finden Sie
hier.
- II. Göttinger Grid-Seminar
Das Motto des diesjährigen Göttinger Grid-Seminars lautete: "Grid
zum Anfassen". Diesem Titel wurde die Veranstaltung durch die
aufgebauten Demo-Stationen der Projekte MediGrid, Instant-Grid und
TextGrid gerecht. So hatten die rund 60 Veranstaltungsteilnehmer, die
vorwiegend aus dem wissenschaftlichem Umfeld stammten, während der
Pausen die Gelegenheit, sich die einzelnen Community-Anwendungen
vorführen zu lassen oder auch aktiv auszuprobieren.
In den Vortragsteil führte Herr Klaus-Peter Mickel (DGI-Koordinator) mit einem Beitrag über "Grid-Anwendungen in Deutschland" ein (
Präsentation). Einen weiteren einführenden Vortrag zur "e-Infrastructure" hielt Laurent Romary (Direktor der MPDL,
Präsentation).
Danach folgten übergreifende und community-spezifische
Anwendungsbeispiele aus dem naturwissenschaftlichen, dem
lebenswissenschaftlichen und dem geisteswissenschaftlichen Bereich (die
einzelnen Präsentationen finden Sie
hier).
Seit kurzem ist die Göttinger Grid-Community um ein neues Mitglied
reicher: In Goettingen wird zur Zeit der Aufbau eines Tier-2 Zentrums
für das HEP-Grid betrieben. Geleitet wird dieses Projekt von Arnulf
Quadt, II. Physikalisches Institut der Georg-August-Universität
Göttingen. Die
Präsentation informiert Sie über Status und Pläne dieses Vorhabens.
Eine Podiumsdiskussion, in der ein reges Interesse an den Arbeiten der Göttinger Grid-Community deutlich wurde, rundete die Veranstaltung ab. Zum Abschluss ludt der Moderator, Prof. Dr. Ulrich Sax (Abteilung Medizinische Informatik,
MediGrid)
zur nächsten Veranstaltung ein: "Die besonders gut eingespielte
Zusammenarbeit innerhalb der Göttinger Grid-Projekte wird zukünftig
weitere Aktivitäten verknüpfen und ich möchte Sie bereits jetzt zu
unserem III. Göttinger Grid-Seminar 2008 einladen!" Das Programm und die Präsentationen finden
hier.
- I. D-Grid All Hands Meeting
Das erste Treffen aller Projektpartner der D-Grid-Initiative und
einiger Wissensvernetzungsprojekte vom 10. bis 12. September 2007 in
Göttingen diente dem Informationsaustausch innerhalb der Community und
wurde von den mehr als 220 Teilnehmern gern genutzt.
Als Keynote-Referent konnte Tony Hey (Microsoft Research) gewonnen werden, der die Schaffung einer weitläufigen Cyberinfrastruktur als Voraussetzung für das Aufkommen eines neuen Methodenparadigmas in den Wissenschaften bezeichnete.Nach einführenden Worten zur aktuellen D-Grid Infrastruktur von Wolfgang Gentzsch (D-Grid Koordinator) und Klaus-Peter Mickel (DGI-Koordinator) stellten sich im Laufe der Tagung die einzelnen Projekte jeweils mit Kurzvorträgen vor. Während der Pausen hatten alle D-Grid-I-Projekte Gelegenheit, ihre Arbeit auf Informationspostern und anhand von Demos zu präsentieren.
Darüber hinaus wurden am zweiten Veranstaltungstag Workshops zu spezifischen Fragestellungen abgehalten, in denen Fachleute technische Aspekte diskutierten und sich der Frage nach Synergiepotentialen der Einzelprojekte innerhalb der D-Grid-Initiative widmen konnten.
Zum Abschluss erörterten die Teilnehmer das Thema der Nachhaltigkeit ihrer Projekte und legten konkrete gemeinsame Pläne für den Ausbau der D-Grid-Infrastruktur in den kommenden Jahren dar.
TextGrid präsentierte im Rahmen des D-Grid All Hands Meeting eine erste Live-Demo des
TextGridLab, der integrierten Workbench des
TextGrid-Projektes.
Die Konferenz konnte dank der Förderung durch das BMBF realisiert werden. Die Agenda und nahezu alle der gehaltenen Vorträge finden Sie
hier.Die Publikation (Neuroth, Heike, Kerzel, Martina, Gentzsch, Wolfgang (Hg.)
Die D-Grid Initiative), die anlässlich dieser Veranstaltung erschienen ist, finden Sie
deutschsprachig hier und
englischsprachig hier.
Aktuelle Veröffentlichungen
• TextGrid Kerncodierung
– Ein Beitrag aus der AG TextFormate
Wozu Kerncodierungen?
Texte von Projekten, die in TextGrid veröffentlicht werden, sollen auf zwei verschiedene Weisen durchsuchbar sein:
1. eine projektspezifische Suche durchsucht nur Texte jeweils eines Projekts, die Projektmacher können jedoch Suchmasken und Ergebnisdarstellung auf die ganz spezifischen Besonderheiten ihres Projekts anpassen;
2. die TextGrid-übergreifende Suche bietet eine Suchmöglichkeit über alle in TextGrid veröffentlichten Texte hinweg. Für ersteres können die Projekte alle Freiheiten der TEI-Codierung (oder sogar darüberhinausgehende XML-Codierungen) nutzen. Für letzteres ist es jedoch nötig, die projektspezifischen Codierungen auf eine gemeinsame Kerncodierung abzubilden. Diese Abbildung wird durch einen Adaptor (etwa ein XSLT-Stylesheet) realisiert.
Beitrag lesen….
• Das Projekt "TextGrid. Modulare Plattform für verteilte und kooperative wissenschaftliche Textdatenverarbeitung - ein Community-Grid für die Geisteswissenschaften". Chancen und Perspektiven für eine neue Wissenschaftskultur in den Geisteswissenschaften.
Andrea Rapp. In: Jahrbuch der historischen Forschung in der Bundesrepublik Deutschland: Berichtsjahr 2006 / hrsg. von der Arbeitsgemeinschaft historischer Forschungseinrichtungen in der Bundesrepublik Deutschland.
München: Oldenbourg 2007, S. 61-68.
• e-Humanities - eine virtuelle Forschungsumgebung für die Geistes-, Kultur- und Sozialwissenschaften
Heike Neuroth, Andreas Aschenbrenner, Felix Lohmeier. In: Bibliothek. Forschung und Praxis, 1 (2008). Preprint.
Artikel lesen
Weitere Veröffentlichungen von und über TextGrid sind zu finden unter:
http://www.textgrid.de/index.php?id=berichte
Veranstaltungen, an denen TextGrid eine Beteiligung plant:
Edirom Musikedition: "Digitale Edition zwischen Experiment und Standardisierung", 6.-8.12.2007, Paderborn
3rd IEEE e-Science, 10.-13.12.2007, Bangalore Indien
3rd Digital Curation Conference, 11.-13.12.2007, Washington
Zwölfte internationale Tagung der Arbeitsgemeinschaft für germanistische Edition zum Thema "Materialität", 13.-16.2.2008, Berlin-Brandenburgischen Akademie (BBAW) in Berlin
Second IEEE International Conference on Digital Ecosystems and
Technologies, 26.–29.2.2008, Thailand
TextGrid Info
Haben Sie Fragen an das Projektteam? Dann senden Sie bitte eine Email an die folgende Adresse:
Der Newsletter wird von denTextGrid-Partnern kooperativ erstellt.
Sie können ihn auf der TextGrid-Homepage unter
Newsletter
abonnieren, bzw. sich davon abmelden. Dort haben Sie auch Zugriff auf alle früheren Newsletter.


