• CLARIN-D
  • WebLicht
  • Virtual Language Observatory
  • Exmaralda
  • ELAN
  • DWDS
  • ISOCAT
  • SPEECH FINDER
  • Wortschatz
  • COSMAS2

Aktuelles

CLARIN-D-Videokanal: WebMAUS Automatic Segmentation of Speech

Die Kollegen vom CLARIN-D-Zentrum BAS München haben ein Einführungsvideo zu ihrem Dienst WebMAUS produziert. Das Video kann auch bei Youtube im CLARIN-D-Videokanal angesehen werden.

 

 


WebAnno Annotationswerkzeug verfügbar

Eine Betaversion von WebAnno wurde auf Google Code unter http://code.google.com/p/webanno/ öffentlich verfügbar gemacht. Webanno ist ein flexibles, webbasiertes und visuell unterstütztes System für verteilte Annotationen, welches im Kontext des F-AG-7-Kurationsprojektes KP1 entwickelt wird. Das Werkzeug wird unter einer freien Lizenz (ASL 2.0) vertrieben und steht allen interessierten Nutzern zur Verfügung.

WebAnno Annotation

 

Weiterlesen

WebAnno bietet Annotationsprojektmanagement, frei konfigurierbare Tagsets und Management verschiedener Nutzerrollen. Mit Hilfe von Komponenten von brat (brat.nlplab.org/) werden Annotationen im Webbrowser visualisert und sind editierbar. WebAnno unterstützt beliebig lange Dokumente, austauschbare Import/Export Filter, den Kurationsprozess zwischen den Annotationen mehrerer Benutzer, und bald auch die Anbindung an Crowdsourcingplattformen. Momentan können mit WebAnno Wortarten, Namen, grammatische Dependenzen, Koreferenzketten und alle dazu strukturgleichen Annotationsarten annotiert werden. WebAnno benutzt Weblichts TCF als Austauschformat, und ist via REST-basierte Webservices in die CLARIN-D-Infrastruktur integriert.

WebAnno Curation

Referenz

Seid Muhie Yimam, Iryna Gurevych, Richard Eckart de Castilho and Chris Biemann. “WebAnno: A Flexible, Web-based and Visually Supported System for Distributed Annotations”. Demonstration paper, 51st Annual Meeting of the Association for Computational Linguistics (ACL 2013), Sofia, Bulgaria, August 2013. To appear.

 


Tagungsbericht DTA-/CLARIN-D-Konferenz und -Workshops: Historische Textkorpora für die Geistes- und Sozialwissenschaften. Fragestellungen und Nutzungsperspektiven erschienen

Ein ausführlicher Tagungsbericht von Martina Gödel (textloop, Hamburg) fasst die im Februar 2013 gemeinsam von CLARIN-D und dem Deutschen Textarchiv (DTA) organisierte Konferenz mit begleitenden Workshops zu den Themen "Historische Textkorpora für die Geistes- und Sozialwissenschaften. Fragestellungen und Nutzungsperspektiven" zusammen. Der erste der beiden begleitenden Workshops legte den Fokus auf die in CLARIN-D zur Verfügung stehenden Dienste zur Analyse von Sprachressourcen. Workshop 2 knüpfte an die Erfahrungen des Kurationsprojekts 1 der CLARIN-D-Facharbeitsgruppe 1 und des DTA-Erweiterungsmoduls DTAE an und vermittelte, auf welche Weise existierende oder neue Sprachressourcen mit den Hilfsmitteln des DTA CLARIN-D-konform aufbereitet oder erstellt werden können.

Weiterlesen

Die Vorträge der Konferenz thematisierten laufende Forschungen und Projekte zum Aufbau und zur Zusammensetzung historischer Textkorpora und führten anhand anschaulicher Beispiele in die praktische Arbeit mit diesen Korpora ein. Die Konferenzübersicht und Materialien zu einzelnen Vorträgen sind unter <www.deutschestextarchiv.de/doku/workshop2013> verfügbar.

Der Bericht ist im online-Portal H-Soz-u-Kult erschienen: Tagungsbericht Historische Textkorpora für die Geistes- und Sozialwissenschaften. Fragestellungen und Nutzungsperspektiven. 18.02.2013-19.02.2013, Berlin, in: H-Soz-u-Kult, 07.05.2013, <http://hsozkult.geschichte.hu-berlin.de/tagungsberichte/id=4791>.

 


Workshop "Texte digital: XML und TEI in der geisteswissenschaftlichen Praxis" (26. & 27. 04. 2013) an der Universität Stuttgart

Die eXtensible Markup Language – kurz: XML – hat sich seit ihrer Einführung Ende der 1990er Jahre als Standardformat für den Austausch von Daten sowie zur Auszeichnung digitaler Texte aller Art etabliert. Für Geisteswissenschaftler stellen die von der Text Encoding Initiative (TEI) ausgearbeiteten Richtlinien die sicherlich wichtigste Anwendung dar. So existieren Module zur digitalen Edition einschlägiger Texte verschiedener Gattungen. Aus entsprechend nachhaltig aufbereiteten Texten können z.B. Online- und Print-Publikationen abgeleitet werden. Der Workshop bietet zum einen die Gelegenheit, die Grundlagen von XML und TEI zu erlernen, zum anderen, die Probleme der Textauszeichnung, wie sie sich in der Forschungspraxis stellen, an einem Beispiel genauer zu diskutieren.

Programm

Freitag, 26.04.2013
Keplerstr. 17 (KII), Raum 17.16
09.30–13.00 Uhr / 14.30–18.00 Uhr

Kerstin Eckart (Stuttgart), Jens Stegmann (Stuttgart)

Einführung in XML und TEI

Der Kurs führt in die Grundlagen von XML und TEI ein und vermittelt anhand kleiner Übungseinheiten praktische Grundkenntnisse der Textkodierung in XML und des Dokumentenformats der TEI. Hierauf aufbauend soll auf XML-basierte Metadatenformate sowie aktuelle Entwicklungen bzgl. Anwendungen für die Digital Humanities im Kontext des Projekts CLARIN-D eingegangen werden.

Voraussetzung: internetfähiges Notebook mit Browser, einem Texteditor (z.B. Microsoft Editor/Notepad, Emacs etc.) und den XML-Editor xml copy editor (via http://xml-copy-editor.sourceforge.net/). Die Zahl der Teilnehmer ist auf 30 begrenzt.

 


 

Samstag, 27.04.2013
Keplerstr. 17 (KII), Raum 17.22
09.30–13.00 Uhr

PD Dr. Sonja Glauch (Erlangen), Jakub Šimek (Heidelberg), Philipp Vanscheidt (Trier)

TEI in der Diskussion

Wenn man als Geisteswissenschaftler mit XML/TEI arbeitet, befindet man sich in einer besonderen Situation: Die Texte, gerade wenn es ältere sind, sind höchst individuell, die Kodierungssprache, in die sie übersetzt werden müssen, ist dagegen wie jedes Regelwerk auf Allgemeingültigkeit angelegt. Wie man mit diesem Spannungsverhältnis umgehen kann, soll am Beispiel der Edition mittelhochdeutscher Texte (Minnesang, Thomasin) diskutiert werden. Dabei wird es um eher praktische Fragen genauso gehen wie um die ganz grundsätzliche, ob sich nämlich TEI für die historische Editionswissenschaft überhaupt eignet.

 


Kontakt und Information:

Prof. Dr. Manuel Braun
Institut für Literaturwissenschaft
Abt. Germanistische Mediävistik
Diese E-Mail-Adresse ist vor Spambots geschützt! Zur Anzeige muss JavaScript eingeschaltet sein!