Implementierung einer webbasierten Annotationsplattform für linguistische Annotationen (F-AG 7)


Das Kurationsprojekt zur Erstellung einer webbasierten Annotationsplattform für linguistische Annotationen wurde im Juni 2012 bewilligt. Inhaltlich verantwortlich sind Prof. Chris Biemann, Prof. Iryna Gurevych und Richard Eckart de Castilho (UKP Lab, Technische Universität Darmstadt). Die Implementierung wird von einem Mitarbeiter an der Technischen Universität Darmstadt geleistet. Ferner steht das Tübinger WebLicht-Team (Universität Tübingen) für die Integration der Annotationsplattform in die CLARIN-D Infrastruktur bereit.

Wir realisieren ein webbasiertes Tool, welches im Webbrowser ohne weiteres aufgerufen werden kann, und unterstützen Annotationen auf mehreren linguistischen Ebenen innerhalb derselben Umgebung. Ferner realisieren wir eine Anbindung an Crowdsourcingplattformen, um einfache Annotationsaufgaben schnell auf viele Annotatoren skalieren zu können. Die Annotationsplattform wird an die CLARIN-D Infrastruktur, und insbesondere an die in WebLicht integrierten Verarbeitungspipelines, interoperabel angebunden werden. Die Entwicklung des Annotationstools wird begleitet und inhaltlich unterstützt durch ein zweites Kurationsprojekt, das ‘best practices’ für linguistische Annotation verschiedener linguistische Ebenen für unterschiedliche Annotator-Zielgruppen ausarbeitet.

Diese Plattform adressiert alle Fachcommunitys, welche systematische Annotation von Textmaterial betreiben. Dies meint die Markierung mit einem geschlossenen Inventar an Eigenschaften, welche in Annotationsrichtlinien beschrieben sind. Dies betrifft vor allem die Fachcommunity der Computerlinguistik/Sprachtechnologie und der quantitativen Linguistik.


  • 01.09.2012 – 30.11.2013


Verantwortliche Institution

  • UKP Lab, Fachbereich Informatik, Technische Universität Darmstadt

Ausführende Mitarbeiter

  • Seid M. Yimam (100%), Technische Universität Darmstadt
  • Tübinger WebLicht Team (50%), Universität Tübingen


  • Hinrichs, Marie; Thomas Zastrow and Erhard Hinrichs (2010): WebLicht: Web-based LRT Services in a Distributed eScience Infrastructure. Proceedings of LREC 2010, Malta.
  • Stenetorp, Pontos; Sampo Pyysalo, Goran Topić, Tomoko Ohta, Sophia Ananiadou and Jun'ichi Tsujii (2012). brat: a Web-based Tool for NLP-Assisted Text Annotation. In Proceedings of the Demonstrations Session at EACL 2012, Avignon, France
  • Richard Eckart de Castilho and Sabine Bartsch and Iryna Gurevych (2012): CSniper - Annotation-by-query for non-canonical constructions in large corpora. Proceedings of the 50th Meeting of the Association for Computational Linguistics (ACL) 2012 (Demo section), Jeju, South Korea
  • Richard Eckart de Castilho and Iryna Gurevych (2009): DKPro-UGD: A Flexible Data-Cleansing Approach to Processing User-Generated Discourse. Proceedings of LINA CNRS UMR 6241, Nantes, France