CLARIN-D Blog

CLARIN-D Newsflash Januar 2020

Buchveröffentlichung des Deutschen Textarchivs

2019, zum Jubiläum, seines 250. Geburtstages, ist im Suhrkamp/Insel Verlag eine Nachschrift der ›Kosmos-Vorträge‹ Alexander von Humboldts in einer gedruckten Ausgabe, herausgegeben von Christian Kassung (Humboldt-Universität zu Berlin) und Christian Thomas (BBAW), erschienen. Mit diesem Manuskript der Henriette Kohlrausch, deren bislang unbekannte Verfasserschaft in diesem Band belegt und erstmals einer breiten Öffentlichkeit bekannt gemacht wurde, liegt somit die einzige bekannte Nachschrift der populären Vorträge in der Berliner Sing-Akademie in einer zuverlässigen, anhand der Handschrift geprüften Textfassung vor. Diese basiert auf der gemäß TEI-XML im DTA-Basisformat für Manuskripte (DTABf-M) annotierten Textgrundlage, die 2014/15 im »Hidden Kosmos«-Projekt erstellt und im Deutschen Textarchiv publiziert wurde.

Neue Ressourcen

Das Saarbrücker Kochbuch-Corpus (SaCoCo) kann jetzt unter einer freien Lizenz heruntergeladen werden.

Neue Services

Weiterlesen

BAS WebServices gewinnen Google Wissenschaftspreis in Höhe von $5000

Das CLARIN-D Zentrum Bayerisches Archiv für Sprachsignale (BAS) in München hat sich für ein Google Research Credit Grant beworben und sie wurden ausgezeichnet. Nutzende haben ab sofort mehr Rechenleistung für automatische Transkriptionen von audio-visuellen Sprachdaten zur Verfügung. Wir gratulieren Florian Schiel und seinen KollegInnen am BAS recht herzlich zur Verleihung des Google Wissenschaftspreises in Höhe von 5000 Dollar. Die Förderung hat am 1. Januar 2020 begonnen.

Weiterlesen

Erfolgreiche Abschlussveranstaltung der CLARIN-D Facharbeitsgruppen: Ein Abschied mit Wiedersehen!

Am 14. November 2019 fand die Abschlussveranstaltung der CLARIN-D Facharbeitsgruppen (F-AGs) in der Neuen Aula der Eberhard-Karls-Universität Tübingen statt. Mehr als 20 Teilnehmerinnen und Teilnehmer fanden sich in den repräsentativen Räumen der Universität zusammen, um noch einmal ein Resümee aus der jahrelangen Arbeit der F-AGs in CLARIN-D zu ziehen: Seit Projektbeginn arbeitet CLARIN-D eng mit Forschenden aus verschiedenen Wissenschaftsbereichen zusammen, weswegen es von Anfang an wichtig war, den Input durch Facharbeitsgruppen einzubeziehen. Diese dienten als Impulsgeber in ihren Communities und erstellten beispielsweise Kurationsprojekte. Bei der Abschlussveranstaltung der F-AGs war neben den Leitungen der F-AGs, den Mitarbeitenden und Ehemaligen, auch die Vertreterin des Projektträgers, Dr. Maria Böhme (DLR) anwesend, sowie die Leitungen der CLARIN-D Zentren. Während der Veranstaltung wurde einerseits ein Rückblick auf die geleistete Arbeit und andererseits ein Ausblick auf künftige Zusammenarbeit in anderen Kontexten gegeben: Die Arbeit der F-AGs ist so zentral wie auch “community driven” und die Bedarfe der Nutzenden wachsen stetig, sodass die F-AGs mit hoher Wahrscheinlichkeit an anderer Stelle und mit einem neuen Label fortgeführt werden.

Weiterlesen

CLARIN-D Newsflash Oktober 2019

Neue Ressourcen

Veröffentlichung des Korpus Digitale Sammlung Deutscher Kolonialismus im DTA/CLARIN-D-Repositorium (BBAW, Berlin). Im Rahmen eines zweijährigen, von der DFG geförderten Kooperationsprojekts der Staats- und Universitätsbibliothek (SuUB) Bremen, der Universitätsbibliothek Johann Christian Senckenberg in Frankfurt/Main und der Berlin-Brandenburgischen Akademie der Wissenschaften (BBAW) wurde eine umfassende digitale Sammlung zum Deutschen Kolonialismus erarbeitet. Das mehr als 1000 Titel mit ca. 240000 Seiten umfassende Korpus „Digitale Sammlung Deutscher Kolonialismus“ (DSDK) besteht aus Publikationen, die in der Zeit des deutschen Kaiserreichs und von den genannten Bibliotheken unter dem Aspekt Kolonialismus gesammelt wurden.

Mit der Veröffentlichung des Korpus werden nun der Kolonialismusforschung, der Koloniallinguistik sowie weiteren historisch-textbasiert arbeitenden Disziplinen – und nicht zuletzt auch der breiteren Öffentlichkeit – eine in dieser Form einzigartige Sammlung an Publikationen in Bild und Text digital zur Verfügung gestellt. Die digitale Erfassung erfolgte automatisch mit Methoden der Optical Character Recognition (OCR). Die Texte wurden zunächst innerhalb der Qualitätssicherungsumgebung des Deutschen Textarchivs, DTAQ, publiziert, wo die Bände nach freier Anmeldung zugänglich und bereits vollumfänglich nutzbar sind (URL: http://www.deutschestextarchiv.de/dtaq/book?q=dsdk)

Neue Services

Das Bayerische Archiv für Sprachsignale hat eine neue Version seines Webservices API freigeben (2.31).

Weiterlesen

Eine zehnjährige Erfolgsgeschichte

Text verfasst von Charlotte Hartungen, ins Deutsche übersetzt von Nathalie Walker.

Was im Jahr 2009 als 5-tägige Konferenz mit vier Workshops begann, hat dieses Jahr seinen 10. Geburtstag gefeiert. Wir sprechen von der European Summer University in Digital Humanities “Culture and Technology“ (ESU) an der Universität Leipzig.

Die ESU kann gut mithilfe von ein paar Zahlen und Daten zusammengefasst werden. Während der elf Tage, an denen die ESU stattfand (23.07.-02.08.2019), kamen 92 Student*innen, (Nachwuchs-)Wissenschaftler*innen, Angehörige verschiedener Universitäten und andere am breiten Feld der Digital Humanities Interessierte nach Leipzig, um an einem der elf Workshops, die dieses Jahr angeboten wurden, teilzunehmen. Von den elf Workshops wurden vier von CLARIN ERIC unterstützt und von Expert*innen aus dem CLARIN-D Umfeld durchgeführt.

Weiterlesen

Datenmanagement in den Geisteswissenschaften: Fortschritt in der Standardisierung von Metadatenformaten für sprachbezogene Forschungsdaten

Datenmanagement in den Geisteswissenschaften: Fortschritt in der Standardisierung von             Metadatenformaten für sprachbezogene Forschungsdaten

Im Juli 2019 hat die Internationale Organisation für Normung (ISO) einen neuen Standard veröffentlicht, der dazu beiträgt, sprachbezogene Forschungsdaten bei der Archivierung aussagekräftig und nachhaltig zu beschreiben. Der Standard ISO 24622-2 „Component Metadata Specification Language“ normiert dabei, wie man ein Schema für die Beschreibung angibt, so dass die Beschreibungen bedarfsgerecht erstellt werden können.

Weiterlesen

CLARIN-D Newsflash Juli 2019

Neue Ressourcen

GermaNet Logo

GermaNet Version 14.0 ist nun veröffentlicht. Neu bei dieser Version sind

  • Neue Synsets und ca. 10 000 neue lexikalische Einheiten für alle Wortklassen
  • Neue Relationen zwischen Synsets

Seit November 2017 wird der Briefwechsel Daniel Sanders' im Deutschen Textarchiv veröffentlicht. Derzeit stehen 182 Briefe im Volltext bereit. Insgesamt konnten 432 Briefe aus 41 Archiven nachgewiesen und verzeichnet werden. Mehr dazu im Blogpost zum Briefwechsel Daniel Sanders'.

Die Digitalisierung des zweiten Teils des Mannheimer Korpus Historischer Zeitungen und Zeitschriften (MKHZ2) wurde abgeschlossen. Dieses Digitalisierungsprojekt wurde in Kooperation der CLARIN-Zentren in Mannheim und Berlin durchgeführt. Die Ressourcen sind nun im Deutschen Textarchiv verfügbar. Weitere Informationen im Blogpost "Presseschau um die Jahrhundertwende".

Neue Services

Am Bayerischen Archiv für Sprachsignale (BAS) in München wurden zwei neue Webservices für die Öffentlichkeit freigeschaltet (WebServices 2.30): 'AnnotConv' ist ein Service, welcher Annotationsdateien mit alignierter Zeitinformation in andere Formate konvertiert. Der zweite Service 'AudioEnhance' erlaubt die Anwendung von verschiedenen Signalverarbeitungen auf Sprachsignale des Benutzer, z.B. Filterung, Kanalselektierung und -zusammenfassung, Rauschreduktion, Tonhöhen- und Längenmanipulation. URL: http://hdl.handle.net/11858/00-1779-0000-0028-421B-4

Weiterlesen

DHd Erfahrungsbericht: Rabea Kleymann (Universität Hamburg)

Wie prototypisch sind die Digital Humanities? Softwareprototypen auf der DHd 2019

 

„Stop apologizing for your prototypes!” [1], so lautet bereits im Jahr 2007 ein Appell von Lev Manovich an die Digital Humanities Community. Mit 14 Nennungen in unterschiedlichen Beitragsformaten [2] wurden auf der diesjährigen 6. Jahrestagung des Verbands Digital Humanities im deutschsprachigen Raum (DHd 2019) eine Vielzahl an Prototypen vorgestellt, die zugleich ein breites Spektrum an Verwendungskontexten zeigten. Ich habe mich auf der DHd 2019 einmal nach den Prototypen umgeschaut und gefragt: Was sind eigentlich Prototypen? Welche neuen Prototypen wurden vorgestellt?

 

Was unter einem Prototyp zu verstehen ist, wird in den Konferenzbeiträgen der DHd 2019 in vielfältiger Form beschrieben. So ist die Rede von ‚prototypischer Implementierung‘ oder ‚Umsetzung‘, ‚prototypischen Applikationen‘, ‚Prototypenstudie‘, ‚Software-Prototyp‘, ‚Softwarewerkzeuge‘ sowie ‚Prototyping‘ in den Varianten ‚Paper-Prototyping-Methode‘ und ‚Rapid Prototyping‘. Vorangestellt werden auch die Adjektive ‚experimentell‘, ‚digital‘ oder ‚interaktiv‘. Die Bezeichnungen überblickend deutet sich an, dass es sich um provisorische und experimentelle Formen von Software handelt, die in einer zeitlichen Relation zu einer Idee, die umgesetzt werden soll, und einem antizipierten Tool oder einer Infrastruktur stehen. Des Weiteren differenzieren die Beiträge ansatzweise zwischen nicht-digitalen und digitalen Prototyping, als ein iteratives Verfahren der Softwareentwicklung und Interfacegestaltung, und dem Softwareprototyp, als ein externalisiertes Ergebnis digitalgeisteswissenschaftlicher Forschung.

 

Basierend auf den Konferenzabstracts wurden insgesamt acht solcher Softwareprototypen in den drei Beitragsformaten Workshop, Vortrag und Posterpräsentation erwähnt oder vorgestellt. Zu nennen sind

 

-        eine interaktive 3D Webanwendung ‚Stadtmodell Dresden‘,

-        Text Broom, eine Anwendung zur Erkennung von potenziellen Verletzungen der Privatsphäre mit Hilfe einer Textverarbeitungspipeline,

-        eine 155 Bände umfassende digitale Repräsentation von Fontanes Handbibliothek visualisiert,

-        eine auf der Editions- und Forschungsplattform hallerNet als

Weiterlesen

CLARIN-D Newsflash Mai 2019

Mehr Informationen zu den Visualisierungen befinden sich hier: https://dhd2019.org/erkl%C3%A4rung-visualisierung/

Neue Services

Am Bayerischen Archiv für Sprachsignale (BAS) in München wurden zwei neue Webservices für die Öffentlichkeit freigeschaltet: 'Subtitle' ist ein frei verfügbarer Service, welcher automatisch Untertitel-Tracks für Videos erzeugt - in einer Pipeline zusammen mit automatischer Spracherkennung sogar ohne Transkript. 'Anonymizer' ist ein Service welcher Sprachsignale und zugehörige Annotationen anhand einer Lis te von Stichwörtern automatisch anonymisiert, d.h. alle Vorkommnisse eines Stichworts werden im Signal durch ein Rauschen maskiert und in allen Annotationen gelöscht bzw. durch ein definiertes Tag ersetzt . URL: http://hdl.handle.net/11858/00-1779-0000-0028-421B-4

CLARIN-D und DARIAH-DE bei DHd 2019 in Mainz und Frankfurt

Auf der DHd gab es einen gemeinsamen Infostand von CLARIN-D und DARIAH-DE.

CLARIN-D hat zusammen mit dem DHd Verband und DARIAH insgesamt neun Stipendien für NachwuchswissenschaftlerInnen vergeben. Die Erfahrungsberichte wurden im CLARIN-D Blog veröffentlicht.

DHd-Workshop zu "Qualitätsstandards und Interdisziplinarität in der Kuration audiovisueller (Sprach-)Daten", organisiert von Thomas Schmidt, Jonathan Blumtritt, Hanna Hedeland, Jan Gorisch, Felix Rau, Kai Wörner am 25./26.03.2019 in Mainz mit dem Vortrag "Vergleich der Transkription mit und ohne Spracherkennung."

Workshops und Schulungen

Vorstellung von CLARIN-D Werkzeugen und Services und Beratung für Projekte/Antragstellungen in Gießen (Zentrum für Medien und Interaktivität (ZMI)), Berlin (ZfL Berlin: Leibniz-Zentrum für Literatur- und Kulturforschung Berlin) und Braunschweig (Georg-Eckert-Institut – Leibniz-Institut für internationale Schulbuchforschung) (FAG 8: Geschichtswissenschaften)

"BAS Tutorial Tools and Services" auf der Jahrestagung der Italienischen Gesellschaft der Stimmwissenschaften (AISV) am 14.02.2019 in Arezzo

DHd Erfahrungsbericht: Enes Türkoglu (Universität Köln)

Ein Bericht über DHd2019

Es wäre nicht ungerecht zu sagen, dass Digital Humanities zuweilen einen ausgeprägten projektorientierten Charakter aufweisen. In ihrem Arbeitsalltag arbeiten die Digital HumanistInnen oft in eigenen Projektinseln. Sie beschäftigen sich mit fach- und projektspezifischen Fragestellungen und versuchen, Lösungs- und Forschungsansätze für die jeweiligen Projekte zu entwickeln und zu implementieren. Häufiger werden diese Projektinseln in einem spezifischen geisteswissenschaftlichen Fach verortet. Während immer mehr Digital Humanities Zentren begründet werden, um die unterschiedlichen Lösungs- und Forschungsansätze zu zentralisieren, arbeiten viele Digital Humanistinnen auf ihrer Insel dennoch in der Isolation. Es gibt eine gewisse Selbstverständlichkeit darüber, dass die geisteswissenschaftlichen Fragestellungen fachspezifisch sind und daher eigene Lösungsmethoden erfordern, unabhängig davon, dass sie oft ähnliche Technologien benutzen.

Abgesehen von der Diskussion, ob Digital Humanities Aktivitäten immer auf bestimmten Inseln stattfinden sollen, muss verstanden werden, dass das Arbeiten in der Isolation für Digital Humanistinnen gewisse Konsequenzen hat. Zum einen produzieren die Projektorientierung und die engen Rahmbedingungen eine Situation der definitorischen Problematik, welche die Identitätsbildung des Faches obstruiert, zum anderen kommt es häufiger vor, dass mehrere Digital Humanistinnen auf die gleichen Probleme in unterschiedlichen Fachkontexten stoßen, ohne zu wissen, dass das Problem nicht nur sie allein betrifft, und dass die Lösungen, wenn auch nicht generalisierbar und spiegelbildlich implementierbar, möglicherweise in pragmatisch-philosophischen Form auf einer anderen Insel schon erarbeitet worden sind (Thaller 2012).

Am Anfang meiner Forschung als Digital Humanist war es zumindest so, dass ich mich häufiger isoliert gefühlt habe, und das obwohl ich an der Universität zu Köln studiere, die für sich eine eHumanities-Tradition etabliert hat. Während man versucht, seine eigene Insel zu entschlüsseln, aber sich dabei auch bemüht, andere Inseln zu erforschen und deren Probleme, Herausforderungen und Lösungen zu verstehen, und man wiederum

Weiterlesen