Arkhangelskiy, T., et al. (2020): Evaluating and Assuring Research Data Quality for Audiovisual Annotated Language Data. In: Proceedings of CLARIN Annual Conference 2020. C. Navarretta and M. Eskevich (eds.): 131-135.
Arnold, D., et al. (2020): The CMDI Explorer. In: Proceedings of CLARIN Annual Conference 2020. C. Navarretta and M. Eskevich (eds.): 127-161.
Arnold, D., et al. (2020): Addressing Cha(lle)nges in Long-Term Archiving of Large Corpora. In: Proceedings of the LREC 2020 Workshop, Language Resources and Evaluation Conference, 11–16 May 2020, 8th Workshop on Challenges in the Management of Large Corpora (CMLC-8). P. Bànski, et al. (eds.). Paris, Paris: European Language Resources Association: 1-9.
Arnold, D., et al. (2020): Signposts for CLARIN. In: Proceedings of CLARIN Annual Conference 2020. C. Navarretta and M. Eskevich (eds.): 146-150.
Bański, P., et al. (eds.) (2020): Proceedings of the LREC 2020 Workshop, Language Resources and Evaluation Conference, 11–16 May 2020, 8th Workshop on Challenges in the Management of Large Corpora (CMLC-8). Paris, European Language Resources Association.
Bizzoni, Y., et al. (2020): How Human is Machine Translationese? Comparing Human and Machine Translations of Text and Speech. In: Proceedings The 17th International Workshop on Spoken Language Translation. ACL 17th IWSLT 2020.
Brandt, O., et al. (2020): Extending the CMDI Universe: Metadata for Bioinformatics Data. In: Proceedings of CLARIN Annual Conference 2020. C. Navarretta and M. Eskevich (eds.): 151-156.
CLARIN-D (2020): Interview with Eva Gredel and Yana Strakatova. In: Tour de CLARIN Volume 3. F. Darja and J. Lenardič (eds.): 61-67.
de Jong, F., et al. (2020): Interoperability in an Infrastructure Enabling Multidisciplinary Research: The case of CLARIN. In: Proceedings of the 12th International Conference on Language Resources and Evaluation (LREC). N. Calzolari, et al. (eds.). Paris, European Language Resources Association: 3406-3413.
De Kok, D. and N. Falk (2020a): Reproducible annotation services for WebLicht. In: Proceedings of CLARIN Annual Conference 2020. C. Navarretta and M. Eskevich (eds.): 88-92.
De Kok, D., et al. (2020b): sticker2: a Neural Syntax Annotator for Dutch and German. In: Proceedings of CLARIN Annual Conference 2020. C. Navarretta and M. Eskevich (eds.): 27-30.
Draxler C., et al. (2020a): A CLARIN Transcription Portal for Interview Data. In: Proceedings of the 12th Conference on Language Resources and Evaluation. Marseille, European Language Resources Association (ELRA): 3353-3359.
Dumont, S., Haaf, S. and Seifert, S. (Eds.): Encoding Correspondence. A Manual for Encoding Letters and Postcards in TEI-XML and DTABf. Berlin: Berlin-Brandenburgische Akademie der Wissenschaften 2019.
Eckart. T., et al. (2020): Usability and Accessibility of Bantu Language Dictionaries in the Digital Age: Mobile Access in an Open Environment. In: Proceedings of the first workshop on Resources for African Indigenous Languages. Marseille, European Language Resources Association (ELRA): 9-14.
Evert, S., et al. (2020): Corpus Query Lingua Franca part II: Ontology. In: Proceedings of the 12th International Conference on Language Resources and Evaluation (LREC), May 11-16, 2020. N. Calzolari, et al. (eds.). Paris, European Language Resources Association: 3346–3352.
Fankhauser, P., et al. (2020): Evaluating a Dependency Parser on DeReKo. In: Proceedings of the LREC 2020 Workshop, Language Resources and Evaluation Conference, 11-16 May 2020, 8th Workshop on Challenges in the Management of Large Corpora (CMLC-8). Paris, European Language Resources Association: 10-14.
Ferger, A. and D. Jettka (2020): Use cases of the ISO standard for transcription of spoken language in the project INEL. In: Proceedings of CLARIN Annual Conference 2020. C. Navarretta and M. Eskevich (eds.): 126-130.
Fischer, S., et al. (2020): The Royal Society Corpus 6.0: Providing 300+ Years of Scientific Writing for Humanistic Study. In: Proceedings of the 12th Language Resources and Evaluation Conference 2020: 794-802.
Fisseni, B. and T. Schmidt (2020): CLARIN Web Services for TEI-annotated Transcripts of Spoken Language. In: Selected Papers from the CLARIN Annual Conference 2019. Linköping Electronic Conference Proceedings 172: 12-22.
Gärtner, M. and K. Jung (2020): To Boldly Query What No One Has Annotated Before? The Frontiers of Corpus Querying. In: Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics: 630-6321, 10.18653/v1/2020.acl-main.562
Goldhahn, D., et al. (2020): Enriching and Increasing the Usability of Lexicographical Data for Less-Resourced Languages. In: Selected Papers from the CLARIN Annual Conference 2019, Linköping Electronic Conference Proceedings. 172: 4: 23-32.
Göttel, S. (2020): Digitalisierung, Aufbereitung und Annotation des Friedhofsregister der jüdischen Gemeinde zu Strelitz (1740–1923). In: Im Zentrum Sprache. Untersuchungen zur deutschen Sprache.
Hedeland, H. (2020): Providing Digital Infrastructure for Audio-Visual Linguistic Research Data with Diverse Usage Scenarios: Lessons Learnt. In: Special Issue 14th International Conference on Open Repositories 2019 – All The User Needs.
Hedeland, H. (2020): Towards Comprehensive Definitions of Data Quality for Audiovisual Annotated Language Resource. In: Proceedings of CLARIN Annual Conference 2020. C. Navarretta and M. Eskevich (eds.): 136-140.
Hedeland, H. and A. Ferger (2020): Towards Continuous Quality Control for Spoken Language Corpora. In: International Journal of Digital Curation (IJDC) 15(1).
Hinrichs, E. (2020): Introduction. In: Tour de CLARIN Volume 3. F. Darja and J. Lenardič (eds.): 48-50.
Hinrichs, M. and C. Draxler (2020): WebLicht und WebMaus. In: Tour de CLARIN Volume 3. F. Darja and J. Lenardič (eds.): 51-53.
Hinrichs, M., et al. (2020): Exploring and Visualizing Wordnet Data with GermaNet Rover. In: Proceedings of CLARIN Annual Conference 2020. C. Navarretta and M. Eskevich (eds.): 32-36.
Hug, M., et al. (2020): Über bereichernde Anreicherung. Wechselseitige Annotation von Dramen als Subkorpus der Digitalen Bibliothek zwischen, TGRep, GerDraCor und DTA. In: Im Zentrum Sprache. Untersuchungen zur deutschen Sprache.
Jurish, B. and M. Nieländer (2020): Using DiaCollo for historical research. In: Selected Papers from the CLARIN Annual Conference 2019. Linköping Electronic Conference Proceedings 172: 33-40.
Kamocki, P. (2020): When Size Matters. Legal Perspective(s) on N-grams. In: Proceedings of CLARIN Annual Conference 2020. C. Navarretta and M. Eskevich (eds.): 166-169.
Kamocki, P., et al. (2020): Liability of CLARIN Centres as Service Providers: What Changes with the New Directive on Copyright in the Digital Single Market? In: Selected Papers from the CLARIN Annual Conference 2019. K. Simov and M. Eskevich (eds.). Linköping, Linköping University Press: 48-52.
Kamocki, P. and M. Stauch (2020): Cover this data that I cannot see. In: Maschinelle Übersetzung für Übersetzungsprofis. J. Porsiel (ed.). Berlin, Weiterbildungs- und Fachverlagsgesellschaft: 42-57.
Kamocki, P. and A. Witt (2020): Privacy by Design and Language Resources. In: Proceedings of The 12th Language Resources and Evaluation Conference. Marseille, European Language Resources Association: 3423-3427.
Kamocki, P. and A. Witt (2020). Rechtliche Fragen bei der wissenschaftlichen Nutzung von Sprachdaten. Forschen in der Linguistik. Eine Methodeneinführung für das Germanistik-Studium. M. Beißwenger, L. Lemnitzer and C. Müller-Spitzer (eds.). Stuttgart, UTB.
Kamocki, P. (2020). Trust is Good, Control is Better? Control over Personal Data in Digital Humanities Research. In: S. Hawkins (Ed.), Access, Control, and Dissemination in Digital Humanities. London: Routledge.
Kelli, A., et al. (2020): CLARIN contractual framework for sharing language data. In: Proceedings of CLARIN Annual Conference 2020. C. Navarretta and M. Eskevich (eds.): 171-177.
Ketschik, N. and C. Thomas (2020): Ins Netz gegangen. Datenkuration im Deutschen Textarchiv am Beispiel der Meerwunder-Edition. In: Im Zentrum Sprache. Untersuchungen zur deutschen Sprache.
Ketzan, E. and P. Kamocki (forthcoming): Digital Humanities research under United States and European copyright laws: evolving frameworks and the thorny issue of technological protection measure. In: Access and Control in Digital Humanities. S. Hawkins (ed.), Routledge.
Kupietz, M., et al. (2020a). RKorAPClient: An R Package for Accessing the German Reference Corpus DeReKo via KorAP. In: Proceedings of The 12th Language Resources and Evaluation Conference. Marseille, European Language Resources Association: 7015-7021.
Kupietz, M., et al. (2020b). Recherche in Social-Media-Korpora mit KorAP. Deutsch in Sozialen Medien. Interaktiv, multimodal, vielfältig. Jahrbuch des Instituts für Deutsche Sprache 2019. (= Jahrbuch des Instituts für Deutsche Sprache 2019). Marx, K. et al. (eds.). Berlin/Boston: de Gruyter: 373-378.
Kupietz, M., et al. (2020c). Recent developments in the European Reference Corpus (EuReCo). In: Translating and Comparing Languages: Corpus-based Insights. Corpora and Language in Use. S. Granger and M.-A. Lefer (eds.): 257-273.
Kupietz, M. and C. Thomas (2020): German Reference Corpus (DeReKo) and German Text Archive (DTA). In: Tour de CLARIN Volume 3. F. Darja and J. Lenardič (eds.): 54-58.
Lüngen, H. and M. Kupietz (2020): IBK- und Social Media-Korpora am Leibniz-Institut für Deutsche Sprache. Deutsch in Sozialen Medien. Interaktiv, multimodal, vielfältig. In: Jahrbuch des Instituts für Deutsche Sprache 2019. H. Lobin, et al. (eds.). Berlin, Boston, de Gruyter: 319-344.
Nölte, M. and M. Mehlberg (2020): Digitizing University Libraries – evolving from full text providers to CLARIN contact points on campuses. In: Proceedings of CLARIN Annual Conference 2020. C. Navarretta and M. Eskevich (eds.): 117-120.
Paschen, L., et al. (2020): Building a Time-Aligned Cross-Linguistic Reference Corpus from Language Documentation Data (DoReCo). In: Proceedings of the 12th Conference on Language Resources and Evaluation (Marseille): 2657-2666.
Pfundt, A., et al. (2020): Word Usage in German Texts on Women’s Suffrage around 1900. Corpus Building, Lexical Documentation and the CLARIN-D Infrastructure. In: Selected Papers from the CLARIN Annual Conference 2019. Linköping Electronic Conference Proceedings 172 (2020). K. Simov and M. Eskevich (eds.): 108-118.
Sambale, H., et al. (2020): User Support for the Digital Humanities. In: Selected Papers from the CLARIN Annual Conference 2019. Linköping Electronic Conference Proceedings 172: 119-125.
Siegert, I., et al. (2020): Personal data protection and academia: GDPR issues and multi-modal data-collections “in the wild”. In: Online Journal of Applied Knowledge Management 7(1): 16-31.
Strakatova, Y., et al. (2020): All That Glitters is Not Gold: A Gold Standard of Adjective-Noun Collocations for German. In: Proceedings of the 12th Language Resources and Evaluation Conference: 4368-4378.
Teich, E. (2020): Language Variation and Change: A communicative perspective. Keynote at 42. Jahrestagung der Deutschen Gesellschaft für Sprachwissenschaft (DGfS). March 6, 2020.
Teich, E., et al. (2020): Translation, information theory and cognition. In: The Routledge Handbook of Translation and Cognition. F. Alves and A. L. Jakobsen (eds.). London, Routledge: n. pag.
Thomas, C. (2020a): Reduced to the Max – Pragmatisch-diplomatische Transkription mit dem DTA-Basisformat für Manuskripte. Bergische Universität Wuppertal, Workshop „Die (hyper)diplomatische Transkription und ihre Erkenntnispotentiale“ (6.-7. Februar 2020).
Thomas, C. (2020b): Die Korpora des Deutschen Textarchivs (DTA) und das DTA-Basisformat (DTABf) als Ausgangspunkt für Editionen – digital, hybrid und analog. Bergische Universität Wuppertal, Interdisziplinäres Zentrum für Editions- und Dokumentwissenschaft (IZED) der Bergischen Universität Wuppertal. Reihe "Lesen und lesen lassen. Edition und Korpus" (28. Januar 2020).
Thomas, C. (2020c): Das DTA macht Schule: Historische Drucke aus dem Deutschen Textarchiv als Grundlage für den Unterricht. Universität Hamburg. Seminar „Digitale Literaturwissenschaft und pädagogische Praxis“ (13. Januar 2020).
Thomas, C. (2020d): Alexander von Humboldts berühmte „Kosmos-Vorlesung“ an der Berliner Sing-Akademie (1827/28): von der digitalen zur Druckausgabe. In: CLARIN-D Blog
Walker, N. (2020): An Internship at CLARIN-D. In: Tour de CLARIN Volume 3. F. Darja and J. Lenardič (eds.): 59-60.
Wille, M. (2020): Einführung und Grundlagen für die Arbeit mit dem Referenzkorpus Deutsches Textarchiv (DTA) / Korpusanalysen mit dem DTA. YouTube-Channel des Textanalyseportals (TAP) der Universität Paderborn:
- Video 1: Deutsches Textarchiv Einführung,,
- Video 2: Deutsches Textarchiv Suchanfragen,,
- Video 3: Deutsches Textarchiv POS-Suchen,,
- Video 4: Deutsches Textarchiv Phrasensuchen,,
- Video 5: Deutsches Textarchiv Filter und Export,
Arkhangelskiy, T., et al. (2019): Uralic multimedia corpora: ISO/TEI corpus data in the project INEL. Proceedings of the Fifth International Workshop on Computational Linguistics for Uralic Languages. Tartu (Estland), Association for Computational Linguistics: 115-124.
Arnold, D., et al. (2019): Datenübernahmerichtlinien des Leibniz-Instituts für Deutsche Sprache. Version 24.01.2019. Mannheim, Leibniz-Institut für Deutsche Sprache.
Bizzoni, Y., et al. (2019): Grammar and meaning: Analysing the topology of diachronic word embeddings. Proceedings of the 1st International Workshop on Computational Approaches to Historical Language Change. N. Tahmasebi, L. Borin, A. Jatowt and Y. Xu. Florence (Italy), ACL: 175-185.
Bizzoni, Y., et al. (2019): Some steps towards the generation of diachronic WordNets. Proceedings of the 22nd Nordic Conference on Computational Linguistics (NoDaLiDa 19). M. Hartmann and B. Plank. Turku (Finland), ACL.
Bizzoni, Y. and E. Teich (2019): Analyzing variation in translation through neural semantic spaces. Proceedings of the 12th Workshop on Building and Using Comparable Corpora at Recent Advances in Natural Language Processing (RANLP 2019). S. Sharoff, P. Zweigenbaum and R. Rapp. Varna (Bulgaria).
Blessing, A., et al. (2019): An Environment for the Relational Annotation of Political Debates. Proceedings of ACL System Demonstrations. Florence (Italy), Association of Computational Linguistics.
Boenig, M. and S. Haaf (2019). Aggregating resources in CLARIN: FAIR corpora of historical newspapers in the German Text Archive. Proceedings of CLARIN Annual Conference 2019. K. Simov and M. Eskevich. Leipzig, CLARIN: 124-128.
Boenig, M (2019): „Das DTA-Basisformat im eigenen Projekt nutzen.“ Tutorial im Rahmen des KOSMOS-Workshop Text- und Musikedition im Zeitalter der Digitalisierung, Humboldt-Universität zu Berlin, 4.–6. April 2019.
Burckhardt, D., et al. (2019): "Distant Reading in der Zeitgeschichte. Möglichkeiten und Grenzen einer computergestützten Historischen Semantik am Beispiel der DDR-Presse." Zeithistorische Forschungen/Studies in Contemporary History 16(1): 177-196. DOI: 10.14765/zzf.dok-1345.
Collard, C., et al. (2019): "Interpreting into an SOV language: Memory and the position of the verb. A corpus-based comparative study of interpreted and non-mediated speech." META 63(3): 695-716.
Denisov, P. and N. T. Vu (2019): IMS-speech: A speech to text tool. Studientexte zur Sprachkommunikation: Elektronische Sprachsignalverarbeitung. P. Birkholz and S. Stone. Dresden: 170-177.
Diewald, N., et al. (2019): The KorAP user interface. Accessing CoRoLa via KorAP. On design, creation and use of the Reference Corpus of Contemporary Romanian and its analysis tools. CoRoLa, KorAP, DRuKoLA and EuReCo (=Revue Roumaine de Linguistique 64(3)). R. Cosma and M. Kupietz, Editura Academiei Române.
Dima, C., et al. (2019): No Word is an Island – A Transformation Weighting Model for Semantic Composition. Transactions of the Association for Computational Linguistics 7: 437-451.
Draxler, C. and J. Trouvain (2019): On principles of phonetic data archiving – from paelo-phonetics to modern speech data management. Proceedings of the 3rd International Workshop on History of Speech Communication Research. M. Pucher, J. Trouvain and C. Lozo. Vienna, TUDPress: 41-47.
Eckart, T., et al. (2019): Translation-based Dictionary Alignment for Under-resourced Bantu Languages. Second Conference on Language Data and Knowledge (LDK 2019) (=OpenAccess Series in Informatics (OASIcs) 70). M. Eskevich, G. De Melo, C. Fäth et al. Dagstuhl (Germany), Schloss Dagstuhl, Leibniz-Zentrum für Informatik: 17:1-17:11.
Falenska, A. and J. Kuhn (2019): The (non-)utility of structural features in BiLSTM-based dependency parsers. Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics. Florence (Italy), Association for Computational Linguistics: 117-128.
Fallucchi, F. and E. W. De Luca (2019): Connecting and Mapping LOD and CMDI Through Knowledge Organization. Metadata and Semantic Research 2018. E. Garoufallou, F. Sartori, R. Siatri and M. Zervas. Limassol (Cyprus), Springer. 846: 291-301. DOI: 10.1007/978-3-030-14401-2_27.
Fallucchi, F., et al. (2019): Creating CMDI-Profiles for Textbook Resources. Metadata and Semantic Research 2018. E. Garoufallou, F. Sartori, R. Siatri and M. Zervas. Limassol (Cyprus), Springer. 846: 302-314. DOI: 10.1007/978-3-030-14401-2_28.
Fankhauser, P. and M. Kupietz (2019): Analyzing domain specific word embeddings for a large corpus of contemporary German. International Corpus Linguistics Conference. Cardiff (Wales).
Ferger, A. and H. Hedeland (2019): Technological and Methodological Aspects of Research Data Quality Control. CL-Postersession, 41. Jahrestagung der Deutschen Gesellschaft für Sprachwissenschaft. Bremen (Germany).
Fiechter, B., et al. (2019): Presseschau um die Jahrhundertwende: Neue historische Zeitungen im DTA. Im Zentrum Sprache: Untersuchungen zur deutschen Sprache in Geschichte und Gegenwart.
Fischer, F., et al. (2019): The best of three worlds: Mutual enhancement of corpora of dramatic texts (GerDraCor, German Text Archive, TextGrid Repository). Proceedings of CLARIN Annual Conference 2019. K. Simov and M. Eskevich. Leipzig, CLARIN: 97-103.
Fischer, P., et al. (2019): Association Metrics in Neural Transition-Based Dependency Parsing. Proceedings of the Fifth International Conference on Dependency Linguistics (Depling, SyntaxFest 2019). Paris, Association for Computational Linguistics: 181-189.
Fischer, S. and E. Teich (2019): More complex or just more diverse? Capturing diachronic linguistic variation. 41. Jahrestagung der Deutschen Gesellschaft für Sprachwissenschaft (DGfS).
Fisseni, B. and T. Schmidt (2019): CLARIN Web Services for TEI-annotated Transcripts of Spoken Language. Proceedings of the CLARIN Annual Conference 2019. K. Simov and M. Eskevich. Leipzig, CLARIN.
Göttel, S. (2019): Immer noch gilt: Nur im Wörterbuch steht „Erfolg“ vor „Fleiß“ – Briefwechsel Daniel Sanders. Im Zentrum Sprache. Untersuchungen zur deutschen Sprache.
Goldhahn, D., et al. (2019): Enriching Lexicographical Data for Lesser Resourced Languages: A Use Case. Proceedings of CLARIN Annual Conference 2019. K. Simov and M. Eskevich. Leipzig (Germany), CLARIN: 5-8.
Gredel, E. (2019): "Wikipedaktik: Kollaborative Sachlexikographie als Lehr- und Lerngegenstand im Deutschunterricht." Lexicographica 34(1): 37-65.
Gredel, E., et al. (2019): "Linguistische Wikipedistik." Zeitschrift für germanistische Linguistik 46(3): 480-493.
Haaf, S. (2019): Neues Forschungsprojekt „Die Evolution von komplexen Textmustern“. Im Zentrum Sprache. Untersuchungen zur deutschen Sprache.
Hätty, A., et al. (2019): A gold standard for incorporating meaning shifts into term extraction. Proceedings of the Eighth Joint Conference on Lexical and Computational Semantics (*SEM 2019). R. Mihalcea, E. Shutova, L.-W. Ku, K. Evang and S. Poria, Association for Computational Linguistics: 1-8.
Haunss, S., et al. (2019): Supporting Discourse Network Analysis through Machine Learning for Claim Detection and Classification. Proceedings of the 4th European Conference on Social Networks. Zürich (Switzerland).
Hedeland, H. (2019): Qualitätsstandards und Nachnutzungspotenzial gesprochener und multimodaler Korpora. GAL Sektionentagung 2019. Halle (Saale).
Hedeland, H. (2019): Developing technical infrastructure and services for diverse usage scenarios based on multimedial linguistic data. Open Repositories 2019. Hamburg (Germany).
Hedeland, H. (2019): Anwendbarkeit und Angemessenheit verschiedener Qualitätsstandards bei verschiedenen Typen audiovisueller Sprachdaten. 6. Jahrestagung der Digital Humanities im deutschsprachigen Raum (DHd 2019). Mainz/Frankfurt (Germany).
Hedeland, H. and A. Ferger (2019): Towards Continuous Quality Control for Spoken Language Corpora. 14th International Digital Curation Conference (IDCC19). Melbourne (Australia).
Hedeland, H., et al. (2019): Das Hamburger Zentrum für Sprachkorpora. Postersession, GAL Sektionentagung 2019. Halle (Saale).
Hedeland, H., et al. (2019): Nutzersupport in digitalen Forschungsinfrastrukturen für die Geistes- und Sozialwissenschaften. Postersession, GAL Sektionentagung 2019. Halle (Saale).
Hedeland, H., et al. (2019): Annotation gesprochener Daten mit WebAnno-MM. Postersession, 6. Jahrestagung der Digital Humanities im deutschsprachigen Raum (DHd 2019). Mainz/Frankfurt (Germany).
Hinrichs, E., et al. (2019): "Language technology for digital humanities: introduction to the special issue." Language Resources and Evaluation 53(4): 559-563. DOI: 10.1007/s10579-019-09482-4.
Jung, K. and M. Gärtner (2019): Approaches to Sustainable Process Metadata. Proceedings of CLARIN Annual Conference 2019. K. Simov and M. Eskevich. Leipzig, CLARIN: 93-96.
Jung, K., et al. (2019): Fine-GRAINed Process Metadata. Metadata and Semantic Research. MTSR 2019. (=Communications in Computer and Information Science, vol 1057). E. Garoufallou, F. Fallucchi and E. William de Luca, Springer, Cham.
Jurish, B. and M. Nieländer (2019): Using DiaCollo for historical research. Proceedings of CLARIN Annual Conference 2019. K. Simov and M. Eskevich: 40-43.
Juzek, T. S., et al. (2019): Annotation quality assessment and error correction in diachronic corpora: Combining pattern-based and machine learning approaches. 52nd Annual Meeting of the Societas Linguistica Europaea. O. Spevak. Leipzig (Germany): 668.
Juzek, T. S., et al. (2019): Challenges of parsing a historical corpus of Scientific English. Historical Corpora and Variation. Cagliari (Italy).
Kamocki, P., et al. (2019): Liability of CLARIN Centres as Service Providers: What Changes with the New Directive on Copyright in the Digital Single Market? Proceedings of the CLARIN Annual Conference 2019. K. Simov and M. Eskevich. Leipzig, CLARIN.
Karakanta, A., et al. (2019): Detecting linguistic variation in translated vs. interpreted texts using relative entropy. 49th Poznan Linguistic Meeting, Linguistics: Between science and humanities. An overview of contributing disciplines and research agendas, Book of Abstracts.
Kassung, C. and Thomas, C. (2019): Alexander von Humboldt, Henriette Kohlrausch: Die Kosmos-Vorlesung an der Berliner Sing-Akademie. Buchpräsentation im Rahmen des Alexander-von-Humboldttags 2019 an der Berlin-Brandenburgische Akademie der Wissenschaften (BBAW). L.I.S.A. Wissenschaftsportal Gerda Henkel Stiftung,
Ketzan, E. and P. Kamocki (fortrthcoming): Digital Humanities research under United States and European copyright laws: evolving frameworks and the thorny issue of technological protection measure. Access and Control in Digital Humanities. S. Hawkins and R. Mann, Routledge.
Krielke, P., et al. (2019): System and use of wh-relativizers in 200 years of English scientific writing. Proceedings of the 10th International Corpus Linguistics Conference. Cardiff (Wales, UK).
Kügler, F., et al. (2019): Annotation of German Intonation: DIMA Compared with other Annotation Systems. Proceedings of the 19th International Congress of Phonetic Sciences. S. Calhoun, P. Escudero, M. Tabain and P. Warren. Melbourne (Australia).
Kuhn, J. (2019): "Computational text analysis within the Humanities: How to combine working practices from the contributing fields?" Language Resources and Evaluation 53(4): 565-602. DOI: 10.1007/s10579-019-09459-3.
Kupietz, M., et al. (2019): The DRuKoLA project. On design, creation and use of of the Reference Corpus of Contemporary Romanian and its analysis tools. CoRoLa, KorAP, DRuKoLA and EuReCo. (=Revue Roumaine de Linguistique, 64(3)). R. Cosma and M. Kupietz, Editura Academiei Române.
Kupietz, M., et al. (2019): Neues von KorAP. Neues vom heutigen Deutsch. Empirisch – methodisch – theoretisch. Jahrbuch des Instituts für Deutsche Sprache 2018. (= Jahrbuch des Instituts für Deutsche Sprache 2018). L. M. Eichinger and A. Plewnia. Berlin/Boston, De Gruyter: 345-349.
Kupietz, M., et al. (2019): What’s New in EuReCo? Interoperability, Comparable Corpora, Licensing. Proceedings of the International Corpus Linguistics Conference 2019 Workshop "Challenges in the Management of Large Corpora (CMLC-7)", 22nd of July. P. Bański, A. Barbaresi, H. Biber et al. Mannheim, Leibniz-Institut für die Deutsche Sprache: 33-39.
Menzel, K. (2019): Scientific eponyms throughout the history of English scholarly journal articles. ICHLL10, 10th International Conference on Historical Lexicography and Lexicology (ICHLL). Leeuwarden/Ljouwert.
Menzel, K. (2019): Daltonian atoms, Steiner's curve and Voltaic sparks – the role of eponymous terms in a diachronic corpus of English scientific writing. 41. Jahrestagung der Deutschen Gesellschaft für Sprachwissenschaft (DGfS). Bremen (Germany).
Menzel, K. and E. Teich (2019): Medical discourse across 300 years: insights from the Royal Society Corpus. 2nd International Conference on Historical Medical Discourse (CHIMED-2). Helsinki (Finland).
Müller, L., et al. (2019): The Null Results Portal. Metadata and Semantic Research. MTSR 2019. Communications in Computer and Information Science, vol 1057. E. Garoufallou, F. Fallucchi and E. W. De Luca, Springer, Cham. DOI: 10.1007/978-3-030-36599-8_36
Niebling, F., et al. (2019): Integration of Services for Software Development in DH: A Case Study of Image Classification using Convolutional Neural Networks. INFORMATIK 2019: 50 Jahre Gesellschaft für Informatik – Informatik für Gesellschaft (Workshop Beiträge). C. Draude, M. Lange and B. Sick. Bonn, Gesellschaft für Informatik e.V.: 163-168.
Padó, S., et al. (2019): Who Sides With Whom? Towards Computational Construction of Discourse Networks for Political Debates. Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics. A. Korhonen, D. Traum and L. Màrquez. Florence (Italy), Association for Computational Linguistics: 2841-2847.
Pfundt, A., et al. (2019): Research Data of a PhD Thesis Project in the CLARIN-D Infrastructure. “Texts of the First Women’s Movement” / “Texte der ersten Frauenbewebung (TdeF)” as Part of the German Text Archive. Proceedings of CLARIN Annual Conference 2019. K. Simov and M. Eskevich: 155-158.
Pirinen, T. A., et al. (2019): User Support for the Digital Humanities. CLARIN Annual Conference 2019. Leipzig (Germany).
Pohlmann, J. (2019): "Eintauchen in die Komplexität der Tech-Blog-Sphäre." Im Zentrum Sprache: Untersuchungen zur deutschen Sprache in Geschichte und Gegenwart
Pohlmann, J. and A. Barbaresi (2019): Diving Into The Complexities Of The Tech Blog Sphere. Digital Humanities 2019, ADHO. Utrecht (Netherlands).
Prell, M. (2019): Neues DTAE-Korpus startet mit Frauenbriefen des frühen 18. Jahrhunderts. Im Zentrum Sprache. Untersuchungen zur deutschen Sprache.
Remus, S., et al. (2019): WebAnno-MM: EXMARaLDA meets WebAnno. Selected Papers from the CLARIN Annual Conference 2018. Pisa (Italy): 166-176.
Riedl, M., et al. (2019): Clustering-Based Article Identification in Historical Newspapers. Proceedings of the 3rd Joint SIGHUM Workshop on Computational Linguistics for Cultural Heritage, Social Sciences, Humanities and Literature. B. Alex, S. Degaetano-Ortlieb, A. Kazantseva, N. Reiter and S. Szpakowicz. Minneapolis (USA), Association for Computational Linguistics: 12-17.
Sahami, S. and T. Eckart (2019): Just-In-Time Delivery for NLP Services in a Web-Service-Based IT Infrastructure. Workshop NLP-adapt: Adaptive Workflow Management for NLP Data Processing at ADAPTIVE 2019: The Eleventh International Conference on Adaptive and Self-Adaptive Systems and Applications. N. Abchiche-Mimouni, S. Herold, M. Schindler et al. Venice (Italy), International Academy, Research, and Industry Association (IARIA).
Schlechtweg, D., et al. (2019): A wind of change: Detecting and evaluating lexical semantic change across times and domains. Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics. A. Korhonen, D. Traum and L. Màrquez. Florence (Italy), Association for Computational Linguistics: 732-746.
Teich, E. (2019): Corpus-Driven Investigation of Language Use, Variation and Change – Resources, Models, Tools.CLARIN Annual Conference 2019. Leipzig (Germany).
Thomas, C. (2019). “You Can’t Put Your Arms Around a Memory: The Multiple Versions of Alexander von Humboldt’s ‘Kosmos-Lectures’ (1827/28).” Versioning Cultural Objects (=Schriften des Institut für Dokumentologie und Editorik 13). R. Bleier and S. M. Winslow. Norderstedt, Books on Demand.
Thomas, C. (2019a): „[…] so sind doch die Fortschritte in der Kenntniß des Himmels von allen die Bedeutendsten.“ – Stellenwert und Funktion der Astronomie in Alexander von Humboldts ‚Kosmos-Vorträgen‘ (Berlin, 1827/28). Eröffnungsvortrag „Babelsberger Sternennächte“, Leibniz-Institut für Astrophysik Potsdam (AIP), 17. Oktober 2019.
Thomas, C. (2019b): CLARIN-D/CLARIAH-DE – „Digital-Humanities-Tools“ und weitere Angebote für „Scholarly Makerspaces“ in Bibliotheken. Vortrag auf dem Workshop „Scholarly Makerspaces – Bibliotheken als Vermittlungsplattform für Digital-Humanities-Tools“, Humboldt-Universität zu Berlin, 27. Februar 2019. [Abstract]
Thomas, C. (2019c): Angebote und Erwartungen aus den ‚Digital Humanities‘ an Forschung und Archive. Vortrag auf dem Workshop „Digitale Angebote für die Stadt- und Planungsgeschichte“, Leibniz-Institut für Raumbezogene Sozialforschung, Erkner, 21. Februar 2019.
Trippel, T. and C. Zinn (2019): Describing Research Data with CMDI – Challenges to Establish Contact with Linked Open Data. Development of Linguistic Linked Open Data Resources. A. Pareja-Lora, M. Blume, B. C. Lust and C. Chiarcos. Cambridge, MA, MIT-Press: 99-114.
Trippel, T. and C. Zinn (2019): "Lessons learned: on the challenges of migrating a research data repository from a research institution to a university library." Language Resources and Evaluation. DOI: 10.1007/s10579-019-09474-4.
van den Heuvel, H., et al. (2019): A Transcription Portal for Oral History Research and Beyond. Proceedings of Digital Humanities 2019. A. van Cranenburgh and C. Koolen. Utrecht.
von Humboldt, A. and H. Kohlrausch (2019 [1827/28]): Die Kosmos-Vorlesung an der Berliner Sing-Akademie. C. Kassung and C. Thomas. Berlin, Insel-Verlag.
Wynne, M. (2019): "Natural Language Processing for Historical Documents – A Workshop Report." Im Zentrum Sprache: Untersuchungen zur deutschen Sprache in Geschichte und Gegenwart.
Yu, X., et al. (2019): IMSurReal: IMS at the Surface Realization Shared Task 2019. Proceedings of the 2nd Workshop on Multilingual Surface Realisation (MSR 2019). Hong Kong, Association for Computational Linguistics: 50-58.
Yu, X., et al. (2019):Head-First Linearization with Tree-Structured Representation. Proceedings of the 12th International Conference on Natural Language Generation. K. van Deemter, C. Lin and H. Takamura. Tokyo (Japan), Association for Computational Linguistics: 279-289.
Zeroual, I., et al. (2019): OSIAN: Open Source International Arabic News Corpus – Preparation and Integration into the CLARIN-infrastructure. Proceedings of The Fourth Arabic Natural Language Processing Workshop (WANLP 2019). W. El-Hajj, L. H. Belguith, F. Bougares et al. Florence (Italy), Association for Computational Linguistics: 175-182.
Bánski, P.; Witt, A. (2018): Complex Data Structures. In: Jannidis, F.; Flanders, J.: The shape of Data in Digital Humanities. Modeling Texts and Text-based Resources. .
Bánski, P., et al. (2018): Challanges in the Management of Large Corpora (CMLC-6). LREC 2018 Workshop Miyazaki, Japan, Paris: European language resources association (ELRA). Verfügbar unter:
Bánski, P. et al. (2018): Lightweight Grammatical Annotation in the TEI: New Perspectives. In: Proceedings of the Eleventh International Conference on Language Resources and Evaluation (LREC 2018), 7.-12. Mai 2018, Miyazaki (Jp), S. 1795–1802. Verfügbar unter:
Batinić, D.; Schmidt T. (2018): Reconstruction of separable particle verbs in a corpus of spoken German. Language technologies for the challenges of the digital age. 27th International Conference, GSCL 2017 Berlin, Germany, September , 2017. Proceedings. G. Rehm and T. Declerck. Berlin, Germany: 13 – 14. Verfügbar unter:
Blätte, A. ; Blessing, A. (2018): The GermaParl Corpus of Parliamentary Protocols. In N. C. (C. chair), K. Choukri, C. Cieri, T. Declerck, S. Goggi, K. Hasida, H. Isahara, B. Maegaard, J. Mariani, H. Mazo, A. Moreno, J. Odijk, S. Piperidis & T. Tokunaga (eds.), Proceedings of the Eleventh International Conference on Language Resources and Evaluation (LREC 2018), May 7-12, 2018, Miyazaki, Japan: European Language Resources Association (ELRA). ISBN: 979-10-95546-00-9. Verfügbar unter:
Blessing, A. ; Kuczera, A (2018): NLP meets RegNLP meets Regesta Imperii. Book of Abstracts -- Digital Humanities im deutschsprachigen Raum, March, Cologne, Germany. Verfügbar unter:
Blumtritt, J., et al. (2018): "Forschungsdatenmanagement in den Geisteswissenschaften an der Universität zu Köln." Das Offene Bibliotheksjournal 5(3): 104-117. Verfügbar unter:
Bosch, S., et al. (2018): Preparation and Usage of Xhosa Lexicographical Data for a Multilingual, Federated Environment. In: Proceedings of the 11th International Conference on Language Resources and Evaluation (LREC 2018), Miyazaki (Japan).
Bubenhofer, N.; Kupietz, M. (2018): Visualisierung Sprachlicher Daten. Visual Linguistica - Praxis - Tools, Heidelberg: Heidelberg University Publishing. Verfügbar unter:
Cosma, R. ; Kupietz, M. (2018): Von Schienen, Zügen und Linguistischen Fragestellungen. Germanistische Sprachwissenschaft um 2020. H. Lobin, R. Schneider and A. Witt, Berlin/Boston: deGruyter 2018: 199-218. Verfügbar unter:
Degaetano-Ortlieb, S. (2018). Stylistic Variation over 200 Years of Court Proceedings According to Gender and Social Class. Proceedings of the 2nd Workshop on Stylistic Variation collocated with NAACL HLT 2018. New Orleans, USA.
Degaetano-Ortlieb, S.; Teich E. (2018): Using relative entropy for detection and analysis of periods of diachronic linguistic change. Proceedings of the 2nd Joint SIGHUM Workshop on Computational Linguistics for Cultural Heritage, Social Sciences, Humanities and Literature at COLING 2018. SantaFe, NM, USA: 22-33.
Draxler, Chr.; Schiel, F. (2018): Moderne phonetische Datenbanken. In: Kupietz M.; Schmidt Th.; Plewnia A.; Witt, A. (eds.): Korpuslinguistik, Germanistische Sprachwissenschaft um 2020, Band 5. Berlin Boston: Walter de Gruyter, S. 179 - 208.
Draxler, Chr. ; Trouvain, J. (2018): The New Kid on the Block – Zur Rolle des Datenarchivars bei Sprachdatensammlungen. In: Tagungsband der 14. Phonetik und Phonologie-Konferenz in Wien, Österreich.
Eckart, K. ; Gärtner, M. ; Kuhn, J. ; Schweitzer, K. (2018): Nützlich und nutzbar für die linguistische Forschung: Sprachtechnologische Infrastruktur. In: Lobin, H. / Schneider, R. / Witt, A. (ed.): Digitale Infrastrukturen für die germanistische Forschung. de Gruyter. 115-148.
Eckart, T.; Gradl T. (2018): Combining Metadata Infrastructures: Working on a Metadata Federation between DARIAH-DE and CLARIN. DARIAH-DE Grand Tour 2018, Darmstadt, Germany. Verfügbar unter:
Eckart, T., et al. (2018): Using Linked Data Techniques for Creating an IsiXhosa Lexical Resource - a Collaborative Approach. CLARIN Annual Conference 2018. Pisa, Italy. Verfügbar unter:
Erdmann, D. and Thomas, C. (2018): „Wenn ich Zeit und Ruhe hätte, etwas vernünftiges zu schreiben“. Zur Neuedition von Humboldts Journal der Englandreise 1790 in der edition humboldt digital. Vortrag im Rahmen des Alexander-von-Humboldttags 2019 an der Berlin-Brandenburgische Akademie der Wissenschaften (BBAW). L.I.S.A. Wissenschaftsportal Gerda Henkel Stiftung,
Fischer, S., et al. (2018): Using Topic Modelling to Explore Authorsâ™ Research Fields in a Corpus of Historical Scientific English. Proceedings of DH 2018. Mexico City, Mexico. Verfügbar unter:
Gärtner, M. ; Kuhn, J. (2018): A Lightweight Modeling Middleware for Corpus Processing. In N. C. (C. chair), K. Choukri, C. Cieri, T. Declerck, S. Goggi, K. Hasida, H. Isahara, B. Maegaard, J. Mariani, H. Mazo, A. Moreno, J. Odijk, S. Piperidis & T. Tokunaga (eds.), Proceedings of the Eleventh International Conference on Language Resources and Evaluation (LREC 2018), May 7-12, 2018, Miyazaki, Japan: European Language Resources Association (ELRA). ISBN: 979-10-95546-00-9. Verfügbar unter:
Geyken, A.; Haaf, S. (2018): Integration heterogener historischer Textkorpora in das Deutsche Textarchiv. Strategien der Anlagerung und Perspektiven der Nachnutzung. In: Gessinger, J. / Redder, A. / Schmitz, U. Osnabrücker Beiträge zur Sprachtheorie 92. S.175-192.
Geyken, A., et al. (2018): Das Deutsche Textarchiv als Forschungsplattform für historische Daten in CLARIN. In: Lobin, H. / Schneider, R. / Witt, A. Germanistische Sprachwissenschaft um 2020. 6: 219-248. Verfügbar unter:
Gius, E. ; Reiter, N.; Strötgen, J. ; Willand, M. (2018): SANTA: Systematische Analyse Narrativer Texte durch Annotation. Digital Humanities im Deutschsprachigen Raum, February, Cologne, Germany. Verfügbar unter:
Goosen, T., Haaf, S., Windhouwer, M. (2018): Metadata curation efforts in a nutshell. Vortrag im Rahmen des CLARIN Centre Meeting, Utrecht (NL), 4. Juni 2018. Folien
Haaf, S. (2018a): Text+Berg im Deutschen Textarchiv. Vortrag im Rahmen des Abschlussworkshops zum Projekt „Text+Berg digital“. Zürich, 14./15.6.2018. Folien
Haaf, S. (2018b): Das DTA-Basisformat zur Erzeugung interoperabler Korpusdaten: Stand und aktuelle Entwicklungen. Vortrag im Rahmen des <philtag n="15"/>, Universität Würzburg, 10. April 2018.
Hamann, A.M.; Richarz, K.: „Die Zeichen der Zeit – sind digital.“ In: Im Zentrum Sprache, 5. November 2018. Verfügbar unter:
Hedeland, H. et al.(2018): "Introducing the CLARIN Knowledge Centre for Linguistic Diversity and Language Documentation" In: Proceedings of the Eleventh International Conference on Language Resources and Evaluation (LREC 2018), 7-12 May 2018, Miyazaki, Japan. Verfügbar unter:
Hiebert, M., et al. (2018): Deutsche Geschichte Digital: Ergebnisse der TEI-Konvertierung und Integration in Pilotprojekten. DHd 2018, Kritik der digitalen Vernunft, Konferenzabstracts. G. Vogeler: 371-373. Verfügbar unter:
Hinrichs, E., et al. (2018): Bridging the LAPPS Grid and CLARIN. Proceedings of the Eleventh International Conference on Language Resources and Evaluation (LREC 2018). H. Mazo and Asuncion Moreno and Jan Odijk and Stelios Piperidis and Takenobu Tokunaga, European Language Resources Association (ELRA). Verfügbar unter:
Hinrichs E., Trippel T., et al. (2018): Gute Forschungsdaten, bessere Forschung: wie Forschung durch Forschungsdatenmanagement unterstützt wird. Book of Abstracts -- Digital Humanities im deutschsprachigen Raum, March, Cologne, Germany. Verfügbar unter:
Jurish, Bryan (2018): Diachronic Collocations and Genre. In R. J. Whitt (Hrsg.), Diachronic Corpora, Genre, and Language Change: Book of Abstracts, (Nottingham, 8.–9. April, 2016), S. 22–24, 2016. Verfügbar unter:
Kamocki, P., et al. (2018): CLARIN Legal Information Platformen und Legal Helpdesk. DHd 2018, Kritik der digitalen Vernunft, Konferenzabstracts. G. Vogeler: 365-366. Verfügbar unter:
Kamocki, P., et al. (2018): Das neue "Gesetz zur Angleichung des Urheberrechts an die aktuellen Erfordernisse der Wissensgesellschaft" und seine Auswirkungen für Digital Humanities. DHd 2018, Kritik der digitalen Vernunft, Konferenzabstracts. G. Vogeler: 156-158. Verfügbar unter:
Kamocki, P., et al. (2018): New Exceptions for Text and Data Mining and their possible Impact on the CLARIN Infrastructure. Proceedings of the CLARIN Annual Conference 2018. I. Skadin and M. Eskevich: 39-42. Verfügbar unter:
Kamocki, P., et al. (2018): Towards a CLARIN Data Protection Code of Conduct. Proceedings of the CLARIN Annual Conference 2018. I. Skadin and M. Eskevich: 49-52. Verfügbar unter:
Karakanta, A., et al. (2018): Preserving Metadata from Parliamentary Debates. Proceedings of the Eleventh International Conference on Language Resources and Evaluation (LREC 2018). F. Darja, M. Eskevich and F. d. Jong. Paris, France, European Language Resources Association (ELRA). Verfügbar unter:
Kelli, A., et al. (2018): Processing personal data without the consent of the data subject for the development and use of language resources. Proceedings of the CLARIN Annual Conference 2018. I. Skadin and M. Eskevich: 43-48. Verfügbar unter:
Kermes, H. und E. Teich (2018). Generische Infrastruktur und spezifische Forschung: Angebote und Lösungen. H. Lobin, R. Schneider and A. Witt (eds.): Digitale Infrastrukturen für die germanistische Forschung. Berlin/Boston 2018: 91-114.
Kisler Th.; Schiel, F. (2018): MOCCA: Measure of Confidence for Corpus Analysis - Automatic Reliability Check of Transcript and Automatic Segmentation. Proceedings of the 11th International Conference on Language Resources and Evaluation (LREC 2018). Verfügbar unter:
Kuhn, J. 2018: Computerlinguistische Textanalyse in der Literaturwissenschaft? – oder: „The Importance of Being Earnest“ bei quantitativen Untersuchungen. In: Bernhard, T. ; Willand, M. ; Richter, S. ; Albrecht, A. (ed.): Quantitative Ansätze in den Literatur- und Geisteswissenschaften. Systematische und historische Perspektiven. de Gruyter. 11-44. Verfügbar unter:
Kuhn, J. in preparation. Empirie – Beschreibung – Interpretation: über den Platz von Computermodellen in den hermeneutisch-historisch orientierten Literaturwissenschaften. Accepted to appear in: Jannidis, f. (ed.): Digitale Literaturwissenschaft, Metzler/Springer.
Kupietz, M.; Thomas, S. (2018): Korpuslinguistik. Germanistische Sprachwissenschaft um 2020, Berlin/Boston: de Gruyter, 2018. 5.
Kupietz, M.; Schmidt, T. (2018): Einleitung. Germanistische Sprachwissenschaft um 2020. M. Kupietz and T. Schmidt. Berlin/Boston: deGruyter, 2018: 1-4.
Kupietz, M., et al. (2018): How to Get the Computation Near the Data: Improving data accessibility to, and reusability of analysis functions in corpus query platforms. Proceedings of the LREC 2018 Workshop “Challenges in the Management of Large Corpora (CMLC-6)”. Verfügbar unter:
Kupietz, M., et al. (2018): Recent developments in the European Reference Corpus (EuReCo). Using Corpora in Contrastive and Translation Studies Conference (5th edition). Book of Abstract. . S. Granger, M.-A. Lefer, A. d. S. Penha and L. Marion. 5: 101-103.
Kupietz, M., et al. (2018): The German Reference Corpus DeReKo: New Developments – New Opportunities. Proceedings of the Eleventh International Conference on Language Resources and Evaluation (LREC 2018). N. Calzolari, K. Choukri, C. Cieri et al., Miyazaki: European Language Resources Association (ELRA), 2018: 4353-4360. Verfügbar unter:
Kuthy, K. D. ; Reiter, N.; Riester, A. (2018): QUD-Based Annotation of Discourse Structure and Information Structure: Tool and Evaluation. In N. C. (C. chair), K. Choukri, C. Cieri, T. Declerck, S. Goggi, K. Hasida, H. Isahara, B. Maegaard, J. Mariani, H. Mazo, A. Moreno, J. Odijk, S. Piperidis & T. Tokunaga (eds.), Proceedings of the Eleventh International Conference on Language Resources and Evaluation (LREC 2018), May, Paris, France : European Language Resources Association (ELRA) . ISBN: 979-10-95546-00-9. Verfügbar unter:
Lasch, A. (2018): Handwerkszeug 4: Konstruktionsgrammatik mit den Korpora des DWDS & DTA (CLARIN-D). YouTube-Channel von Alexander Lasch,
Lobin, H., et al. (2018): Digitale Infrastrukturen für die germanistische Forschung. Germanistische Sprachwissenschaft um 2020, Berlin/Boston: deGruyter, 2018. 6.
Lobin, H., et al. (2018): Organisierte Kooperativität – Forschungsinfrastrukturen für die germanistische Linguistik. Germanistische Sprachwissenschaft um 2020 H. Lobin, R. Schneider and A. Witt, Berlin/Boston: deGruyter, 2018. 6: 4-8.
Lüngen, H. ; Herzberg, L. (2018): Reply Relations in CMC: Types and Annotation. Proceedings of the 6th Conference on Computer-Mediated Communication (CMC) and Social Media Corpora (CMC-corpora 2018). R. Vandekerckhove, D. Fišer and L. Hilte. Antwerp, Antwerpen: University of Antwerp: 49-52.
Meliss, M., et al. (2018): Creating a List of Headwords for a Lexical Resource of Spoken German. Proceedings of the XVIII EURALEX International Congress. Lexicography in Global Contexts. J. Čibej, V. Gorjanc, I. Kosem and S. Krek. Ljubljana, Ljubljana: Znanstvenazaložba: 1009-1016. Verfügbar unter:
Mell, R. M. ; Diewald, N. (2018): Korpusbasierte Diskursrecherche mit Rabbid. OPAL - Online publizierte Arbeiten zur Linguistik 2/2018. R. M. Mell and E. Gredel, Mannheim: Institut für Deutsche Sprache. 2/2018: 18-30. Verfügbar unter:
Perkuhn, R. (2018): Kontexte und ihre Verteilung. Germanistische Sprachwissenschaft um 2020. S. Engelberg, H. Kämper and P. Storjohann, Boston: deGruyter. 2: 61-90.
Perkuhn, R. ; Kupietz, M. (2018): Visualisierung als aufmerksamkeitsleitendes Instrument bei der Analyse sehr großer Korpora. Visualisierung sprachlicher Daten. Visual Linguistics – Praxis – Tools. N. Bubenhofer and M. Kupietz, Heidelberg University Publishing: 63-90. Verfügbar unter:
Pirinen, T. (2018): "Rule-based machine-translation between Finnish and German" In: 40. Jahrestagung der Deutschen Gesellschaft für Sprachwissenschaft, CL-Postersession
Pirinen, T. et al. (eds., 2018): Proceedings of the fourth international workshop for computational linguistics of Uralic languages held in Helsinki. Verfügbar unter:
Plewnia, A. ; Witt, A. (2018): Germanistische Sprachwissenschaft um 2020, Berlin/Boston: deGruyter, 2018.
Poerner, N; Schiel F. (2018): A Web Service for Pre-segmenting Very Long Transcribed Speech Recordings In: Proceedings of the 11th International Conference on Language Resources and Evaluation (LREC 2018). Verfügbar unter:
Remus, S. et al. (2018): "EXMARaLDA meets WebAnno" In: Proceedings of the CLARIN Annual Conference 2018 (CAC 2018), 8-10 October 2018, Pisa, Italy. Verfügbar unter:
Rösiger, I. ; Schulz, S. ; Reiter, N. (2018): Towards Coreference for Literary Text: Analyzing Domain-Specific Phenomena. Proceedings of the Second Joint SIGHUM Workshop on Computational Linguistics for Cultural Heritage, Social Sciences, Humanities and Literature (p./pp. 129-138 ), August 2018. Verfügbar unter:
Sahami, S. ; Eckart, T. (2018): Capabilities and Costs of Running NLP Pipeline on Big Data Resources in Service-Oriented Architectures. 40th Annual Conference of the German Linguistic Society. Stuttgart, Germany. Verfügbar unter:
Sahami, S., et al. (2018): Using Apache Spark on Hadoop Clusters as Backend for WebLicht Processing Pipelines. CLARIN Annual Conference 2018. Pisa, Italy. Verfügbar unter:
Schmidt, T. (2018): Gesprächskorpora. Germanistische Sprachwissenschaft um 2020. M. Kupietz and T. Schmidt, Berlin/Boston: deGruyter. 5: 209-230.
Schmidt, T.; Westpfahl S. (2018): A Study on Gaps and Syntactic Boundaries in Spoken Interaction. Proceedings of the 14th Conference on Natural Language Processing (KONVENS 2018). A. Barbaresi, H. Biber, F. Neubarth and R. Osswald. Vienna, Austria, Vienna: Austrian Academy of Sciences: 40-49. Verfügbar unter:
Suchowolec, K., et al. (2018): Bridging standards development and infrastructure usage by means of concept graphs: the liaison of CLARIN and ISO TC37SC4 in practice. Proceedings of the LREC 2018 Workshop. The 3rd workshop on visualization as added value in the development, use and evaluation of language resources (VisLR III). M. El-Assady, A. Hautli-Janisz and V. Lyding. Miyazaki, Japan, Paris: European Language Resources Association (ELRA): 1-8. Verfügbar unter:
Teich, E. ; Fankhauser, P. (2018): Linguistic and computational modeling in language science. In: Jannidis, F. / Flanders, J.: The shape of Data.
Thomas, C. (2018a): Pass the Baton, Libraries! Traversing the Research Data Lifecycle with a Clear Distribution of Roles, Rostock, 4. Oktober 2018. Vortrag auf dem 14th Bibliotheca Baltica Symposium, 4. bis 5. Oktober 2018, Universität Rostock. [Folien]
Thomas, C. (2018b): Aufbereiten, Auffinden und Auswerten von Forschungsdaten: Standards und Best Practices im Rahmen von CLARIN-D, Münster, 28. September 2018. Beitrag zum Panel „Für Skeptiker und Enthusiasten: Was ist und zu welchem Ende nutzt das ‚Digitale‘ in den Geschichtswissenschaften?“, auf dem 52. Historikertag in Münster, 25. bis 28. September 2018, Universität Münster.
Thomas, C. (2018c): Digitale Editionen als geisteswissenschaftliche Forschungsdaten: Präparieren, Prozessieren, Analysieren aus fachwissenschaftlicher Perspektive. Vortrag beim Workshop „Postdigital Humanities“, 20. Workshop des Instituts für Allgemeine und Vergleichende Literaturwissenschaft, 13. Juli 2018, Ludwig-Maximilians-Universität München.
Thomas, C. (2018d): Digitalisierung, Kuratierung und Nachnutzung von „Dinglers polytechnischem Journal“. Vortrag beim Praxisworkshop „Gute Daten? Schlechte Daten? Aspekte der Datenqualität in der (Nach-) Nutzung geisteswissenschaftlicher Forschungsdaten“ des Interdisziplinären Forschungsverbunds Digital Humanities in Berlin (if|DH|b), 12. Juli 2018, BBAW, Berlin.
Thomas, C. (2018e): "Einheit und/als/in der Vielheit"? Die Edition der Nachschriften zu Alexander von Humboldts Kosmos-Vorträgen im „digitalen Paradigma“. Vortrag im Rahmen der Tagung „Kolleghefte und Kollegnachschriften – Problem und Aufgabe der philosophischen Edition“ der Arbeitsgemeinschaft philosophischer Editionen bei der Deutsche Gesellschaft für Philosophie e.V. (DGPhil), Bergische Universität Wuppertal, 7.–8.2.2018.
Thomas, C. (2018f): Mehr als schöne Bilder: Erschließung von Digitalisaten historischer Drucke und Handschriften für die Forschung. Vortrag im Rahmen der Ringvorlesung „Kultur – Wissen – Schaff(t)en“ der Universitätsbibliothek Rostock, Universität Rostock, 24. Januar 2018.
Toscano R. ; Trippel, T. ; Mache, B. (2018): Kooperation von CLARIN-D und DARIAH DE. DARIAH DE Grand Tour 2018, Darmstadt, Germany. Verfügbar unter:
Toscano R. ; Trippel T. (2018): CLARIN-D: eine Forschungsinfrastruktur für die sprachbasierte Forschung in den Geistes-und Sozialwissenschaften. DARIAH DE Grand Tour 2018, Darmstadt, Germany. Verfügbar unter:
Trippel, T. (2018): Datenmanagement – Gegenstand und Dienst der Computerlinguistik. 40th Annual Conference of the German Linguistic Society. Stuttgart, Germany. Verfügbar unter:
Trippel T. ; van Berchum M. (2018): CLARIN Data Management Activities in the PARTHENOS Context. CLARIN Annual Conference 2018. Pisa, Italy. Verfügbar unter:
Vagnini-Holbl, C.; Draxler, Chr. (2018): Comparing acoustic measurements from manual and automatic segmentations. In: Tagungsband der 14. Phonetik und Phonologie-Konferenz in Wien, Österreich.
Westpfahl, S.; Gorisch, J. (2018): A Syntax-Based Scheme for the Annotation and Segmentation of German Spoken Language Interactions. Proceedings of the Joint Workshop on Linguistic Annotation, Multiword Expressions and Constructions (LAW-MWE-CxG-2018@COLING2018). Santa Fe, New Mexico, USA, Stroudsburg, PA: Association for Computational Linguistics: 109-120. Verfügbar unter:
Wiegand, F. et al. (2018): Recherchieren, Arbeiten und Publizieren im Deutschen Textarchiv: ein Praxisbericht. In: Zeitschrift für Germanistische Linguistik 46.1 (2018), S. 147–161. DOI: 10.1515/zgl-2018-0009
Zitzelsberger, Th.; Schiel, F. (2018): Evaluation of Automatic Formant Trackers In: Proceedings of the 11th International Conference on Language Resources and Evaluation (LREC 2018). Verfügbar unter:
Bański, P.; Kupietz, M.; Lüngen, H.; Rayson, P.; Biber, H.; Breiteneder, E.; Clematide, S.; Mariani, J.; Stevenson, M.; Sick, T. (2017): The Workshop on Challenges in the Management of Large Corpora and Big Data and Natural Language Processing (CMLC-5+BigNLP) 2017 including the papers from the Web-as-Corpus (WAC-XI) guest section. of. Mannheim: Institut für Deutsche Sprache. Verfügbar unter
Barbaresi, A. (2017): Tagungsbericht: Workshop zu digitaler Kommunikation. Im Zentrum Sprache. Untersuchungen zur deutschen Sprache.
Blessing, A. ; Echelmeyer, N. ; John, M. ; Reiter, N. ( 2017 ): An End-to-end Environment for Research Question-Driven Entity Extraction and Network Analysis . Proceedings of the Joint SIGHUM Workshop on Computational Linguistics for Cultural Heritage, Social Sciences, Humanities and Literature (p./pp. 57-67 ), August , Vancouver, Canada : Association for Computational Linguistics. Verfügbar unter:
Cassidy, S.; Schmidt, T. (2017): Tools for Multimodal Annotation. In: N. Ide & J. Pustejovsky (Eds.), Handbook of Linguistic Annotation. 209-227. Springer Dordrecht.
Eckart, T.; Goldhahn, D.; Quasthoff, U. (2017): Using Corpus Query Engines for Facilitating Lexicographical Analysis of African LanguagesWorkshop of the African Association for Lexicography (AFRILEX), CLASA 2017, Grahamstown, Grahamstown, SA.
Eckart, T.; Goosen, T.; Haaf, S.; Hedeland, H.; Ohren, O.; van Uytvanck, D.; Windhouwer, M. (2017): Component Metadata Infrastructure Best Practices for CLARINCLARIN Annual Conference 2017 in Budapest, Hungary, Budapest, Hungary. Verfügbar unter
Eckart, T.; Gradl, T. (2017): Working towards a Metadata Federation of CLARIN and DARIAH-DE CLARIN Annual Conference 2017 in Budapest, Hungary, Budapest, Hungary. Verfügbar unter
Fürbacher, M.; Varádi, T.; Witt, A. (2017): Digitale Forschungsinfrastrukturen: Ihre Nutzung durch die Mitglieder der Europäischen Föderation nationaler Sprachinstitutionen. In: J. E. Dąbrowska-Burkhardt, Ludwig M./Itakura, Uta (Ed.), Deutsch: lokal – regional – global. Festschrift für Gerhard Stickel zum 80. Geburtstag (= Studien zur Deutschen Sprache 77). 103-114. Narr, 2017, Tübingen.
Geyken, A. (2017): Das Deutsche Textarchiv: Korpuszusammensetzung, Korpuserstellung und Interoperabilität. Vortrag im Rahmen der Tagung: Referenzkorpora des Deutschen: Konzepte, Methoden, Perspektiven im Rahmen des DFG-Projekts „Syntaktische Grundstrukturen des Neuhochdeutschen. Zur grammatischen Fundierung eines Referenzkorpus Neuhochdeutsch“, Rauischholzhausen, 27.–29. September 2017.
Gloning, T. (2017): Ernst Jünger Publizistik der 1920er Jahre. Befunde zum Wortgebrauchsprofil. In: A. Benedetti & L. Hagestedt (Eds.), Totalität als Faszination: Systematisierung des Heterogenen im Werk Ernst Jüngers. De Gruyter, Berlin.
Göttel, S. (2017): Nur im Wörterbuch steht „Erfolg“ vor „Fleiß“: Briefwechsel Daniel Sanders. Im Zentrum Sprache. Untersuchungen zur deutschen Sprache.
Grallert, T.; Tiepmar, J.; Eckart, T.; Goldhahn, D.; Kuras, C. (2017): Digital Muqtabas CTS Integration in CLARINCLARIN Annual Conference 2017 in Budapest, Hungary, Budapest, Hungary. Verfügbar unter
Haaf, S. (2017): Das DTA-Basisformat in neuem Gewand. In Im Zentrum Sprache. Untersuchungen zur deutschen Sprache. Verfügbar unter
Haaf, S.; Thomas, C. (2017): Enabling the Encoding of Manuscripts within the DTABf. Extensions and Modularization of the Format. In: Journal of the Text Encoding Initiative (jTEI) 10. Verfügbar unter
Haaf, S. et al. (2017): Zum Reformationsjubiläum: Luthers Septembertestament (1522) im DTA. Im Zentrum Sprache. Untersuchungen zur deutschen Sprache.
Harrington, J.; Schiel, F. (2017): /u/-fronting and agent-based modelling - The relationship between the origin and spread of sound change. In: Language, 93 (2), 414-445. Verfügbar unter
Herold, A. and Ast, H. (2017): Bericht von der ESU 2017 – Workshop: From Print and Manuscript to Electronic Version. Im Zentrum Sprache. Untersuchungen zur deutschen Sprache.
Hinrichs, E.; Trippel, T. (2017): CLARIN-D: eine Forschungsinfrastruktur für die sprachbasierte Forschung in den Geistes- und Sozialwissenschaften. In: Bibliothek - Forschung und Praxis, 1 (41). Verfügbar unter
Jurish, B., Nieländer, M. and Werneke, T. (2017): DiaCollo and the Grenzboten. Vortrag an der Tagung Genealogies of Knowledge I: Translating Political and Scientific Thought across Time and Space, University of Manchester, 7.-9. Dezember, 2017.
Jurish, B., and Werneke, T. (2017): Visualizing Semantic Change with DiaCollo. Vortrag beim 20th International Conference on Conceptual History: Concepts in the World: Politics, Knowledge, and Time, Universität Oslo, 23. September 2017.
Kermes, H. ; Teich, E. (2017): Average surprisal of parts-of-speech. Proceedings of the 2017 Teach4DH Workshop on Teaching NLP for DH collocated with GSCL 2017
Kisler, T.; Reichel, U.; Schiel, F. (2017): Multilingual processing of speech via web services In: Computer, Speech and Language, 45, 326-347. Verfügbar unter
Knappen, J.; Fischer, S.; Kermes, H.; Teich, E.; Fankhauser, P. (2017): The Making of the Royal Society Corpus. In: G. a. A. Bouma, Yvonne (Ed.), Proceedings of the NoDaLiDa 2017 Workshop on Processing Historical Language. 7-11. Linköping University Electronic Press, Linköpings universitet. Verfügbar unter
Kuhn, J. ; Blessing, A. (2017): Die Exploration biographischer Textsammlungen mit computerlinguistischen Werkzeugen. In A. Z. Bernad, C. Gruber & M. Kaiser (ed.), Europa baut auf Biographien. Aspekte, Bausteine, Normen und Standards für eine europäische Biographik (pp. 225-257 ). new academic press.
Kupietz, M.; Diewald, N.; Hanl, M.; Margaretha, E. (2017): Möglichkeiten der Erforschung grammatischer Variation mithilfe von KorAP. In: M. W. Konopka, Angelika (Ed.), Grammatische Variation. Empirische Zugänge und theoretische Modellierung. Jahrbuch des Instituts für Deutsche Sprache 2016. 319-329. de Gruyter Berlin/Boston. Verfügbar unter
Kupietz, M.; Witt, A.; Bański, P.; Tufiş, D.; Cristea, D.; Váradi, T. (2017): EuReCo – Joining Forces for a European Reference Corpus as a sustainable base for cross-linguistic research. In: P. Bański et al. (Eds.): The Workshop on Challenges in the Management of Large Corpora and Big Data and Natural Language Processing (CMLC-5+BigNLP) 2017 including the papers from the Web-as-Corpus (WAC-XI) guest section, Birmingham, UK, 15-19. Verfügbar unter
Kuras, C.; Eckart, T. (2017): Prozessmodellierung mittels BPMN in Forschungsinfrastrukturen der Digital Humanities. In: INFORMATIK 2017, Lecture Notes in Informatics (LNI). Verfügbar unter
Lemnitzer, L. (2017): Wortartentagging für die Lexikographie. Im Zentrum Sprache. Untersuchungen zur deutschen Sprache.
Lüngen, H. (2017): DeReKo - Das Deutsche Referenzkorpus. Schriftkorpora der deutschen Gegenwartssprache am Institut für Deutsche Sprache in Mannheim. In: Zeitschrift für germanistische Linguistik, 45 (1), 161-170. Verfügbar unter
Lüngen, H.; Kupietz, M. (2017): CMC Corpora in DeReKo. In: P. Bański et al. (Eds.), Proceedings of the Workshop on Challanges in the Management of Large Corpora and Big Data and Natural Language Processing (CMLC-5+BigNLP) 2017 including the papers from the Web-as-Corpus (WAC-XI) guest section. 20-24. Mannheim: Institut für Deutsche Sprache, Birmingham, UK. Verfügbar unter
Pfundt, A. (2017): Frauenwahlrecht? Oder Damenwahlrecht? Oder doch ein allgemeines Wahlrecht? – Zum Wortgebrauch in der Diskussion um das Frauenwahlrecht um 1900. Im Zentrum Sprache. Untersuchungen zur deutschen Sprache.
Schmidt, T. (2017): Construction and Dissemination of a Corpus of Spoken Interaction - Tools and Workflows in the FOLK project. In: Corpus Linguistic Software Tools. Journal for Language Technology and Computational Linguistics (JLCL), 31 (1), 127-154. Verfügbar unter
Schmidt, T.; Hedeland, H.; Jettka, D. (2017): Conversion and Annotation Web Services for Spoken Language Data in CLARIN. In: L. Borin (Ed.): Selected papers from the CLARIN Annual Conference 2016, Aix-en-Provence, France, 113-130. Verfügbar unter
Stoakes, H.; Schiel, F. (2017): An Pan-Australian Acoustic Model: Automatic Alignment using the MAUS. Conference of the Australian Linguistics Society Dec 2017, Sydney, Australia.
Tiepmar, J.; Eckart, T.; Goldhahn, D.; Kuras, C. (2017): Integrating Canonical Text Services into CLARIN's Search Infrastructure. In: Linguistics and Literature Studies 5(2), 99-104. Verfügbar unter
Tiepmar, J.; Heyer, G. (2017): An Overview of Canonical Text Services. In: Linguistics and Literature Studies, 5(2), 132-148. Verfügbar unter
Thomas, C. (2017): In die Tiefe gehen: Lektüre- und Nutzungsmöglichkeiten digitaler Repräsentationen historischer Textzeugen. Vortrag im Rahmen des Digital-Humanities-Kolloquiums an der BBAW, Berlin, 6. Oktober 2017.
Vela, M. ; Kermes, H. (2017): A Practical Course in Corpus Linguistics for Students with a Humanist Background. Proceedings of the 2017 Teach4DH Workshop on Teaching NLP for DH collocated with GSCL 2017, Berlin.
Bański, P.; Frick, E.; Witt, A. (2016): Corpus Query Lingua Franca (CQLF). In: N. Calzolari et al. (Eds.), Proceedings of the Tenth International Conference on Language Resources and Evaluation (LREC 2016). 2804-2809, Paris: European Language Resources Association (ELRA). Verfügbar unter
Bański, P.; Kupietz, M.; Lüngen, H.; Witt, A.; Barbaresi, A.; Biber, H.; Breiteneder, E.; Clematide, S. (2016): The 4th Workshop on Challenges in the Management of Large Corpora. of. Verfügbar unter
Beißwenger, M.; Chanier, T.; Erjavec, T.; Darja, F.; Herold, A.; Ljubseic, N.; Lüngen, H.; Poudat, C.; Stemle, E.; Storrer, A.; Wigham, C. (2016): Closing a gap in the language resources landscape: Groundwork and best practices from projects on computer-mediated communication in four European countries. In: CLARIN Annual Conference 2016, Aix-en-Provence.
Beißwenger, M.; Ehrhardt, E.; Herold, A.; Lüngen, H.; Storrer, A. (2016a): (Best) Practices for Annotating and Representing CMC and Social Media Corpora in CLARIN-D. In: D. Fišer & M. Beißwenger (Eds.), Proceedings of the 4th Conference on CMC and Social Media Corpora for the Humanities 7-11. Academic Publishing Division of the Faculty of Arts of the University of Ljubljana, 2016, Ljubljana.
Beißwenger, M.; Ehrhardt, E.; Herold, A.; Lüngen, H.; Storrer, A. (2016b): Converting and Representing Social Media Corpora into TEI: Schema and best practices from CLARIN-D. In: C. Resch et al. (Eds.), TEI Conference and Members' Meeting 2016. Book of Abstracts. 39-41. Austrian Academy of Sciences, Austrian Centre for Digital Humanities, 2016, Wien.
Beißwenger, M.; Herold, A.; Lüngen, H.; Storrer, A. (2016): Das Dortmunder Chat-Korpus in CLARIN-D: Modellierung und Mehrwerte. nisaba 2016, Duisburg.
Blessing, A.; Kuhn, J. (2016): Crosslingual Textual Emigration Analysis. In: Digital Humanities 2016: Conference Abstracts, Jagiellonian University & Pedagogical University, Kraków 744-745. Verfügbar unter
Butt, M.; Heyer, G.; Holzinger, K.; Kantner, C.; Keim, D.; Kuhn, J.; Schaal, G.; Blessing, A.; Dumm, S.; El-Assady, M.; Gold, V.; Hautli-Janisz, A.; Lemke, M.; Müller, M.; Niekler, A.; Overbeck, M.; Wiedemann, G. (2016): Argumentanalyse in digitalen Textkorpora. In: DHd 2016, Leipzig.
Cosma, R.; Cristea, D.; Kupietz, M.; Tufiş, D.; Witt, A. (2016): DRuKoLa - Towards Contrastive German-Romanian Research based on Comparable Corpora. . In: P. Bański et al. (Eds.): 4th Workshop on Challenges in the Management of Large Corpora. Proceedings of the Tenth International Conference on Language Resources and Evaluation (LREC 2016), Portorož, Slowenien, 28-32.
Degaetano-Ortlieb, S.; Kermes, H.; Khamis, A.; Knappen, J.; Teich, E. (2016): The Royal Society Corpus: From Uncharted Data to Corpus. In: LREC 2016, Portorož, Slovenia 2016. Verfügbar unter
Diewald, N.; Hanl, M.; Margaretha, E.; Bingel, J.; Kupietz, M.; Bański, P.; Witt, A. (2016): KorAP Architecture - Diving in the Deep Sea of Corpus Data. In: N. Calzolari et al. (Eds.), Proceedings of the Tenth International Conference on Language Resources and Evaluation (LREC 2016). Paris: European Language Resources Association (ELRA) 2016, Portoroz, Slovenia. Verfügbar unter
Diewald, N.; Margaretha, E. (2016): Krill: KorAP search and analysis engine. In: Corpus Linguistic Software Tools. Journal for Language Technology and Computational Linguistics (JLCL) 31 (1). Verfügbar unter
Eckart, T. (2016): Einsatz und Bewertung komponentenbasierter Metadaten in einer föderierten Infrastruktur für Sprachressourcen am Beispiel der CMDI. Universität Leipzig. Verfügbar unter
Eckart, T.; Kuras, C.; Quasthoff, U. (2016): Features for Generic Corpus Querying. In: International Conference on Language Resources and Evaluation (LREC). Verfügbar unter
Fandrych, C.; Frick, E.; Hedeland, H.; Iliash, A.; Jettka, D.; Meißner, C.; Schmidt, T.; Wallner, F.; Weigert, K. (2016): Wer bist du, Nutzer? DHd 2016. 122-125. Verfügbar unter
Fandrych, C.; Frick, E.; Hedeland, H.; Iliash, A.; Jettka, D.; Meißner, C.; Schmidt, T.; Wallner, F.; Weigert, K.; Westpfahl, S. (2016): User, who art thou? User profiling for oral corpus platforms. In: N. Calzolari et al. (Eds.), Tenth International Conference on Language Resources and Evaluation (LREC 2016). 280-287, Portorož, Slovenia Verfügbar unter
Fankhauser, P. (2016): Kuration und Exploration des Korpus "Diskurs in der Weimarer Republik". In: Digital Humanities im deutschsprachigen Raum. Verfügbar unter
Fankhauser, P.; Knappen, J.; Teich, E. (2016): Topical Diversification over Time in the Royal Society Corpus. In: DH 2016, Kraków, Poland. Verfügbar unter file:///Users/sshnder/Downloads/Fankhauser_Knappen_Teich_Topical_Diversification_Over_Time_In_The_Royal_Society_Corpus_2016a.pdf.
Fischer, P. M.; Diewald, N.; Kupietz, M.; Witt, A. (2016): Aufbau einer Korpusinfrastruktur für die Beobachtung des Schreibgebrauchs. In: DHd 2016. Modellierung - Vernetzung - Visualisierung. Die Digital Humanities als fächerübergreifendes Forschungsparadigma. Konferenzabstracts. , Universität Leipzig, 310-312. Verfügbar unter
Freudenberg, M.; Brümmer, M.; Rücknagel, J.; Ulrich, R.; Eckart, T.; Kontokostas, D.; Hellmann, S. (2016): The Metadata Ecosystem of DataID. Springer International Publishing. Verfügbar unter
Haaf, S. (2016): Corpus Analysis based on Structural Phenomena in Texts. Exploiting TEI Encoding for Linguistic Research. In: N. C. e. al. (Ed.), Proceedings of the Tenth International Conference on Language Resources and Evaluation (LREC 2016), 23.-28. Mai 2016, Portorož (Slovenia), Paris: ELRA, 2016. Verfügbar unter
Haaf, S.; Thomas, C. (2016): Die Historischen Korpora des Deutschen Textarchivs als Grundlage für sprachgeschichtliche Forschungen. In: H. R. V. H. L. Schiwek (Ed.), Sprachgeschichte des Deutschen. Positionierungen in Forschung, Studium, Schule. 217-234, Stuttgart. Verfügbar unter
Haaf, S. (2016): Historical newspaper corpora for the Deutsches Textarchiv. [Presentation at CLARINplus-Workshop, Leuven 2016.] CLARIN ERIC YouTube-Channel,
Hedeland, H.; Lehmberg, T.; Wagner-Nagy, B. (2016): Digitale Workflows in Langzeitprojekten am Beispiel einer Infrastruktur zur Dokumentation indigener nordeuropäischer Sprachen (INEL). In: DHd 2016 152-154. Verfügbar unter
Hinrichs, E.; Hinrichs, M.; Trippel, T. (2016): Proceedings of: Language Technology Resources and Tools for Digital Humanities (LT4DH): Workshop at COLING 2016. of. Verfügbar unter
Jurish, B. (2016a): Diachronic Collocations and Genre. In: R. J. Whitt (Ed.), Diachronic Corpora, Genre, and Language Change. 22-24, Nottingham. Verfügbar unter
Jurish, B. (2016b): Tools, Toys, and FiltersRechtsgeschichte - Legal History Rg 24. 347-348. Verfügbar unter
Jurish, B.; Geyken, A.; Werneke, T. (2016): DiaCollo. Diachronen Kollokationen auf der Spur. In: DHd 2016. Modellierung - Vernetzung - Visualisierung, Leipzig, 172-175. Verfügbar unter
Jurish, B.; Maletti, A.; Springmann, U.; Würzner, K.-M. (2016): SIGFSM Workshop on Statistical NLP and Weighted Automata at the 54th Annual Meeting of the Association for Computational Linguistics: Proceedings. of.
Kamocki, P. (2016): "Allow Mining!" - The Argument for "Orthogonal Uses" of Intellectual Works in the Debate on Text and Data MiningRevue Internationale du Droit d'Auteur 4-85. Verfügbar unter
Kamocki, P.; Ketzan, E.; Witt, A. (2016): Lizenzauswahlwerkzeuge für die digitalen Geisteswissenschaften. In: DHd 2016. Modellierung – Vernetzung – Visualisierung. Die Digital Humanities als fächerübergreifendes Forschungsparadigma. Konferenzabstracts. Universität Leipzig 7. bis 12. März 2016. Duisburg: nisaba, 2016 336-337. Verfügbar unter
Kamocki, P.; O'Regan, J. (2016): Privacy Issues in Online Machine Translation Services - European Perspective In: Language Resources and Evaluation Conference (LREC), Portorož, Slowenien, 4458-4462. Verfügbar unter
Kamocki, P.; O'Regan, J.; Stauch, M. (2016): "All your data belongs to us". European Perspectives on Privacy Issues in 'Free' Online Machine Translation Services. In: A. e. al. (Ed.), Privacy and Identity Management: Time for a Revolution? 265-280. Springer.
Kamocki, P.; Stranák, P.; Sedlák, M. (2016): The Public License Selector: Making Open Licensing Easier. In: N. Calzolari et al. (Eds.), Proceedings of the Tenth International Conference on Language Resources and Evaluation (LREC 2016). 2533-2538. ELRA, Portorož, Slovenien. Verfügbar unter
Kisler, T.; Uwe, R.; Schiel, F.; Draxler, C.; Jackl, B.; Poerner, N. (2016): BAS Speech Science Web Services - an Update of Current Developments10th International Conference on Language Resources and Evaluation (LREC 2016). 3880-3885, Portorož, Slovenia.
Knappen, J.; Fischer, S.; Kermes, H.; Teich, E.; Fankhauser, P. (2017): The Making of the Royal Society Corpus. In: G. a. A. Bouma, Yvonne (Ed.), Proceedings of the NoDaLiDa 2017 Workshop on Processing Historical Language. 7-11. Linköping University Electronic Press, Linköpings universitet. Verfügbar unter
Kupietz, M.; Diewald, N.; Hanl, M.; Margaretha, E. (2017): Möglichkeiten der Erforschung grammatischer Variation mithilfe von KorAP. In: M. W. Konopka, Angelika (Ed.), Grammatische Variation. Empirische Zugänge und theoretische Modellierung. Jahrbuch des Instituts für Deutsche Sprache 2016. 319-329. de Gruyter Berlin/Boston. Verfügbar unter
Kupietz, M.; Geyken, A. (2016): Corpus Linguistic Software Tools. In: Journal for Language Technology and Computational Linguistics (JLCL), 31(1). Verfügbar unter
Le, D.-T.; Vu, N. T.; Blessing, A. (2016): Towards a text analysis system for political debates. In: LaTeCH@ACL, Berlin: The Association for Computer Linguistics, Berlin. Verfügbar unter
Lemke, M.; Wiedemann, G. (2016): Text Mining in den Sozialwissenschaften. Grundlagen und Anwendungen zwischen qualitativer und quantitativer Diskursanalyse. Springer VS 2016. Verfügbar unter
Lüngen, H.; Beißwenger, M.; Ehrhardt, E.; Herold, A.; Storrer, A. (2016): Integrating corpora of computer-mediated communication in CLARIN-D: Results from the curation project ChatCorpus2CLARINProceedings of the 13th Conference on Natural Language Processing (KONVENS 2016). 156-164. Verfügbar unter
Martínez Martínez, J. M. (2016): Saarbrücken Cookbook Corpus: a recipe for a diachronic study à la CLARIN-D, Universität des Saarlandes, Deutschland. Verfügbar unter
Martínez Martínez, J. M. (2016): Working with Corpora (WwC). Verfügbar unter
Martínez Martinéz, J. M.; Vela, M. (2016): SubCo: A Learner Translation Corpus of Human and Machine Subtitles. In: LREC 2016, Portoroz, Slovenia. Verfügbar unter
Poerner, N.; Schiel, F. (2016): An automatic chunk segmentation tool for long transcribed speech recordingsPhonetik & Phonologie, Munich.
Schmidt, T. (2016): Good practices in the compilation of FOLK, the Research and Teaching Corpus of Spoken German. In: Compilation, transcription, markup and annotation of spoken corpora. Special Issue of the International Journal of Corpus Linguistics (IJCL 21:3), 21:3 (396-418). Verfügbar unter
Schmidt, T. (2017): Construction and Dissemination of a Corpus of Spoken Interaction - Tools and Workflows in the FOLK project. In: Corpus Linguistic Software Tools. Journal for Language Technology and Computational Linguistics (JLCL), 31 (1), 127-154. Verfügbar unter
Schmidt, T.; Hedeland, H.; Jettka, D. (2017): Conversion and Annotation Web Services for Spoken Language Data in CLARIN. In: L. Borin (Ed.): Selected papers from the CLARIN Annual Conference 2016, Aix-en-Provence, France, 113-130. Verfügbar unter
Schmidt, T.; Wörner, K.; Hedeland, H. (2016): Elemente eines Geschäftsmodells für etablierte wissenschaftliche Software. In: FORGE 2016, 17-18.
Tiepmar, J.; Eckart, T.; Goldhahn, D.; Kuras, C. (2016): Canonical Text Services in CLARIN - Reaching out to the Digital Classics and beyond. In: CLARIN Annual Conference 2016.
Trippel, T. (2016): CLARIN: Forschungsinfrastruktur für die Geistes- und Sozialwissenschaften. In: Akademie Aktuell: Zeitschrift der Bayerischen Akademie der Wissenschaften, 1 (56), 89-91. Verfügbar unter
Trippel, T.; Zinn, C. (2016): Enhancing the Quality of Metadata by using Authority Control. In: 5th Workshop on Linked Data in Linguistics, Portorož, Slovenia.
Westpfahl, S.; Schmidt, T. (2016): FOLK-Gold - A GOLD standard for Part-of-Speech-Tagging of Spoken GermanProceedings of the Tenth Conference on International Language Resources and Evaluation (LREC’16), Portorož, Slovenia. 1493-1499. Paris: European Language Resources Association (ELRA). Verfügbar unter
Wiedemann, G. (2016): Text Mining for Qualitative Data Analysis in the Social Sciences. Springer 2016. Verfügbar unter
Wille, M. (2016): Der Hamburgische Unpartheyische Correspondent [im Deutschen Textarchiv]. Youtube-Channel des Textanalyseportals (TAP) der Universität Paderborn:
- Deutsche Fassung,,
- English version,
Zinn, C.; Trippel, T.; Kaminski, S.; Dima, E. (2016): Crosswalking from CMDI to Dublin Core and MARC 21. In: N. Calzolari et al. (Eds.), Tenth International Conference on Language Resources and Evaluation (LREC 2016). European Language Resources Association (ELRA), Portorož, Slovenia. Verfügbar unter
Bański, P.; Biber, H.; Breiteneder, E.; Kupietz, M.; Lüngen, H.; Witt, A. (2015): The 3rd Workshop on Challenges in the Management of Large Corpora (CMLC-3). of. Mannheim: Institut für Deutsche Sprache. Verfügbar unter
Beißwenger, M.; Ehrhardt, E.; Horbach, A.; Lüngen, H.; Steffen, D.; Storrer, A. (2015): Adding Value to CMC Corpora: CLARINification and Part-of-Speech Annotation of the Dortmund Chat Corpus. In: 2nd Workshop on Natural Language Processing for Computer-Mediated Communication / Social Media (NLP4CMC2015), Essen, Germany. Verfügbar unter
Bingel, J.; Diewald, N. (2015): KoralQuery - a General Corpus Query Protocol Proceedings of the Workshop on Innovative Corpus Query and Visualization Tools at NODALIDA 2015. Linköping University Electronic Press, 2015, Linköping, Sweden. Verfügbar unter
Blessing, A.; Glaser, A.; Kuhn, J. (2015): Biographical Data Exploration as a Test-bed for a Multi-view, Multi-method Approach in the Digital Humanities. In: First Conference on Biographical Data in a Digital World 2015, Amsterdam, The Netherlands, April 9, 2015. 53-60. Verfügbar unter
Blessing, A.; Kliche, F.; Heid, U.; Kantner, C.; Kuhn, J. (2015): Computerlinguistische Werkzeuge zur Erschließung und Exploration großer Textsammlungen aus der Perspektive fachspezifischer Theorien. In: Grenzen und Möglichkeiten der Digital Humanities. Hg. von Constanze Baum / Thomas Stäcker. 2015 (= Sonderband der Zeitschrift für digitale Geisteswissenschaften, 1). Verfügbar unter
Cap, F.; Rösiger, I.; Kuhn, J. (2015): A Pilot Experiment on Exploiting Translations for Literary Studies on Kafka’s “Verwandlung”. In: 4th Workshop on Computational Linguistics for Literature (CLFL) at NAACL, Denver/Colorada, USA, 48. Verfügbar unter
Çöltekin, Ç. (2015a): A Grammar-Book Treebank of Turkish. In: International Workshop on Treebanks and Linguistic Theories (TLT14), Warsaw, Poland. Verfügbar unter
Çöltekin, Ç. (2015b): Turkish nlp web services in the weblicht environment. In: CLARIN Annual Conference, Wroclaw, Poland. Verfügbar unter
De Kok, D. (2015a): Bootstrapping a neural net dependency parser for German using CLARIN resources. In: CLARIN Annual Conference, Wroclaw, Poland.
De Kok, D. (2015b): A Poor Man’s Morphology for German Transition-Based Dependency Parsing. In: International Workshop on Treebanks and Linguistic Theories (TLT14), Warsaw, Poland, 50.
De Kok, D.; Qiu, W.; Hinrichs, M. (2015): WebLicht: Bombardieren bevor die Services explodieren. In: DHd Konferenz, Graz.
Degaetano-Ortlieb, S.; Kermes, H.; Khamis, A.; Knappen, J.; Ordan, N.; Teich, E. (2015): Information Density in Scientific Writing: A Diachronic Perspective. In: "Challenging Boundaries" - 42nd International Systemic Functional Congress (ISFCW2015), RWTH Aachen University.
Degaetano-Ortlieb, S.; Kermes, H.; Khamis, A.; Ordan, N.; Teich, E. (2015): The taming of the data: Using text mining in building a corpus for diachronic analysis. In: Varieng - From Data to Evidence (d2e), University of Helsinki. Verfügbar unter
Dima, C.; Hinrichs, E. (2015): Automatic Noun Compound Interpretation using Deep Neural Networks and Word Embeddings. In: IWCS 2015 173.
Draxler, C.; Kleiner, S. (2015): A Cross-Database Comparison of two Large German Speech DatabasesProceedings of ICPhS, Glasgow, UK.
Eckart, K.; Gärtner, M.; Schweitzer, K. (2015): Leaving Traces - Workflow Tracking in Computational Linguistics In: DGfS 2015 CL-Postersession.
Eckart, T.; Hellwig, A.; Goosen, T. (2015): Influence of Interface Design on User Behaviour in the VLO. In: CLARIN Annual Conference, Wroclaw, Poland.
Gärtner, M.; Schweitzer, K.; Eckart, K.; Kuhn, J. (2015): Multi-modal Visualization and Search for Text and Prosody Annotations. In: 53rd Annual Meeting of the Association for Computational Linguistics and the 7th International Joint Conference on Natural Language Processing (ACL-IJCNLP 2015), Beijing, China, 25.
Geyken, A.; Gloning, T. (2015a): Corpus strategies, technology, organization. In: J. Gippert & R. Gehrke (Eds.), Historical Corpora. Challenges and Perspectives. 165-180. Narr Francke Attempto, Tübingen.
Geyken, A.; Gloning, T. (2015b): A living text archive of 15th-19th-century German. Corpus strategies, technology, organization. In: J. Gippert & R. Gehrke (Eds.), Historical Corpora. Challenges and Perspectives. 165-180. Narr Francke Attempto, Tübingen.
Goldhahn, D.; Eckart, T.; Gloning, T.; Dreßler, K.; Heyer, G. (2015): Operationalisation of Research Questions of the Humanities within the CLARIN Infrastructure – An Ernst Jünger Use Case. In: CLARIN Annual Conference, Wroclaw, Poland.
Gupta, R.; Orasan, C.; Zampieri, M.; Vela, M.; Genabith, J. V. (2015): Can Translation Memories afford not to use paraphrasing? In: 18th Annual Conference of the European Association for Machine Translation (EAMT) 35-42. Verfügbar unter
Haaf, S.; Thomas, C. (2015): Introducing the DTABf-M: A Manuscript-specific Extension to the DTA >Base Format< (DTABf). In: Journal of the Text Encoding Initiative (jTEI) 10: 2015 Conference Issue.
Henrich, V. (2015): Word Sense Disambiguation with GermaNet. PhD Thesis, University of Tübingen.
Henrich, V.; Hinrichs, E. (2015): Special Issue: Computational, Cognitive and Linguistic Approaches to the Analysis of Compounds and Collocations. In: Journal of Cognitive Science, 16 (3). Verfügbar unter
Herzog, G.; Heid, U.; Trippel, T.; Bánski, P.; Romary, L.; Schmidt, T.; Witt, A.; Eckart, K. (2015): Recent Initiatives towards New Standards for Language Resources. In: International Conference of the German Society for Computational Linguistics and Language Technology (GSCL 2015), Essen, Germany, 154 - 156. Verfügbar unter
Hinrichs, E. (2015): Digitale Geisteswissenschaften und Informatik – Modelle der Zusammenarbeit. In: DHd Konferenz, Graz, Austria.
Hinrichs, E.; de Kok, D.; Çöltekin, Ç. (2015): Treebank Data and Query Tools for Rare Syntactic Constructions. In: International Workshop on Treebanks and Linguistic Theories (TLT14) 106.
Horbach, A.; Thater, S.; Steffen, D.; Fischer, P. M.; Witt, A.; Pinkal, M. (2015): Internet Corpora: A Challenge for Linguistic Processing. In: Datenbank-Spektrum, 15 (1), 41-47. Verfügbar unter
Jettka, D.; Hedeland, H.; Lehmberg, T. (2015): Vom digitalen Hausmeister zum international vernetzten Forschungsdatenzentrum. Die Entwicklung der digitalen Infrastruktur des Hamburger Zentrums für Sprachkorpora. In: FORGE 2015, Hamburg.
John, M.; Koch, S.; Heimerl, F.; Müller, A.; Ertl, T.; Kuhn, J. (2015): Interactive Visual Analysis Of German Poetics. In: Global Digital Humanities, Sydney, Australia.
Jügler, J.; Zimmerer, F.; Möbius, B.; Draxler, C. (2015): The effect of high-variability training on the perception and production of French stops by German native speakers. In: INTERSPEECH 2015, 16th Annual Conference of the International Speech Communication Association, Dresden, Germany, September 6-10, 2015 806--810. Verfügbar unter
Jurish, B. (2015): DiaCollo: On the trail of diachronic collocations. In: CLARIN Annual Conference, Wroclaw, Poland, 28-31. Verfügbar unter
Jurish, B.; Ast, H. (2015): Using an Alignment-based Lexicon for Canonicalization of Historical Text. In: J. Gippert & R. Gehrke (Eds.), Historical Corpora. Challenges and Perspectives. 197-208. Narr Francke Attempto, Tübingen, Germany. Verfügbar unter
Kamocki, P.; Ketzan, E. (2015): "What's new in Creative Commons 4.0?". In: CLARIN Legal Issues Committee (CLIC), White Paper Series.
Khamis, A.; Degaetano-Ortlieb, S.; Kermes, H.; Knappen, J.; Ordan, N.; Teich, E. (2015): A resource for the diachronic study of scientific English: Introducing the Royal Society Corpus. In: Corpus Linguistics 2015, Lancaster. Verfügbar unter
Kisler, T.; Schiel, F.; Reichel, U. D.; Draxler, C. (2015): Phonetic/linguistic web services at BAS. In: Interspeech-2015, Dresden, Germany, 2609-2610. Verfügbar unter
Kuhn, J.; Reiter, N. (2015): A Plea for a Method-driven Agenda in the Digital Humanities. In: Global Digital Humanities, Sydney, Australia.
Kunz, K.; Lapshinova-Koltunski, E.; Martínez Martínez, J. M.; Menzel, K.; Steiner, E. (2015a): Lexical cohesion in a contrastive perspective (English - German). In: ICAME36, Trier, Germany.
Kunz, K.; Lapshinova-Koltunski, E.; Martínez Martínez, J. M.; Menzel, K.; Steiner, E. (2015b): Lexical cohesion in a contrastive perspective (English - German): some instantial patterns. In: 42nd International Systemic Functional Congress, RWTH Aachen University, Germany.
Kunz, K. A.; Lapshinova-Koltunski, E.; Martínez Martínez, J. M.; Menzel, K.; Steiner, E. (2015): GECCo: Corpus to Analyse German-English Contrasts in Cohesion. In: 1st Action Conference. Textlink: Structuring Discourse in Multilingual Europe, Louvain, Belgium. Verfügbar unter
Kupietz, M. (2015): Constructing a Corpus. In: P. Durkin (Ed.), The Oxford Handbook of Lexicography. 62-75. Oxford University Press, Oxford, UK.
Kupietz, M.; Schmidt, T. (2015): Schriftliche und mündliche Korpora am IDS als Grundlage für die empirische Forschung In: L. M. Eichinger (Ed.), Sprachwissenschaft im Fokus. Positionsbestimmungen und Perspektiven (= Jahrbuch des Instituts für Deutsche Sprache 2014). 297-322. de Gruyter, Berlin/Boston. Verfügbar unter
Lapshinova-Koltunski, E.; Vela, M. (2015): Measuring "Registerness" in Human and Machine Translation: A Text Classification Approach. In: EMNLP 2015 Workshop on Discourse in Machine Translation, Lisbon, Portugal. Verfügbar unter
Lehmberg, T. (2015): Wissenstransfer und Wissensressourcen: Support und Helpdesk in den Digital Humanities. In: FORGE 2015, Hamburg, Germany.
Lemke, M.; Niekler, A.; Schaal, G. S.; Wiedemann, G. (2015): Content Analysis between Quality and Quantity. Fulfilling Blended-Reading Requirements for the Social Sciences with a Scalable Text Mining Infrastructure. Springer Berlin Heidelberg 2015. Verfügbar unter
Lemnitzer, L.; Geyken, A. (2015): Semantic Modeling of Collocations for Lexicographic Purposes. In: Journal of Cognitive Science, 16 (3), 200-223. Verfügbar unter
Lyse, G. I.; Meurer, P.; De Smedt, K. (2015): COMEDI: A component metadata editor. In: Selected Papers from the CLARIN 2014 Conference, October 24-25, 2014 (8), Soesterberg, The Netherlands, 82-98. Verfügbar unter
Mahlow, C.; Piotrowski, M. (2015): Systems and Frameworks for Computational Morphology - Fourth International Workshop, SFCM 2015, Proceedings. Springer International Publishing, Cham/Berlin/Heidelberg.
Müller, A.; John, M.; Koch, S.; Ertl, T.; Kuhn, J. (2015): Erkennung und Visualisierung attribuierter Phrasen in Poetiken. In: Digital Humanities im deutschsprachigen Raum 2015.
Pal, S.; Vela, M.; Naskar, S. K.; van Genabith, J. (2015): USAAR-SAPE: An English--Spanish Statistical Automatic Post-Editing System. In: 10th Workshop on Statistical Machine Translation (WMT), Lisbon, Portugal. Verfügbar unter
Quasthoff, U.; Goldhahn, D. (2015): Was sind IT-basierte Forschungsinfrastrukturen für die Geistes- und Sozialwissenschaft und wie können sie genutzt werden? . In: Information - Wissenschaft & Praxis. Verfügbar unter
Quasthoff, U.; Goldhahn, D.; Eckart, T. (2015): Building Large Resources for Text Mining: The Leipzig Corpora CollectionText Mining - From Ontology Learning to Automated Text Processing Applications. Springer.
Reiter, N.; Kuhn, J. (2015): Annotation as a Pivot in DH Experiments. In Digital Humanities Experiments #DHIHA6, Open Peer Review-Blog. Verfügbar unter
Sandberg, M.; Baxter, R.; Lecarpentier, D.; Kamocki, P. (2015): Open Data - What Do Research Communities Really Think About it? In: ERCIM (The European Research Consortium for Informatics and Mathematics) News, 2015 (100), 19-20.
Scarton, C.; Zampieri, M.; Vela, M.; van Genabith, J.; Specia, L. (2015): Searching for Context: a Study on Document-Level Labels for Translation Quality Estimation. In: 18th Annual Conference of the European Association for Machine Translation (EAMT), Antalya, Turkey.
Schiel, F. (2015): A statistical model for predicting pronunciation. In: International Conference on Phonetic Sciences, Glasgow, United Kingdom.
Schröck, J.; Lüngen, H. (2015): Building and Annotating a Corpus of German-Language Newsgroups. In: M. Beißwenger & T. Zesch (Eds.), NLP4CMC 2015. 2nd Workshop on Natural Language Processing for Computer-Mediated Communication / Social Media. Proceedings of the Workshop. 17-22. German Society for Computational Linguistics & Language Technology (GSCL) 2015, University of Duisburg-Essen, Campus Essen. Verfügbar unter
Schweitzer, K.; Gärtner, M.; Riester, A.; Rösiger, I.; Eckart, K.; Kuhn, J.; Dogil, G. (2015): Analysing automatic descriptions of intonation with ICARUS. In: Sixteenth Annual Conference of the International Speech Communication Association.
Stührenberg, M.; Diewald, N.; Gleim, R. (2015): Considerations for a linguistic network markup language. In: A. Mehler et al. (Eds.), Towards a theoretical framework for analyzing complex linguistic networks. (= Understanding Complex Systems). 299-330. Springer, 2015, Heidelberg.
Teich, E.; Degaetano-Ortlieb, S.; Fankhauser, P.; Kermes, H.; Lapshinova-Koltunski, E. (2015): The linguistic construal of disciplinarity: A data-mining approach using register features. In: Journal of the Association for Information Science and Technology. 10.1002/asi.23457.
Telljohann, H.; Hinrichs, E. W.; Kübler, S.; Zinsmeister, H.; Beck, K. (2015): Stylebook for the Tübingen treebank of written German (TüBa-D/Z). Verfügbar unter
Thomas, C.; Wiegand, F. (2015): Making great work even better: Appraisal and Digital Curation of widely dispersed Electronic Textual Resources (c. 15th–19th cent.) in CLARIN-D. In: J. Gippert & R. Gehrke (Eds.), Historical Corpora. Challenges and Perspectives. Narr Francke Attempto, Tübingen. Verfügbar unter
Trippel, T.; Zinn, C. (2015a): Describing Research Data with CMDI. In: B. Lust et al. (Eds.), Proceedings of the Workshop: Development of Linguistic Linked open Data Resources for Collaborative Data-Intensive Research in the Language Sciences, University of Chicago.
Trippel, T.; Zinn, C. (2015b): DMPTY - A Wizard For Generating Data Management Plans. In: CLARIN Annual Conference, Wroclaw, Poland. Verfügbar unter
Trouvain, J.; Möbius, B. (2015): BAS Resources for Phonetic Learner Corpora. In, Glasgow. Verfügbar unter
Vela, M.; Lapshinova-Koltunski, E. (2015): A Classification Approach to Register-based Machine Translation Evaluation. In: 15th MT Summit, Miami, Florida.
Vela, M.; Tan, L. (2015): Predicting Machine Translation Adequacy with Document Embeddings. In: 10th Workshop on Statistical Machine Translation (WMT), Lisbon, Portugal, 382-390. Verfügbar unter
Vela, M.; van Genabith, J. (2015): Re-assessing the WMT2013 Human Evaluation with Professional Translators Trainees? In: 18th Annual Conference of the European Association for Machine Translation (EAMT), Antalya, Turkey. Verfügbar unter
Wagner-Nagy, B.; Hedeland, H.; Lehmberg, T.; Rießler, M. (2015): INEL – ein Infrastrukturvorhaben zur Dokumentation indigener nordeurasischer Sprachen. In: FORGE 2015, Hamburg, Germany.
Würzner, K.-M.; Jurish, B. (2015): Dsolve. Morphological segmentation for German using conditional random fields. In: M. P. Cerstin Mahlow (Ed.): Fourth International Workshop on Systems and Frameworks for Computational Morphology (SFCM). , Stuttgart, 94-103. Verfügbar unter
Würzner, K.-M.; Jurish, B. (2015): Gramophone. A hybrid approach to grapheme-phoneme conversion. In: 12th International Conference on Finite State Methods and Natural Language Processing (FSMNLP), Düsseldorf. Verfügbar unter
Zielke, D.; Jettka, D. (2015): Towards depositor-controlled data ingest in digital repositories for linguistic corpora: automation of metadata processing. In: CLARIN Annual Conference, Wroclaw, Poland.
Bański, P.; Diewald, N.; Hanl, M.; Kupietz, M.; Witt, A. (2014): Access Control by Query Rewriting. The Case of KorAPProceedings of the Ninth Conference on International Language Resources and Evaluation (LREC'14). 3817-3822. European Language Resoruces Association (ELRA). Verfügbar unter file:///Users/sshnder/Downloads/Banski_Diewald_Hanl_Kupietz_Witt_Access%20control_2014.pdf.
Bański, P.; Frick, E.; Hanl, M.; Kupietz, M.; Schnober, C.; Witt, A. (2014): Robust corpus architecture: a new look at virtual collections and data access Corpus Linguistics 2013. Abstract Book. 23-25. Lancaster: UCREL, Lancaster, UK.
Beißwenger, M.; Lüngen, H.; Margaretha, E.; Pölitz, C. (2014): Mining corpora of computer-mediated communication: Analysis of linguistic features in Wikipedia talk pages using Machine Learning methodsProceedings of KONVENS 2014 (Konferenz zur Verarbeitung natürlicher Sprachen). 42-47. Universität Hildesheim 2014, Hildesheim.
Beňuš, Š.; Reichel, U. D.; Mády, K. (2014): Modelling accentual phrase intonation in Slovak and Hungarian. In: Speech Prosody 7, Dublin, Republic of Ireland.
Berkling, K.; Reichel, U. D.; Lavalley, R. (2014): Untersuchung der Eignung von Fibeln für einen systematischen Schriftspracherwerb. In: GEBF Tagung - Die Perspektiven verbinden, Frankfurt a.M., Germany, 163.
Beurskens, M.; Kamocki, P.; Ketzan, E. (2014): Implied Consent: A Silent Revolution in Digital Copyright Law. U.S., German and French PerspectivesRevue Internationale du Droit d'Auteur. 2-108. Verfügbar unter
Björkelund, A.; Eckart, K.; Riester, A.; Schauffler, N.; Schweitzer, K. (2014): The extended DIRNDL corpus as a resource for coreference and bridging resolution. In: Ninth International Conference on Language Resources and Evaluation (LREC 2014). Verfügbar unter
Björkelund, A.; Kuhn, J. (2014): Learning Structured Perceptrons for Coreference Resolution with Latent Antecedents and Non-local Features. In: A. f. C. Linguistics (Ed.): 52nd Annual Meeting of the Association for Computational Linguistics, Baltimore, Maryland, 47-57. Verfügbar unter
Blessing, A. (2014): Information Extraction for the Geospatial Domain. Stuttgart, Germany. Verfügbar unter
Blessing, A.; Kuhn, J. (2014): Textual Emigration Analysis (TEA). In: Ninth International Conference on Language Resources and Evaluation (LREC'14), Reykjavik, Iceland. Verfügbar unter
Blumtritt, J.; Elbers, W.; Goosen, T.; Sallé, M.; Windhouwer, M. (2014): User Delegation in the CLARIN Infrastructure. In: CLARIN Annual Conference, Soesterberg, The Netherlands. Verfügbar unter
Boehlke, V. (2014): „CLARINifizierung“ von Ressourcen – Anforderungen, Beispiele und Erfahrungen. In: DTA- & CLARIN-D-Konferenz und Workshop: Textkorpora in Infrastrukturen für die Geistes- und Sozialwissenschaften BBAW, Berlin, Germany.
Bosch, S.; Eckart, K.; Faaβ, G.; Heid, U.; Lee, K.; Pareja-Lora, A.; Pretorius, L.; Romary, L.; Witt, A.; Zeldes, A.; Zipser, F. (2014): From <tiger2/> to ISOTiger - Community Driven Developments for Syntax Annotation in SynAF. In: Thirteenth International Workshop on Treebanks and Linguistic Theories (TLT13), Tübingen, Germany, 258-264. Verfügbar unter
De Kok, D. (2014): Build your own Treebank. of CLARIN Annual Conference. Verfügbar unter
Degaetano-Ortlieb, S.; Fankhauser, P.; Kermes, H.; Lapshinova-Koltunski, E.; Ordan, N.; Teich, E. (2014): Data Mining with Shallow vs. Linguistic Features to Study Diversification of Scientific Registers. In: 9th Edition of the Language Resources and Evaluation Conference LREC 2014, Reykjavik, Iceland. Verfügbar unter
Degaetano-Ortlieb, S.; Teich, E. (2014): Register diversification in evaluative language: The case of scientific writing. In: G. Thompson & L. Alba-Juez (Eds.), Evaluation in Context. 241–258. John Benjamins Publishing Company, Amsterdam, The Netherlands.
Deppermann, A.; Schmidt, T. (2014): Gesprächsdatenbanken als methodisches Instrument der Interaktionalen Linguistik - Eine exemplarische Untersuchung auf Basis des Korpus FOLK in der Datenbank für Gesprochenes Deutsch (DGD2). In: Korpora in der Linguistik - Perspektiven und Positionen zu Daten und Datenerhebung [= Mitteilungen des Deutschen Germanistenverbandes 1/2014], 1/2014, 4-17. Verfügbar unter
Drude, S.; Broeder, D.; Trilsbeek, P. (2014): The Language Archive and its solutions for sustainable endangered languages corpora. In.
Drude, S.; Trilsbeek, P.; Sloetjes, H.; Broeder, D. (2014): Best practices in the creation, archiving and dissemination of speech corpora at the Language Archive. In: R. Şükriye et al. (Eds.), Best Practices for Spoken Corpora in Linguistic Research 183-207. Newcastle upon Tyne: Cambridge Scholars Publishing. Verfügbar unter
Ďurčo, M.; Windhouwer, M. (2014): From CLARIN Component Metadata to Linked Open Data. In: LREC, Reykjavik, Iceland. Verfügbar unter
Eckart de Castilho, R.; Biemann, C.; Gurevych, I.; Yimam, S. M. (2014): WebAnno: a flexible, web-based annotation tool for CLARIN. In: Proceedings of the CLARIN Annual Conference (CAC) 2014, Soesterberg, Niederlande. Verfügbar unter
Eckart, K.; Heid, U. (2014): Resource interoperability revisited. In: 12. Konferenz zur Verarbeitung natürlicher Sprache, KONVENS 2014, Hildesheim, Germnay, 116-126. Verfügbar unter
Fankhauser, P.; Kermes, H.; Teich, E. (2014): Combining Macro- and Microanalysis for Exploring the Construal of Scientific Disciplinarity. In: Digital Humanities, Lausanne, Switzerland. Verfügbar unter
Fankhauser, P.; Knappen, J.; Teich, E. (2014): Exploring and Visualizing Variation in Language Resources. In: N. Calzolari et al. (Eds.): Ninth International Conference on Language Resources and Evaluation, LREC 2014, Reykjavik, Iceland. Verfügbar unter
Feiser, H. S.; Draxler, C. (2014): Perceptual voice similarity of related speakers: telephone and microphone recordings. In: 23rd Annual Conference of the International Association for Forensic Phonetics and Acoustics, IAFPA 2014, Zurich, Switzerland, 2-9.
Gärtner, M.; Björkelund, A.; Thiele, G.; Seeker, W.; Kuhn, J. (2014): Visualization, Search, and Error Analysis for Coreference Annotations. In: 52nd Annual Meeting of the Association for Computational Linguistics - System Demonstrations, Association for Computational Linguistics, Baltimore, Maryland, US, 7-12. Verfügbar unter
Goosen, T.; Eckart, T. (2014): Virtual Language Observatory 3.0: What’s New? In: CLARIN Annual Conference 2014, Soesterberg, The Netherlands. Verfügbar unter Annual Report 2014 FINAL.pdf.
Goosen, T.; Windhouwer, M.; Ohren, O.; Herold, A.; Eckart, T.; Ďurčo, M.; Schonefeld, O. (2014): CMDI 1.2: Improvements in the CLARIN Component Metadata Infrastructure. In: CLARIN Annual Conference, Soesterberg, The Netherlands. Verfügbar unter
Haaf, S.; Fankhauser, P.; Trippel, T.; Eckart, K.; Eckart, T.; Hedeland, H.; Herold, A.; Knappen, J.; Schiel, F.; Stegmann, J.; Uytvanck, D. V. (2014): CLARIN's Virtual Language Observatory (VLO) under scrutiny -- The VLO taskforce of the CLARIN-D centres. In: CLARIN Annual Conference, Soesterberg, Netherlands. Verfügbar unter
Haaf, S.; Schulz, M. (2014): Historical Newspapers & Journals for the DTA. In: Language Resources and Technologies for Processing and Linking Historical Documents and Archives – Deploying Linked Open Data in Cultural Heritage – LRT4HDA, Reykjavik, Island, 50-54. Verfügbar unter Proceedings.pdf - page=57.
Hedeland, H.; Jettka, D.; Lehmberg, T. (2014): Vernetzung statt Vereinheitlichung – Digitale Forschungsinfrastrukturen in den Geisteswissenschaften. In: - Zeitschrift für Bibliothek, Information und Technologie, 17 (5), 446-455. Verfügbar unter
Heinrich, C.; Schiel, F. (2014): The influence of alcoholic intoxication on the short-time energy function of speech. In: Journal of the Acoustical Society of America, 135 (5), 2942-2951. Verfügbar unter
Henrich, V.; Hinrichs, E. (2014a): Consistency of Manual Sense Annotation and Integration into the TüBa-D/Z Treebank13th International Workshop on Treebanks and Linguistic Theories, Tübingen, Germany. Verfügbar unter
Henrich, V.; Hinrichs, E. (2014b): Proceedings of the Workshop on Computational, Cognitive, and Linguistic Approaches to the Analysis of Complex Words and Collocations. of. University of Tübingen, Department of Linguistics. Verfügbar unter
Henrich, V.; Hinrichs, E.; Barkey, R. (2014): Aligning Word Senses in GermaNet and the DWDS Dictionary of the German LanguageProceedings of the 7th Global WordNet Conference (GWC 2014). 63-70, Tartu, Estonia. Verfügbar unter
Henrich, V.; Hinrichs, E.; Vodolazova, T. (2014): Aligning GermaNet Senses with Wiktionary Sense Definitions. In: Z. Vetulani & J. Mariani (Eds.), Human Language Technology: Challenges for Computer Science and Linguistics. 329-342. Verfügbar unter
Heyer, G.; Niekler, A.; Wiedemann, G. (2014): Brauchen die Digital Humanities eine eigene Methodologie? Überlegungen zur systematischen Nutzung von Text Mining Verfahren in einem politikwissenschaftlichen Projekt. In: Jahrestagung der Digital Humanities im deutschsprachigen Raum (DHd 2014). Verfügbar unter
Hinrichs, E. (2014): Auxiliary Fronting in German Subordinate Clauses. A Synchronic and Diachronic Corpus Study Using the CLARIN Research Infrastructure. In: CLARIN Annual Conference, Soesterberg, The Netherlands.
Hinrichs, E.; Kisler, T.; Trippel, T. (2014): Research infrastructures and resources for processing natural language. In: KONVENS, Hildesheim, Germany. special session.
Hinrichs, E.; Krauwer, S. (2014a): The CLARIN Research Infrastructure: Resources and Tools for E-Humanities Scholars. In: N. Calzolari et al. (Eds.), Proceedings of the Ninth International Conference on Language Resources and Evaluation (LREC'14). 1525–1531. ELRA, Reykjavík, Island. Verfügbar unter
Hinrichs, E.; Krauwer, S. (2014b): CLARIN: Resources, Tools, and Services for Digital Humanities Research. In: Digital Humanities, Lausanne, Switzerland.
Jettka, D.; Stein, D. (2014): The HZSK Repository: Implementation, Features, and Use Cases of a Repository for Spoken Language Corpora. In: D-Lib Magazine, 20 (9/10). Verfügbar unter Jettka, D. and D. Stein (2014). The HZSK Repository: Implementation, Features, and Use Cases of a Repository for Spoken Language Corpora. In: D-Lib Magazine, Vol. 20, No. 9/10
Jurish, B.; Thomas, C.; Wiegand, F. (2014): Querying the Deutsches Textarchiv. In: U. Kruschwitz et al. (Eds.), Proceedings of the Workshop MindTheGap 2014: Beyond Single-Shot Text Queries: Bridging the Gap(s) between Research Communities. 25-30. Verfügbar unter
Kamocki, P. (2014): The Liability of Service Providers in e-Research Infrastructures: Killing the Messenger? In: N. Calzolari et al. (Eds.), The Ninth International Conference on Language Resources and Evaluation (LREC'14). 4220-4224. European Language Resources Association (ELRA), Reykjavik, Iceland. Verfügbar unter
Kamocki, P.; Ketzan, E. (2014): Creative Commons and Language Resources: General Issues and What's New. In CC 4.0. CLARIN Legal Issues Committee (CLIC) White Paper Series.
Kermes, H.; Knappen, J.; Martinez, J. M. M.; Teich, E.; Vela, M. (2014): TeLeMaCo - A tool for the dissemination of teaching and learning materials. In: CLARIN Annual Conference, Soesterberg, Netherlands.
Kessler, W.; Kuhn, J. (2014): Detecting Comparative Sentiment Expressions - A Case Study in Annotation Design Decisions. In: KONVENS 2014, Hildesheim, Germany. Verfügbar unter
Kuhn, J. (2014): The Challenge for the Computational Sciences in Digital Humanities: Establishing a Common Meta-Methodological Framework. In: DHd Workshop "Informatik und die Digital Humanities", Leipzig, Germany.
Kunz, K.; Teich, E.; Hansen-Schirra, S.; Neumann, S.; Daut, P. (2014): Caught in the Middle - Language Use and Translation: A Festschrift for Erich Steiner on the Occasion of his 60th Birthday. Universitätsverlag des Saarlandes, Sarbrücken, Germany. Verfügbar unter
Kupietz, M. (2014): Der Programmbereich Korpuslinguistik am IDS: Gegenwart und Zukunft. In: I. f. D. Sprache (Ed.), Ansichten und Einsichten. 50 Jahre Institut für Deutsche Sprache. . 320-328. Institut für Deutsche Sprache Mannheim, Mannheim.
Kupietz, M.; Belica, C.; Lüngen, H.; Perkuhn, R. (2014): Zwischen Empirie und Ästhetik - Ansätze zur korpuslinguistischen Untersuchung und Bewertung von Sprachwandel. In: A. W. Plewnia, Andreas (Ed.), Sprachverfall? Dynamik - Wandel - Variation (= Jahrbuch des Instituts für Deutsche Sprache 2013). 149-169. de Gruyter 2014, Berlin/Boston.
Kupietz, M.; Biber, H.; Lüngen, H.; Bański, P.; Breiteneder, E.; Mörth, K.; Witt, A.; Takhsha, J. (2014): LREC 2014 Workshop Challanges in the Management of Large Corpora (CMLC2). of. European Language Resources Association (ELRA).
Kupietz, M.; Lüngen, H. (2014): Recent Developments in DeReKo. In: N. Calzolari (Ed.), Proceedings of the Ninth International Conference on Language Resources and Evaluation (LREC'14). 2378-2385. European Language Resources Association (ELRA) 2014.
Kupietz, M.; Lüngen, H.; Bański, P.; Belica, C. (2014): Maximizing the Potential of Very Large CorporaProceedings of the LREC-2014-Workshop Challenges in the Management of Large Corpora (CMLC2). European Language Resources Association (ELRA).
Kupietz, M.; Lüngen, H.; Mair, C. (2014): Korpuslinguistik und interdisziplinäre Perspektiven auf Sprache (CLIP). Marc Kupietz
Lüngen, H.; Kupietz, M. (2014): Das Deutsche Referenzkorpus DeReKo im Jubiläumsjahr 2014Sprachreport 2/2014. 24-26. Institut für Deutsche Sprache, Mannheim.
Mády, K.; Reichel, U. D.; Beňuš, Š. (2014): Accentual phrases in Slovak and Hungarian. In: Campbell et al. (Eds.): 7th International Conference on Speech Prosody, Dublin, Ireland, 752-756. Verfügbar unter
Mahlow, C. (2014): Verbal and Nominal Components of German and Spanish Phrasemes. In: Workshop on MWEs, Frankfurt am Main, Germany.
Mahlow, C.; Eckart, K.; Stegmann, J.; Blessing, A.; Thiele, G.; Gärtner, M.; Kuhn, J. (2014): Resources, Tools, and Applications at the CLARIN Center Stuttgart. In: 12th Konferenz zur Verarbeitung natürlicher Sprache (KONVENS 2014) 11-21.
Margaretha, E.; Lüngen, H. (2014): Building Linguistic Corpora from Wikipedia Articles and Discussions. In: Building and Annotating Corpora of Computer-mediated Communication: Issues and Challenges at the Interface between Computational and Corpus Linguistics. Journal for Language Technology and Computational Linguistics (JLCL). (= Journal for Language Technology and Computational Linguistics), 29 (2), 59-82.
Martens, S.; Passarotti, M. (2014): Thomas Aquinas in the TüNDRA: Integrating the Index Thomisticus Treebank into CLARIN-D. In: N. Calzolari et al. (Eds.): Ninth International Conference on Language Resources and Evaluation (LREC-2014), Reykjavík, Island. Verfügbar unter
Mixdorff, H.; Hönemann, A.; Niebuhr, O.; Draxler, C. (2014): Perceived Prominence Reflected by Imitations of Words with and without F0 Continuity. In: Proc. of 7th Speech Prosody, Dublin, Ireland.
Neumeyer, V.; Schiel, F.; Hoole, P. (2014): Speech of cochlear implant patients: An acoustic analysis of vowel production. In: 15th ICPLA Conference (International Clinical Linguistics and Phonetics Association), Stockholm, Sweden, 97.
Neumeyer, V.; Schiel, F.; Hoole, P.; Schuster, M.; Zirn, S. (2014): Acoustic analysis of vowel production during the first year after cochlear implantation. In: 13th International Conference on Cochlear Implants, Munich, Germany.
Pfefferkorn, O.; Fankhauser, P. (2014): On the Role of Historical Newspapers in Disseminating Foreign Words in German. In: Ninth conference on International Language Resources and Evaluation (LREC’14), Reykjavik, Iceland.
Reichel, U. D. (2014): Linking bottom-up intonation stylization to discourse structure. Computer, Speech, and Language. In: 28, 1340-1365.
Reichel, U. D.; Kisler, T. (2014): Language-independent grapheme-phoneme conversion and word stress assignment as a web service. In: Elektronische Sprachverarbeitung 2014, 42-49.
Reichel, U. D.; Mády, K. (2014): Comparing parameterizations of pitch register and its discontinuities at prosodic boundaries for HungarianProceedings of Interspeech 2014.
Reichel, U. D.; Markó, A.; Mády, K. (2014): Parameterization and automatic labeling of Hungarian intonationProceedings Speech Prosody. 738-742.
Ruhi, Ş.; Haugh, M.; Schmidt, T.; Wörner, K. (2014): Best Practices for Spoken Corpora in Linguistic Research. Cambridge Scholars Publishing, Newcastle, UK.
Schaal, S. G.; Kath, R. (2014): Zeit für einen Paradigmenwechsel in der politischen Theorie? In: A. Brodocz et al. (Eds.), Die Verfassung des Politischen: Festschrift für Hans Vorländer. 331-350. Springer Fachmedien Wiesbaden, Wiesbaden, Germany. DOI 10.1007/978-3-658-04784-9_20.
Schiel, F. (2014): CLARIN: Prosodic/Gesture Corpora - Existing Resources, Best Practice and Formats. In: PAGE Workshop 2014, Ludwig-Maximilians-Universität München, Germany.
Schiel, F.; Kisler, T. (2014): German Alcohol Language Corpus - the Question of Dialect. In: Ninth International Conference on Language Resources and Evaluation (LREC'14) 353-356.
Schmidt, T. (2014a): The Database for Spoken German - DGD2Proceedings of the Ninth International Conference on Language Resources and Evaluation (LREC'14), Reykjavik, Iceland: European Language Resources Association (ELRA).
Schmidt, T. (2014b): Gesprächskorpora und Gesprächsdatenbanken am Beispiel von FOLK und DGD. In: Gesprächsforschung - Online-Zeitschrift zur verbalen Interaktion 15, 169-233.
Schmidt, T. (2014c): The Research and Teaching Corpus of Spoken German - FOLKProceedings of the Ninth International Conference on Language Resources and Evaluation (LREC'14), Reykjavik, Iceland: European Language Resources Association (ELRA).
Schonefeld, O.; Witt, A. (2014): Forschungsinfrastrukturen am IDS: Gegenwart und Zukunft. In: I. f. D. Sprache (Ed.), Ansichten und Einsichten. 50 Jahre Institut für Deutsche Sprache. 329-336. Institut für Deutsche Sprache, 2014, Mannheim.
Schuller, B.; Steidl, S.; Batliner, A.; Schiel, F.; Krajevski, J. (2014): Introduction to the Special Issue on Broadening the View on Speaker Analysis. In: Computer, Speech and Language, 28 (2), 343-345.
Schuller, B.; Steidl, S.; Batliner, A.; Schiel, F.; Krajevski, J.; Weninger, F.; Eyben, F. (2014): Medium-term speaker states—A review on intoxication, sleepiness and the first challenge. In: Computer, Speech and Language, 346-374.
Sorokin, D.; Dima, C.; Hinrichs, E. (2014): Classification of Semantic Relations in German Nominal Compounds Using SVMs. In: V. Henrich & E. Hinrichs (Eds.): ESSLLI 2014 Workshop on Computational, Cognitive, and Linguistic Approaches to the Analysis of Complex Words and Collocations, Tübingen, Germany. Verfügbar unter
Stift, U.-M.; Schmidt, T. (2014): Mündliche Korpora am IDS: Vom Deutschen Spracharchiv zur Datenbank für Gesprochenes Deutsch. In: I. f. D. Sprache (Ed.), Ansichten und Einsichten. 50 Jahre Institut für Deutsche Sprache. 360-375. Institut für Deutsche Sprache, 2014, Mannheim.
Strunk, J.; Schiel, F.; Seifart, F. (2014): Untrained Forced Alignment of Transcriptions and Audio for Language Documentation Corpora using WebMAUS. In: Ninth International Conference on Language Resources and Evaluation (LREC'14) 3940-3947.
Tan, L.; Schumann, A.-K.; Martínez, J. M. M.; Bond, F. (2014): Sensible: L2 translation assistance by emulating the manual post-editing process. In: 8th International Workshop on Semantic Evaluation (SemEval 2014), Dublin, Ireland, 541–545. Verfügbar unter
Thiele, G.; Seeker, W.; Gärtner, M.; Björkelund, A.; Kuhn, J. (2014): A Graphical Interface for Automatic Error Mining in Corpora. In: 14th Conference of the European Chapter of the Association for Computational Linguistics, Gothenburg, Sweden, 57-60.
Vela, M.; Schumann, A.-K.; Wurm, A. (2014a): Beyond Linguistic Equivalence. An Empirical Study of Translation Evaluation in a Translation Learner Corpus. In: Workshop on Humans and Computer-assisted Translation (HaCaT 2014).
Vela, M.; Schumann, A.-K.; Wurm, A. (2014b): Human Translation Evaluation and its Coverage by Automatic Scores. In: LREC Workshop on Automatic and Manual Metrics for Operational Translation Evaluation (MTE), Reykjavik, Iceland.
Wälischmiller, L.; Schiel, F.; Hoole, P.; Neumeyer, V.; Zirn, S. (2014): Intonation of speakers with cochlear implant. In: CI 2014, Munich, Germany.
Wright, S. E.; Windhouwer, M.; Schuurman, I.; Broeder, D. (2014): Segueing from a Data Category Registry to a Data Concept Registry. In: 11th International Conference on Terminology and Knowledge Engineering (TKE 2014), Berlin, Germany. Verfügbar unter
Wynne, M.; Trippel, T.; Draxler, C. (2014): Using CLARIN for Digital Research. In: Digital Humanities, Lausanne, Switzerland. Verfügbar unter
Zampieri, M.; Vela, M. (2014): Quantifying the Influence of MT Output in the Translators' Performance: A Case Study in Technical Translation. In: EACL Workshop on Humans and Computer-assisted Translation (HaCat) 93-98.
Amoia, M. (2013): Interactive Video-Training for Medical Professionals. In: The 5th International Conference on Computer Supported Education (CSEDU 2013).
Amoia, M.; Kermes, H.; Knappen, J.; Martínez, J. M.; Teich, E.; Vela, M. (2013): TeLeMaCo - a collaborative repository for training and teaching materials in linguistics. In: The International Conference of the German Society for Computational Linguistics and Language Technology (GSCL 2013).
Beck, K.; Hinrichs, E.; Trippel, T.; Zastrow, T. (2013): CLARIN-D – eine web- und zentrenbasierte Forschungsinfrastruktur für die Geistes- und Sozialwissenschaften. In: 35. Jahrestagung der Deutschen Gesellschaft für Sprachwissenschaft – Informationsstruktur, Potsdam, Germany.
Blessing, A.; Sonntag, J.; Kliche, F.; Heid, U.; Kuhn, J.; Stede, M. (2013): Towards a Tool for Interactive Concept Building for Large Scale Analysis in the Humanities. In: 7th Workshop on Language Technology for Cultural Heritage, Social Sciences, and Humanities, Sofia, Bulgaria, 55-64.
Boehlke, V. (2013): CLARIN-D User Relations. In: CLARIN Annual Meeting, Prag, Czech Republic.
Boehlke, V.; Eckart, T.; Kuras, C. (2013): Tools and Resources of the CLARIN D Centre Leipzig. In: CLARIN-D M24 Workshop, Nijmegen, Netherlands. Verfügbar unter
Boehlke, V.; Heyer, G.; Wittenburg, P. (2013): IT-Based Research Infrastructures for the Humanities and Social Sciences - Developments, Examples, Standards, and Technology. In: Information Technology.
Ďurčo, M.; Windhouwer, M. (2013): Semantic Mapping in CLARIN Component Metadata. In: Metadata and Semantics Research. In: MTSR, Thessaloniki, Greece, 163-16810.1007/978-3-319-03437-9_17.
Eckart, T. (2013): TEI-Integrator. In: 2. CLARIN-D Disseminationsworkshop, Leipzig, Germany. Verfügbar unter
Fankhauser, P.; Fiedler, N.; Witt, A. (2013): Forschungsdatenmanagement in den Geisteswissenschaften am Beispiel der germanistischen Linguistik. In: Zeitschrift für Bibliothekswesen und Bibliographie (ZfBB), 60 (6), 296-306.
Gärtner, M.; Thiele, G.; Seeker, W.; Björkelund, A.; Kuhn, J. (2013): ICARUS - An Extensible Graphical Search Tool for Dependency Treebanks. In: 51st Annual Meeting of the Association for Computational Linguistics: System Demonstrations, Sofia, Bulgaria, 55-60. Verfügbar unter
Geyken, A.; Haaf, S.; Jurish, B.; Schulz, M.; Thomas, C.; Wiegand, F. (2013): DTA-/CLARIN-D-Konferenz und -Workshops: Historische Textkorpora für die Geistes- und Sozialwissenschaften. Fragestellungen und Nutzungsperspektiven. In: CLARIN-D-Newsletter 14/15. Verfügbar unter
Gloning, T. (2013): Digitale Ressourcen und sprachgeschichtliche Forschung. Am Beispiel des "Polytechnischen Journals" (1820-1831). In: Jahrestagung der Gesellschaft für germanistische Sprachgeschichte (GGSG), Universität Kassel.
Gloning, T.; Neuber, F.; Stäcker, T.; Seim, S.; Thomas, C. (2013): Zwischenbericht des CLARIN–D Kurationsprojekts 1 der F-AG 1; Berichtszeitraum 01.09.2012–28.02.2013.
Haaf, S.; Wiegand, F.; Geyken, A. (2013): Measuring the Correctness of Double-Keying: Error Classification and Quality Control in a Large Corpus of TEI-Annotated Historical Text. In: Journal of the Text Encoding Initiative. 10.4000/jtei.739.
Heyer, G.; Boehlke, V. (2013): Text Mining in the Humanities – A Plea for Research Infrastructures. In: J. Gippert & R. Gehrke (Eds.), "Historical Corpora". Corpus Linguistics and Interdisciplinary Perspectives on Language (CLIP). Gunther Narr Publishing House, Tübingen, Germany. Verfügbar unter
Hinrichs, E.; Henrich, V.; Barkey, R. (2013): Using Part-Whole Relations for Automatic Deduction of Compound-Internal Relations in GermaNet. In: Language Resources and Evaluation, 47 (3), 839-858.
Jurish, B. (2013): Canonicalizing the Deutsches Textarchiv. In: I. Hafemann (Ed.): Perspektiven einer corpusbasierten historischen Linguistik und Philologie. Internationale Tagung des Akademienvorhabens „Altägyptisches Wörterbuch“ an der Berlin-Brandenburgischen Akademie der Wissenschaften, Berlin, Germany.
Jurish, B.; Drotschmann, M.; Ast, H. (2013): Constructing a Canonicalized Corpus of Historical German by Text Alignment. In: New Methods in Historical Corpora, Volume 3 of Corpus Linguistics and Interdisciplinary Perspectives on Language (CLIP), 3.
Jurish, B.; Würzner, K.-M. (2013a): Multi-threaded composition of finite-state automata. In: 11th International Conference on Finite State Methods and Natural Language Processing, St Andrews, Scotland, 81-89. Verfügbar unter
Jurish, B.; Würzner, K.-M. (2013b): Word and Sentence Tokenization with Hidden Markov Models In: Journal for Language Technology and Computational Linguistics (JLCL), 28 (2), 61-83. Verfügbar unter
Kupietz, M.; Frick, E. (2013): Korpusanalyseplattform der nächsten Generation. In: I. Kratochvílová & N. R. Wolf (Eds.), Grundlagen einer sprachwissenschaftlichen Quellenkunde (= Studien zur Deutschen Sprache 66). 27-36. Narr 2013, Tübingen.
Lapshinova, E.; Kunz, K. (2013): Cross-linguistic analysis of cohesion: Variation across production types and registers. In: Workshop at ICAME34 "Cross-linguistic studies at the interface between lexic and grammar", Santiago de Compostela, Spain.
Lapshinova-Koltunski, E. (2013): VARTRA: A Comparable Corpus for Analysis of Translation Variation Proceedings of 6th Workshop on Building and Using Comparable Corpora (BUCC), Sofia, Bulgaria.
Lapshinova-Koltunski, E.; Degaetano, S.; Teich, E.; Kermes, H. (2013): Cohesive conjunctions in English and German: Systemic contrasts and textual differences. In: F. Poppi & W. Cheng (Eds.), Linguistic evolution of conjunctive relations in emerging scientific registers. Cambridge Scholars Publishing.
Lapshinova-Koltunski, E.; Degaetano-Ortlieb, S.; Kermes, H.; Teich, E. (2013): Usefulness of Corpora Enriched with Annotations on Abstract Linguistic Levels. In: Genre- and Register-Related Text and Discourse Features in Multilingual Corpora, Brussels, Belgium.
Lapshinova-Koltunski, E.; Kunz, K. (2013): Detecting Cohesion: semi-automatic annotation procedures. In: Corpus Linguistics, Lancaster, UK.
Mair, C. (2013): Developing digital infrastructure for language documentation: some personal experiences, some lessons learnt, and perspectives from CLARIN-D. In: Applying Documentary Linguistics, Freiburg.
Martens, S. (2013): TüNDRA: A Web Application for Treebank Search and Visualization. In: 12th International Workshop on Treebanks and Linguistic Theories (TLT 2013), Sofia.
Neuber, F.; Thomas, C. (2013): Kurz vor dem Ziel: Das Kurationsprojekt 1 der F-AG 1 "Deutsche Philologie". In: CLARIN-D-Newsletter, 5, 29-32.
Reichel, U. D. (2013): Das BAS-Repository. In: CLARIN-D Newsletter, 5, 22-26. Verfügbar unter
Schmidt, T.; Dickgießer, S.; Gasch, J. (2013): Die Datenbank für Gesprochenes Deutsch - DGD2. In.
Schmidt, T.; Wörner, K.; Hedeland, H.; Lehmberg, T. (2013): Leitfaden zur Beurteilung von Aufbereitungsaufwand und Nachnutzbarkeit von Korpora gesprochener Sprache. 1-22. Verfügbar unter [].
Sperberg-McQueen, C. M.; Schonefeld, O.; Kupietz, M.; Lüngen, H.; Witt, A. (2013): Igel: Comparing document grammars using XQuery. In: The Markup Conference 2013 (Balisage Series on Markup Technologies 10), Montréal, Cannada.
Teich, E. (2013): Choices in analyzing choice: methods and techniques for register analysis. In: L. Fontaine et al. (Eds.), Systemic Functional Linguistics: Exploring Choice. 417-431. Cambridge University Press.
Teich, E.; Degaetano-Ortlieb, S.; Kermes, H.; Lapshinova-Koltunski, E. (2013): Scientific registers and disciplinary diversification: a comparable corpus approach. In: The 6th Workshop on Building and Using Comparable Corpora (BUCC), Sofia, Bulgaria.
Westpfahl, S.; Schmidt, T. (2013): POS für(s) FOLK - Part of Speech Tagging des Forschungs- und Lehrkorpus Gesprochenes Deutsch. In: Journal for Language Technology and Computational Linguistics (JLCL), (1), 139-156.
Zastrow, T.; Hinrichs, E.; Hinrichs, M.; Beck, K. (2013): Scientific Visualization as CLARIN-D Web Applications. In: Digital Humanities. Verfügbar unter
Amoia, M.; Bretaudiere, T.; Denis, A.; Gardent, C.; Perez-Beltrachini, L. (2012): A Serious Game for Second Language Acquisition in a Virtual Environment. In: Journal on Systemics, Cybernetics and Informatics 1, 24-34.
Arranz, V.; Broeder, D.; Gaiffe, B.; Gavrilidou, M.; Monachini, M.; Trippel, T. (2012a): Describing Language Resources with Metadata: Towards Flexibility and Interoperability in the Documentation of Language Resources. In: LREC 2012.
Arranz, V.; Broeder, D.; Gaiffe, B.; Gavrilidou, M.; Monachini, M.; Trippel, T. (2012b): Proceedings of the Workshop Describing Language Resources with Metadata: Towards Flexibility and Interoperability in the Documentation of Language Resources.LREC 2012, Istanbul, Türkei. Verfügbar unter Metadata Proceedings.pdf.
Bański, P.; Fischer, P. M.; Frick, E.; Ketzan, E.; Kupietz, M.; Schnober, C.; Schonefeld, O.; Witt, A. (2012): The New IDS Corpus Analysis Platform: Challanges and Prospects. In: N. Calzolari et al. (Eds.), Proceedings of the Eight International Conference on Language Resources and Evaluation (LREC'12). 2905-2911. European Language Resources Association (ELRA), Istanbul, Turkey.
Bański, P.; Majewski, S.; Stührenberg, M.; Werthmann, A. (2012): Building and Maintaining the TEI LingSIG Bibliography. Using Open Source Tools for an Open Content Initiative. In: TEI and Linguistics. Journal of the Text Encoding Initiative, 3.
Banski, P.; Modignani Picozzi, E. L.; Witt, A. (2012): TEI and Linguistics. In: Journal of the Text Encoding Initiative 3.
Bański, P.; Modignani Picozzi, E. L.; Witt, A. (2012): Editorial Introduction to the Third Issue. In: TEI and Linguistics. Journal of the Text Encoding Initiative, 3.
Beißwenger, M.; Ermakova, M.; Geyken, A.; Lemnitzer, L.; Storrer, A. (2012a): DeRiK. A German Reference Corpus of Computer-Mediated Communication. In: Digital Humanities Conference, Hamburg. Verfügbar unter
Beißwenger, M.; Ermakova, M.; Geyken, A.; Lemnitzer, L.; Storrer, A. (2012b): A TEI schema for the Representation of the Computer-mediated Communication. In: TEI (Text Encoding Initiative) Journal, Vol 3. Verfügbar unter
Beißwenger, M.; Lemnitzer, L. (2012): Aufbau eines Referenzkorpus zur deutschsprachigen internetbasierten Kommunikation: Fragen der Annotation und Verarbeitung. In: Talk, Webkorpora in Linguistik und Sprachforschung (Workshop), Mannheim.
Blessing, A.; Eckart, K.; Kuhn, J.; Stegmann, J.; Zinsmeister, H. (2012): Interaktive Textanalyse und das CLARIN-D Infrastrukturprojekt. In: Ringvorlesung Digital Humanities: Projekte und Perspektiven.
Boehlke, V.; Compart, T.; Eckart, T. (2012): Building up a CLARIN resource center – Step 1: Providing metadata. Workshop on Describing Language Resources with Metadata. In: LREC 2012, Istanbul, Turkey.
Broeder, D.; Uytvanck, D. v.; Gavrilidou, M.; Trippel, T. (2012): Standardizing a Component Metadata Infrastructure. In: N. Calzolari et al. (Eds.): International Conference on Language Resources and Evaluation (LREC 2012), Istanbul, Turkey. Verfügbar unter
Broeder, D.; Windhouwer, M.; van Uytvanck, D.; Trippel, T.; Goosen, T. (2012): CMDI: a Component Metadata Infrastructure. In: V. Arranz et al. (Eds.): Proceedings of the LREC 2012 Workshop Describing Language Resources with Metadata: Towards Flexibility and Interoperability in the Documentation of Language Resources., Istanbul, Türkei, 1-4. Verfügbar unter Metadata Proceedings.pdf.
Delz, M. (2012): WebLicht - a web based linguistic chaining tool for incremental text annotation. In: Tutorium auf der 52. Studentischen Tagung Sprachwissenschaften (StuTS 52), Berlin.
Dima, E.; Henrich, V.; Hinrichs, E.; Hinrichs, M.; Hoppermann, C.; Trippel, T.; Zastrow, T.; Zinn, C. (2012): A Repository for the Sustainable Management of Research Data. In: 8th International Conference on Language Resources and Evaluation. Verfügbar unter
Dima, E.; Hinrichs, E.; Hinrichs, M.; Kislev, A.; Trippel, T.; Zastrow, T. (2012): Integration of WebLicht into the CLARIN Infrastructure. In: CLARIN-D/DARIAH Workshop „Service-oriented Architectures (SOAs) for the Humanities: Solutions and Impacts“ at Digital Humanities Conference, Hamburg, Germany, 17-23. Verfügbar unter
Dima, E.; Hoppermann, C.; Trippel, T.; Zinn, C. (2012): A Metadata Editor to Support the Description of Linguistic Resources. In: LREC 2012, Istanbul, Turkey. Verfügbar unter
Dittmann, H.; Ďurčo, M.; Geyken, A.; Roth, T.; Zimmer, K. (2012): A distributed corpus of German varieties. In: Multilingual Corpora and Multilingual Corpus Analysis, 14, 339–346.
Draxler, C.; Kisler, T. (2012): Tutorien zu SpeechRecorder, WebMAUS und percy In: 52. Studentische Tagung Sprachwissenschaft (StuTS), Berlin.
Drude, S.; Trilsbeek, P.; Broeder, D. (2012): Language Documentation and Digital Humanities: The (DoBeS) Language Archive. In: J. C. Meister (Ed.): Digital Humanities 2012, Hamburg. Verfügbar unter
Eckart, K. (2012): A standardized general framework for encoding and exchange of corpus annotations: The Linguistic Annotation Framework, LAF. In: KONVENS 2012, SFLR Workshop, Vienna, Austria, 506-515. Verfügbar unter
Eckart, K.; Riester, A.; Schweitzer, K. (2012): A Discourse Information Radio News Database for Linguistic Analysis. In: C. Chiarcos et al. (Eds.), Linked Data in Linguistics. Representing and Connecting Language Data and Language Metadata. 65-75. Springer, Heidelberg.
Fischer, P. M.; Witt, A. (2012): Developing Solutions for Long-Term Archiving of Spoken Language Data at the Institut für Deutsche Sprache. In: LREC 2012 Workshop “Best Practices for Speech Corpora in Linguistic Research”, European Language Resources Association (ELRA), Istanbul, Turkey, 47-50. Verfügbar unter Abstracts.pdf.
Frick, E.; Schnober, C.; Bański, P. (2012): Evaluating Query Languages for a Corpus Processing System. In: Proceedings of the Eight International Conference on Language Resources and Evaluation (LREC-2012), Istanbul, Turkey, 2286-2294.
Geyken, A.; Gloning, T.; Stäcker, T. (2012): CLARIN-D-Panel bei der DH 2012 in Hamburg. Ein Panel zu „Large Historical Reference Corpora of German“ an der Uni Hamburg. In: CLARIN-D-Newsletter, 2, 13/14. Verfügbar unter
Geyken, A.; Haaf, S.; Jurish, B.; Schulz, M.; Thomas, C.; Wiegand, F. (2012): TEI und Textkorpora. Fehlerklassifikation und Qualitätskontrolle vor, während und nach der Texterfassung im Deutschen TextarchivJahrbuch für Computerphilologie online. Verfügbar unter
Geyken, A.; Haaf, S.; Kupietz, M.; Lüngen, H.; Witt, A. (2012): CLARIN-D User Guide, Chapter 6.2: Text CorporaCLARIN-D AP5: CLARIN-D User Guide. Version: 1.0.1, Berlin, 2012. Verfügbar unter
Geyken, A.; Haaf, S.; Thomas, C.; Wiegand, F.; Stäcker, T.; Gloning, T. (2012): Compiling large historical reference corpora of German: Quality Assurance, Interoperability and Collaboration in the Process of Publication of Digitized Historical Prints. In: Digital Humanities, Hamburg, Germany.
Geyken, A.; Haaf, S.; Wiegand, F. (2012): The DTA ‘base format’: A TEI-Subset for the Compilation of Interoperable Corpora. In: J. Jancsary (Ed.): 11th Conference on Natural Language Processing (KONVENS) - Empirical Methods in Natural Language Processing (LThist 2012 Workshop), Vienna, Austria, 383-391. Verfügbar unter
Hedeland, H.; Schmidt, T. (2012): Technological and methodological challenges in creating, annotating and sharing a learner corpus of spoken German. In: Multilingual Corpora and Multilingual Corpus Analysis, Hamburg Studies in Multilingualism, 14, 25-46. Verfügbar unter
Hedeland, H.; Wörner, K. (2012): Experiences and Problems creating a CMDI profile from an existing Metadata Schema. In: LREC-Workshop Describing LRs with Metadata: Towards Flexibility and Interoperability in the Documentation of LR, Limerick, Ireland. Verfügbar unter Metadata Proceedings.pdf.
Herold, A.; Lemnitzer, L. (2012a): CLARIN-D User GuideCLARIN-D AP5: CLARIN-D User Guide. Version: 1.0.1. 128. BBAW, Berlin. Verfügbar unter
Herold, A.; Lemnitzer, L. (2012b): CLARIN-D User Guide: Introduction and BackgroundCLARIN-D AP5: CLARIN-D User Guide. Version: 1.0.1, Berlin, 2012. Verfügbar unter
Herold, A.; Lemnitzer, L.; Geyken, A. (2012): Integrating lexical resources through an aligned lemma list. In: C. Chiarcos et al. (Eds.), Linked Data in Linguistics. 35-44. Springer, Berlin, Heidelberg. Verfügbar unter
Heyer, G. (2012): Ansätze und Perspektiven zum Einsatz von Text Mining in den Geisteswissenschaften. In: Eingeladener Vortrag an der Goethe Universität Frankfurt/Main.
Hinrichs, E.; Beck, K. (2012): Web-Based Linguistic Annotation: Current Practice and Future Directions. In: Mapping the Landscape of eResearch, Digitization Lifecycle, MPG, Berlin, Germany. Verfügbar unter
Jurish, B. (2012): Finite-state Canonicalization Techniques for Historical German.
Kasper, W.; Vela, M. (2012): Monitoring and Summarization of Hotel Reviews. In: M. F. a. F. R. a. L. Cantoni (Ed.): Information and Communication Technologies in Tourism 2012.
Kermes, H. (2012a): Formulaic expressions: in this paper but where? . In: Proceedings of ICAME 33, Leuven, Belgium.
Kermes, H. (2012b): A methodology for the extraction of information about the usage of formulaic expressions in scientific texts. In: Proceedings of LREC 2012, Istanbul, Turkey.
Kermes, H.; Teich, E. (2012): Formulaic expressions in scientific texts: Corpus design, extraction and exploration. In: Lexicographica, 28 (1), 99-120.
Kisler, T.; Schiel, F.; Sloetjes, H. (2012): Signal processing via web services: the use case WebMAUS. In: Digital Humanities 2012, Hamburg, Germany, 30-34.
Klosa, A.; Kupietz, M.; Lüngen, H. (2012): Zum Nutzen von Korpusauszeichnungen für die LexikographieLexicographica 28. 71-97. de Gruyter 2012, Berlin/Boston.
Lapshinova-Koltunksi, E.; Teich, E.; Degaetano-Ortlieb, S. (2012): Terminology now and then: changes across periods in academic writing. In: ICAME 33, Leuven, Belgium. Verfügbar unter
Lapshinova-Koltunski, E.; Kunz, K.; Amoia, M. (2012): Compiling a Multilingual Spoken Corpus. In: GSCP 2012 International Conference: SPEECH and CORPORA, Universidade Federal de Minas Gerais, Brazil.
Lapshinova-Koltunski, E.; Teich, E.; Degaetano-Ortlieb, S. (2012): Tracing 'hybridity' in academic discourse: a corpus-based approach. In: ESFLCW 2012, Bertinoro, Italy.
Lüngen, H. (2012): DeReKo-Archiv jetzt mit fünf Milliarden Textwörtern. Zum größten digitalen Textarchiv für deutsche Texte der GegenwartSprachreport 1/2012. 26. Institut für Deutsche Sprache 2012, Mannheim.
Lüngen, H.; Sperberg-McQueen, M. C. (2012): A TEI P5 Document Grammar for the IDS Text Model. In: TEI and Linguistics. Journal of the Text Encoding Initiative 3.: 2012.
Martínez Martínez, J. M.; Serrat Roozen, I. (2012): ECPC: el discurso parlamentario europeo desde la perspectiva de los estudios traductológicos de corpus. In: Linguamática, 4 (2), 65-73. Verfügbar unter
Neuber, F.; Thomas, C. (2012): Vorstellung des Kurationsprojekts 1 der Clarin-D-FAG 1 „Deutsche Philologie“. In: CLARIN-D-Newsletter, 3, 11-13. Verfügbar unter
Perkuhn, R.; Keibel, H.; Kupietz, M. (2012): Korpuslinguistik. Fink, 2012, Paderborn.
Reichel, U. D. (2012): PermA and Balloon: Tools for string alignment and text processing. In: Proc. Interspeech, Portland, Oregon, US. Verfügbar unter
Schmidt, T. (2012): EXMARaLDA and the FOLK tools ― two toolsets for transcribing and annotating spoken language. In: N. Calzolari (Ed.): The Eighth International Conference on Language Resources and Evaluation (LREC 2012), Istanbul, Turkey, 236-240.
Schmidt, T.; Wörner, K. (2012): EXMARaLDA. In: J. Durand et al. (Eds.), Handbook on Corpus Phonology. Oxford University Press
Schuurman, I.; Windhouwer, M. (2012): Tutorial: ISOcat in daily life - possible uses of a large repository of widely used linguistic concepts. . In: Workshop at the LREC 2012, Istanbul.
Stehouwer, H.; Ďurčo, M.; Auer, E.; Broeder, D. (2012): Federated Search: Towards a Common Search Infrastructure. In: N. Calzolari et al. (Eds.): Proceedings of the Eight International Conference on Language Resources and Evaluation (LREC'12), Istanbul, Türkei, 3255-3259. Verfügbar unter
Teich, E.; Degaetano-Ortlieb, S.; Kermes, H.; Lapshinova-Koltunski, E. (2012): Register contact: an exploration of recent linguistic trends in the scientific domain. In: Historical Corpora 2012, Frankfurt, Germany.
Telljohann, H.; Hinrichs, E.; Kübler, S.; Zinsmeister, H.; Beck, K. (2012): Stylebook for the Tübingen Treebank of Written German (TüBa-D/Z), Seminar für Sprachwissenschaft Tübingen.
Thomas, C.; Wiegand, F. (2012): Making great work even better. Appraisal and Digital Curation of widely dispersed Electronic Textual Resources (c. 15th–19th cent.). In: CLARIN-D (Ed.): International Conference “Historical Corpora 2012”, Goethe University, Frankfurt, Germany. Verfügbar unter urn:nbn:de:kobv:b4-opus-23081.
Trippel, T.; Hoppermann, C.; Depoorter, G. (2012): The Component Metadata Infrastructure (CMDI) in a Project on Sustainable Linguistic ResourcesProceedings of the LREC 2012 Workshop Describing Language Resources with Metadata: Towards Flexibility and Interoperability in the Documentation of Language Resources., Istanbul, Türkei. Verfügbar unter Metadata Proceedings.pdf.
Van Uytvanck, D.; Stehouwer, H.; Lampen, L. (2012): Semantic metadata mapping in practice: The Virtual Language Observatory. In: N. Calzolari et al. (Eds.), Proceedings of the Eight International Conference on Language Resources and Evaluation (LREC'12). ELRA, Istanbul, Türkei. Verfügbar unter
Vela, M. (2012): Extraction of ontology schema components from financial news. Postfach 151141, 66041 Saarbrücken. Verfügbar unter
Windhouwer, M.; Wright, S. E. (2012): Linked data in linguistics: Representing and connecting language data and language metadata. In: C. Chiarcos et al. (Eds.), Linking to linguistic data categories in ISOcat. 99-107. Springer, Berlin.
Wittenburg, P.; van Uytvanck, D. (2012): CLARIN-D User Guide, Chapter 2: Metadata. CLARIN-D. Verfügbar unter
Wörner, K. (2012): Finding the balance between strict defaults and total openness: Collecting and managing metadata for spoken language corpora with the EXMARaLDA Corpus Manager. In: T. Schmidt & K. Wörner (Eds.), Multilingual Corpora and Multilingual Corpus Analysis, Hamburg Studies in Multilingualism 14. 383-400. John Benjamin Publishing Company.
Zastrow, T.; Dima, E. (2012): Workflow Engines in Digital Humanities. In: Joint CLARIN-D/DARIAH Workshop „Service-oriented Architectures (SOAs) for the Humanities: Solutions and Impacts" - Digital Humanities Conference, Hamburg, Germany, 56-61. Verfügbar unter
Zinn, C.; Hoppermann, C.; Trippel, T. (2012): The ISOcat Registry Reloaded: a Re-engineering Proposal Following In: E. Simperl et al. (Eds.): 9th Extended Semantic Web Conference (ESWC 2012) 285-29910.1007/978-3-642-30284-8_26.
Zinsmeister, H.; Breckle, M. (2012): The ALeSKo learner corpus: design – annotation – quantitative analyses. In: T. Schmidt & K. Wörner (Eds.), Multilingual Corpora and Multilingual Corpus Analysis. Hamburg Studies in Multilingualism. 71–96. John Benjamins Publishing Company.
Amoia, M. (2011): I-FLEG: A 3D-Game for Learning French. In: The 9th International Conference on Education and Information Systems, Technologies and Applications (EISTA 2011).
Amoia, M.; Gardent, C.; Perez-Beltrachini, L. (2011): Learning a Second Language with a Videogame. In: The International Conference on Information and Communication Technologies (ITS 2011) for Language Learning.
Barkey, R.; Hinrichs, E.; Hoppermann, C.; Trippel, T.; Zinn, C. (2011a): Komponenten-basierte Metadatenschemata und Facetten-basierte Suche: Ein flexibler und universeller Ansatz. In: J. Griesbaum et al. (Eds.): 12. Internationales Symposium für Informationswissenschaft (ISI 2011) (58), Hildesheim, S. 62-73.
Barkey, R.; Hinrichs, E.; Hoppermann, C.; Trippel, T.; Zinn, C. (2011b): Trailblazing through Forests of Resources in Linguistics. In: Digital Humanties (DH), Stanford.
Belica, C.; Kupietz, M.; Witt, A.; Lüngen, H. (2011): The Morphosyntactic Annotation of DeReKo: Interpretation, Opportunities, and Pitfalls. In: M. Konopka et al. (Eds.): Grammatik und Korpora. Dritte Internationale Konferenz, Mannheim, Germany, 451-469.
Broeder, D.; Schonefeld, O.; Trippel, T.; Van Uytvanck, D.; Witt, A. (2011): A pragmatic approach to XML interoperability – the Component Metadata Infrastructure (CMDI). In: Presented at Balisage: The Markup Conference 2011, Montréal, Canada, 10.4242/BalisageVol7.Broeder01.
Degaetano, S.; Teich, E. (2011): Exploring a semi-automatic approach for the analysis of interpersonal meaning in large corpora. In: International Systemic Functional Congress (ISFC 38), Lisbon, Portugal.
Geyken, A. (2011a): Die dynamische Verknüpfung von Kollokationen mit Korpusbelegen und deren Repräsentation im DWDS-Wörterbuch. In: Datenmodellierung für Internetwörterbücher 2/2011, 9-22.
Geyken, A. (2011b): Statistische Wortprofile zur schnellen Analyse der Syntagmatik in Textkorpora. In: A. Abel & R. Zanin (Eds.), Korpora in Lehre und Forschung. 115-137, Bozen/Bolzano.
Geyken, A. (2011c): Wege zu einem historischen Referenzkorpus des Deutschen: das Projekt Deutsches Textarchiv. In: I. Hafemann (Ed.): Perspektiven einer corpusbasierten historischen Linguistik. Internationale Tagung des Akademienvorhabens „Altägyptisches Wörterbuch“, Berlin, Germany, 221-234.
Geyken, A.; Haaf, S.; Jurish, B.; Schulz, M.; Steinmann, J.; Thomas, C.; Wiegand, F. (2011): Das Deutsche Textarchiv: Vom historischen Korpus zum aktiven Archiv. In: S. Schomburg et al. (Eds.), Digitale Wissenschaft. Stand und Entwicklung digital vernetzter Forschung in Deutschland. 157-161, Köln. Verfügbar unter - page=159.
Hedeland, H.; Lehmberg, T.; Schmidt, T.; Wörner, K. (2011): Multilingual Corpora at the Hamburg Centre for Language Corpora. In: T. Schmidt & K. Wörner (Eds.): GSCL Conference, Hamburg, Germany.
Heyer, G.; Büchler, M.; Boehlke, V. (2011): Aspects of an Infrastructure for eHumanities. In: Supporting Digital Humanities, Copenhagen, Denmark.
Hoppermann, C.; Trippel, T.; Zinn, C. (2011): Devil’s Advocate on Metadata in Science. In: H. Hedeland et al. (Eds.): Conference of the German Society for Computational Linguistics and Language Technology (GSCL), Hamburg, 105-109.
Jurish, B. (2011a): Comparing canonicalizations of historical German text. In: 11th Meeting of the ACL Special Interest Group on Computational Morphology and Phonology (SIGMORPHON) 72-77. Verfügbar unter
Jurish, B. (2011b): More than Words. Using Token Context to Improve Canonicalization of Historical German. In: Journal for language technology and computational linguistics (JLCL). Verfügbar unter
Kasper, W.; Vela, M. (2011): Sentiment Analysis for Hotel Reviews. In: Computational Linguistics-Applications Conference.
Kermes, H. (2011): Usage and function of formulaic expressions in scientific texts. In: Corpus Linguistics 2011, Birmingham, UK, 86-87.
Maria, G.; Labropoulou, P.; Piperidis, S.; Monachini, M.; Frontini, F.; Francopoulo, G.; Arranz, V.; Mapelli, V. (2011): A metadata schema for the description of language resources (LRs). In: 5th International Joint Conference on Natural Language Processing (IJCNLP 2011).
Schmidt, T.; Wörner, K.; Hedeland, H.; Lehmberg, T. (2011): New and future developments in EXMARaLDA. In: T. Schmidt & K. Wörner (Eds.): GSCL Conference, Hamburg, Germany.
Schuurman, I.; Windhouwer, M. (2011): Explicit semantics for enriched documents. What do ISOcat, RELcat and SCHEMAcat have to offer? In: 2nd Supporting Digital Humanities conference (SDH 2011), Copenhagen.
Teich, E.; Degaetano, S. (2011): SciTex - A Diachronic Corpus for Analyzing the Development of Scientific Registers. In: Conference on New Methods in Historical Corpora, University of Manchaster, UK.
Teich, E.; Lapshinova, E.; Degaetano, S. (2011): Interdisciplinarity in acadamic discourse - A corpus-based analysis. In: Interdisciplinary Linguistics, Belfast, UK.
Teich, E.; Lapshinova, E.; Kermes, H.; Degaetano, S. (2011): Linguistic evolution of emerging scientific registers. In: Clavier 2011, Modena, Italy.
Vela, M.; Declerck, T. (2011): A Multi-Layer Approach on the Extraction of Schema Components of Ontologies from Text. In: SEMAPRO 2011.
Zinn, C. (2011): Building a Faceted Browser in CouchDB Using Views on Views and Erlang Metaprogramming. In: Functional and Constraint Logic Programming: 20th International Workshop, WFLP 2011, Odense, Denmark, 104-122.
Belica, C.; Keibel, H.; Kupietz, M.; Perkuhn, R.; Vachková, M. (2010): Putting corpora into perspective. Rethinking synchronicity in corpus linguistics. In: M. G.-D. Mahlberg, Victorina/Smith, Catherine (Ed.), Proceedings of the Corpus Linguistics Conference 2009. 22. Liverpool: University of Liverpool 2010, Liverpool, UK.
Henrich, V.; Hinrichs, E. (2010a): GernEdiT - The GermaNet Editing ToolProceedings of the Seventh Conference on International Language Resources and Evaluation (LREC 2010). 2228-2235, Valletta, Malta.
Henrich, V.; Hinrichs, E. (2010b): Standardizing Wordnets in the ISO Standard LMF: Wordnet-LMF for GermaNet. In: 23rd International Conference on Computational Linguistics (COLING 2010), Beijing, 456 – 464.
Hinrichs, E.; Henrich, V.; Zastrow, T. (2010): Sustainability of Linguistic Data and Analysis in the Context of a Collaborative eScience Environment. In: Seventh Conference on International Language Resources and Evaluation (LREC 2010), Valetta, Malta.
Hinrichs, E.; Hinrichs, M.; Zastrow, T. (2010): WebLicht: Web-Based LRT Services for German. In: Proceedings of the Systems Demonstrations at the 48th Annual Meeting of the Association for Computational Linguistics (ACL-2010), Upsala, Schweden, 25-29. Verfügbar unter
Hinrichs, M.; Zastrow, T.; Hinrichs, E. (2010): WebLicht: Web-based LRT Services in a Distributed eScience Infrastructure. In: N. Calzolari et al. (Eds.): Proceedings of the Seventh International Conference on Language Resources and Evaluation (LREC'10), Valletta, Malta, 489-493. Verfügbar unter
Jurish, B. (2010): Efficient online k-best lookup in weighted finite-state cascades. In: T. Hanneforth & G. Fanselow (Eds.), Language and Logos. Studies in Theoretical and Computational Linguistics. 313-327, Berlin, 2010.
Klein, W.; Geyken, A. (2010): Das Digitale Wörterbuch der Deutschen Sprache (DWDS). In: U. Heid et al. (Eds.), Lexicographica. 79-93, Berlin/New York.
Kunze, C.; Lemnitzer, L. (2010): Lexical-semantic and conceptual relations in GermaNet. In: P. Storjohann (Ed.), Lexical-semantic relations. Theoretical and practical perspectives. 163-184. Benjamins, Amsterdam.
Kupietz, M.; Belica, C.; Keibel, H.; Witt, A. (2010): The German Reference Corpus DeReKo: A primordial sample for linguistic research. In: N. Calzolari et al. (Eds.), Proceedings of the Seventh Conference on International Language Resources and Evaluation (LREC 2010). 1848-1854. European Language Resources Association (ELRA) 2010.
Kupietz, M.; Keibel, H. (2009): The Mannheim German Reference Corpus (DeReKo) as a basis for empirical linguistic research. In: Workings Papers in Corpus-based Linguistics and Language Education, 3, 53-59.
Kupietz, M.; Schonefeld, O.; Witt, A. (2010): The German Reference Corpus: New developments building on almost 50 years of experience. In: E. Arranz (Ed.): Language Resources: From Storyboard to Sustainability and LR Lifecycle Management, Workshop held at the Seventh Conference on International Language Resources and Evaluation (LREC 2010), Malta, 39-43.
Rehm, G.; Schonefeld, O.; Trippel, T.; Witt, A. (2010): Sustainability of Linguistic Resources Revisited. In: International Symposium on XML for the Long Haul: Issues in the Long-term Preservation of XML, Balisage, 10.4242/BalisageVol6.Witt01.
Schulz, A.; Teich, E. (2009): The secret life of the negative: An investigation of polarity and modality in a corpus of newsgroup texts. In: English Corpus Linguistics: Looking back, Moving forward, 74, 191-204.
Sloetjes, H.; Wittenburg, P. (2008): Annotation by Category: ELAN and ISO DCR. In: N. Calzolari et al. (Eds.): Proceedings of the Sixth International Conference on Language Resources and Evaluation (LREC'08), Marrakesch, Marokko. Verfügbar unter
Váradi, T.; Wittenburg, P.; Krauwer, S.; Wynne, M.; Koskenniemi, K. (2008): Clarin: Common language resources and technology infrastructure. In: 6th International Conference on Language Resources and Evaluation (LREC).