CLARIN-D Blog

Nutzung des VLO für ein Promotionsprojekt zu Wissenschaftlichen Lehrbüchern

In diesem Screencast zeigt Melanie Grumt Suárez, Wissenschaftliche Mitarbeiterin der CLARIN F1, wie das Virtual Language Observatory (VLO) für ein Promotionsprojekt zu wissenschaftlichen Lehrbüchern genutzt werden kann, um historische Lehrbücher und digitale Werkzeuge in der CLARIN-D-Umgebung mit dem Language Resource Switchboard (LRS) aufzufinden.

Was ist das VLO

Das VLO ist eine spezielle Suchmaschine zum Auffinden von Forschungsdaten und digitalen Werkzeugen innerhalb der CLARIN Forschungsinfrastruktur. Es besteht aus einem großen Katalog an Metadaten, der mittels Textsuche sowie facettierter Suche durchsucht werden kann. Ersteres erfordert die Eingabe bestimmter Schlüsselbegriffe die in Beschreibung oder Titel der entsprechenden Ressource vorkommen. Bei der facettierten Suche kann der Suchbereich eingeschränkt werden, um so gezielt nach ausgewählten Sprachen, Formaten, Kollektionen, etc. zu suchen. Eine Kombination beider Suchfunktionen ist ebenfall möglich. Darüber hinaus können über das LRS passende digitale Werkzeuge zur Auswertung ausgewählt werden.  

Weiterlesen

Diskursanalytische Fragestellungen mithilfe des DeReKo (Teil 2)

Im ersten Teil dieses Screencasts erklärte Simon Meier, Mitglied der CLARIN F1, wie für diskursanalytische Fragestellungen das Deutsche Referenzkorpus (DeReKo) in COSMAS II mit der integrierten Funktion der Themenannotation genutzt werden kann. hier geht es zum Blogpost der Teil 1 des Videos behandelt. 

Dieser Blogpost beschäftigt sich nun mit Teil 2 von Meier's Screencast, in dem er zeigt, wie die in Teil 1 gefundenen Belege exportiert und mithilfe des kostenlosen Korpusanalysewerkzeugs AntConc weiter untersucht werden können. 

Im letzten Screencast zeigte Meier bereits, dass Formulierungen wie heute weiß man in populärwissenschaftlichen Texten sowie Texten über Ernährung und Gesundheit besonders häufig vorkommen. Die Frage ist nun, welche Gegenstände typischerweise, und mit welchen sprachlichen Mitteln, so repräsentiert werden. Um die Frage zu beantworten werden die Belege zusammen mit Referenzbelegen in AntConc analysiert.  

Weiterlesen

Diskursanalytische Fragestellungen mithilfe des DeReKo (Teil 1)

Im ersten Teil dieses Screencasts erklärt Simon Meier, Mitglied der CLARIN F1, wie für diskursanalytische Fragestellungen das Deutsche Referenzkorpus (DeReKo) in COSMAS II mit der integrierten Funktion der Themenannotation genutzt werden kann. Hier geht es zu Teil 2. 

Als Beispiel wählt Meier populärwissenschaftlichen Diskurs in denen Formulierungen wie 

  • heute weiß man
    oder
  • wir wissen heute

genutzt werden. 

Die These lautet: 

Im populärwissenschaftlichen Diskurs als medial vermittelter Experten-Laien-Kommunikation sind wir wissen heute, heute weiß man usw. formelhafte Mittel zur Präsentation von Wissen und Wissensfortschritt.  

Weiterlesen

Sprach-Analysen der Wikipedia-Korpora im DeReKo mithilfe von COSMAS II

In diesem Screencast zeigt Dr. Eva Gredel von der Universität Mannheim, wie die Wikipedia-Korpora im Deutschen Referenzkorpus (DeReKo) mithilfe von COSMAS II für Sprachanalysen genutzt werden können. 

Ganz konkret geht es um eine von ihr durchgeführte Fallstudie zu itis-Kombinationen als Wortbildungsprodukte auf den Diskussionsseiten der Wikipedia.

Das Phänomen
Das Morphem itis, das in medizinischer Fachsprache für Wortbildungsprodukte zum Einsatz kommt, hat als Basiskonstituente üblicherweise Bezeichnungen für Körperteile oder Organe. Seit dem 19. und 20. Jahrhundert kamen dann weitere, gemeinssprachliche itis-Kombinationen wie Telefonitis hinzu. Auch in der Wikipedia, dass sich im 21. Jahrhundert entwickelte, tauchen in bestimmten Kontexten gemeinsprachliche itis-Kombinationen auf. 

Als Beispiele führt Dr. Gredel folgende itis-Kombinationen auf: 

-itisMFS (seit der Antike)   Rach-itis           (Nortmeyer 1987)

-itisBS (19.Jhdt.)                Dichter-itis        (Hoppe 2010)

-itisWikipedia (21.Jhdt.)    Abkürzer-itis     (Gredel 2018)
                                    Newsticker-itis
                                    Zitier-itis

Weiterlesen

CLARIN-D Newsflash Juli 2018

 

Titelseite der ersten Ausgabe der Philosophical Transactions
Titelseite der ersten Ausgabe der Philosophical Transactions

Neue Ressourcen in CLARIN-D

Neue Medien

Sommerschulen und Workshops

Veröffentlichungen

  • Im Sammelband "Computational Social Science—Die Analyse von Big Data" (herausgegeben von Prof. Dr. Andreas Blätte, Prof. Dr. Joachim Behnke, Prof. Dr. Kai-Uwe Schnapp, Prof. Dr. Claudius Wagemann) ist ein Methodenartikel erschienen, in dem die Analyse komplexer sozialwissenschaftlicher Konzepte mit korpusanalytischen Methoden reflektiert wird.
Weiterlesen

Konstruktionsgrammatik - Sprachgebrauchsbasierte Analysen mit den Korpora des DWDS und des DTA

Prof. Dr. Alexander Lasch, Linguist an der TU Dresden, zeigt in diesem Video, wie mit den Ressourcen des DTA und des DWDS sprachgebrauchsbasierte Analysen durchgeführt werden können, um das Deutsche konstruktionsgrammatisch zu beschreiben. Dafür stellt er zwei Leitfragen auf: 

  1. Kann mittels eines konstruktionsgrammatischen Ansatzes Sprachgebrauch gegenstandsadäquat beschrieben werden?
  2. Inwieweit können maschinelle Analysen des Sprachgebrauchs dazu dienen, den sprachgebrauchsbasierten konstruktionsgrammatischen Ansatz zu plausibilisieren?  

Ein sprachgebrauchsbasierter Zugang verlangt die Diskussion darüber, was für uns ein Muster, Pattern, Schema oder eine Konstruktion sei, wovon sowohl die Grammatik des Deutschen, als auch die Konstruktionsgrammatik als Teilgebiet unter spezifischen kognitionslinguistischen Prämissen profitieren können. Der aktuelle Trend ist die Ermittlung solcher Muster durch maschinelle Analysen. Diese Muster werden dann im nächsten Schritt abstrahiert, um aus ihnen Konstruktionen zu gewinnen. Durch diese Vorgehensweise soll Sprachwissen, welches Sprechende zur Produktion der sprachlichen Strukturen verwenden, aus Sprachgebrauch rekonstruiert werden. Für diese Arbeit bieten das DWDS und das DTA gute Mittel.

Weiterlesen

(fast alles) was Sie schon immer über deutsche Grammatik wissen wollten und einfach nachschlagen können …

(fast alles) was Sie schon immer über deutsche Grammatik wissen wollten und einfach nachschlagen können …

 

Seit fast 20 Jahren betreibt das Institut für Deutsche Sprache (IDS) das grammatische Informationssystem grammis (https://grammis.ids-mannheim.de). Grammis vermittelt den hochkomplexen Gegenstandsbereich Grammatik unter Ausnutzung digitaler Sprachressourcen und hypertextueller Navigationsstrukturen gleichermaßen wissenschaftlich fundiert und anschaulich. Forschungsergebnisse werden nicht in Form singulärer Einzelpublikationen transportiert, sondern es wird das gesamte Potenzial multimedialer Medien genutzt. Grammis hebt dadurch Beschränkungen der bisherigen Realisierungsformen von Open Access auf und adressiert variable – insbesondere mobile – Nutzungssituationen. Grammis versammelt multimedial aufbereitetes grammatisches Wissen auf über 3000 Webseiten, ergänzt um linguistisch motivierte Datenbanken, Wörterbücher und Bibliografien. Mit mehr als 100.000 Seitenaufrufen pro Monat zählt es zu den meistgenutzten Online-Ressourcen des IDS.

Weiterlesen

Vom Korpus zum Netz - Prof. Dr. Christian Mair - Forum CA3

Prof. Dr. Christian Mair von der Universität Freiburg geht in seiner Präsentation auf dem Forum CA3 in Hamburg auf die Entwicklungen bezüglich des Community Buildings innerhalb von Forschungsinfrastrukturen wie CLARIN-D ein. In den letzten 50 Jahren gab es bezüglich des Nutzerkreises digitaler Sprachdaten große Veränderungen. Wo früher noch ausschließlich kleine Expertenzirkel ihr Wissen unter sich verbreiteten, wird dies nun mehr und mehr zur massenhaft verbreiteten Kulturtechnik. Die Community, die sich um einen Wissenskreis bildet, ist also nicht mehr so eindeutig abgrenzbar wie früher. Dies liegt in erste Linie an der breiten Digitalisierung der linguistischen Daten wie Schrifttexten, die nun multimodal und multimedial gestaltet werden und somit ein größeres Publikum bedienen können. Des Weiteren werden Texte nicht mehr nur noch gelesen, sondern in Datenform nutztbar gemacht und genutzt. 

Weiterlesen

Analyse von 'sprich' unter Verwendung der DGD und FOLK

In diesem Screencast wird anhand der Datenbank für Gesprochenes Deutsch (DGD) gezeigt, wie Gesprächslinguistische Phänomene datenbankgestützt aufgezeigt und analysiert werden können. Hierfür wird das Forschungs- und Lehrkorpus gesprochenes Deutsch (FOLK) genutzt. Das untersuchte Wort ist sprich in seiner Verwendungsweise als Reformulierungsindikator, in dem es eine ähnliche Funktion wie das heißt hat und von seiner ursprünglichen imperativen Form entfremdet ist.  

Bei welchen Fragestellungen ist eine solche datenbankgestützte Analyse hilfreich? 

  • Finden sich Kookkurrenzen mit anderen Reformulierungsindikatoren wie also oder das heißt?
  • In welchen Interaktionstypen findet sich sprich häufiger und lassen entsprechende Tendenzen weitere Schlussfolgerungen bezüglich der Funktionalität zu? 
  • Welche grammatischen, semantischen und funktionalen Elemente werden durch sprich miteinander verknüpft und in welchem Verhältnis stehen diese? 
Weiterlesen

WebLicht Experteninterview - Extraktion Prädikativer Nominalphrasen

In diesem Experteninterview wird ein Anwendungsszenario von CLARINs WebLicht besprochen. Genau wird gezeigt, wie prädikativ verwendete Nominalphrasen mittels WebLicht aus literarischen Texten extrahiert werden können. Der Forschungskontext innerhalb dessen diese Arbeitsweise genutzt wurde waren Formen und Funktionen von NPs beim Entwurf literarischer Figuren

Bei prädikativ verwendeten NPs im literarischen Kontext handelt es sich zum Beispiel um Charakterisierungen, wie die im folgenden Textausschnitt aus Thomas Manns Mario und der Zauberberg fett markierte Stelle: 

Ohne Schwierigkeiten fand sich ein junger Mann aus den hinteren Sitzreihen, der bereit war, diktierte Ziffern auf die Tafel zu schreiben. Wir kannten ihn auch: die ganze Unterhaltung gewann etwas Familiärs dadurch, dass man so viele Gesichter kannte. Er war der Angestellte des Kolonialwaren- und Obstladens in der Hauptstraße und hatte uns mehrmals in guter Form bedient. 
Mann 1930: 61
 

Weiterlesen