Auffinden

Auffinden

Auswerten

Auswerten

Aufbereiten und Aufbewahren

Aufbereiten

 

Mehr

Mehr

Hilfe

CLARIN hilft

Mehr erfahren

WebMAUS-General: Chunk-Vorbereitung langer Video-Inverviews mit Gesprächspartner, Geräuschen, stillen Intervallen etc.

Interviews und Gespräche werden häufig transkribiert, um den Inhalt analysieren und durchsuchen zu können, z.B. nach Wörtern, Phrasen, o.ä. Der Webdienst WebMAUS erstellt eine zeitliche Alinierung des Inhalts, und zwar auf mehreren Annotationsebenen und für mehrere Sprachen, so dass jedes Wort und jedes Phonem der Äußerung im Signal lokalisierbar ist.

Sehr lange Sprachaufnahmen (typisch in Video-Interviews: mehrere Stunden) sind aus verschiedenen Gründen problematisch für die automatische Segmentierung. Daher bietet das BAS einen Webdienst an, der solche langen Aufnahmen automatisch aufsplittet, segmentiert und die Ergebnisse anschließend wieder zusammenführt, wie in diesem Use-Case demonstriert wird.

Besonders interessant für

  • Linguisten
  • Phonetiker
  • Antropologen
  • Ethnologen

Ausgangslage:

Langer Soundtrack (*.wav) und orthographisches Transcript von Target Speakern mit 'chunk segmentation' (*.TextGrid) waren die wichtigen Teile. Die richtigen Target Speaker wurden orthografisch transkribiert.

Ziel:

Komplette Segmentierung der Target Speaker (Worte, Phone)

Lösung:

Web Interfaces Chunk-Vorbereitung + General MAUS

Kurzanleitung zur Nutzung des Web Interface zur Chunk-Vorbereitung:

Vorbereitung:

  1. gehen Sie auf http://clarin.phonetik.uni-muenchen.de/BASWebServices
  2. klicken Sie auf "General Help + FAQs"
  3. downloaden Sie die Datei, die verlinkt ist unter "Usecase/Tutorials" und dort  "Long video interviews[...]" ftp://ftp.phonetik.uni-muenchen.de/pub/BAS/CLARIN/USE_CASES/longFiles.zip
  4. entpacken Sie den Ordner "longFiles" in Ihrem Ordnersystem, zum Beispiel auf Ihrem Desktop
  5. klicken Sie auf 'BASWebServices'
  6. wählen Sie BAS webservice 'Chunk Preparation' aus
  7. öffnen Sie das Verzeichnis 'longFiles' auf Ihrem Desktop, wählen Sie die Datei 'UniMuenster.TextGrid' aus und ziehen Sie sie in den dafür vorgesehenen Bereich des Services
  8. klicken Sie auf den Button 'Upload'. Nachdem das Hochladen abgeschlossen ist, können Sie die hochgeladene *.TextGrid Datei inspizieren, indem Sie auf den Datei-Link klicken. Die Ebene, die die orthographische Transkription enthält, ist mit 'Transcription 1' gekennzeichnet.
  9. führen Sie den Service mit den folgenden Optionen aus
    • Language = English - Great Britain
    • Input tier name = Transcription 1 (Achten Sie auf die Leerstelle)
    • Sampling rate = 16000 (letztere ist die Sampling Rate der *.wav Datei, die wir segmentieren möchten. Wenn Sie die Sampling Rate nicht wissen, können Sie zum Beispiel den Befehl 'file *.wav' auf einem Terminal oder Audacity nutzen um die Sampling Rate Ihrer Datei herauszufinden.)
    • Output format = TextGrid
  10. Nach der Fertigstellung ist als Zwischenresultat die Datei 'UniMuenster.par' unten zu sehen. Diese Datei beinhaltet das word-tokenized Transkript, die phonologisch wahrscheinlichste Aussprache und die Chunk Information.
  11. Laden Sie das Zwischenresultat 'UniMuenster.par' herunter und speichern Sie es im Verzeichnis 'longFiles', indem Sie mit einem Rechtsclick "Link speichern unter" wählen.

Web Interface 'WebMAUS General':

  1. gehen Sie auf http://clarin.phonetik.uni-muenchen.de/BASWebServices
  2. Wählen Sie BAS webservice 'WebMAUS General'
  3. Klicken Sie auf den Button 'Signal-file-upload' und wählen Sie die Datei 'UniMuenster.wav' aus dem Verzeichnis 'longFiles' zum Hochladen aus
  4. Klicken Sie auf den Button 'Par-file-upload' und wählen Sie die Datei 'UniMuenster.par' aus dem Verzeichnis 'longFiles' zum Hochladen aus
  5. Sie können nun die *.par Datei sehen und das hochgeladene Signal hören
  6. Führen Sie WebMAUS mit den folgenden Optionen aus
    • Language = English - Great Britain
    • KAN tier in TextGrid = true
    • ORT tier in TextGrid = true
    • Chunk segmentation = true
  7. Bestätigen Sie die Nutzungsbedingungen (terms-of-usage) und klicken Sie auf den Button 'Run Web Service'
  8. Nach der Fertigstellung wird die erstellte TextGrid Datei unten angezeigt. Klicken Sie auf "Save result" um es auf Ihr lokales System herunter zu laden, oder
  9. klicken Sie auf den Button 'Segmentation Preview' um ein neues Fenster in Ihrem Browser zu öffnen und inspizieren Sie das Segmentations-Ergebnis direkt mithilfe des EmuLabeller.
  10. Vorschlag: zoomen Sie heran, markieren Sie dann ein Segment mit Ihrer Maus und drücken 'c' auf Ihrer Tastatur um den Ton abzuspielen.