Auffinden

Auffinden

Auswerten

Auswerten

Aufbereiten und Aufbewahren

Aufbereiten

 

Mehr

Mehr

Hilfe

CLARIN hilft

Mehr erfahren

Automatische phonetische Kennzeichnung & Segmentierung mehrfacher Aufnahmen des Ungarischen

Interviews und Gespräche werden häufig aufgenommen und anschließend verschriftlicht, also transkribiert. Der Webdienst WebMAUS Multiple, der in der CLARIN-Infrastruktur zur Verfügung steht, erlaubt es, Audioaufnahmen und Transkriptionen miteinander so zu verknüpfen, dass man die Zeit eines Phonems, Wortes oder Satzes bestimmen kann und mit gängiger Software wie praat direkt zu der entsprechenden Stelle springen kann. Im Gegensatz zu WebMAUS Basic erlaubt dieser Service eine Vielzahl von Optionen, und außerdem ganze Korpora im Stapelverfahren zu bearbeiten.

Besonders interessant für

  • Linguisten
  • Phonetiker
  • Sprachtechnologie-Entwickler
  • Anthropologen
  • Ethnologen
  • Medien-Informatiker

Ausgangslage:

50 Aufnahmen des Ungarischen (*.wav) und 50 orthographische Transkripte (*.txt)

Ziel:

50 hierarchische Segmentierungen (Wörter, Phonologie, Phoneme) in praat kompatiblem Format (*.TextGrid); phonetische Segmente sollten in IPA verschlüsselt werden

Lösung:

Web-Schnittstelle BAS WebMAUS Multiple

Verwandte CLARIN-D Angebote

Eine kurze Anleitung zur Nutzung von BAS WebMAUS Multiple

Vorbereitung:

  1. Herunterladen des ZIP Pakets https://clarin.phonetik.uni-muenchen.de/BASWebServices/useCases/multipleFileSegmentation.zip 
  2. Entpacken Sie es auf Ihrem lokalen Desktop Ordner; es müsste ein Ordner mit dem Namen 'multipleFileSegmentation' auf Ihrem Desktop erscheinen.

Web Interface:

  1. Gehen Sie auf http://clarin.phonetik.uni-muenchen.de/BASWebServices
  2. Wählen Sie den Service 'WebMAUS Multiple' aus
  3. Öffnen Sie den Ordner 'multipleFileSegmentation/Corpus' auf Ihrem Desktop; Wählen Sie die Dateien 50 *.wav und 50 *.txt; (drag&drop) Ziehen Sie die Dateien auf den gekennzeichneten Bereich. Das Transportieren der Dateien kann einige Sekunden dauern, bitte haben Sie etwas Geduld. Alle 100 Dateien sollten nach Abschluss des Uploads in dem gekennzeichneten Bereich sichtbar sein
  4. Drücken Sie die Taste 'Upload', um die hochgeladenen Textdateien zu untersuchen oder die hochgeladenen Sprachsignale anzuhören, indem Sie auf den Link im gekennzeichneten Bereich klicken
  5. Führen Sie WebMAUS mit den folgenden Optionen aus (weitere Optionen brauchen nicht angepasst zu werden)
    • Language = Hungarian
    • KAN tier in TextGrid = true
    • ORT tier in TextGrid = true
    • Chunk segmentation = force
    • Output symbols = ipa
  6. Bestätigen Sie die Nutzungsbedingungen und drücken Sie die Taste 'Run Web Service'
  7. Nach Abschluss werden die 50 Ergebnisse als *.TextGrid Dateien unten angezeigt; Klicken Sie auf "Download as ZIP-File", um alle Dateien auf Ihr lokales System herunterzuladen
  8. Starten Sie Praat (download at praat.org) auf Ihrem lokalen System und öffnen Sie *.TextGrid *.wav pairs, um die Segmentierungen zu untersuchen