skip to content

FDM-Ressourcen und -Services: KA³-Audioservices

Audio- und Videoaufnahmen entstehen in geisteswissenschaftlicher Forschung im Rahmen verschiedener Fächer und Datenerhebungsmethoden. Unter anderem werden Sprachaufnahmen häufig von Interviews aufgenommen. Auswertung und Analyse solcher Audioaufnahmen, beispielsweise durch arbeitsintensive Transkripte, ist meist zeit- und datenintensiv.

Deswegen wird in den meisten geisteswissenschaftlichen Disziplinen mit schriftlichen Repräsentationen von Sprache gearbeitet. Doch auch die Transkription von Audioaufnahmen ist aufwendig.

Automatische Spracherkennung kann den Zeitaufwand dabei signifikant reduzieren. Je nach Sprachregister und Aufnahmequalität können die Ergebnisse variieren, doch selbst bei qualitativ schlechteren Ergebnissen, bei denen eine Nachbearbeitung nötig ist, erreicht man normalerweise eine merkliche Zeitersparnis.

Im BMBF-Verbundprojekt „KA³ – Kölner Zentrum Analyse und Archivierung von AV‐Daten“ hat das DCH mit seinen Projektpartnern Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme (IAIS) und dem Regionalen Rechenzentrum der Universität zu Köln (RRZK) Audioservices aufgebaut.

Die KA³-Audioservices bieten

•    orthografische Transkription, 

•    Kapitelerkennung,

•    reie akademische Nutzung und

•    eine einfache Anwendung.

Die Webservices sind ein Angebot des Data Center for the Humanities. Die Automatische Spracherkennung wurde durch das Fraunhofer IAIS im Rahmen des BMBF-Verbundprojekts KA³ entwickelt und die Services werden in Zusammenarbeit mit dem RRZK bereitgestellt.

Für eine optimale und effiziente Beratung und Unterstützung bei der Transkription und Analyse von audiovisuellen (AV) Daten stehen wir Ihnen in der aktuellen Situation per E-Mail oder Videokonferenz zur Verfügung. Sie erreichen uns hierzu einfach und bequem via info-dch(at)uni-koeln.de.

 

Link: https://grails-prod.rrz.uni-koeln.de/lac-services/