BMBF-Verbundprojekt „KA³ – Kölner Zentrum Analyse und Archivierung von AV‐Daten“

BMBF-Verbundprojekt KA³– Kölner Zentrum Analyse und Archivierung von AV‐Daten

Das Verbundprojekt KA³ wurde in zwei Förderphasen von 2015-2020 durch das BMBF gefördert. Im Rahmen des Projekts wurde am Kölner Standort die Infrastruktur für die Kuratierung und Archivierung von AV-Daten grundlegend überarbeitet und damit auch die technische Basis des Language Archive Cologne (LAC) für eine langfristige und intensivere Nutzung ausgelegt. Das Projekt erprobt außerdem die Anwendung von Methoden aus dem Bereich des Machine Learning zur Erkennung spezifischer Phänomene, die den Prozess manueller Annotation von großen Datenmengen erleichtern oder gar ersetzen können. Die Ergebnisse des Projektes sind die aktuelle technische Grundlage des LAC und die KA³ Services für Audioanalyse.

Partnerinstitutionen

Data Center for the Humanities (DCH), Universität zu Köln

Digital Averroes Research Environment (DARE), Universität zu Köln

Abteilung Allgemeine Sprachwissenschaft (ASW), Institut für Linguistik (IfL), Universität zu Köln

Thomas-Institut, Universität zu Köln

Regionales Rechenzentrum (RRZK), Universität zu Köln

Archiv Deutsches Gedächtnis (ADG), FernUniversität Hagen

Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme (IAIS), Sankt Augustin

(Nur erste Phase: Max-Planck-Institut für Psycholinguistik (MPI-PL), Nijmegen)

Leitung

Team

2. Förderphase

In der zweiten Förderphase liegt der Schwerpunkt auf der Fertigstellung und Erprobung eines dynamischen Repositoriums für audiovisuelle Daten. Bei der Umsetzung werden die zum Teil sehr unterschiedlichen Anforderungen der verschiedenen disziplinären Zugänge an Auffindbarkeit, Zugangskontrolle, Metadaten- und Annotationsformaten berücksichtigt. Dadurch wird das Repositorium offen und für verschiedene Disziplinen vielseitig einsetzbar. Ein dynamisches Repositorium für audiovisuelle Daten ist weiterhin das dringlichste Desideratum, da es weltweit kein stabiles Angebot in diesem Bereich gibt, das nutzerkontrollierte Up- und Downloads bei gleichzeitig sicherer Regelung und Kontrolle von Zugangsberechtigungen erlaubt.

Bei den Komponenten Audiomining und Dokumentenanalyse liegt der Schwerpunkt auf der Stabilisierung und nutzerfreundlichen Bereitstellung der in der ersten Förderphase erprobten und für die wissenschaftliche Forschung modifizierten Werkzeuge des Fraunhofer-Instituts IAIS. Beim Audiomining sind das die automatische Transkription und Verschlagwortung deutschsprachiger AV-Aufnahmen sowie die sprachunabhängige Sprecherdiarisierung (Zuordnung des Sprachsignals zu unterschiedlichen Sprechern). Bei der Dokumentenanalyse steht die Textzeilenerkennung im Vordergrund, die die Basis für alle weiteren Analyseschritte bei der Erforschung handschriftlicher Manuskripte ist.

Wie in der ersten Förderphase werden die Entwicklung des Repositoriums wie auch der Analysewerkzeuge durch drei Pilotstudien aus Linguistik, Oral History und Philosophie begleitet. Die Pilotstudien stellen sicher, dass die Nutzerperspektive im Entwicklungsprozess konstant präsent ist und alle Entwicklungen umgehend auf ihren praktischen Nutzen erprobt werden.

Felix Rau Miguel Ramirez Peña Anke Debbeler

Koordination

Anne Gerlach Lukas Mönch

Konferenzbeiträge

Research Data and Humanities – RDHum 2019
Oulu, 14.–16.08.2019. „Challenges and Developments in Preserving and Publishing of Large Audio/Video Data“. Workshop: Jonathan Blumtritt*, Johan Frid, Jens Larsson, Martin Matthiesen, Felix Rau*.

6. Jahrestagung der Digital Humanities im deutschsprachigen Raum (DHd) 2019 „multimedial & multimodal“
Frankfurt & Mainz, 25.–29.03.2019.

„Qualitätsstandards und Interdisziplinarität in der Kuration audiovisueller (Sprach-)Daten“. Workshop: Thomas Schmidt, Jonathan Blumtritt, Hanna Hedeland, Jan Gorisch, Felix Rau, Kai Wörner. doi:10.5281/zenodo.2596094

„Metadaten im Zeitalter von Google Dataset Search“. Vortrag: Jonathan Blumtritt, Felix Rau. doi:10.5281/zenodo.2596094

INEL-Workshop (Indigenous Northern Eurasian Languages) „Linguistic diversity, minority languages and digital research infrastructures“
Hamburg, 20.–21.09.2018. „Applications and limits of machine learning for language documentation resources“. Vortrag: Felix Rau.

2. Workshop „Forschungsinfrastrukturen für die Geisteswissenschaften“
Berlin, 10.04.2018. „eHumanities-Zentrum: KA3“. Vortrag: Jochen Graf.

5. Jahrestagung der Digital Humanities im deutschsprachigen Raum (DHd) 2018 „Kritik der digitalen Vernunft“
Köln, 26.02.–02.03.2018.

„Audio Mining für die Geistes- und Kulturwissenschaften: Nutzungsszenarien und Herausforderungen“. Workshop: Joachim Köhler, Almut Leh, Nikolaus Himmelmann, Felix Rau. doi:10.18716/KUPS.8085

„Nutzerunterstützung und neueste Entwicklungen in Forschungsdatenrepositorien für audiovisuelle (Sprach-)Daten“. Workshop: Jonathan Blumtritt, Felix Rau. doi:10.18716/KUPS.8085

8. DINI/nestor-Workshop „Forschungsdatenrepositorien“
Stuttgart, 27.11.2017. „Generische Komponenten und fachspezifische Anforderungen im KA³-Projekt“. Vortrag: Jonathan Blumtritt, Christoph Stollwerk.

3. Jahrestagung der Digital Humanities im deutschsprachigen Raum (DHd) 2016 „Modellierung – Vernetzung – Visualisierung: Die Digital Humanities als fächerübergreifendes Forschungsparadigma“
Leipzig, 07.–11.03.2016. „User-Experience von Spracharchiven: Eine Neubewertung der Interaktion von Archiv und Nutzern“. Vortrag: Jonathan Blumtritt, Felix Rau. Link zum Book of Abstracts | Link zu den Folien

*Vortragende*r bei mehreren Co-Autor*innen | externe Co-Autor*innen

Publikationen der Projektpartner

Gref, Michael, Christoph Andreas Schmidt, Sven Behnke, und Köhler, Joachim. „Two-Staged Acoustic Modeling Adaption for Robust Speech Recognition by the Example of German Oral History Interviews.“. In IEEE International Conference on Multimedia and Expo, ICME 2019 Proceedings. Shanghai, China/Piscataway, NJ: IEEE, 2019. pp.796–801. http://publica.fraunhofer.de/documents/N-555493.html

Gref, Michael, Joachim Köhler, und Almut Leh. „Improved transcription and indexing of oral history interviews for digital humanities research.“ In European Language Resources Association -ELRA-, Paris: LREC 2018, Eleventh International Conference on Language Resources and Evaluation. Proceedings. May 7-12, 2018. Phoenix Seagaia Conference Center Miyazaki, Japan Paris: ELRA, 2018. pp. 3124-3131. http://publica.fraunhofer.de/documents/N-494202.html

Gref, Michael, Christoph Andreas Schmidt, und Joachim Köhler. „Improving robust speech recognition for German oral history interviews using multi-condition training.“ In Informationstechnische Gesellschaft -ITG-: Speech communication. 13. ITG-Fachtagung Sprachkommunikation 2018 : 10.- 12. Oktober 2018, Oldenburg, Berlin: VDE-Verlag, 2018 (ITG-Fachbericht 282). http://publica.fraunhofer.de/documents/N-531366.html

Köhler, Joachim, Nikolaus P. Himmelmann, und Almut Leh. „KA3: Speech Analytics for Oral History and the Language Sciences“, ERCIM NEWS, 111 (2017). pp. 13–14.

Köhler, Joachim, Michael Gref, und Almut Leh. „KA³. Weiterentwicklung von Sprachtechnologien im Kontext der Oral History“, BIOS – Zeitschrift für Biographieforschung, Oral History und Lebensverlaufsanalysen, 1-2/2017. pp. 43–59. https://doi.org/10.3224/bios.v30i1-2.05

Leh, Almut, Joachim Köhler, Michael Gref, und Nikolaus Himmelmann. „Speech Analytics in Research Based on Qualitative Interviews. Experiences from KA3“. VIEW Journal of European Television History and Culture 7, Nr. 14 (2018). pp. 138–49. https://doi.org/10.18146/2213-0969.2018.jethc158

Leh, Almut, Michael Gref, und Joachim Köhler. „Audio Mining.Advanced Speech Analytics for Oral History“. Palabras y silencios = Words & silences (2019). 9 pp. http://publica.fraunhofer.de/eprints/urn_nbn_de_0011-n-5690113.pdf

Trilsbeek, Paul. „Migrating The Language Archive to a new repository solution“. In Open Repositories 2019. Hamburg, 2019. pp. 41–44.

Trilsbeek, Paul, und Menzo Windhouwer. „FLAT: A CLARIN-Compatible Repository Solution Based on Fedora Commons“. In CLARIN Annual Conference 2016. Aix-en-Provence, 2016. https://hdl.handle.net/20.500.11755/b72c4df0-9f35-4f4e-9725-a36bcecd5723.

UNIVERSITY OF COLOGNE

Faculty of Arts and HumanitiesData Center for the Humanities