BMBF-Verbundprojekt KA3 – Kölner Zentrum Analyse und Archivierung von AV‐Daten
Das Verbundprojekt KA3 wurde in zwei Förderphasen von 2015-2020 durch das BMBF gefördert. Im Rahmen des Projekts wurde am Kölner Standort die Infrastruktur für die Kuratierung und Archivierung von AV-Daten grundlegend überarbeitet und damit auch die technische Basis des Language Archive Cologne (LAC) für eine langfristige und intensivere Nutzung ausgelegt. Das Projekt erprobt außerdem die Anwendung von Methoden aus dem Bereich des Machine Learning zur Erkennung spezifischer Phänomene, die den Prozess manueller Annotation von großen Datenmengen erleichtern oder gar ersetzen können. Die Ergebnisse des Projektes sind die aktuelle technische Grundlage des LAC und die KA3 Services für Audioanalyse.
Partnerinstitutionen
Leitung
Team
2. Förderphase
Felix Rau Miguel Ramirez Peña Anke Debbeler
Koordination
Anne Gerlach Lukas Mönch
Konferenzbeiträge
Research Data and Humanities – RDHum 2019
Oulu, 14.–16.08.2019. „Challenges and Developments in Preserving and Publishing of Large Audio/Video Data“. Workshop: Jonathan Blumtritt*, Johan Frid, Jens Larsson, Martin Matthiesen, Felix Rau*.
6. Jahrestagung der Digital Humanities im deutschsprachigen Raum (DHd) 2019 „multimedial & multimodal“
Frankfurt & Mainz, 25.–29.03.2019.
„Qualitätsstandards und Interdisziplinarität in der Kuration audiovisueller (Sprach-)Daten“. Workshop: Thomas Schmidt, Jonathan Blumtritt, Hanna Hedeland, Jan Gorisch, Felix Rau, Kai Wörner. doi:10.5281/zenodo.2596094
„Metadaten im Zeitalter von Google Dataset Search“. Vortrag: Jonathan Blumtritt, Felix Rau. doi:10.5281/zenodo.2596094
INEL-Workshop (Indigenous Northern Eurasian Languages) „Linguistic diversity, minority languages and digital research infrastructures“
Hamburg, 20.–21.09.2018. „Applications and limits of machine learning for language documentation resources“. Vortrag: Felix Rau.
2. Workshop „Forschungsinfrastrukturen für die Geisteswissenschaften“
Berlin, 10.04.2018. „eHumanities-Zentrum: KA3“. Vortrag: Jochen Graf.
5. Jahrestagung der Digital Humanities im deutschsprachigen Raum (DHd) 2018 „Kritik der digitalen Vernunft“
Köln, 26.02.–02.03.2018.
„Audio Mining für die Geistes- und Kulturwissenschaften: Nutzungsszenarien und Herausforderungen“. Workshop: Joachim Köhler, Almut Leh, Nikolaus Himmelmann, Felix Rau. doi:10.18716/KUPS.8085
„Nutzerunterstützung und neueste Entwicklungen in Forschungsdatenrepositorien für audiovisuelle (Sprach-)Daten“. Workshop: Jonathan Blumtritt, Felix Rau. doi:10.18716/KUPS.8085
8. DINI/nestor-Workshop „Forschungsdatenrepositorien“
Stuttgart, 27.11.2017. „Generische Komponenten und fachspezifische Anforderungen im KA3-Projekt“. Vortrag: Jonathan Blumtritt, Christoph Stollwerk.
3. Jahrestagung der Digital Humanities im deutschsprachigen Raum (DHd) 2016 „Modellierung – Vernetzung – Visualisierung: Die Digital Humanities als fächerübergreifendes Forschungsparadigma“
Leipzig, 07.–11.03.2016. „User-Experience von Spracharchiven: Eine Neubewertung der Interaktion von Archiv und Nutzern“. Vortrag: Jonathan Blumtritt, Felix Rau. Link zum Book of Abstracts | Link zu den Folien
*Vortragende*r bei mehreren Co-Autor*innen | externe Co-Autor*innen
Publikationen der Projektpartner
Gref, Michael, Christoph Andreas Schmidt, Sven Behnke, und Köhler, Joachim. „Two-Staged Acoustic Modeling Adaption for Robust Speech Recognition by the Example of German Oral History Interviews.“. In IEEE International Conference on Multimedia and Expo, ICME 2019 Proceedings. Shanghai, China/Piscataway, NJ: IEEE, 2019. pp.796–801. http://publica.fraunhofer.de/documents/N-555493.html
Gref, Michael, Joachim Köhler, und Almut Leh. „Improved transcription and indexing of oral history interviews for digital humanities research.“ In European Language Resources Association -ELRA-, Paris: LREC 2018, Eleventh International Conference on Language Resources and Evaluation. Proceedings. May 7-12, 2018. Phoenix Seagaia Conference Center Miyazaki, Japan Paris: ELRA, 2018. pp. 3124-3131. http://publica.fraunhofer.de/documents/N-494202.html
Gref, Michael, Christoph Andreas Schmidt, und Joachim Köhler. „Improving robust speech recognition for German oral history interviews using multi-condition training.“ In Informationstechnische Gesellschaft -ITG-: Speech communication. 13. ITG-Fachtagung Sprachkommunikation 2018 : 10.- 12. Oktober 2018, Oldenburg, Berlin: VDE-Verlag, 2018 (ITG-Fachbericht 282). http://publica.fraunhofer.de/documents/N-531366.html
Köhler, Joachim, Nikolaus P. Himmelmann, und Almut Leh. „KA3: Speech Analytics for Oral History and the Language Sciences“, ERCIM NEWS, 111 (2017). pp. 13–14.
Köhler, Joachim, Michael Gref, und Almut Leh. „KA³. Weiterentwicklung von Sprachtechnologien im Kontext der Oral History“, BIOS – Zeitschrift für Biographieforschung, Oral History und Lebensverlaufsanalysen, 1-2/2017. pp. 43–59. https://doi.org/10.3224/bios.v30i1-2.05
Leh, Almut, Joachim Köhler, Michael Gref, und Nikolaus Himmelmann. „Speech Analytics in Research Based on Qualitative Interviews. Experiences from KA3“. VIEW Journal of European Television History and Culture 7, Nr. 14 (2018). pp. 138–49. https://doi.org/10.18146/2213-0969.2018.jethc158
Leh, Almut, Michael Gref, und Joachim Köhler. „Audio Mining.Advanced Speech Analytics for Oral History“. Palabras y silencios = Words & silences (2019). 9 pp. http://publica.fraunhofer.de/eprints/urn_nbn_de_0011-n-5690113.pdf
Trilsbeek, Paul. „Migrating The Language Archive to a new repository solution“. In Open Repositories 2019. Hamburg, 2019. pp. 41–44.
Trilsbeek, Paul, und Menzo Windhouwer. „FLAT: A CLARIN-Compatible Repository Solution Based on Fedora Commons“. In CLARIN Annual Conference 2016. Aix-en-Provence, 2016. https://hdl.handle.net/20.500.11755/b72c4df0-9f35-4f4e-9725-a36bcecd5723.