skip to content

BMBF-Verbundprojekt KA– Kölner Zentrum Analyse und Archivierung von AV‐Daten

Das Verbundprojekt KA3 wurde in zwei Förderphasen von 2015-2020 durch das BMBF gefördert. Im Rahmen des Projekts wurde am Kölner Standort die Infrastruktur für die Kuratierung und Archivierung von AV-Daten grundlegend überarbeitet und damit auch die technische Basis des Language Archive Cologne (LAC) für eine langfristige und intensivere Nutzung ausgelegt. Das Projekt erprobt außerdem die Anwendung von Methoden aus dem Bereich des Machine Learning zur Erkennung spezifischer Phänomene, die den Prozess manueller Annotation von großen Datenmengen erleichtern oder gar ersetzen können. Die Ergebnisse des Projektes sind die aktuelle technische Grundlage des LAC und die KA3 Services für Audioanalyse.

    Felix Rau                                         Miguel Ramirez Peña                  Anke Debbeler

    Koordination            

    Anne Gerlach                                Lukas Mönch

Konferenzbeiträge

Research Data and Humanities – RDHum 2019
Oulu, 14.–16.08.2019. „Challenges and Developments in Preserving and Publishing of Large Audio/Video Data“. Workshop: Jonathan Blumtritt*, Johan FridJens LarssonMartin Matthiesen, Felix Rau*.

6. Jahrestagung der Digital Humanities im deutschsprachigen Raum (DHd) 2019 „multimedial & multimodal“
Frankfurt & Mainz, 25.–29.03.2019.

„Qualitätsstandards und Interdisziplinarität in der Kuration audiovisueller (Sprach-)Daten“. Workshop: Thomas Schmidt, Jonathan Blumtritt, Hanna HedelandJan Gorisch, Felix RauKai Wörner. doi:10.5281/zenodo.2596094

„Metadaten im Zeitalter von Google Dataset Search“. Vortrag: Jonathan Blumtritt, Felix Rau. doi:10.5281/zenodo.2596094

INEL-Workshop (Indigenous Northern Eurasian Languages) „Linguistic diversity, minority languages and digital research infrastructures“
Hamburg, 20.–21.09.2018. „Applications and limits of machine learning for language documentation resources“. Vortrag: Felix Rau.

2. Workshop „Forschungsinfrastrukturen für die Geisteswissenschaften“
Berlin, 10.04.2018.  „eHumanities-Zentrum: KA3“. Vortrag: Jochen Graf.

5. Jahrestagung der Digital Humanities im deutschsprachigen Raum (DHd) 2018 „Kritik der digitalen Vernunft“
Köln, 26.02.–02.03.2018.

„Audio Mining für die Geistes- und Kulturwissenschaften: Nutzungsszenarien und Herausforderungen“. Workshop: Joachim KöhlerAlmut Leh, Nikolaus Himmelmann, Felix Rau. doi:10.18716/KUPS.8085

„Nutzerunterstützung und neueste Entwicklungen in Forschungsdatenrepositorien für audiovisuelle (Sprach-)Daten“. Workshop: Jonathan Blumtritt, Felix Rau. doi:10.18716/KUPS.8085

8. DINI/nestor-Workshop „Forschungsdatenrepositorien“
Stuttgart, 27.11.2017. „Generische Komponenten und fachspezifische Anforderungen im KA3-Projekt“. Vortrag: Jonathan Blumtritt, Christoph Stollwerk.

3. Jahrestagung der Digital Humanities im deutschsprachigen Raum (DHd) 2016 „Modellierung – Vernetzung – Visualisierung: Die Digital Humanities als fächerübergreifendes Forschungsparadigma“
Leipzig, 07.–11.03.2016. „User-Experience von Spracharchiven: Eine Neubewertung der Interaktion von Archiv und Nutzern“. Vortrag: Jonathan Blumtritt, Felix Rau. Link zum Book of Abstracts | Link zu den Folien

*Vortragende*r bei mehreren Co-Autor*innen | externe Co-Autor*innen

Publikationen der Projektpartner

Gref, Michael, Christoph Andreas Schmidt, Sven Behnke, und Köhler, Joachim. „Two-Staged Acoustic Modeling Adaption for Robust Speech Recognition by the Example of German Oral History Interviews.“. In IEEE International Conference on Multimedia and Expo, ICME 2019 Proceedings. Shanghai, China/Piscataway, NJ: IEEE, 2019. pp.796–801. http://publica.fraunhofer.de/documents/N-555493.html

Gref, Michael, Joachim Köhler, und Almut Leh. „Improved transcription and indexing of oral history interviews for digital humanities research.“ In European Language Resources Association -ELRA-, Paris: LREC 2018, Eleventh International Conference on Language Resources and Evaluation. Proceedings. May 7-12, 2018. Phoenix Seagaia Conference Center Miyazaki, Japan Paris: ELRA, 2018. pp. 3124-3131. http://publica.fraunhofer.de/documents/N-494202.html

Gref, Michael, Christoph Andreas Schmidt, und Joachim Köhler. „Improving robust speech recognition for German oral history interviews using multi-condition training.“ In Informationstechnische Gesellschaft -ITG-: Speech communication. 13. ITG-Fachtagung Sprachkommunikation 2018 : 10.- 12. Oktober 2018, Oldenburg, Berlin: VDE-Verlag, 2018 (ITG-Fachbericht 282). http://publica.fraunhofer.de/documents/N-531366.html

Köhler, Joachim, Nikolaus P. Himmelmann, und Almut Leh. „KA3: Speech Analytics for Oral History and the Language Sciences“, ERCIM NEWS, 111 (2017). pp. 13–14.

Köhler, Joachim, Michael Gref, und Almut Leh. „KA³. Weiterentwicklung von Sprachtechnologien im Kontext der Oral History“, BIOS – Zeitschrift für Biographieforschung, Oral History und Lebensverlaufsanalysen, 1-2/2017. pp. 43–59. https://doi.org/10.3224/bios.v30i1-2.05

Leh, Almut, Joachim Köhler, Michael Gref, und Nikolaus Himmelmann. „Speech Analytics in Research Based on Qualitative Interviews. Experiences from KA3“. VIEW Journal of European Television History and Culture 7, Nr. 14 (2018). pp. 138–49. https://doi.org/10.18146/2213-0969.2018.jethc158

Leh, Almut, Michael Gref, und Joachim Köhler. „Audio Mining.Advanced Speech Analytics for Oral History“. Palabras y silencios = Words & silences (2019). 9 pp. http://publica.fraunhofer.de/eprints/urn_nbn_de_0011-n-5690113.pdf

Trilsbeek, Paul. „Migrating The Language Archive to a new repository solution“. In Open Repositories 2019. Hamburg, 2019. pp. 41–44.

Trilsbeek, Paul, und Menzo Windhouwer. „FLAT: A CLARIN-Compatible Repository Solution Based on Fedora Commons“. In CLARIN Annual Conference 2016. Aix-en-Provence, 2016. https://hdl.handle.net/20.500.11755/b72c4df0-9f35-4f4e-9725-a36bcecd5723.