BMBF-Verbundprojekt KA3 – Kölner Zentrum Analyse und Archivierung von AV‐Daten
Das Verbundprojekt KA3 wurde in zwei Förderphasen von 2015-2020 durch das BMBF gefördert. Im Rahmen des Projekts wurde am Kölner Standort die Infrastruktur für die Kuratierung und Archivierung von AV-Daten grundlegend überarbeitet und damit auch die technische Basis des Language Archive Cologne (LAC) für eine langfristige und intensivere Nutzung ausgelegt. Das Projekt erprobt außerdem die Anwendung von Methoden aus dem Bereich des Machine Learning zur Erkennung spezifischer Phänomene, die den Prozess manueller Annotation von großen Datenmengen erleichtern oder gar ersetzen können. Die Ergebnisse des Projektes sind die aktuelle technische Grundlage des LAC und die KA3 Services für Audioanalyse.
Partnerinstitutionen
Data Center for the Humanities (DCH), Universität zu Köln
Digital Averroes Research Environment (DARE), Universität zu Köln
Abteilung Allgemeine Sprachwissenschaft (ASW), Institut für Linguistik (IfL), Universität zu Köln
Thomas-Institut, Universität zu Köln
Regionales Rechenzentrum (RRZK), Universität zu Köln
Archiv Deutsches Gedächtnis (ADG), FernUniversität Hagen
Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme (IAIS), Sankt Augustin
(Nur erste Phase: Max-Planck-Institut für Psycholinguistik (MPI-PL), Nijmegen)
Leitung
Prof. Dr. Nikolaus P. Himmelmann (IfL)
Prof. Dr. Andreas Witt (DCH/IDS)
Prof. Dr. Ulrich Lang (RRZK)
Team
Universität zu Köln:
Jonathan Blumtritt (CCeH)
Anke Debbeler (DCH; ab 2019)
Mark Eschweiler (DARE; ab 2019)
Anne Gerlach (DCH; ab 2019)
Jochen Graf (RRZK)
Lukas Mönch (DCH; ab 2020)
Miguel Ramirez Peña (DCH)
Felix Rau (DCH)
Christoph Stollwerk (RRZK)
2. Förderphase
In der zweiten Förderphase liegt der Schwerpunkt auf der Fertigstellung und Erprobung eines dynamischen Repositoriums für audiovisuelle Daten. Bei der Umsetzung werden die zum Teil sehr unterschiedlichen Anforderungen der verschiedenen disziplinären Zugänge an Auffindbarkeit, Zugangskontrolle, Metadaten- und Annotationsformaten berücksichtigt. Dadurch wird das Repositorium offen und für verschiedene Disziplinen vielseitig einsetzbar. Ein dynamisches Repositorium für audiovisuelle Daten ist weiterhin das dringlichste Desideratum, da es weltweit kein stabiles Angebot in diesem Bereich gibt, das nutzerkontrollierte Up- und Downloads bei gleichzeitig sicherer Regelung und Kontrolle von Zugangsberechtigungen erlaubt.
Bei den Komponenten Audiomining und Dokumentenanalyse liegt der Schwerpunkt auf der Stabilisierung und nutzerfreundlichen Bereitstellung der in der ersten Förderphase erprobten und für die wissenschaftliche Forschung modifizierten Werkzeuge des Fraunhofer-Instituts IAIS. Beim Audiomining sind das die automatische Transkription und Verschlagwortung deutschsprachiger AV-Aufnahmen sowie die sprachunabhängige Sprecherdiarisierung (Zuordnung des Sprachsignals zu unterschiedlichen Sprechern). Bei der Dokumentenanalyse steht die Textzeilenerkennung im Vordergrund, die die Basis für alle weiteren Analyseschritte bei der Erforschung handschriftlicher Manuskripte ist.
Wie in der ersten Förderphase werden die Entwicklung des Repositoriums wie auch der Analysewerkzeuge durch drei Pilotstudien aus Linguistik, Oral History und Philosophie begleitet. Die Pilotstudien stellen sicher, dass die Nutzerperspektive im Entwicklungsprozess konstant präsent ist und alle Entwicklungen umgehend auf ihren praktischen Nutzen erprobt werden.
Konferenzbeiträge
Research Data and Humanities – RDHum 2019
Oulu, 14.–16.08.2019. „Challenges and Developments in Preserving and Publishing of Large Audio/Video Data“. Workshop: Jonathan Blumtritt*, Johan Frid, Jens Larsson, Martin Matthiesen, Felix Rau*.
6. Jahrestagung der Digital Humanities im deutschsprachigen Raum (DHd) 2019 „multimedial & multimodal“
Frankfurt & Mainz, 25.–29.03.2019.
„Qualitätsstandards und Interdisziplinarität in der Kuration audiovisueller (Sprach-)Daten“. Workshop: Thomas Schmidt, Jonathan Blumtritt, Hanna Hedeland, Jan Gorisch, Felix Rau, Kai Wörner. doi:10.5281/zenodo.2596094
„Metadaten im Zeitalter von Google Dataset Search“. Vortrag: Jonathan Blumtritt, Felix Rau. doi:10.5281/zenodo.2596094
INEL-Workshop (Indigenous Northern Eurasian Languages) „Linguistic diversity, minority languages and digital research infrastructures“
Hamburg, 20.–21.09.2018. „Applications and limits of machine learning for language documentation resources“. Vortrag: Felix Rau.
2. Workshop „Forschungsinfrastrukturen für die Geisteswissenschaften“
Berlin, 10.04.2018. „eHumanities-Zentrum: KA3“. Vortrag: Jochen Graf.
5. Jahrestagung der Digital Humanities im deutschsprachigen Raum (DHd) 2018 „Kritik der digitalen Vernunft“
Köln, 26.02.–02.03.2018.
„Audio Mining für die Geistes- und Kulturwissenschaften: Nutzungsszenarien und Herausforderungen“. Workshop: Joachim Köhler, Almut Leh, Nikolaus Himmelmann, Felix Rau. doi:10.18716/KUPS.8085
„Nutzerunterstützung und neueste Entwicklungen in Forschungsdatenrepositorien für audiovisuelle (Sprach-)Daten“. Workshop: Jonathan Blumtritt, Felix Rau. doi:10.18716/KUPS.8085
8. DINI/nestor-Workshop „Forschungsdatenrepositorien“
Stuttgart, 27.11.2017. „Generische Komponenten und fachspezifische Anforderungen im KA3-Projekt“. Vortrag: Jonathan Blumtritt, Christoph Stollwerk.
3. Jahrestagung der Digital Humanities im deutschsprachigen Raum (DHd) 2016 „Modellierung – Vernetzung – Visualisierung: Die Digital Humanities als fächerübergreifendes Forschungsparadigma“
Leipzig, 07.–11.03.2016. „User-Experience von Spracharchiven: Eine Neubewertung der Interaktion von Archiv und Nutzern“. Vortrag: Jonathan Blumtritt, Felix Rau. Link zum Book of Abstracts | Link zu den Folien
*Vortragende*r bei mehreren Co-Autor*innen | externe Co-Autor*innen
Publikationen der Projektpartner
- Gref, Michael, Christoph Andreas Schmidt, Sven Behnke, und Köhler, Joachim. „Two-Staged Acoustic Modeling Adaption for Robust Speech Recognition by the Example of German Oral History Interviews.“. In IEEE International Conference on Multimedia and Expo, ICME 2019 Proceedings. Shanghai, China/Piscataway, NJ: IEEE, 2019. pp.796–801. publica.fraunhofer.de/documents/N-555493.html
- Gref, Michael, Joachim Köhler, und Almut Leh. „Improved transcription and indexing of oral history interviews for digital humanities research.“ In European Language Resources Association -ELRA-, Paris: LREC 2018, Eleventh International Conference on Language Resources and Evaluation. Proceedings. May 7-12, 2018. Phoenix Seagaia Conference Center Miyazaki, Japan Paris: ELRA, 2018. pp. 3124-3131. publica.fraunhofer.de/documents/N-494202.html
- Gref, Michael, Christoph Andreas Schmidt, und Joachim Köhler. „Improving robust speech recognition for German oral history interviews using multi-condition training.“ In Informationstechnische Gesellschaft -ITG-: Speech communication. 13. ITG-Fachtagung Sprachkommunikation 2018 : 10.- 12. Oktober 2018, Oldenburg, Berlin: VDE-Verlag, 2018 (ITG-Fachbericht 282). http://publica.fraunhofer.de/documents/N-531366.html
- Köhler, Joachim, Nikolaus P. Himmelmann, und Almut Leh. „KA3: Speech Analytics for Oral History and the Language Sciences“, ERCIM NEWS, 111 (2017). pp. 13–14.
- Köhler, Joachim, Michael Gref, und Almut Leh. „KA³. Weiterentwicklung von Sprachtechnologien im Kontext der Oral History“, BIOS – Zeitschrift für Biographieforschung, Oral History und Lebensverlaufsanalysen, 1-2/2017. pp. 43–59. https://doi.org/10.3224/bios.v30i1-2.05
- Leh, Almut, Joachim Köhler, Michael Gref, und Nikolaus Himmelmann. „Speech Analytics in Research Based on Qualitative Interviews. Experiences from KA3“. VIEW Journal of European Television History and Culture 7, Nr. 14 (2018). pp. 138–49. https://doi.org/10.18146/2213-0969.2018.jethc158
- Leh, Almut, Michael Gref, und Joachim Köhler. „Audio Mining.Advanced Speech Analytics for Oral History“. Palabras y silencios = Words & silences (2019). 9 pp. http://publica.fraunhofer.de/eprints/urn_nbn_de_0011-n-5690113.pdf
- Trilsbeek, Paul. „Migrating The Language Archive to a new repository solution“. In Open Repositories 2019. Hamburg, 2019. pp. 41–44.
- Trilsbeek, Paul, und Menzo Windhouwer. „FLAT: A CLARIN-Compatible Repository Solution Based on Fedora Commons“. In CLARIN Annual Conference 2016. Aix-en-Provence, 2016. hdl.handle.net/20.500.11755/b72c4df0-9f35-4f4e-9725-a36bcecd5723.
1. Phase
Förderkennzeichen: 01UG1511
Laufzeit: 10/2015–09/2018
2. Phase
Förderkennzeichen: 01UG1511A
Laufzeit: 10/2018–09/2020
Kontakt
Felix Rau (DCH)
f.rau(at)uni-koeln.de
+49 221 470-5832