skip to content

KA³ - Kölner Zentrum Analyse und Archivierung von AV‐Daten (2. Förderphase)

In der zweiten Förderphase des Verbundprojektes KA³ liegt der Schwerpunkt auf der Fertigstellung und Erprobung eines dynamischen Repositoriums für audiovisuelle Daten. Bei der Umsetzung werden die zum Teil sehr unterschiedlichen Anforderungen der verschiedenen disziplinären Zugänge an Auffindbarkeit, Zugangskontrolle, Metadaten- und Annotationsformaten berücksichtigt. Dadurch wird das Repositorium offen und für verschiedene Disziplinen vielseitig einsetzbar. Ein dynamisches Repositorium für audiovisuelle Daten ist weiterhin das dringlichste Desideratum, da es weltweit kein stabiles Angebot in diesem Bereich gibt, das nutzerkontrollierte Up- und Downloads bei gleichzeitig sicherer Regelung und Kontrolle von Zugangsberechtigungen erlaubt.

Bei den Komponenten Audiomining und Dokumentenanalyse liegt der Schwerpunkt auf der Stabilisierung und nutzerfreundlichen Bereitstellung der in der ersten Förderphase erprobten und für die wissenschaftliche Forschung modifizierten Werkzeuge des Fraunhofer-Instituts IAIS. Beim Audiomining sind das die automatische Transkription und Verschlagwortung deutschsprachiger AV-Aufnahmen sowie die sprachunabhängige Sprecherdiarisierung (Zuordnung des Sprachsignals zu unterschiedlichen Sprechern). Bei der Dokumentenanalyse steht die Textzeilenerkennung im Vordergrund, die die Basis für alle weiteren Analyseschritte bei der Erforschung handschriftlicher Manuskripte ist.

Wie in der ersten Förderphase werden die Entwicklung des Repositoriums wie auch der Analysewerkzeuge durch drei Pilotstudien aus Linguistik, Oral History und Philosophie begleitet. Die Pilotstudien stellen sicher, dass die Nutzerperspektive im Entwicklungsprozess konstant präsent ist und alle Entwicklungen umgehend auf ihren praktischen Nutzen erprobt werden. Die am Verbund beteiligten Partner sind an der Universität zu Köln (UzK) das Regionale Rechenzentrum (RRZK), das Data Center for the Humanities (DCH), die Abteilung Allgemeine Sprachwissenschaft (ASW) sowie das am Thomas-Institut (Philosophie) angesiedelte Projekt Digital Averroes Research Environment (DARE). Weitere Partner sind das Fraunhofer- Institut für Intelligente Analyse- und Informationssysteme (IAIS) und das Archiv „Deutsches Gedächtnis“ (ADG) an der FernUniversität in Hagen.

Steckbrief

Projektname KA³ - Kölner Zentrum Analyse und Archivierung von AV‐Daten (2. Förderphase)
Disziplin/Fachzuordnung Forschungsdatenmanagement, Fachrepositorien, Sprachdaten, Audio- und Videoanalyseverfahren
Projektleitung Prof. Dr. Nikolaus P. Himmelmann (Institut für Linguistik, Universität zu Köln)
Partner  
  • Archiv "Deutsches Gedächtnis", FernUniversität Hagen ADG
  • Data Center for  the Humanities, Universität zu Köln, DCH
  • Digital Averroes Research Environment, Universität zu Köln, DARE
  • Fraunhofer-Institut IAIS, Sankt Augustin, IAIS
  • Institut für Linguistik, Allgemeine Sprachwissenschaften, Universität zu Köln, IfL
  • Max-Planck-Institut für Pycholinguistik, Nijmegen, MPI-PL
  • Regionales Rechenzentrum, Universität zu Köln, RRZK
 
Ansprechpartner am DCH Felix Rau
Förderung BMBF
Förderkennzeichen 01UG1511A
Laufzeit Oktober 2018 - September 2020
Webseite http://dch.phil-fak.uni-koeln.de/ka3.html
Weiterführende Links   

KA³ - Phase 1

Veranstaltungen

Publikationen und Vorträge

 

Diese Liste enthält auch Publikationen der Projektpartner in alphabetischer Reihenfolge.

 

Blumtritt, Jonathan, Johan Frid, Jens Larsson, Martin Matthiesen, und Felix Rau. „Challenges and Developments in Preserving and Publishing of Large Audio/Video Data“. In Research Data and Humanities – RDHum 2019. Oulu, 2019.

Blumtritt, Jonathan, und Felix Rau. „Metadaten im Zeitalter von Google Dataset Search“. In DHd 2019. Digital Humanities: multimedial & multimodal. Konferenzabstracts, 173–75. Frankfurt am Main, 2019. https://doi.org/10.5281/zenodo.2596095.

Blumtritt, Jonathan, und Felix Rau. „Nutzerunterstützung und neueste Entwicklungen in Forschungsdatenrepositorien für audiovisuelle (Sprach-)Daten“. In DHd 2018. Kritik der digitalen Vernunft. Konferenzabstracts. Universität zu Köln. 26. Februar bis 2. Mär 2018, 46–49. Köln, 2018. https://doi.org/10.18716/KUPS.8085.

Blumtritt, Jonathan, und Felix Rau. „User-Experience von Spracharchiven: Eine Neubewertung der Interaktion von Archiv und Nutzern“. In DHd 2016. Modellierung Vernetzung Visualisierung - die Digital Humanities als fachübergreifendes Forschungsparadigma, 215–17. Leipzig, 2016. http://dhd2016.de/boa.pdf#page=215.

Blumtritt, Jonathan, und Christoph Stollwerk. „Generische Komponenten und fachspezifische Anforderungen im KA3-Projekt“. gehalten auf dem 8. DINI/nestor-Workshop „Forschungsdatenrepositorien“, Stuttgart, 27. November 2017.

Graf, Jochen. „eHumanities-Zentrum: KA3“. gehalten auf dem 2. Workshop Forschungsinfrastrukturen für die Geisteswissenschaften, Berlin, 10. April 2018. https://forschungsinfrastrukturen.de/doku.php/programm.

Gref, Michael, Christoph Andreas Schmidt, Sven Behnke, und Köhler, Joachim. „Two-Staged Acoustic Modeling Adaption for Robust Speech Recognition by the Example of German Oral History Interviews.“. In IEEE International Conference on Multimedia and Expo, ICME 2019 Proceedings. Shanghai, China/Piscataway, NJ: IEEE, 2019. pp.796–801. http://publica.fraunhofer.de/documents/N-555493.html

Gref, Michael, Joachim Köhler, und Almut Leh. „Improved transcription and indexing of oral history interviews for digital humanities research.“ In European Language Resources Association -ELRA-, Paris: LREC 2018, Eleventh International Conference on Language Resources and Evaluation. Proceedings. May 7-12, 2018. Phoenix Seagaia Conference Center Miyazaki, Japan Paris: ELRA, 2018. pp. 3124-3131. http://publica.fraunhofer.de/documents/N-494202.html

Gref, Michael, Christoph Andreas Schmidt, und Joachim Köhler. „Improving robust speech recognition for German oral history interviews using multi-condition training.“ In Informationstechnische Gesellschaft -ITG-: Speech communication. 13. ITG-Fachtagung Sprachkommunikation 2018 : 10.- 12. Oktober 2018, Oldenburg, Berlin: VDE-Verlag, 2018 (ITG-Fachbericht 282). http://publica.fraunhofer.de/documents/N-531366.html

Köhler, Joachim, Nikolaus P. Himmelmann, und Almut Leh. „KA3: Speech Analytics for Oral History and the Language Sciences“, ERCIM NEWS, 111 (2017). pp. 13–14.

Köhler, Joachim, Almut Leh, Nikolaus Himmelmann, und Felix Rau. „Audio Mining für die Geistes- und Kulturwissenschaften: Nutzungsszenarien und Herausforderungen“. In DHd 2018. Kritik der digitalen Vernunft. Konferenzabstracts. Universität zu Köln. 26. Februar bis 2. März 2018. Köln, 2018, pp. 21–24. https://doi.org/10.18716/KUPS.8085.

Köhler, Joachim, Michael Gref, und Almut Leh. „KA³. Weiterentwicklung von Sprachtechnologien im Kontext der Oral History“, BIOS – Zeitschrift für Biographieforschung, Oral History und Lebensverlaufsanalysen, 1-2/2017. pp. 43–59. https://doi.org/10.3224/bios.v30i1-2.05

Leh, Almut, Joachim Köhler, Michael Gref, und Nikolaus Himmelmann. „Speech Analytics in Research Based on Qualitative Interviews. Experiences from KA3“. VIEW Journal of European Television History and Culture 7, Nr. 14 (2018). pp. 138–49. https://doi.org/10.18146/2213-0969.2018.jethc158

Leh, Almut, Michael Gref, und Joachim Köhler. „Audio Mining.Advanced Speech Analytics for Oral History“. Palabras y silencios = Words & silences (2019). 9 pp. http://publica.fraunhofer.de/eprints/urn_nbn_de_0011-n-5690113.pdf

Leh, Almut. „Audiomining für die Analyse und Archivierung narrativer Interviews. Perspektiven für die Biographieforschung“. gehalten beim Workshop „Digital Humanities und biographische Forschungspraxis. Recherche, Analyse, Edition, Visualisierung. 02.06.2018. Institut für Geschichte und Biographie der FernUniversität in Hagen

Leh, Almut. „Audio Mining. Advanced Speech Analytics for Oral History“. gehalten auf der Internationalen Oral History Konferenz. 29.06.2018 . Jyväskylä, Finnland

Leh, Almut. „Audio Mining. Advanced Speech Analytics for Oral History“. gehalten beim Workshop From the Living Room to the World-Wide Web: Documenting, Uploading and Utilizing Holocaust Testimonies in the Digital Age des Netzwerkes European Holocaust Research Infrastructure (EHRI). 22.11.2018. Yad Vashem/Israel

Leh, Almut. „KA³ und andere Verheißungen. Was wir in der Oral History von Sprachtechnologien erwarten können?“. gehalten beim Oral History-Netzwerktreffen. 14./15.02.2019, Österreichische Mediathek, Wien.

Rau, Felix. „Applications and limits of machine learning for language documentation resources“. gehalten auf dem Workshop Linguistic diversity, minority languages and digital research infrastructures (INEL). 21. September 2018. Hamburg.

Schmidt, Thomas, Jonathan Blumtritt, Hanna Hedeland, Jan Gorisch, Felix Rau, und Kai Wörner. „Qualitätsstandards und Interdisziplinarität in der Kuration audiovisueller (Sprach-)Daten“. In DHd 2019. Digital Humanities: multimedial & multimodal. Konferenzabstracts. Frankfurt am Main, 2019. https://doi.org/10.5281/zenodo.2596095.

Trilsbeek, Paul. „Migrating The Language Archive to a new repository solution“. In Open Repositories 2019. Hamburg, 2019. pp. 41–44.

Trilsbeek, Paul, und Menzo Windhouwer. „FLAT: A CLARIN-Compatible Repository Solution Based on Fedora Commons“. In CLARIN Annual Conference 2016. Aix-en-Provence, 2016. https://hdl.handle.net/20.500.11755/b72c4df0-9f35-4f4e-9725-a36bcecd5723.

 

Presse

"Nuscheln richtig nutzen. Transkriptionssoftware lernt besser hinzuhören" (basierend auf Interview mit Michael Gref)

innoVisions, 28. Januar 2020

https://www.fraunhofer-innovisions.de/semantische-medienanalyse/nuscheln-nutzen/