zum Inhalt springen

KA³ - Kölner Zentrum Analyse und Archivierung von AV‐Daten (2. Förderphase)

In der zweiten Förderphase des Verbundprojektes KA³ liegt der Schwerpunkt auf der Fertigstellung und Erprobung eines dynamischen Repositoriums für audiovisuelle Daten. Bei der Umsetzung werden die zum Teil sehr unterschiedlichen Anforderungen der verschiedenen disziplinären Zugänge an Auffindbarkeit, Zugangskontrolle, Metadaten- und Annotationsformaten berücksichtigt. Dadurch wird das Repositorium offen und für verschiedene Disziplinen vielseitig einsetzbar. Ein dynamisches Repositorium für audiovisuelle Daten ist weiterhin das dringlichste Desideratum, da es weltweit kein stabiles Angebot in diesem Bereich gibt, das nutzerkontrollierte Up- und Downloads bei gleichzeitig sicherer Regelung und Kontrolle von Zugangsberechtigungen erlaubt.

Bei den Komponenten Audiomining und Dokumentenanalyse liegt der Schwerpunkt auf der Stabilisierung und nutzerfreundlichen Bereitstellung der in der ersten Förderphase erprobten und für die wissenschaftliche Forschung modifizierten Werkzeuge des Fraunhofer-Instituts IAIS. Beim Audiomining sind das die automatische Transkription und Verschlagwortung deutschsprachiger AV-Aufnahmen sowie die sprachunabhängige Sprecherdiarisierung (Zuordnung des Sprachsignals zu unterschiedlichen Sprechern). Bei der Dokumentenanalyse steht die Textzeilenerkennung im Vordergrund, die die Basis für alle weiteren Analyseschritte bei der Erforschung handschriftlicher Manuskripte ist.

Wie in der ersten Förderphase werden die Entwicklung des Repositoriums wie auch der Analysewerkzeuge durch drei Pilotstudien aus Linguistik, Oral History und Philosophie begleitet. Die Pilotstudien stellen sicher, dass die Nutzerperspektive im Entwicklungsprozess konstant präsent ist und alle Entwicklungen umgehend auf ihren praktischen Nutzen erprobt werden. Die am Verbund beteiligten Partner sind an der Universität zu Köln (UzK) das Regionale Rechenzentrum (RRZK), das Data Center for the Humanities (DCH), die Abteilung Allgemeine Sprachwissenschaft (ASW) sowie das am Thomas-Institut (Philosophie) angesiedelte Projekt Digital Averroes Research Environment (DARE). Weitere Partner sind das Fraunhofer- Institut für Intelligente Analyse- und Informationssysteme (IAIS) und das Archiv „Deutsches Gedächtnis“ (ADG) an der FernUniversität in Hagen.

Steckbrief

Projektname KA³ - Kölner Zentrum Analyse und Archivierung von AV‐Daten (2. Förderphase)
Disziplin/Fachzuordnung Forschungsdatenmanagement, Fachrepositorien, Sprachdaten, Audio- und Videoanalyseverfahren
Projektleitung Prof. Dr. Nikolaus P. Himmelmann (Institut für Linguistik, Universität zu Köln)
Partner  
  • Archiv "Deutsches Gedächtnis", FernUniversität Hagen ADG
  • Data Center for  the Humanities, Universität zu Köln, DCH
  • Digital Averroes Research Environment, Universität zu Köln, DARE
  • Fraunhofer-Institut IAIS, Sankt Augustin, IAIS
  • Institut für Linguistik, Allgemeine Sprachwissenschaften, Universität zu Köln, IfL
  • Max-Planck-Institut für Pycholinguistik, Nijmegen, MPI-PL
  • Regionales Rechenzentrum, Universität zu Köln, RRZK
 
Ansprechpartner am DCH Felix Rau
Förderung BMBF
Förderkennzeichen 01UG1511A
Laufzeit Oktober 2018 - September 2020
Webseite http://dch.phil-fak.uni-koeln.de/ka3.html
Weiterführende Links  
  • Language Archive Cologne, LAC
 

KA³ - Phase 1

Veranstaltungen

Publikationen und Vorträge

 

Diese Liste enthält auch Publikationen der Projektpartner.

Blumtritt, Jonathan, Johan Frid, Jens Larsson, Martin Matthiesen, und Felix Rau. „Challenges and Developments in Preserving and Publishing of Large Audio/Video Data“. In Research Data and Humanities – RDHum 2019. Oulu, 2019.

Blumtritt, Jonathan, und Felix Rau. „Metadaten im Zeitalter von Google Dataset Search“. In DHd 2019. Digital Humanities: multimedial & multimodal. Konferenzabstracts, 173–75. Frankfurt am Main, 2019. https://doi.org/10.5281/zenodo.2596095.

Blumtritt, Jonathan, und Felix Rau. „Nutzerunterstützung und neueste Entwicklungen in Forschungsdatenrepositorien für audiovisuelle (Sprach-)Daten“. In DHd 2018. Kritik der digitalen Vernunft. Konferenzabstracts. Universität zu Köln. 26. Februar bis 2. März 2018, 46–49. Köln, 2018. https://doi.org/10.18716/KUPS.8085.

Blumtritt, Jonathan, und Felix Rau. „User-Experience von Spracharchiven: Eine Neubewertung der Interaktion von Archiv und Nutzern“. In DHd 2016. Modellierung Vernetzung Visualisierung - die Digital Humanities als fachübergreifendes Forschungsparadigma, 215–17. Leipzig, 2016. http://dhd2016.de/boa.pdf#page=215.

Blumtritt, Jonathan, und Christoph Stollwerk. „Generische Komponenten und fachspezifische Anforderungen im KA3-Projekt“. gehalten auf dem 8. DINI/nestor-Workshop „Forschungsdatenrepositorien“, Stuttgart, 27. November 2017.

Graf, Jochen. „eHumanities-Zentrum: KA3“. gehalten auf dem 2. Workshop Forschungsinfrastrukturen für die Geisteswissenschaften, Berlin, 10. April 2018. https://forschungsinfrastrukturen.de/doku.php/programm.

Joachim Köhler, Nikolaus P. Himmelmann, und Almut Leh. „KA3: Speech Analytics for Oral History and the Language Sciences“, ERCIM NEWS, 111 (2017): 13–14.

Köhler, Joachim, Almut Leh, Nikolaus Himmelmann, und Felix Rau. „Audio Mining für die Geistes- und Kulturwissenschaften: Nutzungsszenarien undHerausforderungen“. In DHd 2018. Kritik der digitalen Vernunft. Konferenzabstracts. Universität zu Köln. 26. Februar bis 2. März 2018, 21–24. Köln, 2018. https://doi.org/10.18716/KUPS.8085.

Leh, Almut, Joachim Köhler, Michael Gref, und Nikolaus Himmelmann. „Speech Analytics in Research Based on Qualitative Interviews. Experiences from KA3“. VIEW Journal of European Television History and Culture 7, Nr. 14 (2018): 138–49. https://doi.org/10.18146/2213-0969.2018.jethc158.

Rau, Felix. „Applications and limits of machine learning for language documentation resources“. gehalten auf dem Workshop Linguistic diversity, minority languages and digital research infrastructures (INEL), Hamburg, 21. September 2018.

Schmidt, Thomas, Jonathan Blumtritt, Hanna Hedeland, Jan Gorisch, Felix Rau, und Kai Wörner. „Qualitätsstandards und Interdisziplinarität in der Kuration audiovisueller (Sprach-)Daten“. In DHd 2019. Digital Humanities: multimedial & multimodal. Konferenzabstracts, 41–44. Frankfurt am Main, 2019. https://doi.org/10.5281/zenodo.2596095.

Trilsbeek, Paul. „Migrating The Language Archive to a new repository solution“. In Open Repositories 2019. Hamburg, 2019.

Trilsbeek, Paul, und Menzo Windhouwer. „FLAT: A CLARIN-Compatible Repository Solution Based on Fedora Commons“. In CLARIN Annual Conference 2016. Aix-en-Provence, 2016. https://hdl.handle.net/20.500.11755/b72c4df0-9f35-4f4e-9725-a36bcecd5723.