How to Cite
License (Chapter)
This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.
Published
Erkennung wahrgenommener Emotionalität mit Künstlicher Intelligenz in audiovisuellen Zeitzeugeninterviews
Deep Learning, Emotionserkennung, Zeitzeugeninterviews, Multimodalität
Zeitzeugeninterviews sind ein wichtiger Bestandteil musealer Ausstellungs- und Vermittlungspraxis. Bisher wurden in der Auswertung jedoch primär die Transkriptionen des gesprochenen Wortes und damit die Inhalte der Erzählung berücksichtigt. Für eine vertiefte Erschließung ist allerdings nicht nur interessant was gesagt wird, sondern auch wie es gesagt wird. Die automatisierte Erkennung wahrgenommener Emotionalität kann dabei helfen, Zeitzeugeninterviews auf eine neue Weise zu erschließen. In diesem Aufsatz wird ein Forschungsprojekt zur Entwicklung eines Software-Prototyps für Emotionserkennung vorgestellt. Der Prototyp basiert auf einem multimodalen Ansatz, der sich an der menschlichen Fähigkeit orientiert, den emotionalen Zustand anderer Menschen erkennen zu können, (Dekodierungskompetenz). Eine wichtige Modalität hierbei ist die automatisierte Bilderkennung. Neben der Vorstellung der konzeptionellen Überlegungen und ersten Ergebnissen der Experimente werden auch die besonderen Herausforderungen des Projekts erläutert. Menschen nehmen Emotionen subjektiv und oft mehrdeutig wahr. Diese Annahme der Mehrdeutigkeit menschlicher Wahrnehmung von Emotionen zeigt sich bereits in den ersten untersuchten Ergebnissen. Ein Ungleichgewicht der verschiedenen Emotionsklassen beim Training und ein Mangel an repräsentativen Trainingsdaten führen ebenfalls zu Herausforderungen bei der technischen Umsetzung. Gleichzeitig offenbaren die Ergebnisse spannende Beobachtungen und vielversprechende Ideen für die zukünftige Anwendung und Forschung.