Prof. Dr. rer. nat. Andreas Wendemuth
Prof. Dr. rer. nat. Andreas Wendemuth
Lehrstuhl für Kognitive Systeme
Aktuelle Projekte
AI CoWorking Lab - Teilprojekt "KI-gestützte intentionale Dynamiken in der Teamregulation"
Laufzeit: 01.01.2024 bis 31.12.2027
Das AI CoWorking Lab ist ein Verbund von 8 Forschenden: Prof. Dr. Ayoub Al-Hamadi (Neuro-Information Technology), Prof. Dr. Julia Arlinghaus (Production Systems and Automation), Prof. Dr. Benjamin Noack (Autonomous Multisensor Systems), Prof. Dr. Andreas Nürnberger (Data & Knowledge Engineering), SPRECHER Prof. Dr. Frank Ortmeier (Software Engineering), Prof. Dr. Myra Spiliopoulou (Knowledge Management & Discovery), Prof. Dr. Sebastian Stober (Artificial Intelligence) und Prof. Dr. Andreas Wendemuth (Cognitive Systems). Der Verbund ist eingebettet in die "Productive Teaming" Initiative (https://forschungsnetzwerk-chim.de/productive-teaming/) innerhalb des Forschungsnetzwerkes "Chemnitz-Ilmenau-Magdeburg (CHIM)" (https://forschungsnetzwerk-chim.de/).
Hauptziel des Gesamtantrages "AI Co-Working Lab" ist das Ermöglichen zukünftiger "Productive Teaming" Produktionssysteme, in denen Menschen und Maschinen auf Augenhöhe zusammenarbeiten. Das "AI Co-Working Lab" baut auf bestehenden Kompetenzschwerpunkten auf und nutzt Methoden der künstlichen Intelligenz.
Das vorliegende Forschungsthema dieses Teilprojektes "KI-gestützte intentionale Dynamiken in der Teamregulation" unterstützt das Gesamtziel direkt. Es erforscht eine zentrale Frage, nämlich die der Anforderungen an Mensch-Maschine-Interaktionen in einem hybriden Produktionsablauf. Human - Cyber Physical Production Systems (H-CPPS) stellen erhebliche kognitive Anforderungen an die menschlichen Partner, und für Effektivität und zielführende Zusammenarbeit bedarf es eines Interaktionsmodells, welches indirekt und/oder implizit kommunizierte Bedarfe erfasst und nutzt, was vor allem bei menschzentrierten und individualisierten Prozessen und Teamregulationen von zentraler Bedeutung ist. Dieses Modell wird hier erforscht und operationalisiert.
ENABLING - Teilprojekt "Mensch-Roboter-Interaktion mit KI-Systemen"
Laufzeit: 01.01.2024 bis 31.12.2027
Im übergeordneten Projekt "Resiliente Human-Roboter-Kollaboration in Mixed-Skill-Umgebung (ENABLING)" (https://forschung-sachsen-anhalt.de/project/resiliente-human-roboter-kollaboration-27761) arbeiten die Arbeitsgruppen "Neuro-Informationstechnik" (Prof. Al-Hamadi) und "Kognitive Systeme" (Prof. Wendemuth). Das Vorhaben ENABLING adressiert den Problemraum der Entwicklung von KI-Methoden zur gegenseitigen Ergänzung der Skills von Roboter und Mensch.
Dieses Teilprojekt "Mensch-Roboter-Interaktion mit KI-Systemen" unter Leitung von Prof. Wendemuth hat die folgenden Forschungsfragen:
• Durchführung von Studien im Bereich (Sprach-)Interaktion im Bereich Mensch-Maschine/Roboter-Interaktion vor allem im Bereich Intent Recognition
• Konzeptionierung von Multimodalen, KI-gestützten Multi-User Interaktionsszenarien
• Entwicklung von Machine-Learning-Algorithmen zur Verbesserung der o.g. Szenarien
• Mitarbeit an der Entwicklung von Maßen zur Qualitätsabschätzung von natürlicher Roboter-Mensch-Interaktion
• Entwurf und Programmierung von Verfahren und KI-Methoden im Bereich der Sprachdialoge
IMIQ - Intelligenter Mobilitätsraum im Quartier
Laufzeit: 01.01.2024 bis 31.12.2027
Übersicht
"IMIQ - Intelligenter Mobilitätsraum im Quartier" ist ein Projekt des IMR - Intelligenter Mobilitätsraum Sachsen Anhalt (https://niimo.ovgu.de/Intelligenter+Mobilit%C3%A4tsraum.html), welches im Wissenschaftshafen in Magdeburg ansässig sein wird. In der Laufzeit von 3 1/2 Jahren (01/2024 - 12/2027, tatsächlicher operativer Beginn 8/2024) wird der Wissenschaftshafen zu einem Zukunfts-Quartier, in welchem neue Lösungen bedürfnisorientiert erdacht, technisch und informatorisch getestet und sozio-ökonomisch implementiert werden. Wesentliche Innovationen sind ein Digitaler Work-Life-Zwilling (DWLZ) und ein Reallabor intelligenter Mobilität (RIM).
Ambitionen
Ziel ist die Entwicklung und Erprobung innovativer Mobilitäts- und Kommunikationsansätze. In einem Digitalen Work-Life-Zwilling (DWLZ) wird eine ganzheitliche und innovative Mobilitäts- und Kommunikationserfahrung ermöglicht, die durch Sensoren, 5G und digitale Services effiziente und personalisierte Lösungen bietet und gleichzeitig die soziale Interaktion und den Austausch vor Ort fördert. Im Reallabor Intelligente Mobilität (RIM) werden die Entwicklungen der Forschenden zur Intelligenten Mobilität physisch sichtbar und anfassbar / erlebbar, sie werden getestet und evaluiert. Technologien zur Kommunikation und V2X, zu Lokalisierung und Tracking werden in einem Operation Control Center gesteuert, mit Infrastruktur (u.a. Mobilitätsstationen) integriert und mit
autonomen Fahrzeugen umgesetzt.
Weiterführende Informationen
Detaillierte Beschreibung, aktuelle Nachrichten und Personalstellen finden Sie hier: https://niimo.ovgu.de/IMIQ.html. Unter diesem link, oder unter den oben verlinkten Namen, finden Sie auch Informationen zu den IMIQ-Arbeitsbereichen der Projektpartner.
Mit diesem Vorhaben wird die Spitzenforschung im interdisziplinären Forschungsfeld Mobilität an der OVGU ausgebaut und der Transfer neuer Mobilitätslösungen in Sachsen-Anhalt und darüber hinaus ermöglicht. Die Sichtbarkeit bzw. Erlebbarkeit richtet sich an alle Stakeholder.
IMIQ - Teilprojekt "Assistenz und Individualisierung für Mobilitätsbedürfnisse"
Laufzeit: 01.01.2024 bis 31.12.2027
Forschungsinhalte Mobile Tagesplanung im Quartier:
- Definition der Datenformate für einen Digitalen Work-Life-Zwilling
- Entwicklung KI-gestützter Methoden für Mobilitätsbedürfnisse
- Umsetzung der Abläufe für Arbeit, Dienstleistungen und Mobilität im Quartier
Wissenschaftshafen für verschiedene Zielgruppen
Forschungsinhalte Individueller Öffentlicher Verkehr:
- Erhebung und Verfügbarmachung von Daten für individuelle Mobilitätsbedürfnisse
- Entwicklung individualisierter dialogbasierter Sprachassistenzsysteme zur barrierefreien Interaktion mit einem Digitalen Work-Life-Zwilling
- Erkundung und Experimentieren mit multimodalenTechnologien
- Anwendung im Betrieb autonomer Elektro-Shuttlebusse
Intelligenter Mobilitätsraum Magdeburg
Laufzeit: 01.01.2021 bis 31.12.2027
Die Otto-von-Guericke-Universität Magdeburg (Forschungsschwerpunkt Intelligenter Mobilitätsraum, Sprecher Prof. A. Wendemuth) und die Nahverkehrsservicegesellschaft Sachsen-Anhalt GmbH (NASA) schaffen gemeinsam in der Region Magdeburg einen Experimentierraum für Mobilitätslösungen. Dazu haben beide Seiten im Februar 2021 einen Kooperationsvertrag unterschrieben. Neue Ergebnisse und Technologien aus der Forschung werden für Mobilität & Leben/ Wohnen der Zukunft erprobt und umgesetzt. Praxisnah werden Alltagslösungen entwickelt, um Stadt und Umland besser miteinander zu vernetzen. Hier entstehen individualisierte Angebote sowohl für mobilitätseingeschränkte ältere Menschen wie auch für junge mobile Familien.
NIIMO: Netzwerkinitiative Intelligente Mobilität
Laufzeit: 01.01.2021 bis 31.12.2027
NIIMO: Netzwerkinitiative Intelligente Mobilität
Mobilitätsbedürfnisse, verkehrsplanerische und verkehrswirtschaftliche Ansätze, Reallabors, in Kooperation der OVGU mit der NASA GmbH. Dies wird mit Kooperationsvertrag OVGU-NASA vom Februar 2021 verfolgt.
Weiterführende Informationen
Seitens der OVGU wid NIIMO koordiniert vom Wissensverbund IMR - Intelligenter Mobilitätsraum Sachsen-Anhalt (https://niimo.ovgu.de/Intelligenter+Mobilit%C3%A4tsraum.html)
Resiliente Human-Roboter-Kollaboration in Mixed-Skill-Umgebung (ENABLING)
Laufzeit: 01.01.2024 bis 31.12.2027
Kollaborationsfähige Robotersysteme sind eine Schlüsseltechnologie der flexiblen intelligenten Produktion, Logistik und Medizin, die sich im Sinne der Verknüpfung komplementärer Skills in einer eng verzahnten und potentialorientierten Zusammenarbeit mit dem Menschen, aber auch zur Substitution von Aufgaben und Fähigkeiten einsetzen lassen. Das Vorhaben ENABLING adressiert den Problemraum der Entwicklung von KI-Methoden zur gegenseitigen Ergänzung der Skills von Roboter und Mensch. Somit werden Innovationen in den Querschnittsbereichen Informationstechnologie und Key-Enabling-Technologie ermöglicht und die Grundlage für zukünftige Anwendungen in Mixed-Skill-Umgebungen in den Leitmärkten geschaffen. Das ENABLING wird die Kollaboration in Mixed-Skill-Arbeitswelten grundlegend verändern, indem Mensch und Roboter für das gegenseitige Verständnis von Prozessen, Handlungen und Absichten befähigt werden. ENABLING erhöht für die vollständige Informationsverarbeitungskette nicht nur die Effizienz in Produktion und Logistik, sie minimiert auch die Gefahren im Arbeitsprozess.
Adaptive Strategien für Assistenztechnologien in Mehrpersonen-Interaktionen II (ASAMI II)
Laufzeit: 31.12.2024 bis 31.12.2024
Übergeordnete Ziele von ASAMI II sind das Verständnis des Verhältnisses zwischen sprachlich erfassbaren Dispositionen und Handlungsintentionen und darüber hinaus die Strategien von Nutzern eines Assistenzsystems in einer Mehrpersonensituation. Dafür wird die Entwicklung, Evaluierung und Optimierung der situationsbezogenen Dispositionserkennung des Benutzers durch gesprochene Sprache weiterhin im Fokus bleiben. Dies wird um die Komponente der Handlungsintentionserkennung im dialogischen Umfeld erweitert. Die Bewertung von Nutzercharakteristiken stellt für das Dialogmanagement eine wichtige Voraussetzung dar. Es wird eine informierte Dispositionserkennung etabliert, die sich auf akustische Ereignisse stützt, welche aus spektralen, prosodischen und paralinguistischen Merkmalen ableitbar sind. Die gewonnenen Erkenntnisse werden dabei direkt in die Handlungsintentions- und Interaktionsstilerkennung einfließen, die für eine adaptive, zielorientierte Dialogstrategie genutzt werden. Komplementär dazu werden die akustischen Nutzersignale innerhalb einer Mehrpersonensituation analysiert. Dazu wird das dynamische Wechselspiel zwischen aktiven und passiven Interaktionsanteilen (Involvement) eines Kommunikationspartners auf akustischer Ebene analysiert. Solch dynamische Änderungen sind integrales Merkmal einer Konversation und geben Aufschluss über Strategien des Nutzers. Insbesondere lässt sich dieses Wechselspiel bei einem Szenario bestehend aus einem Assistenzsystem und mehreren Personen beobachten. Hier geht es vor allem um die Etablierung adaptiver Problemlösungsstrategien.
Adaptive Strategien für Assistenztechnologien in Mehrpersonen-Interaktionen II (ASAMI II)
Laufzeit: 01.07.2022 bis 31.12.2024
Übergeordnete Ziele von ASAMI II sind das Verständnis des Verhältnisses zwischen sprachlich erfassbaren Dispositionen und Handlungsintentionen und darüber hinaus die Strategien von Nutzern eines Assistenzsystems in einer Mehrpersonensituation. Dafür wird die Entwicklung, Evaluierung und Optimierung der situationsbezogenen Dispositionserkennung des Benutzers durch gesprochene Sprache weiterhin im Fokus bleiben. Dies wird um die Komponente der Handlungsintentionserkennung im dialogischen Umfeld erweitert. Die Bewertung von Nutzercharakteristiken stellt für das Dialogmanagement eine wichtige Voraussetzung dar. Es wird eine informierte Dispositionserkennung etabliert, die sich auf akustische Ereignisse stützt, welche aus spektralen, prosodischen und paralinguistischen Merkmalen ableitbar sind. Die gewonnenen Erkenntnisse werden dabei direkt in die Handlungsintentions- und Interaktionsstilerkennung einfließen, die für eine adaptive, zielorientierte Dialogstrategie genutzt werden. Komplementär dazu werden die akustischen Nutzersignale innerhalb einer Mehrpersonensituation analysiert. Dazu wird das dynamische Wechselspiel zwischen aktiven und passiven Interaktionsanteilen (Involvement) eines Kommunikationspartners auf akustischer Ebene analysiert. Solch dynamische Änderungen sind integrales Merkmal einer Konversation und geben Aufschluss über Strategien des Nutzers. Insbesondere lässt sich dieses Wechselspiel bei einem Szenario bestehend aus einem Assistenzsystem und mehreren Personen beobachten. Hier geht es vor allem um die Etablierung adaptiver Problemlösungsstrategien.
Abgeschlossene Projekte
Adaptive Strategien für Assistenztechnologien in Mehrpersonen-Interaktionen (ASAMI)
Laufzeit: 01.01.2021 bis 30.06.2022
Adaptive Strategien für Assistenztechnologien in Mehrpersonen-Interaktionen (ASAMI) sind Unterstützungsparadigmen, die für einzelne oder mehrere Akteure zielgerichtete technische Assistenzen anbieten können, um Unsicherheit in der Handlungsplanung und in der gemeinsamen Interaktion der Akteure zu reduzieren und die Aufgabenbearbeitung voranzubringen. Dazu gehören die Antizipation und das Auswählen von Handlungsmöglichkeiten, das Monitoring und Anpassen von Handlungsfolgen, Strategien der Informationsbeschaffung (extern), situiertes Explorieren sowie kommunikative Strategien wie Feedback, Informieren, Intervenieren oder Aushandeln mit Mitteln der multimodalen, dialogischen Kommunikation. Ebenso eingeschlossen ist die Translation und kreative Verknüpfung von Wissen aus anderen Kontexten, um den Möglichkeitsraum zu erweitern. Dabei werden handlungsleitende Ziel- und Vorhabenstellungen der Akteure erfasst und einbezogen.
Intentionale, antizipatorische, interaktive Systeme (IAIS)
Laufzeit: 01.01.2018 bis 31.12.2021
Intentionale, antizipatorische, interaktive Systeme (IAIS) stellen eine neue Klasse nutzerzentrierter Assistenzsysteme dar und sind ein Nukleus für die Entwicklung der Informationstechnik mit entsprechenden KMUs in Sachsen-Anhalt. IAIS nutzt aus Signaldaten abgeleitete Handlungs- und Systemintentionen sowie den affektiven Zustand des Nutzers. Mittels einer Antizipation des weiteren Handelns des Nutzers werden Lösungen interaktiv ausgehandelt. Die aktiven Rollen des Menschen und des Systems wechseln strategisch, wozu neuro- und verhaltensbiologische Modelle benötigt werden. Die im vorhandenen Systemlabor, auf Grundlage des SFB-TRR 62, applizierten Mensch-Maschine-Systeme haben dann das Ziel des Verständnisses der situierten Interaktion. Dies stärkt die regionale Wirtschaft bei der Integration von Assistenzsystemen für die Industrie 4.0 im demographischen Wandel wesentlich.
ADAS&ME : Adaptive leistungsfähige Fahrer-Assistenzsysteme zur Unterstützung von beanspruchten Fahrern & Effektives Abfangen von Risiken durch maßgeschneiderte Mensch-Maschine-Interaktion in der Fahrzeugautomatisierung
Laufzeit: 01.09.2016 bis 28.02.2020
ADAS&ME entwickelt adaptierte leistungsfähige Fahrerassistenzsysteme, die Fahrerzustand, Situations- / Umweltkontext und adaptive Interaktion beinhalten, um automatisch die Kontrolle zwischen Fahrzeug und Fahrer zu übertragen und somit eine sicherere und effizientere Straßenbenutzung zu gewährleisten. Die Arbeit basiert auf 7 Fallstudien, die einen großen Teil der Fahrsituationen auf europäischen Straßen abdecken. Experimentelle Untersuchungen werden an Algorithmen zur Fahrerzustandsüberwachung sowie an Mensch-Maschine-Interaktions- wie auch an Automatisierungssystemen durchgeführt. Unterschiedliche Fahrerzustände wie Müdigkeit, Schläfrigkeit, Stress, Unaufmerksamkeit und beeinträchtigende Emotionen werden untersucht, wobei Sensortechnologien unter Berücksichtigung von Verkehrs- und Witterungsbedingungen eingesetzt und für individuelle Fahrer-Physiologie und Fahrverhalten personalisiert werden. Multimodale und adaptive Warn- und Interventions-Strategien basieren auf dem aktuellen Fahrerzustand und der Gefährlichkeit von Szenarien. Das Endergebnis ist ein Fahrer-Zustandsüberwachungssystem, das in die Fahrzeugautomatisierung integriert ist. Das System wird mit einem breiten Pool von Fahrern unter simulierten und realen Straßenbedingungen und unter verschiedenen Fahrzuständen validiert. Diese herausfordernde Aufgabe wird durch ein multidisziplinäres europäisches Konsortium von 30 Partnern durchgeführt, darunter ein Hersteller pro Fahrzeugtyp und 7 Direktlieferanten.
Der Lehrstuhl Kognitive Systeme an der Otto-von-Guericke-Universität wird zu diesem Konsortium beitragen, indem er den emotionalen Inhalt der akustischen Äußerungen im Auto analysiert. Wir werden weiterhin in der Informationsfusion von Daten aus verschiedenen Modalitäten (akustisch, Video und andere) tätig sein, um Schläfrigkeit oder einen Verlust des Kontrollzustandes des Fahrers zu analysieren und so in mehreren Anwendungsfällen zur Fahrerassistenz beizutragen, für Autos, Busse, Lastwagen und Motorräder.
Das Projekt wird gefördert durch das EU-Rahmenprogramm für Forschung und Innovation Horizont 2020 (Grant Agreement Nr. 688900).
3Dsensation (BMBF Zwanzig20)
Laufzeit: 01.01.2014 bis 31.12.2019
Die Allianz 3Dsensation verleiht Maschinen durch innovative 3D-Technologien die Fähigkeit der visuellen Aufnahme und Interpretation komplexer Szenarien. Maschinen werden so zu situativ agierenden Partnern und personalisierten Assistenten des Menschen. Durch die neue Form der Mensch-Maschine-Interaktion schafft 3Dsensation den Zugang zu Lebens- und Arbeitswelten unabhängig von Alter und körperlicher Leistungsfähigkeit. In der Produktion ermöglicht 3Dsensation die Symbiose von Mensch und Maschine auf der Grundlage des 3D-Sehens. Es schafft eine sichere Umgebung für Menschen in Fertigungsprozessen, gewährleistet die Wahrnehmung von Assistenzfunktionen und sichert die Qualität von Produkten. Durch die 3D-Erfassung und Analyse von Mimik, Gestik und Bewegung zur Steuerung von Assistenzsystemen verbessert 3Dsensation die Gesundheitsversorgung und garantiert Selbstbestimmung bis ins hohe Alter.
Durch Kopplung von 3D-Informationen mit Assistenzsystemen ermöglicht 3Dsensation individuelle Mobilität unabhängig von gesundheitlichen und altersbedingten Beeinträchtigungen in urbanen und ländlichen Räumen. 3Dsensation schafft individuelle Sicherheit durch die autonome erfahrungsbasierte 3D-Analyse von Merkmalen von Personen und Bewegungsabläufen zur Identifikation von Auffälligkeiten und Gefahren. Durch die branchen- und disziplinübergreifende Vernetzung von Wirtschaft und Wissenschaft wird eine Allianz geschaffen, welche zentrale technische, ethische und soziologische Fragestellungen der Mensch-Maschine-Interaktion löst.
3Dsensation liefert fundamental neue Lösungen der Mensch-Maschinen-Interaktion und sichert so die Zukunft für Deutschlands wichtigste Exportbranchen.
MOD-3D (in 3Dsensation) Modellierung von Verhaltens- und Handlungsintentionsverläufen aus multimodalen 3D-Daten (Verlängerung)
Laufzeit: 01.01.2018 bis 31.12.2019
In immer mehr Bereichen des täglichen Lebens werden technische Systeme eingesetzt, wodurch auch immer mehr Menschen mit solchen Systemen interagieren müssen - ob im Bereich der Mobilität im Rahmen von Fahrerassistenzsystemen oder im Bereich der Gesundheit und Pflege, zum Beispiel beim betreuten Wohnen. Eine solche Interaktion kann vor allem bei älteren und weniger versierten Nutzern Probleme verursachen. Um diese Nutzergruppen zu unterstützen, ist es notwendig, die Interaktion adaptiv, antizipatorisch und nutzerzentriert zu gestalten. Ein wichtiger Schritt in Richtung solcher Systeme ist die Erkennung und die dafür notwendige Modellierung des aktuellen Nutzerzustandes. In Projekt MOD3D werden drei verschiedene Nutzerzustände bzw. Verhaltenskategorien auf Grundlage von multimodalen Daten untersucht: Überforderung, Zufriedenheit und Kooperativität. Um die spätere praktische Verwendbarkeit zu gewährleisten, werden die Untersuchungen an natürlichen Interaktionsdaten durchgeführt, die in anwendungsnahen Szenarien unter natürlichen Bedingungen aufgenommen wurden.
MOVA3D (in 3Dsensation) Multimodaler Omnidirektionaler 3D-Sensor für die Verhaltens-Analyse von Personen
Laufzeit: 01.08.2016 bis 31.12.2019
Die Allianz 3Dsensation verleiht Maschinen durch innovative 3D-Technologien die Fähigkeit der visuellen Aufnahme und Interpretation komplexer Szenarien. Maschinen werden so zu situativ agierenden Partnern und personalisierten Assistenten des Menschen. Durch die neue Form der Mensch-Maschine-Interaktion schafft 3Dsensation den Zugang zu Lebens- und Arbeitswelten unabhängig von Alter und körperlicher Leistungsfähigkeit.
Motiviert durch den demographischen Wandel und den damit einhergehenden gesellschaftlichen Herausforderungen soll für das Bedarfsfeld "Gesundheit" im Projekt MOVA3D ein intelligenter Sensor zur häuslichen Assistenz älterer Menschen entwickelt werden. Zur vollständigen Abdeckung eines Raumes mit einem einzigen Sensor wird ein neuartiges omnidirektionales optisches 3D-Messprinzip mit einer akustischen Raumerfassung zur multimodalen Informationsgewinnung kombiniert. Hochgenaue (3D-) Video- und Audiodaten sind die Voraussetzung für die anschließende Erkennung komplexer menschlicher Handlungen in Alltagssituationen und Interaktionen mit technischen Systemen, sowie der Identifizierung von relevanten Abweichungen. Diese automatische Analyse des Verhaltens betroffener Personen bildet die Grundlage für entsprechende Assistenzfunktionen sowie eine umfangreiche Interaktion über audio- und lichtbasierte Schnittstellen. Die umfassende Einbindung der späteren Nutzer in Form von Akzeptanz-, Funktions- und Nutzerstudien ist essentieller Teil des Projektes MOVA3D. Über die Integration in aktuelle AAL- und Home-Automation-Systeme hinaus ist eine spätere bedarfsfeldübergreifende Anwendung denkbar und angestrebt.
MOD-3D (in 3Dsensation) Modellierung von Verhaltens- und Handlungsintentionsverläufen aus multimodalen 3D-Daten
Laufzeit: 01.08.2015 bis 31.12.2017
Die Allianz 3Dsensation verleiht Maschinen durch innovative 3D-Technologien die Fähigkeit der visuellen Aufnahme und Interpretation komplexer Szenarien. Maschinen werden so zu situativ agierenden Partnern und personalisierten Assistenten des Menschen. Durch die neue Form der Mensch-Maschine-Interaktion schafft 3Dsensation den Zugang zu Lebens- und Arbeitswelten unabhängig von Alter und körperlicher Leistungsfähigkeit.
Ziel von MOD-3D ist die Erstellung eines generischen Modells für die zeitliche Abfolge von Handlungen in
Mensch-Maschine-Interaktionen in dedizierten Anwendungen. Dies geschieht auf der Grundlage
von multimodalen 3D-Daten der direkt und indirekt geäußerten Handlungsabsichten von Nutzern.
SFB / Transregio 62: Informationsfusion zur zeitvarianten Dispositionserkennung
Laufzeit: 31.12.2016 bis 31.12.2017
Das Ziel der Informationsfusion in einem Companion-System ist die Erstellung eines umfassenden Modells zur Situationsinterpretation für die Planungs- und Entscheidungsebene. Hierzu werden die räumlichen Situationsmodelle zeitlich integriert und mit den Ergebnissen der Nutzeremotionserkennung fusioniert. Für die zuverlässige Erkennung der Nutzeremotion auf der Basis gesprochener Sprache, Gestik, Mimik und psychobiologischer Daten werden multimodale Informationsfusionsarchitekturen verschiedener Abstraktionsebenen entwickelt und evaluiert.
SFB / Transregio 62: Situationsbezogene Erkennung anwendungsrelevanter Dispositionen und Handlungsintentionen aus gesprochener Sprache
Laufzeit: 31.12.2016 bis 31.12.2017
Die Emotionen des Benutzers sind aus seinen sprachlichen Äußerungen zu klassifizieren. Dazu werden für den Mensch-Maschine-Dialog relevante Emotionsklassen gebildet. Zum einen werden sprachliche subsymbolische und biologienahe Merkmale klassifiziert, zum zweiten wird prosodische automatische Spracherkennung zur Emotionserkennung und -unter Nutzung des semantischen Inhalts zur weiterführenden Intentionserkennung genutzt. Frühe wie auch späte Fusion beider Ansätze wird durchgeführt. Experimentelle Provokation von emotionaler Sprache wird untersucht und Emotionsannotierte Datenbanken werden generiert.
SFB / Transregio 62: Informationsfusion zur Emotions- und Dispositionserkennung
Laufzeit: 31.12.2012 bis 31.12.2016
Das Ziel der Informationsfusion in einem Companion-System ist die Erstellung eines umfassenden Modells zur Situationsinterpretation für die Planungs- und Entscheidungsebene. Hierzu werden die räumlichen Situationsmodelle zeitlich integriert und mit den Ergebnissen der Nutzeremotionserkennung fusioniert. Für die zuverlässige Erkennung der Nutzeremotion auf der Basis gesprochener Sprache, Gestik, Mimik und psychobiologischer Daten werden multimodale Informationsfusionsarchitekturen verschiedener Abstraktionsebenen entwickelt und evaluiert.
SFB / Transregio 62: Situationsbezogene Erkennung anwendungsrelevanter Dispositionskategorien aus gesprochener Sprache
Laufzeit: 31.12.2012 bis 31.12.2016
Die Emotionen des Benutzers sind aus seinen sprachlichen Äußerungen zu klassifizieren. Dazu werden für den Mensch-Maschine-Dialog relevante Emotionsklassen gebildet. Zum einen werden sprachliche subsymbolische und biologienahe Merkmale klassifiziert, zum zweiten wird prosodische automatische Spracherkennung zur Emotionserkennung und -unter Nutzung des semantischen Inhalts zur weiterführenden Intentionserkennung genutzt. Frühe wie auch späte Fusion beider Ansätze wird durchgeführt. Experimentelle Provokation von emotionaler Sprache wird untersucht und Emotionsannotierte Datenbanken werden generiert.
SFB / Transregio 62: Zentrale Aufgaben
Laufzeit: 31.12.2012 bis 31.12.2016
Prof. Wendemuth ist Magdeburger Sprecher des SFB / TRR 62 "Eine Companion-Technologie für Kognitive Technische Systeme". Im Zentralen Bereich wird Projektmanagement durchgeführt, zwei Labore in Ulm und Magdeburg werden koordiniert, 3 Demonstratoren werden jeweils an beiden Standorten erstellt, Wizard-of-Oz- Versuche werden durchgeführt. Ein Graduiertenkolleg wird eingerichtet.
Emotionsbasierte Unterstützung von Dialoganwendungen in Call-Centern
Laufzeit: 15.04.2014 bis 28.11.2015
Die anwendungsbezogene Forschung auf dem Gebiet Emotionsbasierte Unterstützung von Dialoganwendungen in Call-Centern wird weiter entwickelt. Hier handelt es sich um Telefondialoge,
bei denen der Call-Center-Operator in seiner Gesprächsgestaltung durch Rückmeldung über den
emotionalen Zustand (Kontrolle, Valenz) unterstützt wird.
Kategorientheorie für Dispositionserkennung
Laufzeit: 01.06.2013 bis 28.06.2014
Kategorientheorie wird genutzt, um Dispositionen und dazu passende Merkmale zu identifizieren. Dabei werden existierende appraisals bzgl. ihrer features untersucht. Das Ergebnis ist eine konsolidierte feature Basis.
Situationsangepasste Spracherkennung
Laufzeit: 31.12.2012 bis 14.01.2014
Hier soll ein Situationsmodell genutzt werden, um top-down Durchgriff im Spracherkenner und Dialogmanager zu ermöglichen. Ziel ist, nicht nur (dichte) Lattices als Schnittstellen zu nutzen, sondern z.B. bei Änderung der akustischen Umgebung direkt die akustische Merkmalsextraktion zu adaptieren und iterativ den Spracherkenner neu zu nutzen. Ähnliches gilt für Änderungen im Emotions- oder Verhaltenszustand, die z.B. zur Nutzung angepasster akustischer Modelle führen. Oder Änderungen in der Domäne oder der Aufgabe, oder der Kooperativität oder der Intention des Benutzers, die den Dialogmanager beeinflussen. Lernvorgänge sind hier zu implementieren und zu untersuchen bzw. die Anzahl von Alternativen zu vergrößern. Aus der Spracherkennung sind abgeleitete Grössen zu definieren, die für Verhaltensmodelle elevant sind und von diesem interpretativ verwendet werden können bzw. dieses modifizieren.
Linguistisch - Phonetische Analyse
Laufzeit: 01.01.2013 bis 31.12.2013
Wir nutzen textuelle Transcripte um Interaktionsstile und Diskursverläufe zu analysieren. Der individuelle Erfolgszustand des Nutzers wird mit einem Hidden Markov Modell modelliert, indem die beobachteten System-Rückmeldungen zum Training benutzt werden. Anschliessend werden semi-automatsich Signifikante Dialogverläufe annotiert und detektiert.
Modell zur Verortung von Stimmungen und Persönlichkeitsmerkmalen im valence-pleasure-arousal-Raum
Laufzeit: 01.01.2013 bis 31.12.2013
Ein mechanistisches Federmodell zur Verortung von Stimmungen und Persönlichkeitsmerkmalen im valence-pleasure-arousal-Raum von Emotionen wird untersucht. Dabei werden Versuchsabläufe in Trajektorien abgebildet und dafür eine Modellierung generiert.
Context-Dependent Learning and Memory Modelling in Cognitive Behavioral Scenarios
Laufzeit: 18.12.2012 bis 30.06.2013
Zwei Modelle des assoziativen und kontextabhängigen Lernens werden modelliert. Damit können Versuche mit menschlichen Probanden, welche Teil der Arbeit von Prof. Dr. Jochen Braun und der Doktorarbeit von Dipl.-Ing. Oussama Hamid sind , informationstechnisch nachvollzogen werden. Die beiden Modelle verfolgen jeweils zwei unterschiedliche Ansätze und wurden in Matlab implementiert.
Ein Ansatz zur Modellierung basiert auf einem Markov-Entscheidungsprozess (engl. Markov Decision Process), wie er häufig im Bereich des Maschinellen Lernens verwendet wird. Ein damit entworfener menschenähnlicher Lernalgorithmus wurde anschließend um die Fähigkeit erweitert aus dem Zeitkontext in der Lernaufgabe Nutzen zu ziehen.
Der zweite Ansatz ist ein Kapazitätsmodell, welches sich auf Erkenntnisse aus der Gedächtnispsychologie stützt. Das Lernen von Assoziationen wird als Prozess im Kurzzeitgedächtnis modelliert, wobei der zeitliche Kontext unterstützend wirkt. Die Kapazität des Kurzzeitspeichers ist dabei der limitierende Faktor. Die Rolle der zeitlichen Information wurde auf verschiedene Weisen in das Modell implementiert. Es kann z.B. ein Einfluss auf die Vergessensrate oder auf das Erinnerungsvermögen der Probanden simuliert werden. Für die Simulation von Umlernen bei Kontextwechsel wurde zusätzlich ein Langzeitgedächtnis in das Modell eingefügt.
informationstechnisch nachvollzogen werden. Die beiden Modelle verfolgen jeweils zwei unterschiedliche Ansätze und wurden in Matlab implementiert.
SFB / Transregio 62: Emotionserkennung aus gesprochener Sprache
Laufzeit: 31.12.2008 bis 31.12.2012
Die Emotionen des Benutzers sind aus seinen sprachlichen Äußerungen zu klassifizieren. Dazu werden für den Mensch-Maschine-Dialog relevante Emotionsklassen gebildet. Zum einen werden sprachliche subsymbolische und biologienahe Merkmale klassifiziert, zum zweiten wird prosodische automatische Spracherkennung zur Emotionserkennung und -unter Nutzung des semantischen Inhalts zur weiterführenden Intentionserkennung genutzt. Frühe wie auch späte Fusion beider Ansätze wird durchgeführt. Experimentelle Provokation von emotionaler Sprache wird untersucht und Emotionsannotierte Datenbanken werden generiert.
SFB / Transregio 62: Informationsfusion
Laufzeit: 31.12.2008 bis 31.12.2012
Das Ziel der Informationsfusion in einem Companion-System ist die Erstellung eines umfassenden Modells zur Situationsinterpretation für die Planungs- und Entscheidungsebene. Hierzu werden die räumlichen Situationsmodelle zeitlich integriert und mit den Ergebnissen der Nutzeremotionserkennung fusioniert. Für die zuverlässige Erkennung der Nutzeremotion auf der Basis gesprochener Sprache, Gestik, Mimik und psychobiologischer Daten werden multimodale Informationsfusionsarchitekturen verschiedener Abstraktionsebenen entwickelt und evaluiert.
SFB / Transregio 62: Zentrale Aufgaben
Laufzeit: 31.12.2008 bis 31.12.2012
Prof. Wendemuth ist Magdeburger Sprecher des SFB / TRR 62 "Eine Companion-Technologie für Kognitive Technische Systeme". Im Zentralen Bereich wird Projektmanagement durchgeführt, zwei Labore in Ulm und Magdeburg werden koordiniert, 3 Demonstratoren werden jeweils an beiden Standorten erstellt, Wizard-of-Oz- Versuche werden durchgeführt. Ein Graduiertenkolleg wird eingerichtet.
Context-Dependent Learning and Memory Modelling in Cognitive Behavioral Scenarios
Laufzeit: 18.12.2008 bis 18.12.2012
Zwei Modelle des assoziativen und kontextabhängigen Lernens werden modelliert. Damit können Versuche mit menschlichen Probanden, welche Teil der Arbeit von Prof. Dr. Jochen Braun und der Doktorarbeit von Dipl.-Ing. Oussama Hamid sind , informationstechnisch nachvollzogen werden. Die beiden Modelle verfolgen jeweils zwei unterschiedliche Ansätze und wurden in Matlab implementiert.
Ein Ansatz zur Modellierung basiert auf einem Markov-Entscheidungsprozess (engl. Markov Decision Process), wie er häufig im Bereich des Maschinellen Lernens verwendet wird. Ein damit entworfener menschenähnlicher Lernalgorithmus wurde anschließend um die Fähigkeit erweitert aus dem Zeitkontext in der Lernaufgabe Nutzen zu ziehen.
Der zweite Ansatz ist ein Kapazitätsmodell, welches sich auf Erkenntnisse aus der Gedächtnispsychologie stützt. Das Lernen von Assoziationen wird als Prozess im Kurzzeitgedächtnis modelliert, wobei der zeitliche Kontext unterstützend wirkt. Die Kapazität des Kurzzeitspeichers ist dabei der limitierende Faktor. Die Rolle der zeitlichen Information wurde auf verschiedene Weisen in das Modell implementiert. Es kann z.B. ein Einfluss auf die Vergessensrate oder auf das Erinnerungsvermögen der Probanden simuliert werden. Für die Simulation von Umlernen bei Kontextwechsel wurde zusätzlich ein Langzeitgedächtnis in das Modell eingefügt.
informationstechnisch nachvollzogen werden. Die beiden Modelle verfolgen jeweils zwei unterschiedliche Ansätze und wurden in Matlab implementiert.
Situationsangepasste Spracherkennung
Laufzeit: 10.10.2007 bis 09.10.2012
Hier soll ein Situationsmodell genutzt werden, um top-down Durchgriff im Spracherkenner und Dialogmanager zu ermöglichen. Ziel ist, nicht nur (dichte) Lattices als Schnittstellen zu nutzen, sondern z.B. bei Änderung der akustischen Umgebung direkt die akustische Merkmalsextraktion zu adaptieren und iterativ den Spracherkenner neu zu nutzen. Ähnliches gilt für Änderungen im Emotions- oder Verhaltenszustand, die z.B. zur Nutzung angepasster akustischer Modelle führen. Oder Änderungen in der Domäne oder der Aufgabe, oder der Kooperativität oder der Intention des Benutzers, die den Dialogmanager beeinflussen. Lernvorgänge sind hier zu implementieren und zu untersuchen bzw. die Anzahl von Alternativen zu vergrößern. Aus der Spracherkennung sind abgeleitete Grössen zu definieren, die für Verhaltensmodelle elevant sind und von diesem interpretativ verwendet werden können bzw. dieses modifizieren.
Spracherkennung mit Unsicherheitsbewertung
Laufzeit: 01.04.2008 bis 31.03.2012
Kombination von Modalitäten (mit verschiedenen Konfidenzen / Unsicherheiten) auf einem Datenstrom. (Wahrscheinlichkeits-)Theorie zur korrekten Berechnung der besten Gesamt-Hypothese.
Teilziele:
- Diskriminative Lernmethoden: andere Kostenfunktionen, z:b. MMI, MCE. Annäherung an Bayes schen Klassifizierer.
- Universeller Spracherkenner : wesentliche Arbeiten für Erkenner, die auf andere Domäne / Sprache / akust. Umgebung portiert werden. Graphem-Phonem Äquivalenz
Neurobiologisch inspirierte, multimodale Intentionserkennung für technische Kommunikationssysteme (C4)
Laufzeit: 01.05.2008 bis 31.12.2010
NIMITEK II steht für Neurobiologisch inspirierte, multimodale Intentionserkennung für technische Kommunikationssysteme. Gegenstand der Forschung ist das Zusammenwirken von Mensch und Maschine in technischen Kommunikationssystemen. Solche Systeme werden schon heute vielfältig benutzt, sei es ein sprachgesteuerter telefonischer Dienst oder das Hilfe-Menü einer Textverarbeitung. Viele Benutzer sind unzufrieden mit dem Verhalten der Maschine. Die Neurobiologen in Magdeburg haben in diesem Zusammenhang in den letzten Jahren Erkenntnisse gewonnen, wie das Verhalten des Menschen beschrieben werden kann und wie seine Absichten und Intentionen darauf einwirken. Diese Erkenntnisse werden nun als Modelle in Computern programmiert und werden damit die Kommunikation von Mensch und Maschine deutlich verbessern. Gleichzeitig dient diese technische Umsetzung als experimentelles Labor für weitere grundlegende Forschungen der Neurowissenschaften. Sprecher von NIMITEK ist Prof. Dr. Andreas Wendemuth. Speziell werden in seiner Arbeitsgruppe bearbeitet: Spracherkennung, mutimodale Informations- und Prosodieerkennung, Klassifikation emotionaler Einheiten, Modellierung von assoziativen Zusammenhängen.
Bernstein-Gruppe Components of cognition: small networks to flexible rules: Context-dependent associative learning
Laufzeit: 15.12.2006 bis 31.01.2010
The overarching questions to be addressed by this project are as follows:
- Is the learning of context-conditional associations by human observers influenced by, or even predicated on, consistent temporal ordering of environmental events? In other words, can the context-dependence of human associative learning be understood in terms of a temporalorderdependence?
- How does temporal-order-dependent learning compare to abstract learning algorithms (e.g.,support-vector machines, dynamic adaptation of neural nets) for detecting patterns and regularities in high-dimensional data streams?
- Is temporal-order-dependent learning suited as a general solution to complex learning problems? How does it perform on diverse problems such as those described in section 7.3 (i.e., learning to recognize prosodic signals in speech or emotional markers in facial expression)?
Bernstein-Gruppe Components of cognition: small networks to flexible rules: Multi-modal emotion recognition and blind source separation
Laufzeit: 15.12.2006 bis 31.01.2010
The immediate goal is to analyze concurrent speech utterances and facial expressions in terms of speaker emotion and intention. Speech and face information will be combined to a multi-modal feature vector and subjected to blind source separation (ICA) analysis. In a different context similar methods were already suggested by the applicant in his Habilitationsschrift [Michaelis 80]. In the longer term, the proposed project is aimed at the automatic recognition of subtly different human interactions (e.g., friendly/cooperative, impatient/evasive, aversive/violent). A second long-term goal is to apply the automatic recognition of emotion states to a neurobiological investigation of the neural basis of emotion. A correlation with results of EEG and MRI investigations can be carried out [Heinzel 05]. The software tools to be developed here would be invaluable in brain imaging (fMRI) of human emotion.
Situationsangepasste, biologische Verhaltensmodellierung
Laufzeit: 10.10.2007 bis 10.01.2010
Hier sollen das Situationsmodell und Ergebnisse des iterativen, einander modifizierenden top-down und bottom-up Prozesses in der Spracherkennung (Projekt Situationsangepasste Spracherkennung) genutzt werden, um ein interpretatives Verhaltensmodell einer Person oder von Personen in einer definierten Situation / Umgebung ( Situiertheit ) zu erzeugen und damit Interaktion als (intentionales) Verhalten zu modellieren. Die Ergebnisse des Projektes Situationsangepasste Spracherkennung dienen hier als direktes Maß dafür, wie sich die Person(en) zur Umgebung und zu einer gestellten Aufgabe äußern (Inhalt, Emotion) und wie dies mit den erfassten Umgebungsparametern zusammenpasst (match / mismatch der sprachlichen Äusserungen zur Umgebung), woraus Bestätigungen oder Änderungen des Verhaltensmodells abgeleitet werden können. Das gleiche gilt für eine Intentionserkennung, die mit B.Vlasenko zusammen entwickelt wird. Für die Situationsbeschreibung sind insbesondere Modellgrössen wie Zustandsparameter, Ziel(Kosten)grössen, Optimierungskriterien (LQ, ML, MMI, ME, MDL, andere?) zu definieren. Iterative und/oder syntaktisch-deskriptive (wenn-dann-Beziehungen) Lernvorgänge sind hier zu implementieren und zu untersuchen bzw. die Anzahl von Alternativen zu vergrößern. Das umfasst sowohl die Fähigkeit zum besseren Lernen einer Situation wie auch das Lernen, zwischen verschiedenen Situationen zu unterscheiden (dies ist auch in der Gruppe Prof. Braun von hohem Interesse). Aus dem Verhaltensmodell sind abgeleitete Grössen zu definieren, die für die Spracherkennung und Dialogmanager relevant sind und von dieser interpretativ verwendet werden können bzw. diesen modifizieren.
Robuster, sprachgesteuerter Datenbankzugang via Telephon (Folgeprojekt)
Laufzeit: 01.08.2008 bis 30.04.2009
Spracherkennung wird zum Hinzufügen von Daten und der Abfrage von Daten von einer Datenbank per Telefon auch unter ungünstigen Bedingungen genutzt. Sprachausgabe geschieht durch Sprachsynthese. Sprachverstehen wird angewendet, um den Inhalt der Abfragen zu analysieren. Robuste Spracherkennung auf Telefonen wird entwickelt. Hier geht es um eine Systemanwendung, die die Anwendbarkeit der Technologien im realen Umfeld zeigt und Neuentwicklungen aus praktischen Aspekten hervorbringt.
Robuster, sprachgesteuerter Datenbankzugang via Telephon
Laufzeit: 01.08.2005 bis 31.07.2008
Spracherkennung wird zum Hinzufügen von Daten und der Abfrage von Daten von einer Datenbank per Telefon auch unter ungünstigen Bedingungen genutzt. Sprachausgabe geschieht durch Sprachsynthese. Sprachverstehen wird angewendet, um den Inhalt der Abfragen zu analysieren. Robuste Spracherkennung auf Telefonen wird entwickelt.Hier geht es um eine Systemanwendung, die die Anwendbarkeit der Technologien im realen Umfeld zeigt und Neuentwicklungen aus praktischen Aspekten hervorbringt.
Einsatz von Support-Vektor-Maschinen zur Flexibilisierung von automatischer Sprachverarbeitung
Laufzeit: 01.07.2003 bis 29.06.2008
Support Vektor Maschinen werden zur Flexibilisierung von Produktionswahrscheinlichkeiten in der automatischen Sprachverarbeitung benutzt. Dabei sind insbesondere hybride HMM-Systeme zu untersuchen.
Support-Vector-Machines are used for flexible tailoringof automatic speech recognition systems to new tasks.
Neurobiologisch inspirierte, multimodale Intentionserkennung für technische Kommunikationssysteme II
Laufzeit: 01.01.2008 bis 01.04.2008
NIMITEK II steht für Neurobiologisch inspirierte, multimodale Intentionserkennung für technische Kommunikationssysteme. Gegenstand der Forschung ist das Zusammenwirken von Mensch und Maschine in technischen Kommunikationssystemen. Solche Systeme werden schon heute vielfältig benutzt, sei es ein sprachgesteuerter telefonischer Dienst oder das Hilfe-Menü einer Textverarbeitung. Viele Benutzer sind unzufrieden mit dem Verhalten der Maschine. Die Neurobiologen in Magdeburg haben in diesem Zusammenhang in den letzten Jahren Erkenntnisse gewonnen, wie das Verhalten des Menschen beschrieben werden kann und wie seine Absichten und Intentionen darauf einwirken. Diese Erkenntnisse werden nun als Modelle in Computern programmiert und werden damit die Kommunikation von Mensch und Maschine deutlich verbessern. Gleichzeitig dient diese technische Umsetzung als experimentelles Labor für weitere grundlegende Forschungen der Neurowissenschaften. Sprecher von NIMITEK ist Prof. Dr. Andreas Wendemuth. Speziell werden in seiner Arbeitsgruppe bearbeitet: Spracherkennung, mutimodale Informations- und Prosodieerkennung, Klassifikation emotionaler Einheiten, Modellierung von assoziativen Zusammenhängen.
Neurobiologisch inspirierte, multimodale Intentionserkennung für technische Kommunikationssysteme
Laufzeit: 01.12.2005 bis 31.12.2007
NIMITEK steht für Neurobiologisch inspirierte, multimodale Intentionserkennung für technische Kommunikationssysteme . Gegenstand der Forschung ist das Zusammenwirken von Mensch und Maschine in technischen Kommunikationssystemen. Solche Systeme werden schon heute vielfältig benutzt, sei es ein sprachgesteuerter telefonischer Dienst oder das Hilfe-Menü einer Textverarbeitung. Viele Benutzer sind unzufrieden mit dem Verhalten der Maschine. Die Neurobiologen in Magdeburg haben in diesem Zusammenhang in den letzten Jahren Erkenntnisse gewonnen, wie das Verhalten des Menschen beschrieben werden kann und wie seine Absichten und Intentionen darauf einwirken. Diese Erkenntnisse werden nun als Modelle in Computern programmiert und werden damit die Kommunikation von Mensch und Maschine deutlich verbessern. Gleichzeitig dient diese technische Umsetzung als experimentelles Labor für weitere grundlegende Forschungen der Neurowissenschaften. Sprecher von NIMITEK ist Prof. Dr. Andreas Wendemuth. Speziell werden in seiner Arbeitsgruppe bearbeitet: Spracherkennung, mutimodale Informations- und Prosodieerkennung, Klassifikation emotionaler Einheiten, Modellierung von assoziativen Zusammenhängen.
Support-Vektor-Maschinen und Kernelbasierte Methoden in der automatischen Sprachverarbeitung (Fortsetzung)
Laufzeit: 01.10.2006 bis 31.12.2007
Support-Vektor-Maschinen und Kernelbasierte Methoden in der automatischen prachverarbeitung werden angewandt und dabei mathematische Methoden aus der Numerik verwendet und ergänzt. Wahrscheinlichkeitsausgaben werden generiert.
Support Vector Machines als Akustische Modelle von Hidden-Markov-Modell-basierten Spracherkennungssystemen
Laufzeit: 01.07.2003 bis 30.06.2007
Support Vektor Maschinen werden zur Modellierung von Produktionswahrscheinlichkeiten als akustische Modelle in der automatischen Sprachverarbeitung benutzt. Dabei werden SVM-Trainingsverfahren eingebettet.
Support Vector Machines are used to model Production probabilitieswhich are used as acoustic models in automatic speech recognition.
Generalisierungsfähige akustische Klassifikation in der automatischen Sprachverarbeitung (Fortsetzung)
Laufzeit: 01.07.2006 bis 30.12.2006
Gegenstand dieses Promotionsvorhabens sind Untersuchungen verschiedener parametrischer Schätzverfahren für die automatische Sprachverarbeitung. Ziel ist es, Schätzverfahren zu entwickeln und zu untersuchen, die Spracherkennung mit hoher Generalisierungsfähigkeit ermöglichen. Dies gilt insbesondere vor dem Hintergrund geringen oder unpassenden Datenmaterials, sowie bei Rausch-, Kanal- und anderen Störungen. Das Vorhaben verfolgt damit anspruchsvolle theoretische sowie software-orientierte Ziele, seine Ergebnisse sind praxisnah einsetzbar
Support-Vektor-Maschinen und Kernelbasierte Methoden in der automatischen Sprachverarbeitung
Laufzeit: 01.10.2001 bis 30.09.2006
Support-Vektor-Maschinen und Kernelbasierte Methoden in der automatischen prachverarbeitung werden angewandt und dabei mathematische Methoden aus der Numerik verwendet und ergänzt. Wahrscheinlichkeitsausgaben werden generiert.
Support-Vector-Machines and Kernel-based Methods will be utilized in automatic speech recognition. Numercial Methods will be used to generate probability measures.
Generalisierungsfähige akustische Klassifikation in der automatischen Sprachverarbeitung
Laufzeit: 01.07.2001 bis 30.06.2006
Gegenstand dieses Promotionsvorhabens sind Untersuchungen verschiedener parametrischer Schätzverfahren für die automatische Sprachverarbeitung. Ziel ist es, Schätzverfahren zu entwickeln und zu untersuchen, die Spracherkennung mit hoher Generalisierungsfähigkeit ermöglichen. Dies gilt insbesondere vor dem Hintergrund geringen oder unpassenden Datenmaterials, sowie bei Rausch-, Kanal- und anderen Störungen. Das Vorhaben verfolgt damit anspruchsvolle theoretische sowie software-orientierte Ziele, seine Ergebnisse sind praxisnah einsetzbar
Iterative Lösung für eine Multiklassen-Diskriminantenanalyse mit Kernfunktionen (Fortsetzung)
Laufzeit: 01.07.2005 bis 30.06.2006
Sprachsignale werden mit Methoden der digitalen Signalverarbeitung bearbeitet. Die dabei entstehenden Cluster können jedoch sehr leicht nicht separierbar werden. Dies ist insbesondere dann der Fall, wenn mehr als zwei Klassen vorliegen. Daher ist eine Weiterverarbeitung der Daten unumgänglich. Die bisherigen Methoden basieren auf einer linearen Transformationen des hochdimensionalen Vektorraums, aus dem die erwähnten Cluster stammen. Diese Methoden funktionieren jedoch nur in sehr einfachen Fällen. Der neue Ansatz innerhalb dieses Promotionsvorhabens zielt auf eine nicht-lineare Transformation des hochdimensionalen Vektorraums mit Kernfunktionen ab, durch die eine bessere Separierung der einzelnen Cluster ermöglicht werden soll. Bei der anschließenden linearen Diskriminanzanalyse können schnell Matrizen sehr hoher Dimensionalität entstehen. Vor allem im Hinblick auf einen späteren Echtzeiteinsatz des Spracherkenners wäre eine analytische Bearbeitung solcher Matrizen nicht sinnvoll. Daher ist ein weiteres wichtiges Ziel dieses Promotionsvorhabens eine Diskriminanzanalyse, die iterativ implementiert werden kann.
Iterative Lösung für eine Multiklassen-Diskriminantenanalyse mit Kernfunktionen
Laufzeit: 01.07.2003 bis 30.06.2005
Eine robuste Spracherkennung kann nur dann funktionieren, wenn einzelne phonetische Einheiten im Signalraum als zu einer Klasse gehörende Cluster identifizierbar und voneinander unterscheidbar sind. Um dies zu gewährleisten, werden Sprachsignale mit Methoden der digitalen Signalverarbeitung bearbeitet. Die dabei entstehenden Cluster können jedoch sehr leicht nicht separierbar werden. Dies ist insbesondere dann der Fall, wenn mehr als zwei Klassen vorliegen. Daher ist eine Weiterverarbeitung der Daten unumgänglich. Die bisherigen Methoden basieren auf einer linearen Transformationen des hochdimensionalen Vektorraums, aus dem die erwähnten Cluster stammen. Diese Methoden funktionieren jedoch nur in sehr einfachen Fällen. Der neue Ansatz innerhalb dieses Promotionsvorhabens zielt auf eine nicht-lineare Transformation des hochdimensionalen Vektorraums mit Kernfunktionen ab, durch die eine bessere Separierung der einzelnen Cluster ermöglicht werden soll. Bei der anschließenden linearen Diskriminanzanalyse können schnell Matrizen sehr hoher Dimensionalität entstehen. Vor allem im Hinblick auf einen späteren Echtzeiteinsatz des Spracherkenners wäre eine analytische Bearbeitung solcher Matrizen nicht sinnvoll. Daher ist ein weiteres wichtiges Ziel dieses Promotionsvorhabens eine Diskriminanzanalyse, die iterativ implementiert werden kann
Internationale Sommerschule Robuste Sprachverarbeitung 7.7.-18.7.2003
Laufzeit: 07.04.2003 bis 18.07.2003
Die Sommerschule leistet folgendes:- Vermitteln von präzisem Methodenwissen und fertigkeiten in Techniken der Spracherkennung für junge Wissenschaftler, die noch keine vertiefte Erfahrung in diesem Feld haben- Vermitteln detaillierter Kenntnisse für robuste Methoden - Anleitung der Wissenschaftler zum unmittelbaren Anwenden der erworbenen Kenntnisse in existierenden Spracherkennungssystemen- Junge Wissenschaftler in die Lage versetzen, ein individuelles Spracherkennungssystem in ihrer Muttersprache zu erstellen auf der Grundlage existierender Korpora- Eröffnen von Kontakten zu anderen akademischen Institutionen und der Industrie, durch eingeladene Referenten und anwendungsorientierte Zusammenarbeit am Hochschulort
Internationale Sommeruniversität Sprachverarbeitung 2002
Laufzeit: 01.07.2002 bis 01.10.2002
Die Studenten werden von uns in Digitaler Signalverarbeitung sowie in Automatischer Sprachverarbeitung ausgebildet. Sie erhalten Gelegenheit, ihre Kenntnisse an dem am Lehrstuhl installierten Sprachlabor praktisch anzuwenden und zu vertiefen. Sie werden dabei aktuellste Aufgaben in diesen Gebieten durchführen, deren Resultate wiederum in der Arbeitsgruppe zum weiteren Ausbau der Forschung und Lehre eingesetzt werden können.
2023
Buchbeitrag
Presenting a German dataset of wake words - first analyses and comparison of different solutions for speech-based activation techniques
Busch, Matthias; Sinha, Yamini; Hintz, Jan; Wendemuth, Andreas; Siegert, Ingo
In: DAGA 2023 - Berlin : Deutsche Gesellschaft für Akustik e.V., S. 1478-1481
Cross-reliability benchmark test for preserving emotional content in speech-synthesis related datasets
Hintz, Jan; Wendemuth, Andreas; Siegert, Ingo
In: Elektronische Sprachsignalverarbeitung 2023 / Konferenz Elektronische Sprachsignalverarbeitung , 2023 - Dresden : TUDpress ; Draxler, Christoph *1960-*, S. 64-72 - (Studientexte zur Sprachkommunikation; 105)
Multiparty dialogic processes of goal and strategy formation in hybrid teams
Wendemuth, Andreas; Kopp, Stefan
In: Computer-Human Interaction Research and Applications , 1st ed. 2023. - Cham : Springer Nature Switzerland ; da Silva, Hugo Plácido, S. 110-120 - (Communications in computer and information science; volume 1996)
Companion technology
Wendemuth, Andreas
In: Handbook of human-machine systems - Wiley ; Fortino, Giancarlo . - 2023, S. 155-163
Cross-timescale experience evaluation framework for productive teaming
Raake, Alexander; Broll, Wolfgang; Chuang, Lewis L.; Domahidi, Emese; Wendemuth, Andreas
In: Engineering for a changing world - Ilmenau : ilmedia ; Sattler, Kai-Uwe *1968-* . - 2023, S. 1-6, Artikel 5.4.129
Going one step further: towards cognitively enhanced problem-solving teaming agents
Puricelli, Leonardo; Brandenburg, Stefan; Wendemuth, Andreas; Husung, Stephan; Armbruster, Diana; Meyer, Bertolt; Ragni, Marco
In: Engineering for a changing world - Ilmenau : ilmedia ; Sattler, Kai-Uwe *1968-* . - 2023, S. 1-12, Artikel 5.1.137
Dissertation
An automatic and multi-modal system for continuous pain intensity monitoring based on analyzing data from five sensor modalities
Othman, Ehsan; Hamadi, Ayoub; Wendemuth, Andreas
In: Magdeburg: Universitätsbibliothek, Dissertation Otto-von-Guericke-Universität Magdeburg, Fakultät für Elektrotechnik und Informationstechik 2023, 1 Online-Ressource (xxi, 155 Seiten, 7,42 MB) [Literaturverzeichnis: Seite 137-155]
2022
Buchbeitrag
Emotion preservation for one-shot speaker anonymization using McAdams
Sinha, Yamini; Wendemuth, Andreas; Siegert, Ingo
In: Konferenz: 33. Konferenz "Elektronische Sprachsignalverarbeitung", Sonderborg, 2.-4. März 2022, Elektronische Sprachsignalverarbeitung 2022 - Dresden: TUDpress; Weston, Heather . - 2022, S. 235-242 - (Studientexte zur Sprachkommunikation; 103)
Why Eli Roth should not use TTS-Systems for anonymization
Sinha, Yamini; Hintz, Jan; Busch, Matthias; Polzehl, Tim; Haase, Matthias; Wendemuth, Andreas; Siegert, Ingo
In: 2nd Symposium on Security and Privacy in Speech Communication - Incheon, Korea, 23-24 September 2022 - Internatinal Speech Communication Association ; Siegert, Ingo, S. 17-22
Parameter optimization issues for cross-corpora emotion classification
Vlasenko, Bogdan; Philippou-Hübner, David; Wendemuth, Andreas
In: Konferenz: 2013 Humaine Association Conference on Affective Computing and Intelligent Interaction, Geneva, Switzerland, 02-05 September 2013, Humaine Association Conference on Affective Computing and Intelligent Interaction (ACII), 2013 - Piscataway, NJ: IEEE . - 2013, S. 454-459
Begutachteter Zeitschriftenartikel
Acoustic-based automatic addressee detection for technical systems - a review
Siegert, Ingo; Weißkirchen, Norman; Wendemuth, Andreas
In: Frontiers in computer science - Lausanne : Frontiers Media, Bd. 4 (2022), Artikel 831784, insges. 20 S.
Dissertation
Driver affect recognition from real-world speech data in in-vehicle driving environments
Requardt, Alicia Flores; Wendemuth, Andreas; Jumar, Ulrich
In: Magdeburg: Universitätsbibliothek, Dissertation Otto-von-Guericke-Universität Magdeburg, Fakultät für Elektrotechnik und Informationstechnik 2022, 1 Online-Ressource (xxiii, 296 Seiten, 8,08 MB) [Literaturverzeichnis: Seite 209-251]
Artikel in Kongressband
Public interactions with voice assistant - discussion of different one-shot solutions to preserve speaker privacy
Siegert, Ingo; Sinha, Yamini; Winkelmann, Gino; Jokisch, Oliver; Wendemuth, Andreas
In: Proceedings of the LREC 2022 Joint Workshop on Legal and Ethical Issues in Human Language Technologies and Multilingual De-Identification of Sensitive Language Resources (LEGAL - MDLR 2022) - Paris : European Language Resources Association (ELRA) ; Rigault, Mickaël, S. 44-47
2021
Begutachteter Zeitschriftenartikel
Admitting the addressee detection faultiness of voice assistants to improve the activation performance using a continuous learning framework
Siegert, Ingo; Weißkirchen, Norman; Krüger, Julia; Akhtiamov, Oleg; Wendemuth, Andreas
In: Cognitive systems research - Amsterdam [u.a.] : Elsevier Science, Bd. 70 (2021), S. 65-79
Dissertation
Efficient deep learning algorithms for securing Industrial Control Systems from cyberattacks
Potluri, Sasanka; Diedrich, Christian; Wendemuth, Andreas
In: Magdeburg, Dissertation Otto-von-Guericke-Universität Magdeburg, Fakultät für Elektrotechnik und Informationstechnik 2021, xxviii, 268 Seiten [Literaturverzeichnis: Seite 181-194][Literaturverzeichnis: Seite 181-194]
2020
Buchbeitrag
Utilizing computer vision algorithms to detect and describe local features in images for emotion recognition from speech
Weißkirchen, Norman; Reddy, Mainampati Vasudeva; Wendemuth, Andreas; Siegert, Ingo
In: Proceedings of the 2020 IEEE International Conference on Human-Machine Systems (ICHMS): Sept 7-9, 2020, Rome, Italy/ IEEE International Conference on Human-Machine Systems - [Piscataway, NJ]: IEEE; Weibkirchen, Norman . - 2020, insges. 6 S.
Filtering-based analysis of spectral and temporal effects of room modes on low-level descriptors of emotionally coloured speech
Gottschalk, Martin; Höbel-Müller, Juliane; Siegert, Ingo; Verhey, Jesko L.; Wendemuth, Andreas
In: Elektronische Sprachsignalverarbeitung 2020 - Tagungsband der 31. Konferenz Magdeburg : Magdeburg, 4.-6. März 2020 / Konferenz "Elektronische Sprachsignalverarbeitung" , 2020 - Dresden : TUDpress ; Wendemuth, Andreas, S. 219-226 - (Studientexte zur Sprachkommunikation; 95) [Konferenz: 31. Konferenz "Elektronische Sprachsignalverarbeitung", Magdeburg, 4.-6. März 2020]
Machine learning-assisted affect labelling of speech data
Requardt, Alicia Flores; Egorow, Olga; Wendemuth, Andreas
In: Elektronische Sprachsignalverarbeitung 2020 - Tagungsband der 31. Konferenz Magdeburg : Magdeburg, 4.-6. März 2020: Tagungsband der 31. Konferenz Magdeburg : Magdeburg, 4.-6. März 2020/ Konferenz "Elektronische Sprachsignalverarbeitung" - Dresden: TUDpress . - 2020, S. 199-205 - (Studientexte zur Sprachkommunikation; 95)
Investigation of the influence of standing waves on distant speech emotion recognition
Höbel-Müller, Juliane; Siegert, Ingo; Gottschalk, Martin; Heinemann, Ralph; Wendemuth, Andreas
In: Fortschritte der Akustik - DAGA 2020 - Berlin : Deutsche Gesellschaft für Akustik e.V. (DEGA), S. 822-825 [Konferenz: DAGA 2020, Hannover, 16.-19. März 2020]
Recognition performance of selected speech recognition APIs - a longitudinal study
Siegert, Ingo; Sinha, Yamini; Jokisch, Oliver; Wendemuth, Andreas
In: Speech and Computer - Cham : Springer ; Karpov, Alexey . - 2020, S. 520-529 - ( Lecture notes in computer science; 12335)
Towards true artificial peers
Weißkirchen, Norman; Böck, Ronald; Wendemuth, Andreas
In: Proceedings of the 2020 IEEE International Conference on Human-Machine Systems (ICHMS): Sept 7-9, 2020, Rome, Italy/ IEEE International Conference on Human-Machine Systems - [Piscataway, NJ]: IEEE . - 2020, insges. 5 S.
Begutachteter Zeitschriftenartikel
Adaptive transitions for automation in cars, trucks, busses and motorcycles
Wendemuth, Andreas; Diederichs, Frederik; Knauss, Alessia; Milbrink, Marc; Lilis, Yannis; Chrysochoou, Evangelia; Annund, Anna; Bekiaris, Evangelos; Nikolaou, Stella; Finer, Svitlana; Zanovello, Luca; Maroudis, Pantelis; Krupenia, Stas; Abser, Andreas; Dimokas, Nikos; Apoy, Camilla; Karlsson, Johan; Larsson, Annika; Zidianakis, Emmanouil; Efa, Alexander; Widlroither, Harald; Dai, Mengnuo; Teichmann, Daniel; Sanatnama, Hamid; Bischoff, Sven
In: IET intelligent transport systems/ Institution of Engineering and Technology - London: IET . - 2020
Towards affect-aware vehicles for increasing safety and comfort - recognising driver emotions from audio recordings in a realistic driving study
Requardt, Alicia F.; Ihme, Klas; Wilbrink, Marc; Wendemuth, Andreas
In: IET intelligent transport systems/ Institution of Engineering and Technology - London: IET, Bd. 14 (2020), 10, S. 1265-1277
Dissertation
Accessing the interlocutor - recognition of interaction-related interlocutor states in multiple modalities
Egorow, Olga; Wendemuth, Andreas; Diedrich, Christian
In: Magdeburg, Dissertation Otto-von-Guericke-Universität Magdeburg, Fakultät für Elektrotechnik und Informationstechnik 2020, I, xv, 143 Seiten [Literaturverzeichnis: Seite 117-143][Literaturverzeichnis: Seite 117-143]
Habilitation
Anticipate the user - multimodal analyses in human-machine interaction towards group interactions
Böck, Ronald; Wendemuth, Andreas
In: Dresden: TUDpress, 2020, xxiii, 354 Seiten, Illustrationen, Diagramme, 24 cm - (Studientexte zur Sprachkommunikation; Band 98)
Herausgeberschaft
Elektronische Sprachsignalverarbeitung 2020 - Tagungsband der 31. Konferenz Magdeburg : Magdeburg, 4.-6. März 2020
Wendemuth, Andreas; Böck, Ronald; Siegert, Ingo
In: Dresden: TUDpress, 2020, XI, 288 Seiten, Illustrationen, Diagramme, 24 cm x 17 cm - (Studientexte zur Sprachkommunikation; Band 95)
2019
Abstract
Admitting the addressee-detection faultiness to improve the performance using a continous learning framework
Siegert, Ingo; Weißkirchen, Norman; Wendemuth, Andreas
In: 8. Interdisziplinärer Workshop Kognitive Systeme: Verstehen, Beschreiben und Gestalten Kognitiver (Technischer) Systeme - Duisburg: Universität Duisburg-Essen, S. 38-39, 2019
Experimentelles Design zur Induktion von Emotionalität in Sprache und Gangverhalten im häuslichen Umfeld
Höbel-Müller, Juliane; Böck, Ronald; Perez Grassi, Ana Cecilia; Wendemuth, Andreas
In: 8. Interdisziplinärer Workshop Kognitive Systeme: Verstehen, Beschreiben und Gestalten Kognitiver (Technischer) Systeme: Duisburg, 26.-28. März 2019 - Duisburg: Universität Duisburg-Essen, 2019; Eyssel, Friederike . - 2019, S. 22-23
Buchbeitrag
Analysis of the influence of different room acoustics on acoustic emotion features
Höbel-Müller, Juliane; Siegert, Ingo; Heinemann, Ralph; Requardt, Alicia Flores; Tornow, Michael; Wendemuth, Andreas
In: Elektronische Sprachsignalverarbeitung 2019: Tagungsband der 30. Konferenz, Dresden, 6.-8. März 2019 / Peter Birkholz und Simon Stone (Hrsg.): Tagungsband der 30. Konferenz, Dresden, 6.-8. März 2019/ Konferenz "Elektronische Sprachsignalverarbeitung" - Dresden: TUDpress, 2019 . - 2019, S. 156-163 - (Studientexte zur Sprachkommunikation; 93)[Konferenz: 30. Konferenz Elektronische Sprachsignalverarbeitung 2019: Tagungsband der 30. Konferenz, Dresden, 6.-8. März 2019 / Peter Birkholz und Simon Stone (Hrsg.), Dresden, 6.-8. März 2019]
Anticipating the user - acoustic disposition recognition in intelligent interactions
Böck, Ronald; Egorow, Olga; Höbel-Müller, Juliane; Requardt, Alicia Flores; Siegert, Ingo; Wendemuth, Andreas
In: Innovations in big data mining and embedded knowledge - Cham, Switzerland: Springer, 2019; Esposito, Anna . - 2019, S. 203-233 - (Intelligent systems reference library; volume 159)
Employing Bottleneck and convolutional features for speech-based physical load detection on limited data amounts
Egorow, Olga; Mrech, Tarik; Weißkirchen, Norman; Wendemuth, Andreas
In: Interspeech 2019: 15-19 September 2019, Graz - International Speech and Communication Association, 2019; Kubin, Gernot . - 2019, S. 1666-1670[Interspeech 2019, Graz, 15-19 September 2019]
Towards cognitive systems for assisted cooperative processes of goal finding and strategy change
Wendemuth, Andreas; Kopp, Stefan
In: Konferenz: IEEE International Conference on Systems, Man, and Cybernetics, IEEE SMC 2019, 6-9 October 2019, Bari Italy, 2019 IEEE International Conference on Systems, Man and Cybernetics (SMC)/ IEEE International Conference on Systems, Man, and Cybernetics - [Piscataway, NJ]: IEEE . - 2019, S. 4302-4307
The Restaurant Booking Corpus - content-identical comparative human-human and human-computer simulated telephone conversations
Siegert, Ingo; Nietzold, Jannik; Heinemann, Ralph; Wendemuth, Andreas
In: Elektronische Sprachsignalverarbeitung 2019 - Dresden: TUDpress, S. 126-133 - (Studientexte zur Sprachkommunikation; 93)[Konferenz: 30. Konferenz Elektronische Sprachsignalverarbeitung 2019, Dresden, 6.-8. März 2019]
Analysis of the influence of different room acoustics on acoustic emotion features and emotion recognition performance
Höbel-Müller, Juliane; Siegert, Ingo; Heinemann, Ralph; Requardt, Alicia Flores; Tornow, Michael; Wendemuth, Andreas
In: Tagungsband - DAGA 2019 - Berlin: Deutsche Gesellschaft für Akustik e.V. (DEGA), 2019 . - 2019, S. 886-889[Tagung: 45. Jahrestagung für Akustik, DAGA 2019, 18.-21. März 2019, Rostock]
Begutachteter Zeitschriftenartikel
On emotions as features for speech overlaps classification
Egorow, Olga; Wendemuth, Andreas
In: IEEE transactions on affective computing/ Institute of Electrical and Electronics Engineers - New York, NY: IEEE, 2010 . - 2019[Online first]
2018
Buchbeitrag
Significance of feature differences in the distinction of mental-load
Weißkirchen, Norman; Böck, Ronald; Wendemuth, Andreas; Nürnberger, Andreas
In: SMC 2018 / IEEE International Conference on Systems, Man, and Cybernetics , 2018 - Piscataway, NJ : IEEE ; Hata, Yutaka, S. 2604-2609 [Konferenz: 2018 IEEE International Conference on Systems, Man, and Cybernetics, SMC, Miyazaki, Japan, 7-10 October 2018]
Improving emotion recognition performance by random-forest-based feature selection
Egorow, Olga; Siegert, Ingo; Wendemuth, Andreas
In: Speech and computer: 20th International Conference, SPECOM 2018, Leipzig, Germany, September 18-22, 2018 : proceedings/ SPECOM - Cham: Springer, 2018 . - 2018, S. 134-144 - (Lecture notes in computer science; 11096; Lecture notes in artificial intelligence)[Konferenz: 20th International Conference Speech and Computer, SPECOM 2018, Leipzig, Germany, September 18-22, 2018]
Recognition of emotional speech with convolutional neural networks by means of spectral estimates
Weißkirchen, Norman; Böck, Ronald; Wendemuth, Andreas
In: 2017 Seventh International Conference on Affective Computing and Intelligent Interaction Workshops and Demos (ACIIW): 23-26 Oct. 2017/ International Workshop on Context Based Affect Recognition - [Piscataway, NJ]: IEEE, 2017; International Workshop on Context Based Affect Recognition (5.:2017) . - 2018, S. 50-55[Copyright: 2017; Konferenz: Seventh International Conference on Affective Computing and Intelligent Interaction Workshops and Demos, ACIIW, San Antonio, Tex., 23 - 26 October 2017]
Emotion recognition from disturbed speech - towards affective computing in real-world in-car environments
Lotz, Alicia Flores; Faller, Fabian; Siegert, Ingo; Wendemuth, Andreas
In: Elektronische Sprachsignalverarbeitung 2018: Tagungsband der 29. Konferenz, Ulm, 7.-9. März 2018/ Konferenz "Elektronische Sprachsignalverarbeitung"- Dresden: TUDpress, 2018, S. 208-215[Konferenz: 29. Elektronische Sprachsignalverarbeitung 2018, Ulm, 7. - 10. März; Literaturverzeichnis: Seite 214-215]
Acoustic detection of consecutive stages of spoken interaction based on speaker-group specific features
Böck, Ronald; Egorow, Olga; Wendemuth, Andreas
In: Elektronische Sprachsignalverarbeitung 2018: Tagungsband der 29. Konferenz, Ulm, 7.-9. März 2018/ Konferenz "Elektronische Sprachsignalverarbeitung" - Dresden: TUDpress, 2018; Berton, André . - 2018, S. 247-254[Konferenz: 29. Elektronische Sprachsignalverarbeitung 2018, Ulm, 7. - 10. März; Literaturverzeichnis: Seite 252-254]
The effect of emotional speech on relative speaker discrimination
Höbel-Müller, Juliane; Böck, Ronald; Wendemuth, Andreas
In: Elektronische Sprachsignalverarbeitung 2018: Tagungsband der 29. Konferenz, Ulm, 7.-9. März 2018/ Konferenz "Elektronische Sprachsignalverarbeitung" - Dresden: TUDpress, 2018; Berton, André . - 2018, S. 216-223[Konferenz: 29. Elektronische Sprachsignalverarbeitung 2018, Ulm, 7. - 10. März; Literaturverzeichnis: Seite 222-223]
Recognizing behavioral factors while driving - a real-world multimodal corpus to monitor the drivers affective state
Lotz, Alicia Flores; Ihme, Klas; Charnoz, Audrey; Maroudis, Pantelis; Dmitriev, Ivan; Wendemuth, Andreas
In: LREC 2018 - Paris : European Language Resources Association, ELRA, S. 1589-1596
Intention-based anticipatory interactive systems
Wendemuth, Andreas; Böck, Ronald; Nürnberger, Andreas; Hamadi, Ayoub; Brechmann, André; Ohl, Frank W.
In: SMC 2018: 2018 IEEE International Conference on Systems, Man, and Cybernetics$d7-10 October 2018, Miyazaki, Japan : proceedings/ IEEE International Conference on Systems, Man, and Cybernetics - Piscataway, NJ: IEEE, 2018; Hata, Yutaka . - 2018, S. 2579-2584[Konferenz: 2018 IEEE International Conference on Systems, Man, and Cybernetics, SMC, Miyazaki, Japan, 7-10 October 2018]
Begutachteter Zeitschriftenartikel
Using a PCA-based dataset similarity measure to improve cross-corpus emotion recogniton
Siegert, Ingo; Böck, Ronald; Wendemuth, Andreas
In: Computer speech and language - London: Academic Press, 1986 . - 2018, insges. 31 S.
An experimental paradigm for inducing emotions in a real world driving scenario evidence from self-report, annotation of speech data and peripheral physiology
Requardt, Alicia Flores; Wilbrink, Marc; Siegert, Ingo; Jipp, Meike; Wendemuth, Andreas; Ihme, Klas
In: Kognitive Systeme - Duisburg : DuEPublico, Duisburg-Essen Publication Online, Universität Duisburg-Essen . - 2018, Heft 1, insges. 12 S.
Dissertation
Spline-Methoden für die modellbasierte 3D-Oberflächeninspektion
Enzberg, Sebastian; Hamadi, Ayoub; Wendemuth, Andreas
In: Magdeburg, Dissertation Otto-von-Guericke-Universität Magdeburg, Fakultät für Elektrotechnik und Informationstechnik 2018, 155 Seiten [Literaturverzeichnis: Seite 145-155][Literaturverzeichnis: Seite 145-155]
Automatic facial analysis methods - facial point localization, head pose estimation, and facial expression recognition
Saeed, Anwar Maresh Qahtan; Al-Hamadi, Ayoub; Wendemuth, Andreas
In: Magdeburg, 2018, xxx, 192 Seiten, Illustrationen, Tabellen, Diagramme[Literaturverzeichnis: Seite 169-188]
2017
Buchbeitrag
Improving speech-based emotion recognition by using psychoacoustic modeling and analysis-by-synthesis
Siegert, Ingo; Lotz, Alicia Flores; Egorow, Olga; Wendemuth, Andreas
In: Speech and Computer: 19th International Conference, SPECOM 2017, Hatfield, UK, September 12-16, 2017, Proceedings - Cham: Springer, 2017; Potapova, Rodmonga . - 2017, S. 445-455 - (Lecture Notes in Computer Science; 10458)[Konferenz: 19th International Conference Speech and Computer, SPECOM 2017, Hatfield, UK, September 12-16, 2017]
Towards a sensor failure-dependent performance adaptation using the validity concept
Höbel, Juliane; Jäger, Georg; Zug, Sebastian; Wendemuth, Andreas
In: Computer Safety, Reliability, and Security - Cham : Springer ; Schoitsch, Erwin . - 2017, S. 270-286 - ( Lecture Notes in Computer Science; volume 10488) [Konferenz: 36th International Conference, SAFECOMP 2017, Trento, Italy, September 13-15, 2017]
Companion-systems - a reference architecture
Hörnle, Thilo; Tornow, Michael; Honold, Frank; Schwegler, Reinhard; Heinemann, Ralph; Biundo, Susanne; Wendemuth, Andreas
In: Companion technology - Cham : Springer ; Biundo-Stephan, Susanne *1955-* . - 2017, S. 449-469
Accelerating manual annotation of filled pauses by automatic pre-selection
Egorow, Olga; Lotz, Alicia Flores; Siegert, Ingo; Böck, Ronald; Krüger, Julia; Wendemuth, Andreas
In: 2017 International Conference on Companion Technology (ICCT): 11-13 Sept. 2017/ International Conference on Companion Technology - [Piscataway, NJ]: IEEE, 2017; International Conference on Companion Technology (2.:2017) . - 2017, insges. 6 S.[Konferenz: 2017 International Conference on Companion Technology (ICCT), Ulm, Germany, 11.-13. September 2017]
An introduction to companion-technology
Biundo, Susanne; Wendemuth, Andreas
In: Companion technology - Cham : Springer ; Biundo-Stephan, Susanne *1955-* . - 2017, S. 1-15
Modeling aspects in human-computer interaction - adaptivity, user characteristics and evaluation
Gossen, Tatiana; Siegert, Ingo; Nürnberger, Andreas; Hartmann, Kim; Kotzyba, Michael; Wendemuth, Andreas
In: Companion technology - Cham : Springer ; Biundo-Stephan, Susanne *1955-* . - 2017, S. 57-58
Multi-modal information processing in companion-systems - a ticket purchase system
Siegert, Ingo; Schüssel, Felix; Schmidt, Miriam; Reuter, Stephan; Meudt, Sascha; Layher, Georg; Krell, Gerald; Hörnle, Thilo; Handrich, Sebastian; Al-Hamadi, Ayoub; Dietmayer, Klaus; Neumann, Heiko; Palm, Günther; Schwenker, Friedhelm; Wendemuth, Andreas
In: Companion technology - Cham : Springer ; Biundo-Stephan, Susanne *1955-* . - 2017, S. 493-500
Comparative study on normalisation in emotion recognition from speech
Böck, Ronald; Egorow, Olga; Siegert, Ingo; Wendemuth, Andreas
In: Intelligent human computer interaction / IHCI , 2017 - Cham : Springer ; Horain, Patrick, S. 189-201 - (Lecture Notes in Computer Science; 10688)
The last minute corpus as a research resource - from signal processing to behavioral analyses in user-companion interactions
Rösner, Dietmar; Frommer, Jörg; Wendemuth, Andreas; Bauer, Thomas; Günther, Stephan; Haase, Matthias; Siegert, Ingo
In: Companion technology - Cham : Springer ; Biundo-Stephan, Susanne *1955-* . - 2017, S. 277-299
Multimodal affect recognition in the context of human-computer interaction for companion-systems
Schwenker, Friedhelm; Böck, Ronald; Schels, Martin; Meudt, Sascha; Siegert, Ingo; Glodek, Michael; Kächele, Markus; Schmidt-Wack, Miriam; Thiam, Patrick; Wendemuth, Andreas; Krell, Gerald
In: Companion technology - Cham : Springer ; Biundo-Stephan, Susanne *1955-* . - 2017, S. 387-408
Emotion recognition from speech
Wendemuth, Andreas; Vlasenko, Bogdan; Siegert, Ingo; Böck, Ronald; Schwenker, Friedhelm; Palm, Günther
In: Companion technology - Cham : Springer ; Biundo-Stephan, Susanne *1955-* . - 2017, S. 409-428
Recognition of emotional speech with convolutional neural networks by means of spectral estimates
Weißkirchen, Norman; Böck, Ronald; Wendemuth, Andreas
In: 2017 Seventh International Conference on Affective Computing and Intelligent Interaction Workshops and Demos (ACII) ; Part 2 - IEEE, 2017; Part 2 . - 2017, S. 50-55[Konferenz: 7th International Conference on Affective Computing and Intelligent Interaction Workshops and Demos, ACII, San Antonio, Texas, 23. - 26.10.2017]
Speaker-group specific acoustic differences in consecutive stages of spoken interaction
Böck, Ronald; Egorow, Olga; Wendemuth, Andreas
In: Elektronische Sprachsignalverarbeitung 2017: Tagungsband der 28. Konferenz Saarbrücken, 15. - 17. März 2017 / Jürgen Trouvain ; Ingmar Steiner und Bern Möbius (Hrsg.): Tagungsband der 28. Konferenz Saarbrücken, 15. - 17. März 2017 - Dresden: TUDpress Verlag der Wissenschaften GmbH, 2017; Trouvain, Jürgen . - 2017, S. 211-218[Kongress: 28. Konferenz Elektronische Sprachsignalverarbeitung, Saarbrücken, 15. - 17. März, 2017]
Emotional features for speech overlaps classification
Egorow, Olga; Wendemuth, Andreas
In: INTERSPEECH 2017: 20-24 August 2017, Stockholm - International Speech and Communication Association, 2017; Lacerda, Francisco . - 2017, S. 2356-2360[Session: Social signals, styles, and interaction; Kongress: INTERSPEECH 2017, Stockholm, 20-14 August 2017]
Audio compression and its impact on emotion recognition in affective computing
Lotz, Alicia Flores; Siegert, Ingo; Maruschke, Michael; Wendemuth, Andreas
In: Elektronische Sprachsignalverarbeitung 2017: Tagungsband der 28. Konferenz Saarbrücken, 15. - 17. März 2017 / Jürgen Trouvain ; Ingmar Steiner und Bern Möbius (Hrsg.): Tagungsband der 28. Konferenz Saarbrücken, 15. - 17. März 2017 - Dresden: TUDpress Verlag der Wissenschaften GmbH, 2017 . - 2017, S. 1-8[Kongress: 28. Konferenz Elektronische Sprachsignalverarbeitung, Saarbrücken, 15. - 17. März, 2017]
ikannotate2 - a tool supporting annotation of emotions in audio-visual data
Siegert, Ingo; Wendemuth, Andreas
In: Elektronische Sprachsignalverarbeitung 2017: Tagungsband der 28. Konferenz Saarbrücken, 15. - 17. März 2017 / Jürgen Trouvain ; Ingmar Steiner und Bern Möbius (Hrsg.): Tagungsband der 28. Konferenz Saarbrücken, 15. - 17. März 2017 - Dresden: TUDpress Verlag der Wissenschaften GmbH, 2017 . - 2017, S. 17-24[Kongress: 28. Konferenz Elektronische Sprachsignalverarbeitung, Saarbrücken, 15. - 17. März, 2017]
Begutachteter Zeitschriftenartikel
Prediction of user satisfaction in naturalistic human-computer interaction
Egorow, Olga; Siegert, Ingo; Wendemuth, Andreas
In: Kognitive Systeme - Duisburg: DuEPublico, Duisburg-Essen Publication Online, Universität Duisburg-Essen, 2013 . - 2017, 1, insges. 9 S.
Herausgeberschaft
Companion technology - a paradigm shift in human-technology interaction
Biundo-Stephan, Susanne; Wendemuth, Andreas
In: Cham: Springer, 2017, 1 Online-Ressource - (Cognitive technologies), ISBN: 978-3-319-43665-4
Companion technology - a paradigm shift in human-technology interaction
Biundo-Stephan, Susanne; Wendemuth, Andreas
In: Cham: Springer, 2017, 1 Online-Ressource - (Cognitive technologies), ISBN: 978-3-319-43665-4
2016
Buchbeitrag
Akustische Marker für eine verbesserte Situations- und Intentionserkennung von technischen Assistenzsystemen
Siegert, Ingo; Lotz, Alicia Flores; Egorow, Olga; Böck, Ronald; Schega, Lutz; Tornow, Michael; Thiers, Angelina; Wendemuth, Andreas
In: Technische Unterstützungssysteme, die die Menschen wirklich wollen: Zweite Transdisziplinäre Konferenz : Hamburg 2016 - Hamburg: Laboratorium Fertigungstechnik, smartASSIST, Helmut Schmidt Universität$, S. 465-474[Kongress: 2. Transdisziplinäre Konferenz "Technische Unterstützungssysteme, die die Menschen wirklich wollen", Hamburg, 2016]
Multimodale, dialogische Interaktion in der Industrie - auf dem Weg zur Industrie 5.0
Böck, Ronald; Wendemuth, Andreas
In: 3D SENSATION - transdisziplinäre Perspektiven: innteract conference - Chemnitz: Verlag aw&l Wissenschaft und Praxis, 2016 . - 2016, S. 392-401[Kongress: innteract conference 2016, Chemnitz, 23. - 24. Juni, 2016]
Modellierung von Verhaltens- und Handlungsintentionsverläufen aus multimodalen 3D-Daten
Egorow, Olga; Wendemuth, Andreas
In: 3D SENSATION - transdisziplinäre Perspektiven: innteract conference - Chemnitz: Verlag aw&l Wissenschaft und Praxis, 2016 . - 2016, S. 88-89[Kongress: Innteract conference 2016, Chemnitz, 23. - 24. Juni, 2016]
Detection of challenging dialogue stages using acoustic signals and biosignals
Egorow, Olga; Wendemuth, Andreas
In: WSCG 2016: 24th International Conference in Central Europe on Computer Graphics, Visualization and Computer Vision, WSCG 2016, Plzen, Czech Republic, May 30 - June 3, 2016 ; short paper proceedings - Plzen: Vaclav Skala - Union Agency, 2016; Skala, Vaclav . - 2016, S. 137-143[Konferenz: 24th International Conference in Central Europe on Computer Graphics, Visualization and Computer Vision, WSCG 2016, Plzen, Czech Republic, May 30 - June 3, 2016]
Kennzeichnung von Nutzerprofilen zur Interaktionssteuerung beim Gehen
Thiers, Angelina; Hamacher, Dennis; Tornow, Michael; Heinemann, Ralph; Siegert, Ingo; Wendemuth, Andreas; Schega, Lutz
In: Technische Unterstützungssysteme, die die Menschen wirklich wollen / Transdisziplinäre Konferenz Technische Unterstützungssysteme, die die Menschen Wirklich Wollen , 2016 - Hamburg : Laboratorium Fertigungstechnik, smartASSIST, Helmut Schmidt Universität, S. 475-484
Developing recording and synchronous handling of ten modalities in affective human machine interactions
Wendemuth, Andreas
In: Proceedings of the 2nd workshop on Emotion Representations and Modelling for Companion Systems: November 16, 2016, Tokyo, Japan - New York, NY: ACM, S. 13-14[Kongress: 2nd Workshop on Emotion Representations and Modelling for Companion Systems, Tokyo, Japan, 16. November, 2016]
Approximation of a nonlinear distortion function for combined linear and nonlinear residual echo suppression
Schalk-Schupp, Ingo; Faubel, Friedrich; Buck, Markus; Wendemuth, Andreas
In: 2016 International Workshop on Acoustic Signal Enhancement (IWAENC): September 13-16, 2016, Xi'an, China - [Piscataway, NJ]: IEEE[Kongress: 2016 International Workshop on Acoustic Signal Enhancement (IWAENC), Xian, China, 13-16 September, 2016]
Emotion intelligibility within codec-compressed and reduced bandwidth speech
Siegert, Ingo; Lotz, Alicia Flores; Maruschke, Michael; Jokisch, Oliver; Wendemuth, Andreas
In: Speech communication / ITG-Fachtagung Sprachkommunikation , 2016 - Berlin : VDE Verlag, S. 215-219
Discourse particles in human-human and human-computer interaction - Analysis and evaluation
Siegert, Ingo; Krüger, Julia; Haase, Matthias; Lotz, Alicia Flores; Günther, Stephan; Frommer, Jörg; Rösner, Dietmar; Wendemuth, Andreas
In: Human-Computer Interaction. Theory, Design, Development and Practice - Cham : Springer International Publishing ; Kurosu, Masaaki . - 2016, S. 105-117
Classification of functional-meanings of non-isolated discourse particles in human-human-interaction
Lotz, Alicia Flores; Siegert, Ingo; Wendemuth, Andreas
In: Human-Computer Interaction. Theory, Design, Development and Practice - Cham : Springer International Publishing ; Kurosu, Masaaki . - 2016, S. 53-64 - (Lecture Notes in Computer Science; 9731)
Annotators agreement and spontaneous emotion classification performance
Vlasenko, Bogdan; Wendemuth, Andreas
In: Speech beyond speech towards a better understanding of the most important biosignal / International Speech Communication Association , 2015 - Red Hook, NY : Curran Associates, Inc. . - 2016, S. 1546-1550
Multimodal information processing - the ticket purchase : a demonstration scenario of the SFB/TRR-62
Siegert, Ingo; Reuter, Stephan; Schüssel, Felix; Layer, Georg; Hörnle, Thilo; Meudt, Sascha; Wendemuth, Andreas
In: Elektronische Sprachsignalverarbeitung 2016: Tagungsband der 27. Konferenz, Leipzig, 2.-4. März 2016 / Oliver Jokisch (Hrsg.) ; Tagungsorganisation: Hochschule für Telekommunikation Leipzig, Institut für Kommunikationstechnik, Prof. Dr.-Ing. Oliver Jokisch: Tagungsband der 27. Konferenz, Leipzig, 2.-4. März 2016/ Konferenz "Elektronische Sprachsignalverarbeitung" - Dresden: TUDpress, 2016; Jokisch, Oliver . - 2016, S. 111-118 - (Studientexte zur Sprachkommunikation; Band 81)[Kongress: 27. Konferenz Elektronische Sprachsignalverarbeitung 2016: Tagungsband der 27. Konferenz, Leipzig, 2.-4. März 2016 / Oliver Jokisch (Hrsg.) ; Tagungsorganisation: Hochschule für Telekommunikation Leipzig, Institut für Kommunikationstechnik, Prof. Dr.-Ing. Oliver Jokisch, Leipzig, 2. - 4. März 2016]
Measuring the impact of audio compression on the spectral quality of speech data
Siegert, Ingo; Lotz, Alicia Flores; Doung, Linh Linda; Wendemuth, Andreas
In: Elektronische Sprachsignalverarbeitung 2016 / Konferenz "Elektronische Sprachsignalverarbeitung" , 2016 - Dresden : TUDpress, S. 229-236 - (Studientexte zur Sprachkommunikation; Band 81)
Tendencies regarding the effect of emotional intensity in inter corpus phoneme-level speech emotion modelling
Vlasenko, Bogdan; Schuller, Björn; Wendemuth, Andreas
In: 2016 IEEE 12th Image, Video, and Multidimensional Signal Processing Workshop (IVMSP) / IEEE Image, Video, and Multidimensional Signal Processing Workshop , 2016 - Piscataway, NJ : IEEE ; IEEE Image, Video, and Multidimensional Signal Processing Workshop (12.:2016), insges. 6 S.
Combined linear and nonlinear residual echo suppression using a deficient distortion model - a proof of concept
Schalk-Schupp, Ingo; Faubel, Friedrich; Buck, Markus; Wendemuth, Andreas
In: Speech communication / ITG-Fachtagung Sprachkommunikation , 2016 - Berlin : VDE Verlag, S. 312-316
Begutachteter Zeitschriftenartikel
Counting votes in coupled decisions - an efficient method for counting votes in coupled decisions with multiple inequality restrictions
Wendemuth, Andreas; Simonelli, Italo
In: Theory and decision - Dordrecht [u.a.] : Springer Science + Business Media B.V., Bd. 81 (2016), S. 213-253
Comparison of different modeling techniques for robust prototype matching of speech pitch-contours
Lotz, Alicia Flores; Siegert, Ingo; Wendemuth, Andreas
In: Kognitive Systeme - Duisburg: DuEPublico, 1, insges. 10 S., 2016
Artikel in Kongressband
Integrated health and fitness (iGF)-corpus - ten-modal highly synchronized subject-dispositional and emotional human machine interactions
Tornow, Michael; Krippl, Martin; Bade, Svea; Thiers, Angelina; Siegert, Ingo; Handrich, Sebastian; Krüger, Julia; Schega, Lutz; Wendemuth, Andreas
In: Kongress: MMC 2016, Portorož, 2016.05.24, Multimodal Corpora: Computer vision and language processing (MMC 2016) - ELRA, S. 21-24
2015
Buchbeitrag
Automatic differentiation of form-function-relations of the discourse particle "hm" in a naturalistic human-computer interaction
Lotz, Alicia Flores; Siegert, Ingo; Wendemuth, Andreas
In: Elektronische Sprachsignalverarbeitung 2015: Tagungsband der 26. Konferenz, Eichstätt, 25. - 27. März 2015 / [26. Konferenz "Elektronische Sprachsignalverarbeitung"]. Günther Wirsching (Hrsg.). [Mitw. Förderverein Elektronische Sprachsignalverarbeitung e.V. Tagungsort Katholische Universität Eichstätt-Ingolstadt. Tagungsorganisation Katholische Universität Eichstätt-Ingolstadt, Lehrstuhl für Mathematik-Statistik]: Tagungsband der 26. Konferenz, Eichstätt, 25. - 27. März 2015 - Dresden: TUDpress, 2015 . - 2015, S. 172-179 - (Studientexte zur Sprachkommunikation; 78)Kongress: Konferenz "Elektronische Sprachsignalverarbeitung 26 (Eichstätt : 2015)
Companion-Systeme - soziale Agenten mit kognitiven Fähigkeiten
Wendemuth, Andreas
In: Die Technisierung des Menschlichen und die Humanisierung der Maschine: interdisziplinäre Beiträge zur Interdependenz von Mensch und Technik - Halle (Saale): Mitteldeutscher Verlag, 2015 . - 2015, S. 75-100
NaLMC - a database on non-acted and acted emotional sequences in HCI
Hartmann, Kim; Krüger, Julia; Frommer, Jörg; Wendemuth, Andreas
In: Proceedings of the 2015 ACM International Conference on Multimodal Interaction: November 9 - 13, 2015, Seattle, Washington / sponsored by: ACM SIGCHI: November 9 - 13, 2015, Seattle, Washington/ ICMI - New York, NY: ACM, 2015 . - 2015, S. 199-202
Ein Datenset zur Untersuchung emotionaler Sprache in Kundenbindungsdialogen
Siegert, Ingo; Philippou-Hübner, David; Tornow, Michael; Heinemann, Ralph; Wendemuth, Andreas; Ohnemus, Kerstin; Fischer, Sarah; Schreiber, Gerald
In: Elektronische Sprachsignalverarbeitung 2015: Tagungsband der 26. Konferenz, Eichstätt, 25. - 27. März 2015 - Dresden: TUDpress, S. 180-187 - (Studientexte zur Sprachkommunikation; 78)Kongress: Konferenz "Elektronische Sprachsignalverarbeitung 26 (Eichstätt : 2015)
Overlapping speech, utterance duration and affective content in HHI and HCI - an comparison
Siegert, Ingo; Böck, Ronald; Vlasenko, Bogdan; Ohnemus, Kerstin; Wendemuth, Andreas
In: CogInfoCom 2015 , 2015 - [Piscataway, NJ] : IEEE ; CogInfoCom (6.:2015), S. 83-88
Cross-corpus acoustic emotion recognition - variances and strategies (extended abstract)
Schuller, Björn; Vlasenko, Bogdan; Eyben, Florian; Wollmer, Martin; Stuhlsatz, André; Wendemuth, Andreas; Rigoll, Gerhard
In: 2015 International Conference on Affective Computing and Intelligent Interaction (ACII): 21 - 24 Sept. 2015, Xi'an - Piscataway, NJ: IEEE, 2015 . - 2015, S. 470 - 476[Kongress: International Conference on Affective Computing and Intelligent Interaction (ACII), 21 - 24 Sept. 2015, Xi'an]
Begutachteter Zeitschriftenartikel
Companion-technology for cognitive technical systems
Wendemuth, Andreas; Biundo, Susanne
In: Künstliche Intelligenz: KI ; Forschung, Entwicklung, Erfahrungen ; Organ des Fachbereichs 1 Künstliche Intelligenz der Gesellschaft für Informatik e.V., GI - Berlin: Springer, 2010 . - 2015, insges. 5 S.
Exploratory voice-controlled search for young users - Challenges & Potential Benefits
Kotzyba, Michael; Siegert, Ingo; Gossen, Tatiana; Wendemuth, Andreas; Nürnberger, Andreas
In: Kognitive Systeme - Duisburg : DuEPublico, Duisburg-Essen Publication Online, Universität Duisburg-Essen . - 2015, Heft 1, insges. 10 S.
Probabilistic breadth as an evaluation measure of gaussian mixture models used for acoustic emotion states
Böck, Ronald; Siegert, Ingo; Wendemuth, Andreas
In: Kognitive Systeme - Duisburg: DuEPublico, Duisburg-Essen Publication Online, Universität Duisburg-Essen, 2013 . - 2015, 2, insges. 8 S.
Dissertation
Emotional and user-specific cues for improved analysis of naturalistic interactions
Siegert, Ingo; Wendemuth, Andreas; Diedrich, Christian
In: Magdeburg, Magdeburg, Univ., Fak. für Elektrotechnik und Informationstechnik, Diss., 2015, XIX, 266 S.
Artikel in Kongressband
Probabilistic breadth used in evaluation of resulting gaussian mixture models
Böck, Ronald; Siegert, Ingo; Wendemuth, Andreas
In: 4. Interdisziplinärer Workshop Kognitive Systeme 2015: Mensch, Teams, Systeme und Automaten: proceedings - Bielefeld, 2015 . - 2015, insges. 8 S.Kongress: Interdisziplinärer Workshop Kognitive Systeme 4 (Bielefeld : 2015.03.23-25)
Exploring dataset similarities using PCA-based feature selection
Siegert, Ingo; Böck, Ronald; Vlasenko, Bogdan; Wendemuth, Andreas
In: 2015 International Conference on Affective Computing and Intelligent Interaction (ACII): 21 - 24 Sept. 2015, Xi'an - Piscataway, NJ: IEEE, 2015 . - 2015, S. 387-393
Functional analysis of pitch contours for disposition recognition from speech
Prylipko, Dmytro; Böck, Ronald; Wendemuth, Andreas
In: 4. Interdisziplinärer Workshop Kognitive Systeme 2015: Mensch, Teams, Systeme und Automaten: proceedings - Bielefeld, 2015 . - 2015, insges. 6 S.Kongress: Interdisziplinärer Workshop Kognitive Systeme 4 (Bielefeld : 2015.03.23-25)
2014
Buchbeitrag
Location of an emotionally neutral region in valence-arousal space - two-class vs. three-class cross corpora emotion recognition evaluations
Vlasenko, B.; Wendemuth, Andreas
In: IEEE International Conference on Multimedia and Expo workshops (ICMEW), 2014: 14 - 18 July 2014, Chengdu, China - Piscataway, NJ: IEEE, 2014 . - 2014, insges. 6 S.
Investigating the form-function-relation of the discourse particle “hm” in a naturalistic human-computer interaction
Siegert, Ingo; Prylipko, Dmytro; Hartmann, Kim; Böck, Ronald; Wendemuth, Andreas
In: Recent Advances of Neural Network Models and Applications / Bassis , Simone - Cham : Springer International Publishing ; Bassis, Simone . - 2014, S. 387-394 - (Smart Innovation, Systems and Technologies; 26)
Discourse particles and user characteristics in naturalistic human-computer interaction
Siegert, Ingo; Haase, Matthias; Prylipko, Dmytro; Wendemuth, Andreas
In: Human-Computer Interaction. Advanced Interaction Modalities and Techniques / Kurosu , Masaaki - Cham [u.a.] : Springer ; Kurosu, Masaaki . - 2014, S. 492-501 - (Lecture notes in computer science; 8511) Kongress: HCI International 16 Heraklion, Crete 2014.06.22-27
Begutachteter Zeitschriftenartikel
Investigation of speaker group-dependent modelling for recognition of affective states from speech
Siegert, Ingo; Philippou-Hübner, David; Hartmann, Kim; Böck, Ronald; Wendemuth, Andreas
In: Cognitive Computation - New York, NY: Springer, 2009, Bd. 6.2014, 4, S. 892-913
Analysis of significant dialog events in realistic human-computer interaction
Prylipko, Dmytro; Rösner, Dietmar; Siegert, Ingo; Günther, Stephan; Friesen, Rafael; Haase, Matthias; Vlasenko, Bogdan; Wendemuth, Andreas
In: Journal on multimodal user interfaces - Berlin: Springer, 2007, Bd. 8.2014, 1, S. 75-86
Learning long-term dependencies in segmented-memory recurrent neural networks with backpropagation of error
Glüge, Stefan; Böck, Ronald; Palm, Günther; Wendemuth, Andreas
In: Neurocomputing: an international journal - Amsterdam: Elsevier, 1989, Bd. 141.2014, S. 54-64
Modeling phonetic pattern variability in favor of the creation of robust emotion classifiers for real-life applications
Vlasenko, Bogdan; Prylipko, Dmytro; Böck, Ronald; Wendemuth, Andreas
In: Computer speech and language - London: Academic Press, 1986, Bd. 28.2014, 2, S. 483-500
Artikel in Kongressband
Application of image processing methods to filled pauses detection from spontaneous speech
Prylipko, Dmytro; Egorow, O.; Siegert, Ingo; Wendemuth, Andreas
In: 15th annual conference of the International Speech Communication Association, INTERSPEECH: Singapore, 14 - 18 September 2014 - International Speech and Communication Association, S. 1816-1820Kongress: INTERSPEECH 15 (Singapore : 2014.09.14-18)
Nicht begutachteter Zeitschriftenartikel
Companion-Systeme - interaktive, kognitive Informationstechnik
Wendemuth, Andreas
In: Mitteldeutsche Mitteilungen - Forum technisch-wissenschaftlicher Vereine und Verbände: Informationen aus Wirtschaft, Wissenschaft, Gesellschaft : Forum der technisch-wissenschaftlichen Vereine und Verbände Sachsen-Anhalts - Magdeburg: VDI, Landesverband Sachsen-Anhalt, 1999, Bd. 23.2014, 3, S. 12-13
2013
Buchbeitrag
Dempster-shafer theory with smoothness
Böck, Ronald; Glüge, Stefan; Wendemuth, Andreas
In: Integrated Uncertainty in Knowledge Modelling and Decision Making / Qin , Zengchang - Berlin, Heidelberg : Springer ; Qin, Zengchang . - 2013, S. 13-22 - (Lecture notes in computer science; 8032) Kongress: IUKM Beijing 2013.07.12-14
Audio-based pre-classification for semi-automatic facial expression coding
Böck, Ronald; Limbrecht-Ecklundt, Kerstin; Siegert, Ingo; Walter, Steffen; Wendemuth, Andreas
In: Human-computer interaction ; Pt. 5:Towards intelligent and implicit interaction - Berlin [u.a.]: Springer, 2013 . - 2013, S. 301-309 - (Lecture notes in computer science; 8008)Kongress: HCI International 15 (Las Vegas, Nev. : 2013.07.21-26)
Human behaviour in HCI - complex emotion detection through sparse speech features
Siegert, Ingo; Hartmann, Kim; Philippou-Hübner, David; Wendemuth, Andreas
In: Human Behavior Understanding / Salah , Albert Ali - Cham [u.a.] : Springer ; Salah, Albert Ali . - 2013, S. 246-257 - (Lecture notes in computer science; 8212) Kongress: HBU 4 Barcelona 2013.10.22
Characterization of Lamb wave attenuation mechanisms
Schmidt, Daniel; Sadri, Hossein; Szewieczek, Artur; Sinapius, Michael; Wierach, Peter; Siegert, Ingo; Wendemuth, Andreas
In: Health monitoring of structural and biological systems 2013 : 11 - 14 March 2013, San Diego, California, United States ; [part of SPIE smart structures/NDE]. - Bellingham, Wash. : SPIE - (Proceedings of SPIE; 8695)Kongress: Conference on Health Monitoring of Structural and Biological Systems; (San Diego, Calif.) : 2013.03.11-14
Determining the smallest emotional unit for level of arousal classification
Vlasenko, Bogdan; Wendemuth, Andreas
In: Humaine Association Conference on Affective Computing and Intelligent Interaction (ACII), 2013 - Piscataway, NJ : IEEE, S. 734-739
Fusion of fragmentary classifier decisions for affective state recognition
Krell, Gerald; Glodek, Michael; Panning, Axel; Siegert, Ingo; Michaelis, Bernd; Wendemuth, Andreas; Schwenker, Friedhelm
In: Multimodal pattern recognition of social signals in human-computer-interaction : first IAPR TC3 workshop, MPRSS 2012, Tsukuba, Japan, November 11, 2012 ; revised selected papers. - Berlin [u.a.] : Springer, S. 116-130, 2013 - (Lecture notes in computer science; 7742)Kongress: MPRSS; 1 (Tsukuba) : 2012.11.11
Auto-encoder pre-training of segmented-memory recurrent neural networks
Glüge, Stefan; Böck, Ronald; Wendemuth, Andreas
In: Proceedings: Bruges, Belgium, April 24 - 25 - 26, 2013 / [organised in collaboration with: UCL (Université Catholique de Louvain, Louvain-la-Neuve); KULeuven (Katholiek Universiteit Leuven). Ed.: Michel Verleysen]: Bruges, Belgium, April 24 - 25 - 26, 2013 - Louvain-la-Neuve: Ciaco, 2013 . - 2013, S. 29Kongress: ESANN 21 (Bruges : 2013.04.24-26)
Emotion detection in HCI - from speech features to emotion space?
Hartmann, Kim; Siegert, Ingo; Philippou-Hübner, David; Wendemuth, Andreas
In: 7th IFAC Conference on Manufacturing Modelling, Management, and Control, 2013. - IFAC, S. 288-295Kongress: IFAC Conference on Manufacturing Modelling, Management, and Control; 7 (Saint Petersburg) : 2013.06.19-21
Solving number series with simple recurrent networks
Glüge, Stefan; Wendemuth, Andreas
In: Natural and Artificial Models in Computation and Biology / Ferrández Vicente , José Manuel - Berlin, Heidelberg : Springer ; Ferrández Vicente, José Manuel . - 2013, S. 412-420 - (Lecture notes in computer science; volume 7930)
Annotation and classification of changes of involvement in group conversation
Böck, Ronald; Glüge, Stefan; Siegert, Ingo; Wendemuth, Andreas
In: Humaine Association Conference on Affective Computing and Intelligent Interaction (ACII), 2013 - Piscataway, NJ : IEEE, S. 803-808
The influence of context knowledge for multi-modal affective annotation
Siegert, Ingo; Böck, Ronald; Wendemuth, Andreas
In: Human-computer interaction ; Pt. 5:Towards intelligent and implicit interaction - Berlin [u.a.]: Springer, 2013 . - 2013, S. 381-390 - (Lecture notes in computer science; 8008)Kongress: HCI International 15 (Las Vegas, Nev. : 2013.07.21-26)
Using speaker group dependent modelling to improve fusion of fragmentary classifier decisions
Siegert, Ingo; Glodek, Michael; Panning, Axel; Krell, Gerald; Schwenker, Friedhelm; Al-Hamadi, Ayoub; Wendemuth, Andreas
In: Proceedings of the 2013 IEEE International Conference on Cybernetics (CYBCONF 2013) : Lausanne, Switzerland, 13-15 June, 2013. - IEEE, S. 132-137Kongress: CYBCONF; (Lausanne, Switzerland) : 2013.06.13-15
Begutachteter Zeitschriftenartikel
Modelling of emotional development within human-computer-interaction
Siegert, Ingo; Hartmann, Kim; Glüge, Stefan; Wendemuth, Andreas
In: Kognitive Systeme. - Duisburg : DuEPublico, 1, insges. 8 S., 2013
Inter-rater reliability for emotion annotation in human-computer interaction - comparison and methodological improvements
Siegert, Ingo; Böck, Ronald; Wendemuth, Andreas
In: Journal on multimodal user interfaces - Berlin: Springer, 2007 . - 2013
Dissertation
Multimodal automatic user disposition recognition in human-machine interaction
Böck, Ronald; Wendemuth, Andreas; Diedrich, Christian
In: Magdeburg, Univ., Fak. für Elektrotechnik und Informationstechnik, Diss., 2013: Magdeburg, XVII, 206 S., graph. Darst.
Implicit sequence learning in recurrent neural networks
Glüge, Stefan; Wendemuth, Andreas; Al-Hamadi, Ayoub
In: Magdeburg, Univ., Fak. für Elektrotechnik und Informationstechnik, Diss., 2013, VIII, 132 S., graph. Darst.
2012
Abstract
Emotion detection by event evaluation using fuzzy sets as appraisal variables
Kotzyba, Michael; Deml, Barbara; Neumann, Hendrik; Glüge, Stefan; Hartmann, Kim; Siegert, Ingo; Wendemuth, Andreas; Traue, Harald; Walter, Steffen
In: Proceedings of ICCM 2012 : 11th International Conference on Cognitive Modeling. - Berlin : Universitätsverl. der TU Berlin, S. 123-124
Buchbeitrag
Modeling users' mood state to improve human-machine-interaction
Siegert, Ingo; Böck, Ronald; Wendemuth, Andreas
In: Cognitive behavioural systems - Berlin [u.a.]: Springer; Esposito, Anna . - 2012, S. 273-279 - (Lecture Notes in Computer Science; 7403)Kongress: COST Dresden : 2011.02.21-26
Fine-tuning HMMS for nonverbal vocalizations in spontaneous speech - a multicorpus perspective
Prylipko, Dmytro; Schuller, Björn; Wendemuth, Andreas
In: IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2012: 25 - 30 March 2012, Kyoto, Japan ; proceedings - Piscataway, NJ: IEEE, 2012 . - 2012, S. 4625-4628Kongress: TSD 15 (Brno, Czech Republic : 2012.09.03-07)
Language modeling of nonverbal vocalizations in spontaneous speech
Prylipko, Dmytro; Vlasenko, Bogdan; Stolcke, Andreas; Wendemuth, Andreas
In: Text, Speech and Dialogue / Sojka , Petr - Berlin, Heidelberg : Springer ; Sojka, Petr . - 2012, S. 488-495 - (Lecture notes in computer science; 7499) Kongress: TSD 15 Brno, Czech Republic 2012.09.03-07
A companion technology for cognitive technical systems
Wendemuth, Andreas; Biundo, Susanne
In: Cognitive behavioural systems - Berlin [u.a.]: Springer; Esposito, Anna . - 2012, S. 89-103 - (Lecture Notes in Computer Science; 7403)
Applying the speaking rate in a hierarchical classifier for emotion recognition from speech
Philippou-Hübner, David; Böck, Ronald; Wendemuth, Andreas
In: Elektronische Sprachsignalverarbeitung 2012 - Dresden: TUDpress Verl. der Wiss.; Wolff, Matthias . - 2012, S. 228 - (Studientexte zur Sprachkommunikation; 64)Kongress: Konferenz Elektronische Sprachsignalverarbeitung 23 (Cottbus : 2012.08.29-31)
The performance of the speaking rate parameter in emotion recognition from speech
Philippou-Hübner, David; Vlasenko, Bogdan; Böck, Ronald; Wendemuth, Andreas
In: 2012 IEEE International Conference on Multimedia and Expo - Piscataway: IEEE . - 2012, S. 248-253Kongress: ICME (Melbourne, Australia : 2012.07.09-13)
Multimodal affect recognition in spontaneous HCI environment
Panning, Axel; Siegert, Ingo; Al-Hamadi, Ayoub; Wendemuth, Andreas; Rösner, Dietmar; Frommer, Jörg; Krell, Gerald; Michaelis, Bernd
In: 2012 IEEE International Conference on Signal Processing, Communications and Computing (ICSPCC 2012) : Hong Kong, China, 12-15 August 2012 ; proceedings. - Piscataway, NJ : IEEE, insges. 6 S.Kongress: ICSPCC; (Hong Kong) : 2012.08.12-15
Towards emotion and affect detection in the multimodal LAST MINUTE corpus
Frommer, Jörg; Michaelis, Bernd; Rösner, Dietmar; Wendemuth, Andreas; Friesen, Rafael; Haase, Matthias; Kunze, Manuela; Andrich, Rico; Krüger, Julia; Panning, Axel; Siegert, Ingo
In: Proceedings of the 8th International Conference on Language Resources and Evaluation: May 23-25, 2012 / eds. Nicoletta Calzolari: May 23-25, 2012 - ELRA, 2012; Calzolari, Nicoletta . - 2012, S. 3064-3069Kongress: LREC 2010 8 (Istanbul, Turkey : 2012.05.23-25)
The Influence of Context Knowledge for Multimodal Annotation
Siegert, Ingo; Böck, Ronald; Wendemuth, Andreas
In: Joint proceedings of the IVA 2012 workshops - Santa Cruz, California, September 15, 2012 - Magdeburg: Univ. . - 2012, S. 25-31Kongress: IVA 12 (Santa Cruz, Calif. : 2012.09.12-15)
Describing human emotions through mathematical modelling
Hartmann, Kim; Siegert, Ingo; Glüge, Stefan; Wendemuth, Andreas; Kotzyba, Michael; Deml, Barbara
In: Preprints MATHMOD 2012 Vienna : abstract volume. - Vienna : ARGESIM, ARGE Simulation News, Vienna Univ. of Technology, insges. 6 S. - (ARGESIM report; 38)Kongress: MATHMOD; 7 (Vienna) : 2012.02.15-17
Extension of backpropagation through time for segmented-memory recurrent neural networks
Glüge, Stefan; Böck, Ronald; Wendemuth, Andreas
In: Proceedings of the 4th International Joint Conference on Computational Intelligence: Barcelona, Spain, 5 - 7 October 2012 / sponsored by INSTICC, Institute for Systems and Technologies of Information, Control and Communication. [Ed. by Agostinho Rosa, ...] - [S.l.]: SciTePress; Rosa, Agostinho . - 2012, S. 451-456Kongress: IJCCI 4 (Barcelona, Spain : 2012.10.05-07)
Intraindividual and interindividual multimodal emotion analyses in human-machine-interaction
Böck, Ronald; Glüge, Stefan; Wendemuth, Andreas; Limbrecht, Kerstin; Walter, Steffen; Hrabal, David; Traue, Harald C.
In: 2012 IEEE International Multi-Disciplinary Conference on Cognitive Methods in Situation Awareness and Decision Support (CogSIMA 2012): New Orleans, Louisiana, USA, 6 - 8 March 2012 - Piscataway, NJ: IEEE, 2012 . - 2012, S. 59-64Kongress: CogSIMA (New Orleans, La. : 2012.03.06-08)
Investigation of hierarchical classification for simultaneous gender and age recognition
Siegert, Ingo; Böck, Ronald; Philippou-Hübner, David; Wendemuth, Andreas
In: Elektronische Sprachsignalverarbeitung 2012 - Dresden: TUDpress Verl. der Wiss.; Wolff, Matthias . - 2012, S. 58 - (Studientexte zur Sprachkommunikation; 64)Kongress: Konferenz Elektronische Sprachsignalverarbeitung 23 (Cottbus : 2012.08.29-31)
Combining mimic and prosodic analyses for user disposition classification
Böck, Ronald; Limbrecht, Kerstin; Siegert, Ingo; Glüge, Stefan; Walter, Steffen; Wendemuth, Andreas
In: Elektronische Sprachsignalverarbeitung 2012 - Dresden: TUDpress Verl. der Wiss.; Wolff, Matthias . - 2012, S. 220 - (Studientexte zur Sprachkommunikation; 64)Kongress: Konferenz Elektronische Sprachsignalverarbeitung 23 (Cottbus : 2012.08.29-31)
Begutachteter Zeitschriftenartikel
Majority decisions in overlapping committees and asymptotic size of dichotomies
Wendemuth, Andreas; Simonelli, Italo
In: SIAM journal on discrete mathematics/ Society for Industrial and Applied Mathematics - Philadelphia, Pa.: Soc., 1988, Bd. 26.2012, 4, S. 1537-1549
Artikel in Kongressband
Towards robust spontaneous speech recognition with emotional speech adapted acoustic models
Vlasenko, Bogdan; Prylipko, Dmytro; Wendemuth, Andreas
In: KI 2012: Poster and Demo Track: 35th German Conference on Artifical Intelligence, Saarbrücken, Germany, September 24-27, 2012 - Saarbrücken, 2012 . - 2012, S. 103-107Kongress: KI 2012 (Saarbrücken : 2012.09.24-27)
2011
Abstract
Incorporation of a mood-model to improve user-disposition prediction from emotion recognition
Siegert, Ingo; Böck, Ronald; Wendemuth, Andreas
In: Program and abstracts of the COST 2102 Final Conference: held in conjunction with the 4th COST 2102 International Training School on Cognitive Behavioural Systems ; February 21 - 25, 2011, Dresden, Germany / Technische Universität Dresden, Institut für Akustik und Sprachkommunikation. [Ed. by Anna Esposito ...]: held in conjunction with the 4th COST 2102 International Training School on Cognitive Behavioural Systems ; February 21 - 25, 2011, Dresden, Germany - Dresden: Techn. Univ., Inst. für Akustik und Sprachkommunikation, 2011; Esposito, Anna . - 2011, S. 34[Kongress: COST 2102 Final Conference, Dresden, Germany, February 21 - 25, 2011]
Buchbeitrag
Vowels formants analysis allows straightforward detection of high arousal emotions
Vlasenko, Bogdan; Philippou-Hübner, David; Prylipko, Dmytro; Böck, Ronald; Siegert, Ingo; Wendemuth, Andreas
In: 2011 IEEE International Conference on Multimedia and Expo: ICME 2011 ; electronic proceedings - Piscataway, NJ: IEEE, 2011; Chen, Irene, 2011, paper 631, insgesamt 6 S.Kongress: ICME (Barcelona, Spain : 2011.07.11-15)[Beitrag auf USB-Stick]
Appropriate emotional labelling of non-acted speech using basic emotions, geneva emotion wheel and self assessment manikins
Siegert, Ingo; Böck, Ronald; Philippou-Hübner, David; Vlasenko, Bogdan; Wendemuth, Andreas
In: 2011 IEEE International Conference on Multimedia and Expo: ICME 2011 ; electronic proceedings - Piscataway, NJ: IEEE, 2011; Chen, Irene, 2011, paper 419, insgesamt 6 S.Kongress: ICME (Barcelona, Spain : 2011.07.11-15)[Beitrag auf USB-Stick]
Ikannotate - a tool for labelling, transcription, and annotation of emotionally coloured speech
Böck, Ronald; Siegert, Ingo; Haase, Matthias; Lange, Julia; Wendemuth, Andreas
In: Affective computing and intelligent interaction ; Pt. 1 - Heidelberg [u.a.]: Springer, 2011; Pt. 1 . - 2011, S. 25-34 - (Lecture notes in computer science; 6974)Kongress: ACII 4 (Memphis, TN : 2011.10.09-12)
A processing tool for emotionally coloured speech
Böck, Ronald; Siegert, Ingo; Vlasenko, Bogdan; Wendemuth, Andreas; Haase, Matthias; Lange, Julia
In: 2011 IEEE International Conference on Multimedia and Expo: ICME 2011 ; electronic proceedings - Piscataway, NJ: IEEE, 2011; Chen, Irene, 2011, paper 895, insgesamt 1 S.Kongress: ICME (Barcelona, Spain : 2011.07.11-15)[Beitrag auf USB-Stick]
Multi-modal fusion with particle filter for speaker localization and tracking
Heuer, Michael; Hamadi, Ayoub; Michaelis, Bernd; Wendemuth, Andreas
In: 2011 International Conference on Multimedia Technology ; Vol. 7 - Piscataway, NJ: IEEE, 2011; Vol. 7 . - 2011, S. 6450-6453Kongress: ICMT (Hangzhou, China : 2011.07.26-28)
Dissertation
Ökonomische Objektivierung von elektromechanischen Funktionsgeräuschen
Scheibner, Philipp; Wendemuth, Andreas
In: Berlin: Logos-Verl., 2012, Zugl.: Magdeburg, Univ., Fak. für Elektrotechnik und Informationstechnik., Diss., 2011, X, 138 S., ISBN: 978-3-8325-3069-3
Emotion recognition within spoken dialog systems
Vlasenko, Bogdan; Wendemuth, Andreas; Rösner, Dietmar
In: Magdeburg, Univ., Fak. für Elektrotechnik und Informationstechnik, Diss., 2011, XXVII, 179 S.
Artikel in Kongressband
Segmented-memory recurrent neural networks versus Hidden Markov Models in emotion recognition from speech
Glüge, Stefan; Böck, Ronald; Wendemuth, Andreas
In: IC3K 2011: 3rd International Joint Conference on Knowledge, Knowledge Engineering and Knowledge Management, Paris, France, 26 - 29 October, 2011 - Paris, 2011 . - 2011, S. 308-315
Originalartikel in begutachteter zeitschriftenartiger Reihe
Zanzibar OpenIVR - an open-source framework for development of spoken dialog systems
Prylipko, Dmytro; Schnelle-Walka, Dirk; Lord, Spencer; Wendemuth, Andreas
In: Text, speech and dialogue : 14th international conference, TSD 2011, Pilsen, Czech Republic, September 1-5, 2011 ; proceedings. - Heidelberg [u.a.] : Springer, S. 372-379 - (Lecture notes in computer science; 6836)Kongress: TSD; 14 (Pilsen) : 2011.09.01-05
A Markov model of conditional associative learning in a cognitive behavioural scenario
Glüge, Stefan; Hamid, Oussama H.; Braun, Jochen; Wendemuth, Andreas
In: Foundations on natural and artificial computation - Heidelberg [u.a.]: Springer, S. 10-19, 2011 - (Lecture notes in computer science; 6686)Kongress: IWINAC 4 (La Palma : 2011.05.30-06.03
Vowels formants analysis allows straightforward detection of high arousal acted and spontaneous emotions
Vlasenko, Bogdan; Prylipko, Dmytro; Philippou-Hübner, David; Wendemuth, Andreas
In: Proceedings of the 11th Annual Conference of the International Speech Communication Association, (Interspeech 2010) : 26 - 30 September, 2010, Makuhari, Chiba, Japan. - ISCA, S. 1577-1580, 2011Kongress: Interspeech 2010; 11 (Makuhari, Chiba, Japan) : 2010.09.26-30
2010
Buchbeitrag
Determining optimal signal features and parameters for HMM-based emotion classification
Böck, Ronald; Hübner, David; Wendemuth, Andreas
In: 15th IEEE Mediterranian Electromechanical Conference - IEEE . - 2010, S. 1586-1590Kongress: Melecon 2010 15 (Valletta, Malta : 2010.04.25-28)
Implicit sequence learning - a case study with a 4-2-4 encoder simple recurrent network
Glüge, Stefan; Böck, Ronald; Wendemuth, Andreas
In: IJCCI 2010 - Setúbal: SciTePress . - 2010, S. 279-288Kongress: ICNC 2010 (Valencia, Spain) ; 2010.10.24-26
Adaptive beamforming in speaker diarization
Grosser, Tobias; Elsafadi, Aoys; Hübner, David; Böck, Ronald; Wendemuth, Andreas
In: Proceedings - Berlin . - 2010, insges. 9 S.
Dissertation
Machine learning with Lipschitz classifiers
Stuhlsatz, André; Wendemuth, Andreas; Findeisen, Rolf
In: Magdeburg, Univ., Fak. für Elektrotechnik und Informationstechnik, Diss., 2010, VII, 200 S.
Artikel in Kongressband
Modeling affected user behavior during human-machine interaction
Vlasenko, Bogdan; Böck, Ronald; Wendemuth, Andreas
In: Proceedings of the 5th International Conference Speech prosody 2010 - Chicago . - 2010, insges. 4 S.Kongress: International Conference on Speech Prosody 5 (Chicago, Ill. : 2010.05.11-14)
Originalartikel in begutachteter internationaler Zeitschrift
Temporal context and conditional associative learning
Hamid, Oussama H.; Wendemuth, Andreas; Braun, Jochen
In: BMC neuroscience - London: BioMed Central, Bd. 11 (2010), insges. 15 S.
Cross-corpus acoustic emotion recognition - variances and strategies
Schuller, Björn; Vlasenko, Bogdan; Eyben, Florian; Wöllmer, Martin; Stuhlsatz, André; Wendemuth, Andreas; Rigoll, Gerhard
In: Institute of Electrical and Electronics Engineers : IEEE transactions on affective computing . - New York, NY : IEEE, Abstract
A simple recurrent network for implicit learning of temporal sequences
Glüge, Stefan; Hamid, Oussama H.; Wendemuth, Andreas
In: Cognitive computation - New York, N.Y.: Springer, 2009, Bd. 2.2010, 4, S. 265-271[From the issue entitled "Special Issue: Advances in Computational Intelligence and Applications - ISNN 2010"]
Temporal context and conditional associative learning
Hamid, O; Wendemuth, A; Braun, J
In: BMC Neuroscience
A simple recurrent network for implicit learning of temporal sequences
Glüge, Stefan; Hamid, Oussama H.; Wendemuth, Andreas
In: Cognitive Computation - New York, NY : Springer, Bd. 2 (2010), Heft 4, S. 265-271
Originalartikel in begutachteter nationaler Zeitschrift
Von kognitiven technischen Systemen zu Companion-Systemen
Biundo, Susanne; Wendemuth, Andreas
In: Künstliche Intelligenz . - Berlin : Springer, insges. 5 S.; Abstract
Originalartikel in begutachteter zeitschriftenartiger Reihe
Determining optimal features for emotion recognition from speech by applying an evolutionary algorithm
Hübner, David; Vlasenko, Bogdan; Grosser, Tobias; Wendemuth, Andreas
In: Proceedings of the 11th Annual Conference of the International Speech Communication Association, (Interspeech 2010) . - ISCA, S. 2358-2361Kongress: Interspeech 2010; 11 (Makuhari, Chiba, Japan) : 2010.09.26-30
2009
Buchbeitrag
Application of HMMs for the recognition of emotional sequences in the valence-arousal space
Hübner, David; Böck, Ronald; Wendemuth, Andreas
In: Tagungsband der 20. Konferenz, Dresden, 21. bis 23. September 2009 - Dresden: TUDpress; Hoffmann, Rüdiger . - 2009, S. 200-206 - (Studientexte zur Sprachkommunikation; 53)Kongress: ESSV 20 (Dresden : 2009.09.21-23)
Acoustic emotion recognition: a benchmark comparison of performances
Schuller, Björn; Vlasenko, Bogdan; Eyben, Florian; Rigoll, Gerhard; Wendemuth, Andreas
In: 2009 IEEE Workshop on Automatic Speech Recognition & Understanding, ASRU 2009 . - Piscataway, NJ : IEEE, ISBN 978-1-424-45479-2, S. 552-558Kongress: ASRU 2009; (Merano) : 2009.12.13-17
On the influences of feature extration in single emotion recognition in naive vs. acted speech
Böck, Ronald; Hübner, David; Wendemuth, Andreas
In: Tagungsband der 20. Konferenz, Dresden, 21. bis 23. September 2009 - Dresden: TUDpress; Hoffmann, Rüdiger . - 2009, S. 207-214 - (Studientexte zur Sprachkommunikation; 53)Kongress: ESSV 20 (Dresden : 2009.09.21-23)
Sound quality evaluation of power seat adjusters
Scheibner, Philipp; Zeitler, Alfred; Wendemuth, Andreas
In: NAG DAGA <2009, Rotterdam> : Proceedings // NAG/DAGA 2009 . - [Berlin] : DEGA [u.a.], ISBN 978-3-9808659-6-8, S. 1547-1549Kongress: NAG/DAGA; (Rotterdam) : 2009.03.23-26
Heading toward to the natural way of human-machine interaction - the nimitek project
Vlasenko, Bogdan; Wendemuth, Andreas
In: Konferenz: IEEE International Conference on Multimedia and Expo, New York, NY, USA, 28 June 2009 - 03 July 2009, IEEE International Conference on Multimedia and Expo, 2009 - Piscataway, NJ: IEEE . - 2009, S. 950-953
Artikel in Kongressband
Approach to a design of experiments for sound quality evaluations of car interior adjusting noises
Scheibner, Philipp; Wendemuth, Andreas
In: SAE 2009 Noise and Vibration Conference and Exhibition . - Warrendale, Pa. : SAE International, insges. 6 S.Kongress: SAE Noise and Vibration Conference and Exhibition; (St. Charles, Ill.) : 2009.05.19-21[SAE technical paper 2009-01-2184]
Originalartikel in begutachteter zeitschriftenartiger Reihe
Analysis of merge criteria within a watershed based segmentation algorithm
Grosser, Tobias; Hellwich, Olaf; Wendemuth, Andreas
In: 2nd International Conference on Adaptive Science & Technology, ICAST 2009 . - IEEE, ISBN 978-1-424-43523-4, S. 250-256Kongress: ICAST; 2 (Ghana) : 2009.12.14-16
Processing affected speech within human machine interaction
Vlasenko, Bogdan; Wendemuth, Andreas
In: Proceedings of Interspeech 2009 . - ISCA, S. 2039-2042Kongress: Interspeech 2009; 10 (Brighton, UK) : 2009.09.06-10
2008
Buchbeitrag
Role of phonetic content variation for acoustic emotion recognition
Vlasenko, Bogdan; Wendemuth, Andreas
In: Proceedings of the Workshop on Emotion-, Speech- and Face Recognition with Advanced Classifiers. - Magdeburg : Univ., S. 67-72, 2008Kongress: Workshop on Emotion-, Speech- and Face Recognition with Advanced Classifiers; 3 (Düsseldorf, Germany) : 2008.05.16-17
Using more context in HMM-based semantic tagging model
Mengistu, Kinfe T.; Hannemann, Mirko; Wendemuth, Andreas
In: Proceedings of the Workshop on Emotion-, Speech- and Face Recognition with Advanced Classifiers. - Magdeburg : Univ., S. 79-86, 2008Kongress: Workshop on Emotion-, Speech- and Face Recognition with Advanced Classifiers; 3 (Düsseldorf, Germany) : 2008.05.16-17
Survey of state-of-the-art speech recognition technology
Grosser, Tobias; Böck, Ronald; Hübner, David; Wendemuth, Andreas
In: Proceedings of the Workshop on Emotion-, Speech- and Face Recognition with Advanced Classifiers - Düsseldorf, Germany, May 16 - 17, 2008 ; 3rd joined research workshop between Otto-von-Guericke University Magdeburg and the University of Applied Sciences FH Düsseldorf: Düsseldorf, Germany, May 16 - 17, 2008 ; 3rd joined research workshop between Otto-von-Guericke University Magdeburg and the University of Applied Sciences FH Düsseldorf/ Workshop on Emotion, Speech and Face Recognition with Advanced Classifiers - Magdeburg: Univ.; Wendemuth, Andreas . - 2008, S. 73-78Kongress: Workshop on Emotion-, Speech- and Face Recognition with Advanced Classifiers 3 (Düsseldorf, Germany : 2008.05.16-17)
Neurobiologically inspired companion systems
Wendemuth, Andreas; Glüge, Stefan; Hamid, Oussama
In: Proceedings of the Workshop on Emotion-, Speech- and Face Recognition with Advanced Classifiers. - Magdeburg : Univ., S. 57-66, 2008Kongress: Workshop on Emotion-, Speech- and Face Recognition with Advanced Classifiers; 3 (Düsseldorf, Germany) : 2008.05.16-17
Methods for the reduction of complexity of subjective attributes in the field of sound quality evaluations
Scheibner, Philipp; Wendemuth, Andreas
In: Proceedings of the Workshop on Emotion-, Speech- and Face Recognition with Advanced Classifiers. - Magdeburg : Univ., S. 49-55, 2008Kongress: Workshop on Emotion-, Speech- and Face Recognition with Advanced Classifiers; 3 (Düsseldorf, Germany) : 2008.05.16-17
Emotional speech in robot controlling
Böck, Ronald; Wendemuth, Andreas
In: Proceedings of the Workshop on Emotion-, Speech- and Face Recognition with Advanced Classifiers - Düsseldorf, Germany, May 16 - 17, 2008 ; 3rd joined research workshop between Otto-von-Guericke University Magdeburg and the University of Applied Sciences FH Düsseldorf: Düsseldorf, Germany, May 16 - 17, 2008 ; 3rd joined research workshop between Otto-von-Guericke University Magdeburg and the University of Applied Sciences FH Düsseldorf/ Workshop on Emotion, Speech and Face Recognition with Advanced Classifiers - Magdeburg: Univ.; Wendemuth, Andreas . - 2008, S. 29-37Kongress: Workshop on Emotion-, Speech- and Face Recognition with Advanced Classifiers 3 (Düsseldorf, Germany : 2008.05.16-17)
Dynamic Bayesian Networks and Hidden Markov Models for modeling situations
Hübner, David; Grosser, Tobias; Wendemuth, Andreas
In: Proceedings of the Workshop on Emotion-, Speech- and Face Recognition with Advanced Classifiers. - Magdeburg : Univ., S. 23-28, 2008Kongress: Workshop on Emotion-, Speech- and Face Recognition with Advanced Classifiers; 3 (Düsseldorf, Germany) : 2008.05.16-17
A dual formulation to the Lipschitz Classifier
Stuhlsatz, André; Meier, Hans-Günter; Wendemuth, Andreas
In: Proceedings of the Workshop on Emotion-, Speech- and Face Recognition with Advanced Classifiers. - Magdeburg : Univ., S. 1-6, 2008Kongress: Workshop on Emotion-, Speech- and Face Recognition with Advanced Classifiers; 3 (Düsseldorf, Germany) : 2008.05.16-17
Towards user group dependent acoustic models
Mengistu, Kinfe Tadesse; Wendemuth, Andreas
In: Elektronische Sprachsignalverarbeitung . - Dresden : TUDpress, ISBN 978-3-940046-90-1, S. 64-71; Studientexte zur Sprachkommunikation; 50, 2008
Combining speech recognition and acoustic word emotion models for robust text-independent emotion recognition
Schuller, Björn; Vlasenko, Bogdan; Arsic, Dejan; Rigoll, Gerhard; Wendemuth, Andreas
In: 2008 IEEE International Conference on Multimedia and Expo, ICME 2008 . - Piscataway, NJ : IEEE Service Center, ISBN 978-1-424-42571-6, S. 1333-13337Kongress: ICME 2008; (Hannover) : 2008.06.23-26
Hierarchical HMM-based semantic concept labeling model
Mengistu, Kinfe Tadesse; Hannemann, Mirko; Baum, Tobias; Wendemuth, Andreas
In: 2008 IEEE Workshop on Spoken Language Technology . - Piscataway, N.J : IEEE Service Center, ISBN 978-1-424-43472-5, S. 57-60Kongress: IEEE Workshop on Spoken Language Technology; (Goa, India) : 2008.12.15-18
Herausgeberschaft
Proceedings of the Workshop on Emotion-, Speech- and Face Recognition with Advanced Classifiers - Düsseldorf, Germany, May 16 - 17, 2008 ; 3rd joined research workshop between Otto-von-Guericke University Magdeburg and the University of Applied Sciences FH Düsseldorf
Wendemuth, Andreas; Meier, Hans-Günter
In: Magdeburg: Univ., 2008, 86 S., Ill., graph. Darst.Kongress: Workshop on Emotion-, Speech- and Face Recognition with Advanced Classifiers 3 (Düsseldorf : 2008.05.16-17)
Artikel in Kongressband
Making the Lipschitz classifier practical via semi-infinite programming
Stuhlsatz, André; Meier, Hans-Günter; Wendemuth, Andreas
In: 2008 International Conference on Machine Learning and Applications . - Piscataway, NJ : IEEE, ISBN 978-1-424-44061-0, S. 40-47Kongress: ICMLA; 7 (San Diego, Calif.) : 2008.12.11-13
Using prior domain knowledge to build robust HMM-based semantic tagger trained on completely unannotated data
Tadesse Mengistu, Kinfe; Hannemann, Mirko; Baum, Tobias; Wendemuth, Andreas
In: Proceedings of the Workshop on Prior Knowledge for Text and Language Processing. - Helsinki, S. 31-36, 2008Kongress: Workshop on Prior Knowledge for Text and Language Processing; (Helsinki) : 2008.07.09
Originalartikel in begutachteter zeitschriftenartiger Reihe
Neurobiologically inspired, multimodal intention recognition for technical communication systems (NIMITEK)
Wendemuth, Andreas; Braun, Jochen; Michaelis, Bernd; Ohl, Frank; Rösner, Dietmar; Scheich, Henning; Warnemünde, Ralf
In: Perception in multimodal dialogue systems . - Berlin [u.a.] : Springer, ISBN 3-540-69368-8, S. 141-145; Lecture notes in computer science; 5078, 2008Kongress: PIT; 4 (Kloster Irsee) : 2008.06.16-18
On the influence of phonetic content variation for acoustic emotion recognition
Vlasenko, Bogdan; Schuller, Björn; Wendemuth, Andreas; Rigoll, Gerhard
In: Perception in multimodal dialogue systems . - Berlin [u.a.] : Springer, ISBN 3-540-69368-8, S. 217-221; Lecture notes in computer science; 5078, 2008Kongress: PIT; 4 (Kloster Irsee) : 2008.06.16-18
Balancing spoken content adaptation and unit length in the recognition of emotion and interest
Vlasenko, Bogdan; Schuller, Björn; Mengistu, Kinfe Tadesse; Rigoll, Gerhard; Wendemuth, Andreas
In: Proceedings of Interspeech 2008 incorporating SST 2008 . - Rundle Mall : Causal Productions, S. 805-808Kongress: INTERSPEECH 2008; 9 (Brisbane, Australia) : 2008.09.22-26SST 2008; 12 (Brisbane, Australia) : 2008.09.22-26
Accent and channel adaptation for use in a telephone-based spoken dialog system
Mengistu, Kinfe Tadesse; Wendemuth, Andreas
In: Text, speech and dialogue . - Berlin [u.a.] : Springer, ISBN 3-540-87390-2, S. 403-410; Lecture notes in computer science; 5246, 2008Kongress: TSD; 11 (Brno) : 2008.09.08-12
2007
Buchbeitrag
Acoustic modeling for a speaker-independent telephone-based spoken dialog system
Tadesse Mengistu, Kinfe; Katz, Marcel; Wendemuth, Andreas
In: The XII International Conference "Speech and Computer", SPECOM 2007 ; Vol. 2 - Moscow; Potapova, R. K. Vol. 2 . - 2007, S. 469-474Kongress: SPECOM 2007 12 (Moscow : 2007.10.15-18)
Combining frame and turn-level information for robust recognition of emotions within speech
Vlasenko, Bogdan; Schuller, Björn; Wendemuth, Andreas; Rigoll, Gerhard
In: Eighth Annual Conference of the International Speech Communication Association - ISCA . - 2007, S. 2249-2253Kongress: Annual Conference of the International Speech Communication Association 8 (Antwerp, Belgium : 2007.08.27-31)
Memory-efficient orthogonal least squares kernel density estimation using enhanced empirical cumulative distribution functions
Schafföner, Martin; Andelić, Edin; Katz, Marcel; Krüger, Sven E.; Wendemuth, Andreas
In: Proceedings of the eleventh International Conference on Artificial Intelligence and Statistics - omnipress . - 2007, insges. 8 S.Kongress: International Conference on Artificial Intelligence and Statistics 11 (San Juan : 2007.03.21-24)
Score calibrating for speaker recognition based on support vector machines and gaussian mixture models
Katz, Marcel; Schafföner, Martin; Krüger, Sven E.; Wendemuth, Andreas
In: Proceedings of the Ninth IASTED International Conference on Signal and Image Processing - Iasted . - 2007, insges. 6 S.Kongress: SIP (Honolulu, Hawaii : 2007.08.20-22)
Acoustic modeling for a speaker-independent telephone-based spoken dialog system
Tadesse Mengistu, Kinfe; Katz, Marcel; Wendemuth, Andreas
In: The XII International Conference "Speech and Computer", SPECOM 2007 - Moscow ; Potapova, R. K. Vol. 2, S. 469-474 Kongress: International Conference Speech and Computer 12 Moscow 2007.10.15-18
Comparing one and two-stage acoustic modeling in the recognition of emotion in speech
Schuller, Björn; Vlasenko, Bogdan; Minguez, Ricardo; Rigoll, Gerhard; Wendemuth, Andreas
In: 2007 IEEE Workshop on Automatic Speech Recognition and Understanding - Piscataway, NJ: IEEE Operations Center . - 2007, S. 596-600Kongress: ASRU 2007 (Kyoto, Japan : 2007.12.09-13)
Gender recognition and Gender-based acoustic model adaptation for telephone-based spoken dialog system
Tadesse Mengistu, Kinfe; Schafföner, Martin; Wendemuth, Andreas
In: Elektronische Sprachsignalverarbeitung - Dresden . - 2007, insges. 8 S.Kongress: Konferenz "ESSV 2007" 18 (Cottbus : 2007.09.10-12)
Support vector machines as acoustic models in speech recognition
Krüger, Sven E.; Schafföner, Martin; Katz, Marcel; Andelić, Edin; Wendemuth, Andreas
In: Fortschritte der Akustik - Berlin: Dt. Ges. für Akustik . - 2007, insges. 2 S.Kongress: DAGA 33 (Stuttgart : 2007.03.19-22)
Discriminative Kernel classifiers in speaker recognition
Katz, Marcel; Schafföner, Martin; Andelić, Edin; Krüger, Sven E.; Wendemuth, Andreas
In: Fortschritte der Akustik - Berlin: Dt. Ges. für Akustik . - 2007, insges. 2 S.Kongress: DAGA 33 (Stuttgart : 2007.03.19-22)
Tuning Hidden Markov model for speech emotion recognition
Vlasenko, Bogdan; Wendemuth, Andreas
In: Fortschritte der Akustik - Berlin: Dt. Ges. für Akustik . - 2007, insges. 1 S.Kongress: DAGA 33 (Stuttgart : 2007.03.19-22)
Telephone-based spoken dialog system using HTK-based speech recognizer and voiceXML
Tadesse Mengistu, Kinfe; Wendemuth, Andreas
In: Fortschritte der Akustik - Berlin: Dt. Ges. für Akustik . - 2007, insges. 1 S.Kongress: DAGA 33 (Stuttgart : 2007.03.19-22)
Aus technischen Gründen können nur 200 Publikationen angezeigt werden.
Mehr im Forschungsportal ansehen.
- Nahverkehrsservice Sachsen-Anhalt GmbH
- Verhaltensteuerung
- Emotionserkennung
Signal- und Sprachverarbeitung
- Signalverarbeitung
- Sprachverarbeitung
- Klassifikation
- Datenbankabfrage / data base query
- Gerätesteuerung, mit automatischer Sprachverarbeitung
Computational Neuroscience
- Signalverarbeitung
- Sprachverarbeitung
- Klassifikation
- Datenbankabfrage / data base query
- Gerätesteuerung, mit automatischer Sprachverarbeitung
Verhaltensmodellierung
Companion-Systeme
Computational Neuroscience
1984-1994 | Studium und Promotion, Physik und Elektrotechnik. Abschlüsse: |
1988 | Master of Science, University of Miami, Fl. (USA) |
1991 | Diplom-Physiker, Universität Gießen |
1994 | Diplom-Ingenieur Elektrotechnik, FernUniversität Hagen |
1994 | Promotion zum D.Phil. (Dr. rer. nat.), University of Oxford (UK) |
1993-1995 | Postdoctoral Research Fellow (Marie Curie), University of Oxford (UK) |
1995-2001 | Wissenschaftler, Man-Machine-Interfaces, Philips Forschungslaboratorien Aachen |
seit 2001 | Professor für Kognitive Systeme, Universität Magdeburg |
2005/6 & 2012/13 | Institutsleiter Institut für Informations- und Kommunikationstechnik |
2005-2008 | gewählter Universitätssenator |
2005-2010 | Sprecher des Verbundprojekts NIMITEK im Rahmen der Exzellenzförderung des Landes Sachsen-Anhalt: Neurobiologisch inspirierte, multimodale Intentionserkennung für technische Kommunikationssysteme (mit Ohl, Scheich, Rösner, Michaelis) |
2007-2017 | Gründungsmitglied, Mitglied des Direktoriums, Center for Behavioral Brain Sciences (www.med.uni-magdeburg.de/neuromd/) |
2009-2018 | stellv. Sprecher und Koordinator des Standortes Magdeburg: SFB/Transregio 62 "Eine Companion-Technologie für Kognitive Technische Systeme" (www.sfb-trr-62.de) |