TY - CHAP U1 - Konferenzveröffentlichung A1 - Braun, Simone A1 - Alkhouri, Georges A1 - Peukert, Eric ED - Reussner, Ralf H. ED - Koziolek, Anne ED - Heinrich, Robert T1 - KOBRA: Praxisfähige lernbasierte Verfahren zur automatischen Konfiguration von Business-Regeln in Duplikaterkennungssystemen T2 - INFORMATIK 2020. Gesellschaft für Informatik T2 - Lecture Notes in Informatics : Proceedings N2 - Duplikaterkennung, -suche und -konsolidierung für Kunden- und Geschäftspartnerdaten, sog. „Identity Resolution“, ist die Voraussetzung für erfolgreiches Customer Relationship Management und Customer Experience Management, aber auch für das Risikomanagement zur Minimierung von Betrugsrisiken und Einhaltung regulatorischer Vorschriften und viele weitere Anwendungsfälle. Diese Systeme sind jedoch hochkomplex und müssen individuell an die kundenspezifischen Anforderungen angepasst werden. Der Einsatz lernbasierter Verfahren bietet großes Potenzial zur automatisierten Anpassung. In diesem Beitrag präsentieren wir für ein KMU praxisfähige, lernbasierte Verfahren zur automatischen Konfiguration von Business-Regeln in Duplikaterkennungssystemen. Dabei wurden für Fachanwender Möglichkeiten entwickelt, um beispielgetrieben das Match-System an individuelle Business-Regeln (u.a. Umzugserkennung, Sperrlistenabgleich) anzupassen und zu konfigurieren. Die entwickelten Verfahren wurden evaluiert und in einer prototypischen Lösung integriert. Wir konnten zeigen, dass unser Machine-Learning-Verfahren, die von einem Domainexperten erstellten Business-Regeln für das Duplikaterkennungssystem „identity“ verbessern konnte. Zudem konnte der hierzu erforderliche Zeitaufwand verkürzt werden. KW - Sequential Model-Based Optimization KW - Nonlinear Regression KW - Reinforcement Learning KW - Entity Resolution KW - Identity Resolution Y1 - 2021 SN - 1617-5468 (Print) SS - 1617-5468 (Print) SN - 1617-5468 (Online) SS - 1617-5468 (Online) SN - 978-3-88579-701-2 SB - 978-3-88579-701-2 U6 - https://doi.org/10.18420/inf2020_37 DO - https://doi.org/10.18420/inf2020_37 VL - P-307 SP - 395 EP - 409 S1 - 15 CY - Bonn ER -