Datenpflege ist kritischer Erfolgsfaktor für Unternehmen

ZIM-Kooperationsprojekt will Machine Learning Verfahren zur fehlertoleranten automatischen Dublettenerken­nung (Identity Resolution) entwickeln

Die Pflege von Kunden- und Interessentendatenbanken für Unternehmen und Institutionen künftig zu vereinfachen ist das Ziel eines gemeinsamen Forschungs- und Entwicklungsprojekts des Instituts für Angewandte Informatik (InfAI) e.V., Leipzig und der Uniserv GmbH, Pforzheim. Beide Partner sind Mitglied in dem bundesweiten GFFT-Kooperationsnetzwerk „Erfolgreiche IT-Großprojekte: Mit System zum Erfolg“.

Fehlertolerante automatische Dublettenerkennung ist Voraussetzung, damit Unternehmen zum Beispiel eine komplette 360°-Sicht auf Kunden und Interessenten herstellen oder personalisierte Kundeninteraktion auslösen können. Dies gilt auch für Analysen auf Haushaltsebene oder um einen Abgleich gegen Sperrlisten zur Betrugserkennung und Risikoabschätzung durchzuführen.

Im Bereich der Verwaltung großer Datenbestände von Kunden und Interessenten ist die Erstellung von Geschäftsregeln für die Erkennung von Duplikaten eine hoch komplexe Aufgabe. Denn es geht dabei nicht nur um doppelte oder mehrfach vorhandene Stammdaten, sondern oft auch um zugehörige Transaktionsdaten, die nicht über eindeutige Kundennummern, sondern über so genannte „weiche“ Identifikationskriterien wie Namen und Adressen, Telefonnummer, E-Mailadresse oder Social Login zugeordnet werden müssen. Diese Zuordnungen maschinell sicher durch zu führen, wird im Zeitalter der Digitalisierung immer wichtiger.

Dabei sind diese Geschäftsregeln nicht nur je Unternehmen und Institution unterschiedlich. Sie hängen auch erheblich von der jeweiligen Aufgabenstellung (wie beispielsweise Konsolidierung aller Finanz- und Versicherungsverträge in einem Haushalt oder Datenanreicherung für Marketing-Kampagnen) ab sowie auch von der Datenqualität, die je nach Erfassungsart (Webformular, Call-Center etc.) sehr unterschiedlich ist. Da sich Aufgaben und Anforderungen oft sehr kurzfristig ergeben bzw. ändern, muss die Erstellung eines neuen aufgabenspezifischen Regelwerks sehr schnell und möglichst durch die Fachabteilung direkt erfolgen können.

Mit Hilfe des Projekts KOBRA (Konfiguration von Business-Regeln für Anwender von Duplikaterken­nungssystemen) soll nun eine Lösung geschaffen werden, die die aufgaben- und unternehmensspeziellen Regeln durch Hinzufügen von positiven und negativen Beispielen der Nutzer immer besser an die spezifische Problemstellung anpasst. Dies geschieht durch eine neuartige Kombination unter­schiedlicher Verfahren des maschinellen Lernens mit einer Trainingsdatenselektion, Historisierung und Simulationsumgebung. Mittels dieser automatisierten Identitäts- und damit Duplikaterkennung kann die Datenqualität signifikant gesteigert werden.

„Das Projekt ermöglicht es uns, Knowhow aus langjähriger Forschungsarbeit in die Praxis übertragen zu können und gemeinsam weiter zu vertiefen. Wir freuen uns sehr auf die Zusammenarbeit mit Uniserv“, erläutert Professor Erhard Rahm, Leiter der Abteilung Datenbanken am InfAI.

Hervorgegangen ist das Projekt KOBRA aus dem ZIM-geförderten Kooperationsnetzwerk „Erfolgrei­che IT-Großprojekte: Mit System zum Erfolg“, welches von der GFFT Innovationsförderung GmbH be­trieben wird. Ziel des Netzwerks ist es, bestehende Methoden, Techniken und Werkzeuge, die für kleine und mittlere Projekte gut geeignet sind, systematisch auf ihre Eignung für IT-Großprojekte zu untersuchen, um dann die dort erkannten methodischen und technologischen Lücken zu schließen. So soll ein durchgehendes Gesamtkonzept zur erfolgreichen Durchführung großer IT-Projekte ge­schaffen werden.

„Wir freuen uns sehr auf die künftige Zusammenarbeit mit der GFFT und dem InfAI im Rahmen des Forschungsprojekts KOBRA. Das Projekt soll zeigen, wie Künstliche Intelligenz dabei helfen kann, die Ansprache von Unternehmen an ihre Kunden zu verbessern – und die Qualität von Kundendaten zu erhöhen. Die Ergebnisse des Projekts wollen wir nach Abschluss auch in unsere Lösung Uniserv Identity einfließen lassen“, erklärt Dr. Simone Braun, Business Development, Uniserv.

Das Projekt KOBRA wird für zwei Jahre im Rahmen des Zentralen Innovationsprogramms Mittelstand (ZIM) durch das Bundesministerium für Wirtschaft und Energie gefördert.


Die GFFT Innovationsförderung GmbH

Die GFFT Innovationsförderung GmbH mit Sitz in Bad Vilbel initiiert und betreibt Netzwerke und Innovationszen­tren, deren Ziel die Ent­wicklung und Bündelung innovativer Lösungen im Bereich der Informationstechnologie ist. Diese Initiativen führen kompetente Partner aus Forschung und Praxis zusammen und richten ihre Kräfte auf ein gemeinsames Ziel aus. Die GFFT Innovationsförderung GmbH unterstützt ihre Partner durch das Management, die Fortschrittskontrolle und den sukzessiven Ausbau der Netzwerke sowie durch die Vermarktung der Lösungen.

Mehr Informationen unter www.gfft-ev.de.


Uniserv GmbH

Uniserv ist Experte für erfolgreiches Kundendatenmanagement. In seinen Customer-Data-Management- und Data-Quality-Lösungen für Kundenstamm- und Bewegungsdaten vereint Uniserv Datenqualitätssicherung und Datenintegration zu einem ganzheitlichen Ansatz. Kundendaten stehen im Mittelpunkt von Initiativen für Master Data Management, Datenqualität, Datenmigration und Data Warehousing, beispielsweise im Umfeld von CRM-Anwendungen, eBusiness, Direct- und Database-Marketing, CDI/MDM-Anwendungen und Business Intelligence. Mit mehreren Tausend Installationen weltweit bedient Uniserv die Erwartungshaltung einer ganzheitlichen Lösung für alle Geschäfts- und Kundendaten über den gesamten Datenlebenszyklus hinweg. Am Stammsitz in Pforzheim sowie in den Niederlassungen in Paris, Frankreich, und Amsterdam, Niederlande, beschäftigt das Unternehmen über 130 Mitarbeiter und zählt branchenübergreifend und international zahlreiche renommierte Unternehmen wie beispielsweise Allianz, Deutsche Bank, eBay, EDEKA, E.ON, France Telecom, Lufthansa, Otto, Siemens, Time Warner sowie TUI und VOLKSWAGEN zu seinen Kunden. Der Landesdatenschutzbeauftragte für Baden-Würt­temberg hat kürzlich bestätigt, dass Uniserv seine Geschäftsprozesse datenschutzgerecht gestaltet. Zudem hat das Unternehmen kürzlich erneut das Qualitätssiegel Datenverarbeitung des Deutschen Dialogmarketing Verban­des e.V. für das Jahr 2017 erhalten.

Mehr Informationen unter www.uniserv.com.

Institut für Angewandte Informatik (InfAI) e.V.

Das InfAI bzw. die am InfAI beteiligte Arbeitsgruppe von Prof. Dr. Erhard Rahm an der Universität Leipzig ist eine der weltweit führenden Forschungsgruppen im Bereich der Datenintegration, Datenmigration und insbesondere der Duplikaterkennung und kann umfangreiche wissenschaftliche Erfahrungen auf diesem Gebiet vorweisen. Er­hard Rahm ist außerdem einer der wissenschaftlichen Koordinatoren des nationalen Big Data Kompetenzzen­trums ScaDS Dresden/Leipzig, welches das Projekt ebenfalls inhaltlich unterstützen wird.

Mehr Informationen unter www.infai.org.

Ansprechpartner für Rückfragen:

GFFT Innovationsförderung GmbH

Dr. Thorsten Arendt

Mail: thorsten.arendt@gfft-ev.de

Tel: +49 6101/ 95 49 8 98

 

Uniserv GmbH

Dr. Simone Braun

Mail: simone.braun@uniserv.com

Tel.: +49 7231 936 1081

 

Institut für Angewandte Informatik (InfAI) e.V.

Dr. Erik Peukert

Mail: peukert@infai.org

Tel.: +49 341 97 39524