Data matching use cases with Talend

Data matching use cases with Talend

Accolade

 

Cette entreprise de 600 employés fournit à de larges firmes telles que HP ou Comcast des solutions pour optimiser la couverture sociale et médicale de leurs employés. Selon eux, environ 40 % de l’argent allouée par les entreprises aux couvertures médicales est dépensé inutilement lorsque les employés décident de choisir eux-même leur mutuelle. Accolade propose donc de récupérer les données des employés afin d’affecter à chacun la meilleure couverture, et donc d’économiser aux entreprises ces coûts inutiles.

Afin de fonctionner, Accolade a besoin de données de santé de différents agents : l’employeur, l’employé lui-même, les couvertures santé précédentes, etc. Il va de soit que ces données apparaissent dans des formats très différents ; ils ont donc choisit d’utiliser Talend MDM pour uniformiser les données et pouvoir les exploiter. En sus, ils utilisent la technologie Amazon Web Service (compatible avec Talend) pour récupérer facilement les données.

Cependant, l’automatisation du processus est loin d’être complète. En effet, la solution d’Accolade comprend de nombreux assistants de santé qui sont tenus de contacter les employés des firmes clientes afin d’obtenir les données qui viendraient à manquer. De nombreux agents (journaux spécialisés, employés,…) prétendent que la satisfaction client (98 % d’après Accolade) est en grande partie due à cette proximité humaine entre client et opérateur ; à tel point qu’on peut se demander si cette automatisation partielle n’est pas voulue, ou en tout cas bénéfique à l’entreprise.

Aujourd’hui, Accolade cherche à accélérer la récolte des données avec Talend Data Preparation.

Sources :

 

Air France KLM

 

La compagnie aérienne transporte 90M passagers chaque année, et gère 27M membres du programme Flying Blue. La gestion des données client représente donc une partie importante du travail de la compagnie. Elle cherche à accélérer le traitement des données, à la fois pour améliorer la qualité de ses services, et pour réduire les coûts tant que faire se peut.

Les canaux utilisés par Air France pour récupérer des données sont pléthores : Twitter, Réservation sur AirFrance.com, données liées aux publicités web réalisées par la compagnie elle-même, comptes Flying Blue, etc. L’utilisation de Talend Metadata & Data Management permet l’ajustement des données et la création de profils personnalisés très poussés qui doivent leur permettre de s’adapter à leurs clients à un très haut niveau.

Seulement, les utilisations de ces données restes très humbles : actuellement, elles sont surtout utilisées pour générer des messages adaptés (pour un taux d’ouverture plus élevé de 2 points) et pour proposer des recommandations de voyage aux clients. AirFrance cherche aujourd’hui à utiliser ces données pour mieux réagir aux imprévus, par exemple en s’occupant individuellement des passagers lors d’un retard ou d’une correspondance ratée.

Le problème de la confidentialité qui devait apparaître pour une telle concentration de données personnelles à un même endroit a été gérée par la compagnie en se munissant de Talend Data Masking, qui permet de crypter et d’anonymiser les données. Il semble que l’opinion publique n’ait pas réagi négativement à l’accumulation d’information par AirFrance, ce qui tend à prouver que la mesure a été efficace.

Sources :

 

Vinci

 

Plus de 185 000 employés travaillent aujourd’hui dans le groupe Vinci, répartis dans plus de 15 000 organisations qui font parties d’environ 4 500 entreprises distinctes, chacune possédant son propre système de données. Bien qu’il s’agisse d’un cauchemar pour tout data scientist, c’est en fait la volonté du groupe de laisser à chacun son indépendance relative et son identité propre ; d’autant que Vinci effectue des acquisitions presque quotidiennement.

Cependant, à cause de ces hétérogénéités parfois extrêmes, de nombreux problèmes de communication faisaient surface, l’un des plus symptomatique étant que 30% des emails internes n’atteignaient pas leur destination. Vinci a fini par réagir, et utilise Talend MDM pour permettre la communication sans trop de problèmes entre ses différents pôles. Selon Vinci eux-même, l’uniformisation via Talend a été mis en place sur 95% du groupe en moins d’un mois ; et la mise à jour des informations se fait à un rythme quotidien : il est donc raisonnable de considérer que les informations fournies dans la BDD sont toujours les bonnes. Le taux d’emails internes n’arrivant pas à destination est selon eux arrivé à 0%. Même s’il s’agit vraisemblablement d’un arrondi visant à améliorer les statistiques, il y a une nette amélioration entre le 30% d’auparavant, et un taux inférieur à 0.5%.

En plus de la facilité de communication, les employés de Vinci ont obtenu une facilité d’utilisation des applications proposées par l’entreprise. En effet, si auparavant chaque application nécessitait un compte propre, à présent chacune utilise la même clef pour un même employé.

L’outil Talend, vu au sein de l’entreprise sous son angle de gestion de données et de matching, fera même l’objet d’une formation de 40h pour les employés de Vinci qui le désirent. On peut dire que le logiciel a bien pénétré l’entreprise.

Sources :

 

Veolia

 

Afin de gérer la distribution d’eau sur tout le territoire, Veolia dispose de pas moins de 400 applications distinctes. Or, le mapping réalisé courant 2015 a révélé que chacune de ces applications utilisait son langage propre, ce qui rendait la communication entre les territoires, et donc la gestion de problèmes réseau de grande ampleur, difficile. D’un autre côté, elles étaient toutes hébergées sur leur propre serveur, ce qui rendait leur maintenance plus complexe.

Ainsi, Veolia a entrepris un vaste travail de migration de ses applications vers Amazon service, non sans les avoir auparavant passés au crible de Talend pour les rendre cohérentes entre elles. Les applications rendues cohérentes tant physiquement que linguistiquement, le délai de détection d’incident sur le réseau est descendu à 15 minutes, soit 75% de moins par rapport à ce qui se passait auparavant. Le facteur limitant reste la prise en charge du problème qui n’a que peu changé (2 heures en moyenne), mais l’amélioration globale du traitement des flux est suffisante pour que le groupe puisse proposer de nouveaux services tels que le paiement en direct.

Sources :

 

TUI

 

Historiquement, TUI récoltait des informations sur ses clients grâce à ses boutiques physiques, puis grâce à un centre de contact client, et enfin grâce à ses boutiques en ligne. L’entreprise parvenait ainsi à entretenir un flux de données permanent vers l’équipe managériale, qui les utilisaient qualitativement (gestion des budget, variation des campagnes de publicité globales,…).

Cependant, il est apparu récemment qu’une meilleure utilisation de ces données pouvait être faite. Via l’uniformisation des données de Talend, ces trois canaux alimentent en temps réel un profil détaillé de chaque client. En sus, tous les membres de TUI qui peuvent en avoir besoin (managers certes, mais aussi conseillers clients ou membres du SAV) peuvent accéder au profil complet du client qui les intéresse. Ainsi, les employés en contact direct avec le client sont plus à même de lui répondre efficacement, et ceux qui s’adressent à lui au travers de la publicité ou de recommandations le font de manière plus pertinente.

Sources :

 

Travis Perkins

 

La compagnie de vente d’équipement, entre autre de construction, propose à la vente plus de 500 000 items différents. Chacun d’entre eux a été ajouté à la main, mais des erreurs ont immanquablement eu lieu : doublons, descriptions imprécises, voire fiches non remplies, les présentations des items n’étaient satisfaisantes ni pour les clients, ni pour les membres de l’entreprise qui gèrent les stocks et les achats.

Travis Perkins a donc utilisé Talend Data Service pour filtrer et augmenter en qualité les fiches de présentation. Cette purification a donné de bons résultat, puisque le taux de transformation (non communiqué) a augmenté de 30%.

En plus de ce filtre opéré sur les fiches, la compagnie a utilisé Talend pour récupérer et utiliser les données client pour être plus efficace sur les recommandations, ce qu’elle ne faisait pas du tout au préalable. Cette opération a révélé que les informations fournies par les clients (adresse mail, numéro de téléphone, …) étaient en grande partie fausses (entre 25% et 40%).

Finalement, l’entreprise réfléchit à migrer l’ensemble de ses applications sur le cloud. Si l’affaire se concrétise, Talend et Google Platform seraient utilisés, et le transfert prendrait jusqu’à fin 2019.

Sources :

 

Kiva

 

L’objectif principal de KIVA, entreprise de conseil sur la relation client, en particulier dans le domaine de la banque, est d’établir un profil standardisé pour chacun de ses clients, tout en préservant au maximum leur anonymat et la sécurité de leurs informations sensible. En effet, il est important que les conseillers puissent accéder au profil de ceux à qui ils s’adressent pour les servir au mieux, mais il est indispensable que certaines données restent cryptées pour éviter les fuites d’argent.

 

Ellie Mae

 

Banque en ligne montante aux Etats-Unis, Ellie Mae a récemment opéré de multiples acquisitions. De ce fait, le nombre de ses dossiers clients s’élevait à plus de 100K. Non seulement les fiches clientes étaient souvent redondantes, mais les données éclatées ne pouvaient pas être utilisées efficacement. En plus des duplications dues aux acquisitions, les bases de données n’avaient jamais été nettoyées ou mises à jour, et une bonne partie des informations (adresse mail, numéro de téléphone, …) n’étaient plus pertinentes, ce qui menait par exemple à un taux de rebond de 70% pour les mails.

L’utilisation de Talend a permis à l’entreprise de nettoyer et de rendre cohérentes ses BDDs. Le nombre d’entrées est descendu de 100K à 60K, mais toutes ces entrées sont des profils de qualité qui rassemblent toutes les données connues sur les clients.

 

Conclusion

 

L’outil de Matching de Talend est utilisé sous deux cas d’usage distincts qui semblent, sans s’exclure, s’éclipser mutuellement. D’une part, certaines entreprises travaillent avec de nombreuses applications différentes qui ont chacune leur langage technique propre ; c’est souvent le cas des entreprises montantes qui acquièrent de nombreux pôles, et donc de nombreuses bases de données à priori dissonantes.    

Talend est alors utilisé pour standardiser les communications entre ces applications, et entre ceux qui les utilisent. L’objectif dans ces cas-ci est une optimisation des process visant un gain de temps pour les employés et donc pour l’entreprise.

Cette façon d’utiliser Talend n’est pas forcément pérenne pour le prestataire, puisqu’une fois les modifications faites, il est possible que le client choisisse d’abandonner Talend et de ne plus ajouter de nouvelle apllication à son parc, ou de le faire en respectant les contraintes établies sous Talend. Il est alors important d’insister sur la difficulté de maintenir rigoureusement la base de donnée sans Talend, et sur les risques pour le système entier si une erreur est commise.

D’autres part, des entreprises utilisent Talend comme un outil de centralisation des données acquises par différents canaux venant directement de l’extérieur de l’écosystème de l’entreprise.

L’objectif est alors l’optimisation de l’utilisation de ces données pour acquérir une meilleure connaissance de leurs utilisateurs et mieux les servir.

Dans ce cas de figure, la fidélité du client à Talend est presque assurée puisque abandonner le prestataire revient à abandonner les nouvelles informations qui arrivent au fil de l’eau sur chacun des média utilisés ; ce qui renverrait directement le client à la case départ. A supposer qu’il n’en ait pas conscience, en faire mention devrait suffire à le convaincre de garder Talend.

Le temps réel est une vrai contrainte dans ce cas d’usage, car les informations ne sont pertinentes qu’à certains moment (par exemple, accéder aux données récentes relatives à un certain usager de compagnie aérienne est plus important lorsqu’il vient de rater une correspondance que lorsqu’il est au travail).

 

Raphaël

 

Tags:
No Comments

Sorry, the comment form is closed at this time.

en_USEnglish