Algorithme matching

À propos de ce projet

Crawler web

La direction de technique de la DDI Bouygues Energie & Service a dans son périmètre fonctionnel la production des grandes offres de gestion des infrastructures d’éclairage public. Ces offres ont pour objet de définir la stratégie de construction, de remplacement et de maintenance de l’infrastructure en tenant compte de problématiques d’usage et de consommation. Dans ce cadre, elle reçoit en donnée d’entrée un fichier décrivant le patrimoine des collectivités étudiées.

Collecte données

Ce fichier patrimoine suit une nomenclature propre à chaque projet et doit être normalisé avant de pouvoir être utilisé. Une des étapes de normalisation est réalisée manuellement et consiste à identifier le matériel mentionné (support, luminaire, console, source, appareillage) selon la nomenclature utilisée au sein de la direction technique. Conscient que ce travail chronophage devait être automatisable, la Direction Technique a fait appel à notre cabinet pour créer un programme de matching permettant d’associer automatiquement un équipement du patrimoine avec un équipement du catalogue. Dans ce contexte, nous avons considéré plusieurs approches – utilisation de librairies, full-text SQL, utilisation d’outils d’indexation comme solr ou elasticsearch – pour finalement sélectionner la solution de la startup Algolia créée par des vétérans des moteurs de recherche et du text mining. Leur solution de recherche est facilement intégrable et permet de mettre en place des index sur des données structurées et de gérer une multitude de paramètres comme le ranking, la synonymie ou encore la gestion d’erreurs de typo. Nous avons intégré Algolia en REST avec la plateforme BPM du client puis construit l’algorithme de matching correspondant à leur cas d’usage.

Catégorie
Algorithme, Business Process Management, Intégration applicative