Article co-écrit avec Nicolas Fleuret et Alexandre Fenet-Garde, Associés Risk Advisory
La détection des opérations liées à du blanchiment d’argent ou du financement du terrorisme (LCB-FT) est une discipline complexe : les transactions incriminées sont rares dans la masse des flux, les circuits de blanchiment peuvent prendre des formes très variables et évoluent constamment, et la création de nouveaux produits financiers peut créer de nouveaux risques dont il faut pouvoir assurer la surveillance. Dans un contexte d’accroissement de la pression réglementaire, les institutions financières recherchent des dispositifs LCB-FT à la fois suffisamment flexibles et robustes pour pouvoir maintenir une couverture des risques efficace et minimisant les moyens techniques et humains à mobiliser. Les progrès de l’intelligence artificielle et notamment du Machine Learning, alliés aux capacités renforcées d’accès aux données de l’entreprise, font émerger de nouvelles opportunités pour l’amélioration de ces dispositifs.
En grande majorité, les systèmes de lutte contre le blanchiment et le financement du terrorisme actuellement en place pour la surveillance des transactions s’appuient sur des scénarios métier de détection. Ces scénarios sont généralement basés sur des règles fixes qui sont peu modifiées dans le temps. De fait, les alertes issues de ces systèmes peuvent être assez directement interprétées, par les analystes en charge du traitement des alertes, ou les autorités supervisant ces dispositifs. Ces systèmes peuvent être en général rapidement déployés grâce à des scénarios pré-paramétrés, sous réserve d’accès aux données nécessaires.
Aujourd’hui, les évolutions règlementaires génèrent une génération de volumes d’alertes de plus en plus importants, associés à des taux de faux positifs très significatifs ce qui, in fine, induit des comportements routiniers et nuit à la nécessaire vigilance des analystes en charge du traitement des alertes. De plus, la rigidité des règles ne facilite pas l’ajustement des dispositifs pour faire face aux évolutions du risque LCB-FT et ne permet pas l’identification des nouvelles typologies ou schémas de criminalité financière. Ceci amène les entreprises à réfléchir à l’efficacité et à la pertinence de dispositifs en place.
Le Machine Learning, incluant le Deep Learning, recouvre des techniques de développement visant à élaborer des modèles prédictifs, grâce généralement à des techniques d’apprentissage sur des données et informations déjà observées. On distingue les modèles supervisés, visant à identifier des situations définies par l’apprentissage de situations similaires dans le passé (ex : alertes LCB critiques VS faux positifs) et les modèles non supervisés permettant par exemple de regrouper les données par similitudes ou recherche de corrélations entre les données (ex : clustering, profilage,…).
Depuis peu, des avancées concrètes et rapides sont observées sur la mise en œuvre efficiente de techniques de Machine Learning sur la LCB-FT. Ces avancées sont le fruit de différentes évolutions. D’abord, la disponibilité, l’accès et la qualité des données : la prise de conscience de la plupart des banques et compagnies d’assurances de l’importance de leurs données donne lieu chez la grande majorité des entreprises à des programmes d’architecture data, de data gouvernance et data quality.
Autre facteur d’adoption du Machine Learning : la capacité des infrastructures informatiques à traiter de grands volumes de données. Les progrès dans le développement des algorithmes et l’adoption généralisée des librairies Open Sources permettent par ailleurs la mise en œuvre plus rapide de modèles pertinents. Des techniques récentes, telles que LIME et SHAP, améliorent l’explicabilité des résultats fournis par les modèles. Ces techniques permettent de connaitre, pour chaque résultat en sortie d’un modèle, les variables ayant conduit à la décision proposée (dans un sens ou dans un autre) et leur contribution. Ainsi, l’effet « boite noire » des modèles est réduit, l’analyse des résultats est facilitée et leur explicabilité/auditabilité largement augmentées, ce point étant critique s’agissant de processus réglementaires pour lesquels il est nécessaire d’assurer une traçabilité. Ceci permet d’initier des discussions avec les régulateurs sur l’utilisation du Machine Learning en remplacement progressif des méthodologies traditionnelles.
Si le Machine Learning s’impose de plus en plus, c’est enfin en raison d’une appropriation croissante de ces techniques par les utilisateurs et l’évolution des régulateurs sur ces technologies – un mouvement important des régulateurs sur le sujet est en train d’être observé afin d’intégrer ces nouvelles technologies dans leur réflexions, voire de les encourager.
Les techniques d’apprentissage supervisé permettent de catégoriser par priorité les alertes générées par les outils de détection. Avec ce principe de catégorisation, chaque alerte est priorisée et peut être ensuite orientée vers le mode de traitement le plus adapté à sa priorité.
La définition de la catégorie s’appuie sur un processus d’apprentissage basé sur les alertes passées et le traitement qu’elles ont pu avoir. A l’issue de cet apprentissage, les modèles sont capables de proposer une catégorisation pour chaque nouvelle alerte en fonction de sa similarité avec les modalités de traitement et de conclusion des alertes passées :
L’apport de ces modèles de Machine Learning est double, à la fois en termes d’efficacité opérationnelle, mais également en termes de diminution du risque réglementaire grâce à un traitement plus rapide et plus adapté des alertes les plus prioritaires.
Cette approche est relativement rapide à mettre en œuvre car elle ne nécessite pas de remplacer le système de surveillance en place. Elle permet de l’améliorer et d’intégrer progressivement la technique de machine learning auprès des équipes et du système d’information. Par ailleurs, les logiques d’explicabilité peuvent être introduites dans les algorithmes et ainsi faciliter la traçabilité et l’auditabilité de la catégorisation, et au final renforcer les dispositifs.
En fonction de la disponibilité et de la qualité des données KYC (Know Your Customer) et transactionnelles, les techniques de Machine Learning sont aussi capables d’améliorer la détection des situations à risques ou d’améliorer le processus de scoring KYC. Les possibilités d’application sont multiples :
Les cas d’usage du Machine Learning sont très nombreux dans le secteur financier. Sa mise en œuvre sur les activités de sécurité financière permet à la fois un retour sur investissement rapide, une acculturation et enfin d’engager des discussions avec les autorités pour faire évoluer les modes de fonctionnement traditionnels, en lien avec de l’automatisation (robotique). Le développement de solution machine learning permet de poser les premières pierres de chaines de traitement encore plus automatisées, permettant de focaliser les ressources sur l’expertise et l’analyse des cas les plus complexes. Au-delà du sujet LCB-FT, cette technique peut être ainsi étendue progressivement à d’autres champs d’application connexes ( Lutte Anti-Fraude, KYC, abus de marché…).
Article co-rédigé avec Cyril Chalin, Charles-Henri Carlier, Joseph Delawari et Pape Modou Mbow. La loi…
Entretien avec Jérôme de Grandmaison (VP Talent Management, Product Lines & Functions, Alstom) à l’occasion…
Article co-écrit par Ivann Le Pallec (Senior Consultant Risk Advisory) et Valentin Brohm (Manager Risk…
Five Trends Shaping the Market Hear “luxury travel,” and you’re likely to envision a swirl…
Interview réalisée par Marie-Line Ricard, Associée Blockchain & Web 3, Jérémy Stevance, Manager Blockchain &…
Article co-rédigé avec Wilfrid Biamou, Senior manager. Les évolutions réglementaires successives Alur du 26 mars…