Modèle analytique aux fins de la détection de la fraude et formation avancée en ligne

17 juin 2022

L’OMD a le plaisir d’annoncer que, grâce au soutien du Fonds de coopération douanière de la Corée (FCD Corée), le modèle LITE DATE pour la détection de la fraude et la formation avancée sur l’analyse des données sont à présent disponibles en anglais et en français sur la plate-forme CLiKC et ce, à compter du 17 juin.

Le Projet BACUDA, qui traduit l’intérêt de l’OMD pour l’analyse des données à des fins douanières, continue de proposer en source ouverte des algorithmes qui répondent aux besoins des Membres ainsi que des activités afférentes de renforcement des capacités.

À cet égard, le modèle LITE DATE constitue le dernier ajout effectué et il est désormais possible d’en obtenir le code source sur la plate-forme e-learning CLiKC! et d’avoir accès sur cette même plate-forme aux explications qui se trouvent dans la formation avancée sur l’analyse des données.

LITE DATE, un modèle simple et facile à utiliser

LITE DATE est une version allégée du modèle DATE, élaboré en 2020 dans le cadre du Projet BACUDA. En effet, la structure du modèle a été simplifiée pour permettre un usage plus large sans pour autant renoncer aux fonctions du modèle d’origine. Suite à la publication du modèle DATE et au lancement du cours de niveau intermédiaire, consacré à l’algorithme et au code source du modèle DATE, les Membres ont fait part de leur besoin de résoudre les difficultés liées au modèle, que ce soit en raison des techniques complexes de programmation nécessaires, ou encore des problèmes relatifs aux bibliothèques et aux processeurs graphiques.    

C’est donc en réponse à ces observations et recommandations que le modèle LITE DATE a été créé. L’idée était de mettre en place un modèle facile à utiliser, à comprendre et à mettre en œuvre, sans nécessairement disposer pour cela d’un processeur graphique très performant.

Alors que le modèle DATE d’origine était destiné à détecter la fraude et à prédire le montant de recettes supplémentaires, le modèle LITE DATE se contente de remplir uniquement la première de ces fonctions.

Éléments centraux du modèle LITE DATE  

Le modèle LITE DATE vise à détecter les transactions frauduleuses. D’un point de vue technique, il s’agit d’un modèle de classification binaire qui s’efforce de classer une transaction donnée soit dans la catégorie des transactions illégales, soit dans la catégorie des transactions non illégales. L’outil de classement XGBoost est utilisé aux fins de la classification binaire. Il s’appuie sur un algorithme basé sur un ensemble d’arbres qui utilise la méthode du boosting.

C'est le jeu de données artificielles de la déclaration douanière, créé et communiqué par l’équipe en charge du projet, qui est utilisé pour le modèle de la formation. Le jeu de données comprend 100 000 déclarations douanières artificielles, assorties des résultats d’une inspection également artificielle.

En matière de performances, le modèle affiche un taux de « rappel » de 79,9 % et un niveau de précision de 20,8 % (le « rappel » est une mesure communément utilisée pour évaluer avec précision le niveau de détection des fraudes par l’intelligence artificielle).

D’après les résultats, on estime que le modèle pourrait détecter environ 80 % de la totalité des transactions illicites, réduire d’un tiers le nombre des transactions nécessitant une inspection humaine, et tripler le niveau d’efficacité, qui passerait de 7 % à 20,8 %.

L’OMD invite les Membres qui auraient besoin d’un soutien personnalisé accru ou qui souhaiteraient poser des questions sur la formation à contacter l'équipe en charge du Projet BACUDA de l’OMD (bacuda@wcoomd.org).