La détection algorithmique de la fraude fiscale après l’AI Act : un encadrement toujours insuffisant du recours à l’intelligence artificielle
Cet article analyse le recours à l’intelligence artificielle (IA) par la Direction générale des finances publiques pour la détection de la fraude fiscale (projet « ciblage de la fraude et valorisation des requêtes » lancé en 2014). Comme tout système d’IA, l’outil est susceptible de conduire à des atteintes au droit au respect de la vie privée, à la protection des données personnelles ou encore au principe d’égalité. Se pose dès lors l’enjeu de la conciliation entre l’objectif de valeur constitutionnelle de lutte contre la fraude fiscale et les droits et libertés des contribuables. Le point d’équilibre ne semble pas avoir été trouvé à ce jour. En dépit du changement de paradigme qu’implique la mobilisation croissante de l’outil algorithmique par l’administration pour programmer les contrôles fiscaux, le cadre juridique censé prévenir les dérives potentielles est resté largement insuffisant. Or, l’application prochaine du règlement (UE) 2024/1689 du Parlement européen et du Conseil du 13 juin 2024 établissant des règles harmonisées concernant l’intelligence artificielle (« AI Act ») ne paraît pas à même de combler cette importante lacune. Si le nouveau texte européen prévoit des obligations inédites à la charge des fournisseurs et déployeurs de systèmes d’IA à « haut risque », d’importantes incertitudes subsistent à ce stade sur la classification de l’algorithme de détection de la fraude fiscale et sur l’effectivité du régime prévu par le règlement européen. De sorte qu’il est difficile de voir dans l’AI Act la révolution espérée.
Louis Imbert, docteur en droit public, qualifié aux fonctions de maître de conférences, enseignant contractuel à l’Université d’Orléans et chercheur associé au CREDOF (Université Paris Nanterre)
« Big Brother is taxing you ! » C’est en ces termes directement inspirés du roman dystopique 1984 de George Orwell que des citoyens se sont inquiétés en novembre 2018 de l’annonce par le ministre de l’Action et des Comptes publics Gérald Darmanin d’une expérimentation consistant pour l’administration fiscale à collecter les données des contribuables sur les réseaux sociaux en vue de détecter plus efficacement la fraude fiscale1. Cette collecte étendue des données en ligne avait vocation à alimenter un algorithme préexistant de détection de la fraude fiscale2, soulevant ainsi la question de l’équilibre entre la lutte contre la fraude et les droits et libertés des contribuables, notamment le droit au respect de la vie privée et la protection des données personnelles.
L’administration fiscale française a été pionnière dans le déploiement d’outils d’intelligence artificielle, qui se sont depuis répandus dans de nombreuses administrations3, notamment à des fins de lutte contre les fraudes et de contrôle. La lutte contre la fraude fiscale, qui constitue un objectif de valeur constitutionnelle4, paraît a priori constituer un motif légitime pour mettre en place ce type de technologies, et ce au vu non seulement d’un impératif largement partagé de justice fiscale mais aussi des sommes colossales en jeu (plusieurs dizaines de milliards d’euros par an5). La Direction générale des finances publiques (DGFiP) affiche un volontarisme certain en la matière6. La France ne fait d’ailleurs pas figure d’exception, puisqu’un nombre croissant d’États s’appuient sur l’intelligence artificielle pour détecter la fraude fiscale7.
Le projet « ciblage de la fraude et valorisation des requêtes » (CFVR) de la DGFiP mobilise un traitement algorithmique ciblant les anomalies déclaratives à partir d’une méthode de datamining. Il s’agit d’un traitement automatisé paramétré à partir d’une phase préalable d’apprentissage machine8, ce qui en fait un système d’intelligence artificielle au sens du règlement européen sur l’intelligence artificielle (« AI Act ») définitivement adoptée en juin 20249. L’article 3 paragraphe 1 de ce nouveau texte propose en effet une large définition du système d’intelligence artificielle (IA), qui englobe tout « système automatisé qui est conçu pour fonctionner à différents niveaux d’autonomie et peut faire preuve d’une capacité d’adaptation après son déploiement, et qui, pour des objectifs explicites ou implicites, déduit, à partir des entrées qu’il reçoit, la manière de générer des sorties telles que des prédictions, du contenu, des recommandations ou des décisions qui peuvent influencer les environnements physiques ou virtuels ». Les deux éléments les plus importants de cette définition sont le fait qu’il s’agisse d’un système automatisé et qu’il soit capable de déduire des résultats à partir d’entrées qu’il a reçues10. Or, tel est bien le cas de l’algorithme mis en place par le projet CFVR, qui génère de façon automatisée des prédictions de fraude à partir du croisement des données des contribuables.
Comme tout système d’IA, l’outil est susceptible de conduire à des atteintes au droit au respect de la vie privée, à la protection des données personnelles ou encore au principe d’égalité11. Se pose dès lors l’enjeu de la conciliation entre l’objectif légitime de lutte contre la fraude fiscale et les droits et libertés des contribuables. En l’occurrence, le point d’équilibre ne semble pas avoir été trouvé à ce jour12. En effet, en dépit du changement de paradigme qu’implique le recours croissant à l’outil algorithmique par l’administration pour programmer les contrôles fiscaux, le cadre juridique censé prévenir les dérives potentielles est resté largement insuffisant (I). Dans ce contexte, l’application prochaine de l’AI Act pourrait-elle venir combler cette importante lacune ? Si le nouveau texte européen prévoit des obligations inédites à la charge des fournisseurs et déployeurs de systèmes d’IA à « haut risque », d’importantes incertitudes subsistent à ce stade sur la classification de l’algorithme de détection de la fraude fiscale et sur l’effectivité du régime prévu par le règlement européen (II). De sorte qu’il est difficile de voir dans l’AI Act la révolution espérée.
I – L’irrésistible montée en puissance de l’intelligence artificielle dans la détection de la fraude fiscale
D’abord expérimental et circonscrit à un champ réduit, le recours à l’intelligence artificielle pour cibler les contrôles fiscaux a rapidement été pérennisé et étendu à de nouveaux secteurs. L’outil algorithmique traduit pourtant un véritable changement de paradigme, qui comporte des implications majeures pour les droits fondamentaux des contribuables (A.). Il repose sur le traitement d’une grande quantité de données, ce qui a conduit les autorités à mettre en place une collecte massive des données des contribuables (B.). Cette fuite en avant technologique s’est pourtant réalisée sans véritable évaluation de l’efficacité du dispositif, et ce malgré les risques importants pour les droits des citoyens.
A – Le changement de paradigme induit par le déploiement d’un traitement algorithmique
Dès 2014, la DGFiP lance à titre expérimental son projet « ciblage de la fraude et valorisation des requêtes » (CFVR). Fondé sur un traitement automatisé de données à caractère personnel, celui-ci vise à « modéliser les comportements frauduleux » et « se base notamment sur les caractéristiques des cas de fraudes avérées afin de mener des actions de prévention, de recherche, de constatation ou de poursuite d’infractions pénales ainsi que des opérations de recherche, de constatation ou de poursuite de manquements fiscaux »13. Il s’agit dans un premier temps de cibler les fraudes des professionnels, en particulier en matière de taxe sur la valeur ajoutée (TVA). L’expérimentation est ensuite pérennisée et étendue aux fraudes perpétrées par les particuliers à partir de 201714. En vue d’améliorer le ciblage des contrôles fiscaux, le projet CFVR s’appuie sur une méthode de datamining, « consistant en une fouille approfondie des données s’appuyant sur des méthodes exploratoires basées sur des algorithmes, notamment statistiques, de nature à permettre de modéliser des comportements frauduleux »15. Il s’agit ce faisant de « mieux identifier les situations potentiellement frauduleuses en mettant en évidence des incohérences ou des défaillances déclaratives dans les dossiers des contribuables »16. En 2014, la Commission nationale de l’informatique et des libertés (CNIL) relève que l’outil ne produit que des éléments de signalement et ne conduit pas à une programmation automatique des contrôles. Elle se satisfait ainsi de ce que « l’outil constitue bien une aide au ciblage et à l’optimisation de la détection de la fraude et non pas un outil de profiling destiné à identifier directement des fraudeurs potentiels »17.
Pourtant, le projet CFVR occupe bien une place croissante dans la programmation des contrôles fiscaux. Plus de la moitié des contrôles sont ciblés par intelligence artificielle et datamining depuis 202218. En pratique, les agents de la DGFiP chargés des contrôles reçoivent de la part des services centraux des listes de datamining (DM), qui orientent désormais l’essentiel de leur travail19. Ils ne maîtrisent plus vraiment les critères de sélection propres à la programmation des contrôles fiscaux. Leur mission se réduit bien souvent à la simple vérification de la pertinence des dossiers transmis. Cela constitue un changement important dans les pratiques de l’administration fiscale. Derrière cette nouvelle stratégie technologique, censée augmenter l’efficacité des contrôles, se cache – comme ce fut déjà le cas dans le passé avec d’autres avancées technologiques20 – un choix politique, inavoué mais bien réel. Ainsi que l’explique la Cour des comptes en 2023, « la stratégie de lutte contre la fraude des particuliers a connu une révolution silencieuse en passant d’une logique de contrôle triennal des plus gros contribuables (les dossiers dits ‘à fort enjeu’) à une logique d’analyse des risques alimentée par un travail systématique sur les données et par un recours accru au renseignement fiscal »21. Or, le choix ainsi opéré n’a pas été débattu publiquement ni même véritablement formalisé22, en dépit des enjeux pour l’égalité devant l’impôt et alors même que des inégalités de traitement ont pu être constatées par le passé dans les pratiques de l’administration fiscale23.
Le recours croissant à l’intelligence artificielle pour la détection de la fraude fiscale traduit bel et bien un changement de paradigme24. Loin d’être neutre, l’outil algorithmique repose sur un modèle probabiliste d’analyse des risques qui tend par avance à faire de chaque contribuable un fraudeur en puissance, et ce d’autant plus si l’on tient compte de la masse toujours plus conséquente de données collectées puis recroisées25. Là où la programmation du contrôle fiscal s’opérait auparavant à partir de critères préalablement établis ou d’éléments tangibles concernant un contribuable en particulier, le traitement algorithmique vise l’ensemble des contribuables, d’emblée suspectés de fraude. Caroline Lequesne-Roth va jusqu’à évoquer l’avènement d’un « État de surveillance » dès lors que les outils mobilisés « impliquent, dans un même mouvement, une surveillance ex ante – la fraude étant présumée avant même sa réalisation –, et la surveillance généralisée de l’ensemble des individus pour repérer les comportements frauduleux de quelques-uns »26. En outre, il ne s’agit plus de suivre un « raisonnement juridique causal », c’est-à-dire de déceler la fraude par une appréciation contextualisée des faits et par la mise en relation de ces faits avec les éléments constitutifs de la fraude. Il est désormais question de dresser des corrélations de faits qui induisent une présomption statistique de fraude, à l’aune d’indicateurs quantitatifs liés aux dossiers déjà instruits27. On bascule alors d’une norme juridique vers une « une nouvelle forme de norme, proprement algorithmique »28.
Face à ce changement d’ampleur, la digitalisation de la lutte contre la fraude fiscale présente deux problèmes concrets du point de vue des contribuables. Le premier tient à l’opacité du dispositif. Les principes du fonctionnement de l’algorithme sont inaccessibles au public, de sorte que celui-ci demeure une véritable boîte noire pour les citoyens. Or, il n’est pas certain que le principe de transparence algorithmique adopté dans la loi pour une République numérique en 2016 trouve ici à s’appliquer29. L’article L. 311-3-1 du code des relations entre le public et l’administration (CRPA) prévoit certes qu’« une décision individuelle prise sur le fondement d’un traitement algorithmique comporte une mention explicite en informant l’intéressé » et que « les règles définissant ce traitement ainsi que les principales caractéristiques de sa mise en œuvre sont communiquées par l’administration à l’intéressé s’il en fait la demande ». Mais une décision mettant en cause un individu pour un comportement de fraude fiscale d’abord repéré par un algorithme doit-elle être considérée comme « une décision individuelle prise sur le fondement d’un traitement algorithmique » ? A supposer que cela soit le cas, il serait en tout état de cause aisé pour l’administration d’opposer au droit de communication des administrés l’exception prévue au 2° de l’article L. 311-5 du CRPA concernant les « documents administratifs dont la consultation ou la communication porterait atteinte […] à la recherche et à la prévention, par les services compétents, d’infractions de toute nature »30. Dans ces conditions, ni les citoyens ni même les personnels de la DGFiP31 ne sont en mesure d’exercer un contrôle effectif sur le fonctionnement concret de l’algorithme. Même la CNIL ne semble pas toujours disposer d’informations suffisantes32, ce qui entrave sa mission pourtant essentielle de protection des libertés des individus visés par des traitements de données à caractère personnel.
Le deuxième problème que soulève le projet CFVR tient aux biais que tout traitement automatisé est susceptible d’entraîner. Un écart peut en effet se creuser entre la réalité, les données censées la représenter et le résultat généré par l’algorithme. On relève ainsi un biais interne de l’algorithme, directement lié à son fonctionnement33. La phase d’apprentissage machine (machine learning) revêt de ce point de vue une importance primordiale. Avant de pouvoir être mis en service, l’algorithme est entraîné à partir d’un jeu de données, dont la quantité, la qualité et la représentativité conditionnent directement les corrélations qui seront ensuite opérées à partir des données, ici celles des contribuables. Comme on le verra plus loin, les données d’entraînement ne sont pas neutres et comportent leurs propres biais et présupposés, que l’algorithme risque ensuite de reproduire sans aucun recul critique. Les calculs ne sont donc pas impartiaux ou objectifs34. Le risque de biais est accru en cas d’apprentissage automatique non supervisé35. Contrairement à ce qu’avançait encore un rapport sénatorial au printemps 202436, un tel dispositif n’est ni neutre ni objectif. Bien au contraire, il est de nature à dresser des corrélations arbitraires et discriminatoires qui s’écartent considérablement de la réalité37. La machine ne dispose en effet d’aucune capacité propre de discernement lui permettant de remettre en question de telles corrélations, même lorsqu’elles sont grossières et manifestement erronées.
Une fois le système mis en place, les biais peuvent se renforcer au fur et à mesure que les nouvelles données générées par l’algorithme sont réinsérées dans le système. Cela donne lieu à un phénomène désormais bien documenté et dénommé « boucle de rétroaction » (feedback loop)38. Le risque est ni plus ni moins que l’automatisation des discriminations39. Ce risque n’est pas hypothétique. Ces dernières années, des scandales ont éclaté dans de nombreux pays concernant des algorithmes qui avaient discriminé massivement certaines populations40. Aux Pays-Bas, des dizaines de milliers de personnes ont été accusées à tort de fraude aux allocations familiales du fait d’un algorithme auto-apprenant qui ciblait spécifiquement les individus de nationalité étrangère (Toeslagenaffaire)41. En France, l’algorithme utilisé par la Caisse nationale des allocations familiales (CNAF) pour détecter la fraude est accusé depuis plusieurs années de cibler les individus les plus précaires. Malgré une alerte précoce du Défenseur des droits en 201742, le système ne semble pas avoir été réformé ni même audité43. Après avoir obtenu le code source de l’algorithme en 2023, l’association La Quadrature du Net a pu mettre en évidence un ciblage discriminatoire des allocataires, à travers l’utilisation de critères (revenus faibles, résidence dans un quartier « défavorisé », bénéfice de l’Allocation Adulte Handicapé, etc.) qui aggravent le score de risque attribué à chaque individu. Or c’est à partir de ce score que sont ensuite déclenchés les contrôles44. Avec d’autres associations, elle a saisi le Conseil d’État à l’automne 2024 pour faire abroger la décision de la CNAF de mettre en œuvre le traitement algorithmique donnant lieu au calcul d’un score de risque pour chaque allocataire45. Cette affaire a mis en évidence de manière concrète les biais discriminatoires potentiellement à l’œuvre dans les algorithmes publics fonctionnant à partir de techniques de datamining.
S’agissant du projet CFVR de la DGFiP, si les critères déployés ne sont sans doute pas les mêmes, les risques de biais sont bien réels. Un haut responsable du ministère des Finances a pu reconnaître l’insuffisance des données d’entraînement, faisant sans doute échapper au système les cas de fraude davantage atypiques46. À défaut de contrôles aléatoires, tels que ceux réalisés par la CNAF pour couvrir l’ensemble du tissu des allocataires47, les données d’entraînement sont susceptibles de refléter des disparités de traitement préalables, ou tout du moins des priorités sous-jacentes. Ainsi, par exemple, si les contrôles ciblent davantage certains quartiers ou certains types de fraude, l’algorithme pourrait reproduire ce schéma48, ce qui poserait une question d’égalité de traitement, mais aussi d’égalité devant l’impôt. En effet, si l’on admet que les contrôles ont un effet dissuasif, la moindre probabilité d’être contrôlé pourrait laisser se développer des schémas de fraude restant indétectés. En pratique, certains contribuables seraient donc davantage astreints à l’impôt que d’autres. Par ailleurs, il n’y a aucune raison que l’algorithme de détection de la fraude fiscale échappe au phénomène de la boucle de rétroaction49. Sur le terrain, les agents de la DGFiP qui reçoivent les listes DM relèvent de nombreuses erreurs et la difficulté de l’algorithme à retracer les schémas de fraude les plus complexes50. Ils constatent aussi que l’algorithme tend à délaisser certains types de contribuables ou au contraire à en cibler d’autres, sans qu’il soit possible d’en comprendre la raison. Seraient par exemple ciblés de manière prépondérante les contribuables d’origine portugaise disposant d’un compte à l’étranger51.
En tout état de cause, il ne semble pas exister de mécanisme interne ou externe destiné à prévenir les biais, en dépit de propositions en ce sens par des syndicats du personnel52, mais aussi par des parlementaires53. Dans ses délibérations les plus récentes, la CNIL met elle aussi en garde contre les risques de biais. Elle recommande des formations à destination des agents chargés de la programmation et des contrôles afin de s’assurer qu’ils maîtrisent les principes des algorithmes utilisés. Elle préconise également la production d’une documentation sur le risque de biais algorithmiques discriminatoires et la mise en place de « mesures et de tests afin d’avoir un suivi continu des performances et des évolutions des algorithmes à des fins d’analyse proactive permettant de mettre à jour l’émergence de tels biais »54. La formulation de ces recommandations par la CNIL au milieu des années 2020 confirme l’insuffisance persistante des mesures adoptées par la DGFiP pour garantir l’absence de biais discriminatoires, et ce alors même que l’expérimentation lancée il y a une dizaine d’années a été pérennisée et considérablement étendue depuis. La fuite en avant technologique ne s’est ainsi pas accompagnée de garde-fous à même de prévenir les dérives potentielles de l’algorithme.
Il pourrait être objecté que l’algorithme ne constitue qu’un outil d’aide à la décision et qu’il ne se substitue en aucun cas à l’agent humain chargé du contrôle. Il est vrai qu’il n’est pas question ici d’automatiser complètement la programmation du contrôle et encore moins la décision administrative qui suivra le contrôle. Il n’en demeure pas moins que la fourniture de « listes DM » produites par l’algorithme s’accompagne de biais spécifiques, distincts du biais interne à l’algorithme. Ces biais ont cette fois à voir avec l’interaction entre l’humain et la machine. Deux types de biais existent à cet égard : un biais d’ancrage et un biais d’automatisation. Le premier renvoie à « l’incapacité ou la difficulté de l’agent à se départir de la ‘première impression’ que lui fournit le système, s’il intervient en amont ». Le second désigne « la tendance de l’humain à faire davantage confiance aux résultats produits par la machine qu’à son propre jugement et, ainsi, à avaliser de façon systématique ou excessive les recommandations qu’elle formule ». Cette tendance est exacerbée par le manque de temps mais aussi et surtout de formation des agents, s’agissant tant du fonctionnement de l’algorithme que des risques de biais qu’il comporte. De ce fait, le Conseil d’État a pu souligner le brouillage potentiel entre décision automatisée et outil d’aide à la décision. Les deux biais mentionnés peuvent conduire les agents à un « enfermement cognitif », qui leur fait perdre la capacité à détecter les erreurs. Un système qui aiguille les contrôles est susceptible de « confirme[r] les catégories de fraudeurs en suspectant naturellement ceux déjà convaincus de fraude, en reproduisant le passé et en supprimant toute (laborieuse) curiosité »55. D’où l’enjeu crucial du contrôle humain de l’algorithme56.
Au-delà des préoccupations quant aux dérives et à l’insuffisance des garanties de nature à les prévenir, on peut finalement s’interroger sur l’extension et la pérennisation du dispositif du point de vue de sa supposée rentabilité. Malgré la promesse d’efficacité maintes fois réitérée, le bilan demeure pour l’instant mitigé. Sur le terrain, les agents sont confrontés à de nombreuses erreurs dans les « listes DM », de sorte que le traitement algorithmique aurait plutôt tendance à augmenter leur charge de travail, et ce dans un contexte généralisé de baisse des effectifs57. Aucune évaluation n’existe à ce jour quant à l’impact du croisement des données en masse sur le temps consacré par les agents à chaque dossier58. En outre, les agents notent une difficulté de l’algorithme à retracer les schémas de fraude les plus élaborés59, alors même que l’outil est parfois justement brandi comme un outil indispensable face aux fraudes les plus sophistiquées60. Enfin, au plan comptable, les gains de productivité sont incertains. L’absence d’estimation statistique de la fraude fiscale en France rend impossible toute évaluation sérieuse de l’efficacité du dispositif61. Les seules données disponibles ne permettent pas d’établir la valeur ajoutée du projet CFVR62. Si plus de la moitié des contrôles sont désormais déclenchés à partir des listes générées par l’algorithme, ces contrôles représentent moins de 15% des sommes mises en recouvrement en 202363. La Cour des comptes relève par ailleurs que le « taux de pertinence du croisement en masse » n’était que « légèrement supérieur à celui de l’ensemble des contrôles » entre 2016 et 202164. En tout état de cause, en dépit des risques considérables pour les droits fondamentaux des contribuables65, l’absence de véritable évaluation de l’aptitude de l’algorithme à atteindre les objectifs escomptés n’a pas empêché le déploiement du projet CFVR. Cette fuite en avant s’est doublée d’une collecte massive des données des contribuables à partir des années 2020, là encore sans certitude aucune quant à la réalisation des gains espérés.
B – La collecte massive des données des contribuables
Afin de faire fonctionner le traitement algorithmique prévu par le projet CFVR, l’administration fiscale a besoin d’une grande quantité de données des contribuables. À cette fin, elle a été autorisée à collecter massivement des données en ligne (webscraping). Ce moissonnage de données à grande échelle présente là encore d’importants risques d’atteinte aux droits et libertés des personnes concernées. Dès l’automne 2018, le législateur avait obligé les plateformes d’économie collaborative à transmettre annuellement à l’administration fiscale un récapitulatif des opérations réalisées par les utilisateurs des sites concernés66. Un an plus tard, l’article 154 de la loi n° 2019-1479 du 28 décembre 2019 de finances pour 2020 autorisait l’administration fiscale, à titre expérimental et pour une durée de trois ans, à collecter et exploiter les contenus « librement accessibles sur les sites Internet des opérateurs de plateforme en ligne » et « manifestement rendus publics par leurs utilisateurs », en particulier pour la détection d’activités occultes ou de fausses domiciliations fiscales à l’étranger.
En amont, la CNIL s’était montrée critique. Saisie en urgence sur le dispositif introduit dans le projet de loi de finances, elle notait d’emblée un « changement d’échelle significatif dans le cadre des prérogatives confiées » à l’administration fiscale pour l’exercice de ses missions. Elle relevait « une forme de renversement des méthodes de travail des administration visées ainsi que des traitements auxquels elles ont recours pour lutter contre la fraude ». En effet, il ne s’agissait plus du traitement ciblé de données à partir d’un doute ou de suspicions de commission d’une infraction, mais d’une « collecte générale préalable de données relatives à l’ensemble des personnes rendant accessibles des contenus sur les plateformes en ligne visées, en vue de cibler des actions ultérieures de contrôle lorsque le traitement de ces données aura fait apparaître un doute ». En outre, la CNIL mettait en avant un risque d’atteinte à la liberté d’opinion et d’expression, dès lors que « la collecte de l’ensemble des contenus librement accessibles publiés sur internet est susceptible de modifier, de manière significative, le comportement des internautes qui pourraient alors ne plus être en mesure de s’exprimer librement sur les réseaux et plateformes visés et, par voie de conséquence, de rétroagir sur l’exercice de leurs libertés ». Enfin, elle mettait en garde contre les atteintes particulièrement importantes au droit au respect de la vie privée et à la protection des données à caractère personnel. De telles atteintes ne pourraient être tolérées qu’à condition de « pouvoir garantir la stricte proportionnalité des données collectées au regard de la finalité poursuivie par le traitement mis en œuvre ainsi que du dispositif dans son ensemble, sans qu’à ce stade, celle-ci ne soit assurée »67.
Appelé à se prononcer sur la disposition et sur les atteintes aux libertés déjà relevées par la CNIL, le Conseil constitutionnel a validé la quasi-totalité du dispositif. Il reconnaît une atteinte importante au droit au respect de la vie privée puisqu’il est notamment question « de collecter de façon indifférenciée d’importants volumes de données, relatives à un grand nombre de personnes » publiées sur les sites Internet des opérateurs de plateforme de mise en relation de plusieurs parties en vue de la vente d’un bien, de la fourniture d’un service ou de l’échange ou du partage d’un contenu, d’un bien ou d’un service. Cependant, il considère que le législateur a opéré une « conciliation qui n’est pas déséquilibrée » entre le droit au respect de la vie privée et l’objectif de valeur constitutionnelle de lutte contre la fraude et l’évasion fiscales68. S’il met en avant des garanties mises en place par le législateur, il estime qu’il appartiendra « au pouvoir réglementaire, sous le contrôle du juge, de veiller à ce que les algorithmes utilisés par ces traitements ne permettent de collecter, d’exploiter et de conserver que les données strictement nécessaires à ces finalités »69. Il s’en remet donc finalement à d’autres autorités – administratives et juridictionnelles –, tout en leur témoignant d’une confiance aveugle, pour assurer le respect effectif du droit à la vie privée70. S’agissant de la liberté d’expression et de communication, il relève que le dispositif était susceptible de « dissuader d’utiliser [les] services [concernés] ou de conduire à en limiter l’utilisation »71 et donc d’y porter atteinte. Il conclut néanmoins sans véritable motivation à une atteinte nécessaire, adaptée et proportionnée aux objectifs poursuivis.
Un nouveau cap a été franchi à l’automne 2023. L’article 112 de la loi n° 2023-1322 du 29 décembre 2023 de finances pour 2024 prolonge l’expérimentation pour une durée supplémentaires de deux ans et en élargit le champ. D’une part, le moissonnage des données est étendu à la recherche des infractions tenant à la minoration ou à la dissimulation de recettes. D’autre part et surtout, le dispositif est désormais étendu aux réseaux sociaux et n’est plus limité aux contenus accessibles sans inscription préalable à un compte. Il devient donc possible pour l’administration fiscale de créer et d’utiliser un compte sur les plateformes et réseaux concernés en vue d’une collecte sensiblement élargie des données. Ce dernier point apparaît en contradiction avec la décision du Conseil constitutionnel du 27 décembre 2019. Parmi les garanties permettant d’assurer une conciliation « non déséquilibrée » entre le droit au respect de la vie privée et l’objectif de valeur constitutionnelle de lutte contre la fraude et l’évasion fiscales, le Conseil avait mis en avant le fait que n’étaient pas susceptibles d’être collectés et exploités les contenus accessibles seulement après saisie d’un mot de passe ou après inscription sur le site en cause72. Si la nouvelle disposition n’a pas été déférée au Conseil et celui-ci n’a pas jugé bon de relever d’office la difficulté, la CNIL a considéré, en amont de l’adoption du projet de loi de finances, que la collecte élargie des données n’était pas suffisamment encadrée.
Plus généralement, elle a de nouveau regretté devoir se prononcer dans l’urgence et a déploré l’évaluation insuffisante de l’expérimentation initiée quelques années auparavant. Alors qu’il s’agissait d’étendre et de prolonger le dispositif, le bilan définitif de l’expérimentation ne lui avait pas été transmis et le bilan intermédiaire s’avérait largement insuffisant73. Près d’un an plus tard, alors appelée à se prononcer sur le projet de décret d’application, la CNIL n’avait reçu qu’un bilan sommaire, dont elle soulignait qu’il « ne comporte pas d’éléments d’analyse qui auraient permis d’apprécier l’efficience du dispositif, ainsi que la proportionnalité entre l’objectif poursuivi (le renforcement de l’efficacité dans la lutte contre la fraude) et l’atteinte aux libertés individuelles »74. Malgré cette carence majeure, le décret d’application a été adopté in extremis le 31 décembre 2024 pour assurer la continuité du dispositif et sa nouvelle extension75. Il est difficile de ne pas à y voir, là aussi, une véritable fuite en avant technologique, qui s’auto-entretient en justifiant chaque nouvelle atteinte aux droits et libertés par de nouveaux gains espérés, pourtant illusoires jusqu’à preuve du contraire76. Face à l’utilisation croissante de l’intelligence artificielle, toujours plus gourmande en données, à des fins de détection de la fraude fiscale, le nouveau cadre juridique européen apporte-t-il des garanties susceptibles de préserver les libertés individuelles ?
II – Les apports incertains du règlement européen sur l’intelligence artificielle
L’adoption définitive du règlement européen établissant des règles harmonisées concernant l’intelligence artificielle (RIA) le 13 juin 2024 marque une étape décisive dans l’évolution du cadre juridique applicable aux systèmes d’intelligence artificielle. Pour autant, les obligations qu’il met à la charge des fournisseurs et déployeurs des systèmes d’intelligence artificielle « à haut risque » sont-elles de nature à renforcer la protection des droits des contribuables face à l’algorithme français de détection de la fraude fiscale ? Rien n’est hélas moins sûr. D’une part, la classification de cet algorithme comme étant à haut risque est loin d’être assurée, alors même qu’elle conditionne l’application de la plupart des obligations mises en place par le règlement européen (A.). D’autre part, si ces obligations revêtent un intérêt indéniable pour la protection des droits des contribuables, le cadre juridique repose avant tout sur une logique de régulation, voire d’autorégulation, ce qui pourrait en limiter l’effectivité (B.). Les apports du RIA demeurent donc tout à fait incertains à ce stade.
A – La classification délicate du système d’intelligence artificielle
Ainsi que cela a été établi en introduction, l’algorithme mis en place par le projet CFVR constitue un système d’intelligence artificielle (SIA) au sens du RIA. Il rentre également sans difficulté dans le champ d’application du texte puisque le déployeur du système – l’administration fiscale française – se situe dans l’Union européenne77. La question se pose ensuite de savoir à quelle catégorie de SIA correspond l’algorithme de détection de la fraude fiscale. S’agissant d’une réglementation inédite, la classification est particulièrement délicate. Le RIA distingue plusieurs catégories de SIA, en fonction des risques qu’ils sont réputés poser. Trois catégories sont susceptibles de s’appliquer en l’espèce : les usages interdits (en raison de risques inacceptables), les SIA à haut risque et les SIA à risque minimal.
L’article 5 du RIA interdit d’abord toute une série de pratiques, dont deux méritent ici d’être mentionnées. La première concerne la notation sociale, c’est-à-dire la « la mise sur le marché, la mise en service ou l’utilisation de systèmes d’IA pour l’évaluation ou la classification de personnes physiques ou de groupes de personnes au cours d’une période donnée en fonction de leur comportement social ou de caractéristiques personnelles ou de personnalité connues, déduites ou prédites, la note sociale conduisant à l’une ou l’autre des situations suivantes, ou aux deux: i) le traitement préjudiciable ou défavorable de certaines personnes physiques ou de groupes de personnes dans des contextes sociaux dissociés du contexte dans lequel les données ont été générées ou collectées à l’origine; ii) le traitement préjudiciable ou défavorable de certaines personnes ou de groupes de personnes, qui est injustifié ou disproportionné par rapport à leur comportement social ou à la gravité de celui-ci ».
L’interdiction de telles pratiques pourrait trouver à s’appliquer à un algorithme de détection de fraude fiscale, en particulier si celui-ci devait conduire à accorder un traitement préjudiciable ou défavorable sur le fondement de critères arbitraires – voire discriminatoires78 – tenant au comportement social ou à des caractéristiques personnelles, sans véritable lien avec la fraude fiscale. Cela dépendra notamment des données sur lesquelles s’appuie l’algorithme de détection de la fraude. Si l’on s’en remet aux lignes directrices de la Commission européenne, qui envisagent l’exemple spécifique d’un algorithme utilisé pour sélectionner les contribuables qui feront l’objet d’un contrôle approfondi, l’interdiction ne touchera que l’exploitation de « données dissociées », telles que les habitudes sociales des contribuables ou leurs connexions internet, et non l’exploitation de « variables pertinentes », telles que les revenus annuels, les actifs ou encore les données sur les membres de la famille des bénéficiaires79.
Un second usage interdit concerne la prédiction des infractions pénales, c’est-à-dire « la mise sur le marché, la mise en service à cette fin spécifique ou l’utilisation d’un système d’IA pour mener des évaluations des risques des personnes physiques visant à évaluer ou à prédire le risque qu’une personne physique commette une infraction pénale, uniquement sur la base du profilage d’une personne physique ou de l’évaluation de ses traits de personnalité ou caractéristiques ». L’interdiction ne s’applique cependant pas aux « systèmes d’IA utilisés pour étayer l’évaluation humaine de l’implication d’une personne dans une activité criminelle, qui est déjà fondée sur des faits objectifs et vérifiables, directement liés à une activité criminelle ». Pour que l’algorithme de détection de la fraude fiscale rentre dans le cadre de l’usage interdit, il faudrait donc qu’il s’appuie exclusivement sur le profilage de personnes physiques80 ou l’évaluation des traits de personnalité ou caractéristiques (par exemple, la nationalité ou encore le lieu de résidence81), sans lien avec des faits objectifs et vérifiables liés à la fraude fiscale. Si ce n’est sans doute pas le scénario le plus probable82, on ne saurait exclure a priori un tel cas de figure.
À défaut de faire partie des usages interdits, le traitement algorithmique de détection de la fraude fiscale pourrait constituer un SIA à haut risque, ce qui l’assujettirait à une série d’obligations spécifiques sur lesquelles on reviendra. On est d’abord amené à envisager cette qualification au vu des risques considérables pour les droits fondamentaux des personnes visées. Pour qu’un SIA soit considéré comme à haut risque, il faut néanmoins qu’il fasse partie de l’une des deux catégories de systèmes mentionnées à l’article 6 du règlement. Seule la seconde est ici pertinente. Elle vise huit domaines, auxquels correspondent des cas d’usage spécifiques, listés à l’annexe III du règlement. Deux de ces domaines pourraient éventuellement être concernés par l’algorithme de détection de la fraude fiscale83.
Le premier est celui de « l’accès et du droit aux services privés essentiels et aux services publics et prestations sociales essentiels » (annexe III, paragraphe 5), qui comprend entre autres les « systèmes d’IA destinés à être utilisés par les autorités publiques ou en leur nom pour évaluer l’éligibilité des personnes physiques aux prestations et services d’aide sociale essentiels, y compris les services de soins de santé ainsi que pour octroyer, réduire, révoquer ou récupérer ces prestations et services ». La question peut éventuellement se poser de savoir si l’administration fiscale constitue un « service public essentiel », notion qui n’est pas définie par le règlement. D’un côté, la réponse peut apparaître relativement évidente, dès lors que l’administration fiscale se rattache aux missions régaliennes de l’État et que ce dernier ne peut exister et se maintenir sans budget et donc sans administration fiscale. D’un autre côté, la qualification de « service public essentiel » n’est pas nécessairement acquise, si on la rapproche de notions voisines préexistantes du droit de l’Union telle que celle de « service d’intérêt économique général » ou encore celle de « services sociaux d’intérêt général »84. Mais surtout, il ne s’agit pas la plupart du temps d’évaluer l’éligibilité des personnes à des prestations ou services d’aide sociale essentiels, à l’exception éventuelle de certains dispositifs de déductions fiscales ou de crédits d’impôts qui pourraient s’y apparenter.
Le second domaine éventuellement concerné par l’algorithme de la DGFiP est celui de « la répression, dans la mesure où [l’utilisation du SIA] est autorisée par le droit de l’Union ou le droit national applicable » (annexe III, paragraphe 6). Ce domaine englobe notamment les « systèmes d’IA destinés à être utilisés par les autorités répressives ou par les institutions, organes et organismes de l’Union, ou en leur nom, en soutien aux autorités répressives pour évaluer le risque qu’une personne physique commette une infraction ou récidive, sans se fonder uniquement sur le profilage des personnes physiques visé à l’article 3, paragraphe 4, de la directive (UE) 2016/680, ou pour évaluer les traits de personnalité, les caractéristiques ou les antécédents judiciaires de personnes physiques ou de groupes ». Le projet CFVR ne vise-t-il pas entre autres à évaluer le risque qu’une personne ait commis le délit de fraude fiscale85 ? La difficulté d’application réside ici dans le fait que le point 59 du préambule du règlement précise que « les systèmes d’IA spécifiquement destinés à être utilisés pour des procédures administratives par les autorités fiscales et douanières […] ne devraient pas être classés comme des systèmes d’IA à haut risque utilisés par les autorités répressives à des fins de prévention et de détection des infractions pénales, d’enquêtes et de poursuites en la matière ». Si cette exception n’est pas reprise à l’annexe III du règlement, il faut néanmoins en tenir compte dans l’interprétation du règlement. Or, l’exception posée par le point 59 du préambule semble indiquer que ce ne serait que dans l’hypothèse d’un usage à des fins exclusivement répressives que l’algorithme serait susceptible de rentrer dans le cas prévu par l’annexe III paragraphe 6. Une telle configuration ne manquerait pas de poser problème, dès lors que les champs administratif et pénal sont fortement imbriqués en matière de lutte contre la fraude fiscale. Le risque serait alors que les algorithmes de détection de la fraude fiscale, tel que celui de la DGFiP, ne soient jamais considérés comme des SIA à haut risque86.
À supposer même que l’algorithme du projet CFVR puisse rentrer dans l’un des domaines visés par l’annexe III, il pourrait encore se voir exclure de la catégorie des SIA à haut risque, en raison de l’exception prévue par l’article 6 paragraphe 3 du règlement, lorsque « le système d’IA est destiné à exécuter une tâche préparatoire en vue d’une évaluation pertinente aux fins des cas d’utilisation visés à l’annexe III ». Autrement dit, l’exclusion pourrait s’appliquer si l’algorithme sert de simple outil d’aide à la décision, comme c’est en principe le cas de celui de la DGFiP. Néanmoins, comme on a déjà eu l’occasion de le souligner, les biais d’ancrage et d’automatisation sont susceptibles de conduire à ce que l’algorithme soit suivi presque systématiquement par les agents chargés du contrôle fiscal. Il serait alors problématique d’exclure le système des SIA à haut risque, d’autant que ce type de SIA est justement soumis à une obligation spécifique de contrôle humain87. Faute d’être classifié comme un SIA à haut risque, l’algorithme de détection de la fraude fiscale basculerait dans la catégorie des SIA à risque minimal, non encadrés par le règlement européen sur l’intelligence artificielle.
En dernier lieu, il convient de souligner que c’est aux fournisseurs eux-mêmes qu’il incombe de décider de la classification du SIA. Selon l’article 6 paragraphe 4 du règlement, un fournisseur peut ainsi décider qu’un système visé à l’annexe III n’est pas à haut risque, à condition de documenter son évaluation avant la mise sur le marché ou la mise en service et de l’enregistrer dans une base de données européenne. Au vu des obligations qui pèsent sur les fournisseurs des SIA à haut risque, on comprend aisément comment ils pourraient souhaiter éviter une telle catégorisation. Il est certes possible pour l’autorité nationale de surveillance du marché, c’est-à-dire la CNIL en France pour ce qui est des activités répressives et des questions d’accès et droit aux services privés et publics essentiels88, de réévaluer ultérieurement la classification et d’exiger la mise en conformité avec le cadre applicable aux SIA à haut risque89. En cas de refus de l’opérateur de se conformer, l’autorité de surveillance peut même prendre « toutes les mesures provisoires appropriées pour interdire ou restreindre la mise à disposition du système d’IA sur son marché national ou sa mise en service »90. Le fournisseur peut également faire l’objet d’amendes s’il apparaît qu’il a classé le SIA comme n’étant pas à haut risque en vue de contourner les obligations pesant sur les SIA à haut risque91. Il n’en demeure pas moins qu’il s’agit d’un mécanisme purement réactif. De manière générale, le règlement européen sur l’intelligence artificielle repose avant tout sur une logique d’autorégulation, ce qui n’est pas sans interroger quant à l’effectivité du cadre juridique mis en place.
B – Un cadre inédit reposant avant tout sur l’autorégulation
Le règlement européen sur l’intelligence artificielle met en place un cadre juridique inédit. Au-delà du principe général de maîtrise de l’IA92, le règlement s’appuie sur une approche par les risques. La notion de risque se définit ici comme « la combinaison de la probabilité d’un préjudice et de la sévérité de celui-ci »93. En dehors des cas d’usage interdits, écartés en raison d’un niveau de risque inacceptable, il s’agit surtout de se prémunir contre les risques. Les obligations pesant sur les fournisseurs et les déployeurs des systèmes d’IA varient en fonction du niveau de risque. Les SIA à risque minimal ne font pas l’objet d’obligations particulières et peuvent être considérés comme n’étant pas soumis au règlement. Tout au plus les fournisseurs doivent-ils enregistrer et documenter, avant la mise sur le marché ou la mise en service, l’évaluation des SIA visés à l’annexe III, lesquels auraient pu être considérés comme étant à haut risque mais ne l’ont pas été94. Pour le reste, le règlement se contente, pour les SIA à risque minimal, d’encourager les acteurs à suivre des bonnes pratiques soutenues par des codes de conduite95. S’il devait être considéré comme un SIA à risque minimal, l’algorithme de détection de la fraude fiscale échapperait donc à la nouvelle réglementation européenne. D’où l’enjeu crucial de la classification du SIA, la catégorie des SIA à haut risque déclenchant quant à elle l’application d’une série d’obligations à la charge des fournisseurs et des déployeurs.
À supposer même que l’algorithme du projet CFVR puisse être considéré comme un SIA à haut risque, ce qui est loin d’être acquis au vu de l’analyse qui précède, le règlement européen sur l’intelligence artificielle apporterait-il un encadrement suffisant de la détection algorithmique de la fraude fiscale ? Le nouveau texte fait d’abord peser sur le fournisseur du SIA des exigences de gestion des risques, de gouvernance des données, de traçabilité, de transparence, de contrôle humain et de caractéristiques techniques d’exactitude, de robustesse et de cybersécurité96. Ces obligations revêtent de prime abord un intérêt certain pour prévenir d’éventuelles dérives de l’algorithme. En cas d’apprentissage machine, ce qui concerne donc le projet CFVR, le fournisseur doit garantir que les données d’entraînement, de validation et de test répondent à des critères de qualité. L’article 10 du règlement précise que « les jeux de données d’entraînement, de validation et de test sont pertinents, suffisamment représentatifs et, dans toute la mesure possible, exempts d’erreurs et complets au regard de la destination ». Une attention particulière doit être accordée aux biais susceptibles de porter atteinte aux droits fondamentaux des personnes visées et en particulier aux biais risquant de « se traduire par une discrimination interdite par le droit de l’Union, en particulier lorsque les données de sortie influencent les entrées pour les opérations futures ». Le fournisseur doit ainsi se montrer particulièrement vigilant à l’égard des boucles de rétroaction et des discriminations qu’elles sont susceptibles d’engendrer97. Il doit prendre des mesures appropriées en vue de détecter, prévenir et atténuer les éventuels biais. Pour ce faire, il est autorisé, à titre exceptionnel et sous de strictes conditions, à traiter des catégories particulières de données à caractère personnel. Des tests pourraient ainsi être menés afin de s’assurer que l’algorithme de détection de la fraude fiscale ne cible pas les contribuables de manière discriminatoire. Une telle évolution pourrait constituer un réel progrès, à condition que le fournisseur de l’algorithme s’en saisisse.
Le fournisseur doit en outre assurer une transparence suffisante de la conception et du développement du SIA « pour permettre aux déployeurs d’interpréter les sorties d’un système et de les utiliser de manière appropriée ». Cela se traduit par la fourniture d’une notice d’utilisation complète et compréhensible98. Enfin, les SIA, par leur conception et leur développement, doivent permettre « un contrôle effectif par des personnes physiques pendant leur période d’utilisation ». Le fournisseur doit notamment faire en sorte que les personnes physiques chargées du contrôle humain par le déployeur – en l’espèce, les agents habilités de la DGFiP – puissent comprendre les capacités et limites du SIA et être en mesure d’en surveiller correctement le fonctionnement, avoir conscience du biais d’automatisation, notamment pour les SIA fournissant des recommandations concernant des décisions à prendre – ce qui est le cas de l’algorithme de détection de la fraude fiscale –, être en mesure d’interpréter correctement les sorties du SIA à haut risque, à l’aide d’outils et de méthodes d’interprétation, ou encore décider de ne pas utiliser le SIA ou d’ignorer, remplacer ou inverser la sortie du SIA99.
Le déployeur du SIA à haut risque – ici la DGFiP – fait également l’objet d’obligations particulières. Il est notamment tenu de confier le contrôle humain du système à « des personnes physiques qui disposent des compétences, de la formation et de l’autorité nécessaires ainsi que du soutien nécessaire »100. Lorsqu’il exerce un contrôle sur les données d’entrée, ce qui est a priori le cas de la DGFiP, le déployeur doit s’assurer de leur pertinence et de leur représentativité suffisante au regard de la destination du SIA. Par ailleurs, en principe, lorsqu’un SIA à haut risque prend des décisions ou facilite les prises de décisions concernant des personnes physiques, le déployeur doit informer les personnes concernées qu’elles sont soumises à l’utilisation d’un SIA à haut risque. Cette obligation pourrait néanmoins ne pas s’appliquer au projet CFVR en raison d’une dérogation restrictive pour les SIA utilisés à des fins répressives101.
Enfin, les déployeurs qui sont des organismes de droit public doivent effectuer en amont du déploiement du SIA à haut risque une analyse de l’impact sur les droits fondamentaux102. Des acteurs de la société civile se sont inquiétés de ce que ne serait pas posée explicitement l’obligation de prévoir dans l’analyse d’impact les risques pour les droits fondamentaux des personnes concernées103. Ne seraient mentionnées, parmi d’autres éléments, que « les mesures à prendre en cas de matérialisation de ces risques ». Toutefois, l’article 27, §1, d) du règlement se réfère aux « risques spécifiques de préjudice susceptibles d’avoir une incidence sur les catégories de personnes physiques ou groupes de personnes [susceptibles d’être concernés par l’utilisation du SIA dans le contexte spécifique], compte tenu des informations fournies par le fournisseur conformément à l’article 13 ». Or cette dernière disposition prévoit que le fournisseur accompagne le SIA à haut risque d’une notice d’utilisation, qui doit notamment renseigner « toutes circonstances connues ou prévisibles liées à l’utilisation du système d’IA à haut risque conformément à sa destination ou dans des conditions de mauvaise utilisation raisonnablement prévisible, susceptibles d’entraîner des risques pour la santé et la sécurité ou pour les droits fondamentaux ». On peut en déduire qu’une évaluation complète des risques pour les droits fondamentaux doit bien être entreprise par les déployeurs104.
En revanche, si les résultats de l’analyse d’impact doivent être soumis à l’autorité de surveillance du marché, seule une synthèse des conclusions de l’analyse d’impact est entrée dans la base de données européenne publique recensant les SIA à haut risque. De plus, cette dernière obligation ne s’applique pas dans le domaine des activités répressives105. Dans ce cas précis, ne se trouve enregistré qu’un nombre limité d’informations (à l’exclusion de la synthèse de l’analyse d’impact), dans une section non publique de la base de données de l’Union. À supposer que l’algorithme de détection de la fraude fiscale se rattache au domaine répressif, ce ne serait donc pas seulement la synthèse de l’analyse d’impact mais toutes les informations relatives au SIA qui seraient soustraites au regard des citoyens et de la société civile. Ces derniers se trouveraient alors empêchés d’exercer un quelconque contrôle à l’égard d’un algorithme public pourtant susceptible d’engendrer d’importantes dérives106.
De manière générale, si les exigences renforcées pesant sur les SIA à haut risque présentent un intérêt indéniable, y compris en ce qui concerne l’algorithme de détection de la fraude fiscale, d’importantes limites doivent encore être soulignées. Premièrement, à supposer que l’algorithme du projet CFVR soit classifié comme un SIA à haut risque, la réglementation européenne ne lui sera sans doute pas appliquée dans l’immédiat107. S’agissant d’un SIA mis en service avant le 2 août 2026, date d’entrée en vigueur du règlement, la mise en conformité ne devra intervenir qu’en cas d’importantes modifications de sa conception. Néanmoins, s’agissant aussi d’un SIA utilisé par une autorité publique, le fournisseur et le déployeur devront prendre les mesures nécessaires pour se conformer au règlement d’ici l’été 2030108. Le fait de retarder de quatre années l’application du règlement à un algorithme public d’une telle envergure paraît problématique au vu des risques majeurs de biais discriminatoires, surtout si l’on tient compte de la volonté de l’administration fiscale d’automatiser toujours plus la détection de la fraude fiscale.
La deuxième limite, plus conséquente et pérenne, tient au fait que c’est avant tout sur les fournisseurs et les déployeurs eux-mêmes que repose le règlement, dans une logique de régulation, voire d’autorégulation. En effet, les fournisseurs classifient eux-mêmes le SIA et sont ensuite chargés, en fonction de cette classification, d’en assurer la conformité avec les grands principes fixées par le règlement109. Destiné à faciliter les innovations technologiques, ce choix majeur a pour conséquence de confier aux acteurs du marché eux-mêmes le soin d’arbitrer entre leurs propres intérêts et les droits fondamentaux, ce qui constitue assurément un « pari risqué »110. Il existe certes un régime de sanctions potentiellement lourdes111 ainsi que des mécanismes de surveillance du marché, qui reposent notamment sur l’introduction de réclamations par des personnes physiques ou morales auprès de l’autorité compétente112. On peut néanmoins s’interroger sur la capacité de ces mécanismes à freiner la fuite en avant algorithmique et à empêcher les dérives. En tout état de cause, il s’agit dans une large mesure d’assurer le respect de garanties procédurales et formelles à la charge des fournisseurs et des déployeurs113. De telles garanties, parfois assez vagues et dont les destinataires s’acquitteront souvent à l’abri du regard citoyen, seront-elles de nature à prévenir les atteintes substantielles aux droits fondamentaux que peuvent engendrer les systèmes d’intelligence artificielle ? Ne faudrait-il pas imposer, pour les algorithmes publics de grande ampleur notamment, l’organisation périodique et obligatoires d’audits par des tiers habilités114 ?
Le règlement européen sur l’intelligence artificielle élude enfin une question pourtant centrale : la démocratisation des algorithmes. Il serait souhaitable d’envisager une implication substantielle de toutes les parties prenantes, au-delà d’une simple approche de régulation par les risques. Au vu de l’enjeu prégnant d’égalité devant l’impôt que soulève la lutte contre la fraude fiscale, ne serait-il pas légitime que les citoyens aient voix au chapitre ? Est-il concevable qu’un pan de l’action publique, dans un domaine aussi essentiel que celui de l’impôt, soit gouverné par un instrument technique qui ne fait l’objet d’aucun débat démocratique et d’aucune concertation citoyenne ? Se pose ainsi l’enjeu de la réappropriation collective de la gouvernance algorithmique. Afin de faire « entrer la société dans les calculs » 115, il conviendrait de mettre en place des mécanismes de participation du public, qui pourraient prendre la forme de commissions ou de jurys d’usagers, ou encore de conventions citoyennes116. Les modalités concrètes de la délibération citoyenne restent à inventer, en tenant compte des spécificités d’un algorithme de lutte contre la fraude.
1 Lilian Alemagna, « Fraude fiscale : le fisc va s’intéresser aux réseaux sociaux », Libération, 11 nov. 2018.
2 Aux termes de l’article 1741 du code général des impôts, se rend coupable du délit de fraude fiscale « quiconque s’est frauduleusement soustrait ou a tenté de se soustraire frauduleusement à l’établissement ou au paiement total ou partiel des impôts visés dans la présente codification, soit qu’il ait volontairement omis de faire sa déclaration dans les délais prescrits, soit qu’il ait volontairement dissimulé une part des sommes sujettes à l’impôt, soit qu’il ait organisé son insolvabilité ou mis obstacle par d’autres manœuvres au recouvrement de l’impôt, soit en agissant de toute autre manière frauduleuse ».
3 Conseil d’État, Intelligence artificielle et action publique : construire la confiance, servir la performance, 2022 ; Défenseur des droits, Algorithmes, systèmes d’IA et services publics : quels droits pour les usages ? Points de vigilance et de recommandations, 2024. L’Observatoire des algorithmes publics en recense 120 en novembre 2025 (https://odap.fr/inventaire/).
4 Cons. const., décision n° 99-424 DC du 29 déc. 1999, Loi de finances pour 2000, cons. 52.
5 Faute d’estimation officielle, v. p. ex. Solidaires Finances Publiques, Quand la baisse des moyens du contrôle fiscal entraîne une baisse de sa présence… Chute inquiétante de la couverture du tissu économique et fiscal, sept. 2028. L’organisation syndicale chiffre l’évitement illégal de l’impôt (fraude et évasion fiscales) à au moins 80 milliards d’euros.
6 DGFiP, Les Finances publiques. Au cœur de l’État, au service de tous, partout sur le territoire, rapport d’activité 2024, juin 2025. Ce volontarisme doit sans doute être nuancé. Ainsi que le note la Cour des comptes dans un rapport récent, « à rebours de l’intention affichée par le législateur, la fraude fiscale n’est ni plus fréquemment, ni plus durement sanctionnée qu’il y a dix ans » (La lutte contre la fraude fiscale, déc. 2025, p. 7).
7 OCDE, Gouverner avec l’intelligence artificielle. État des lieux et perspectives pour les fonctions essentielles de l’État, pp. 191 et s.
8 La CNIL a récemment confirmé que le projet CFVR reposait bien sur une phase préalable d’apprentissage machine (délibération n° 2024-081 du 14 nov. 2024, NOR : CNIX2434790V).
9 Règlement (UE) 2024/1689 du Parlement européen et du Conseil du 13 juin 2024 établissant des règles harmonisées concernant l’intelligence artificielle (RIA).
10 L. Feiler, B. König, « Article 3: Definitions », in C. Necati Pehlivan, N. Forgó, P. Valcke (dir.), The EU Artificial Intelligence (AI) Act: A Commentary, Wolters Kluwer, 2025, pp. 48-85, spéc. p. 59.
11 P. Türk, « L’intelligence artificielle et les risques pour les libertés fondamentales », RFDA 2025 p. 28.
12 S. Le Normand-Caillère, « Algorithmes et droit fiscal : is big brother taxing you ? », in V. Barbé, S. Mauclair (dir.), Vers un droit de l’algorithme ?, Mare & Martin, coll. « Droit & science politique », 2022, pp. 27-36 ; C. Lequesne-Roth, « La science des données numériques au service du contrôle fiscal français. Réflexions sur l’Algocratie », in A. Pariente (dir.), Les chiffres en finances publiques, Mare & Martin, coll. « Droit et gestions publiques », 2019, pp. 177-193 ; Id., « La lutte contre la fraude à l’ère digitale. Les enjeux du recours à l’intelligence artificielle par l’administration financière », Revue de droit fiscal, n° 5, 4 févr. 2021, pp. 1-3 ; M. Kimri, P. Legros, « Le régime juridique du contrôle fiscal algorithmique. De l’expérimentation à l’encadrement du recours aux dispositifs algorithmiques fiscaux », Revue de droit fiscal, n° 5, 4 févr. 2021, pp. 1-5.
13 Art. 2 de l’arrêté du 21 février 2014 portant création par la direction générale des finances publiques d’un traitement automatisé de lutte contre la fraude dénommé « ciblage de la fraude et valorisation des requêtes », JORF n° 0055 du 6 mars 2014, texte n° 34.
14 Arrêté du 28 août 2017, JORF n° 0265 du 14 nov. 2017, NOR : CPAE1728989A ; arrêté du 12 novembre 2019, JORF n° 0278 du 30 nov. 2019, NOR : CPAE1932957A.
15 Délibération n° 2015-186 du 25 juin 2015, NOR : CNIX1522371X.
16 Ibid.
17 Délibération n° 2014-045 du 30 janv. 2014, NOR : CNIX1405066X.
18 Assemblée nationale, « Rapport d’information déposé en application de l’article 146 du Règlement par la Commission des finances, de l’économie générale et du contrôle budgétaire sur l’usage des nouvelles technologies dans le contrôle fiscal et présenté par Charlotte Leduc », n° 2742, 6 juin 2024, p. 19.
19 Solidaires Finances Publiques, L’intelligence artificielle aux impôts. Réflexions et actions syndicales, Editions Syllepse, coll. « Les utopiques », 2024, p. 48.
20 A. Spire, Faibles et puissants face à l’impôt, Raisons d’agir, 2012, p. 75.
21 Cour des comptes, La détection de la fraude fiscale des particuliers. Une incontestable modernisation des méthodes, des résultats encore insuffisants, nov. 2023, p. 27
22 Ibid., p. 15.
23 A. Spire, Faibles et puissants face à l’impôt, op. cit.
24 V. en ce sens C. Lequesne-Roth, « La lutte contre la fraude à l’ère digitale… », op. cit., p. 3 ; S. Le Normand-Caillère, « Algorithmes et droit fiscal : is big brother taxing you ? », in V. Barbé, S. Mauclair (dir.), Vers un droit de l’algorithme ?, Mare & Martin, coll. « Droit & science politique », 2022, pp. 27-36, spéc. p. 35.
25 On reviendra dans la prochaine sous-partie sur cette collecte massive de données, qui suscite ses propres questionnements.
26 C. Lequesne-Roth, « La lutte contre la fraude à l’ère digitale… », op. cit., p. 3.
27 C. Lequesne-Roth, « La science des données numériques au service du contrôle fiscal français… », op. cit., p. 188-189
28 C. Lequesne-Roth, « La lutte contre la fraude à l’ère digitale… », op. cit., p. 3. La norme n’est ainsi plus le droit lui-même et ses règles, mais l’algorithme ou le code, qui prend le pas sur le droit. V. à ce sujet D. Restrepo Amariles, « Algorithmic Decision Systems: Automation and Machine Learning in the Public Administration », in W. Barfield (dir.), The Cambridge Handbook of the Law of Algorithms, Cambdrige University Press, 2021, pp. 273-300, spéc. pp. 297-298.
29 Pour une analyse à ce sujet, v. M. Kimri, P. Legros, « Le régime juridique du contrôle fiscal algorithmique. De l’expérimentation à l’encadrement du recours aux dispositifs algorithmiques fiscaux », op. cit., spéc. p. 4.
30 V. en ce sens L. Cluzel-Métayer, « Intelligence artificielle et décision administrative », in A. Bensamoun, G. Loiseau (dir.), Droit de l’intelligence artificielle, LGDJ, coll. « Les intégrales », 2e éd., 2022, pp. 505-524, spéc. p. 521.
31 Solidaires Finances Publiques, L’intelligence artificielle aux impôts…, op. cit., p. 74.
32 Dans son premier avis sur le projet CFVR en 2014, la CNIL révélait qu’elle « ne dispos[ait] d’aucun élément sur le fonctionnement du traitement lui-même ». Elle demandait en conséquence un bilan détaillé à l’issue de l’expérimentation, avant toute généralisation du dispositif (délibération n° 2014-045 du 30 janv. 2014, NOR : CNIX1405066X). Cinq ans plus tard, elle « regrett[ait] que le bilan de l’expérimentation ne contienne pas la liste précise des critères caractéristiques du risque de fraude » (délibération n° 2019-115 du 12 sept. 2019, NOR : CNIX1933314X).
33 Sur les biais algorithmiques, v. de manière générale R. Pons, L. Risser, « Biais et discriminations dans les systèmes d’intelligence artificielle », Dalloz IP/IT, n° 2, 19 févr. 2022, pp. 75-78.
34 C. O’Neil, Algorithmes. La bombe à retardement, Les Arènes, 2018, p. 40 ; H. Guillaud, Les algorithmes contre la société, La Fabrique, 2025, p. 28.
35 Au vu de l’opacité du dispositif, il est difficile de savoir si le projet CFVR repose sur l’apprentissage automatique non supervisé.
36 Sénat, IA, impôts, prestations sociales et lutte contre la fraude, rapport d’information fait au nom de la délégation sénatoriale à la prospective par Didier Rambaud et Sylvie Vermeillet, n° 491, 2 avril 2024, pp. 48 et 78.
37 Cf. infra pour des exemples concrets.
38 Sur le sujet, v. p. ex. Agence de l’Union européenne pour les droits fondamentaux, Bias in Algorithms: Artificial Intelligence and Discrimination, 2022, pp. 29 et s. ; Défenseur des droits, Algorithmes : prévenir l’automatisation des discriminations, 2020, p. 6.
39 Ibid. ; V. Eubanks, Automating Inequality: How High-Tech Tools Profile, Police and Punish the Poor, Picador, 2018.
40 Pour divers exemples, v. entre autres C. O’Neil, Algorithmes…, op. cit. ; V. Eubanks, Automating Inequality…, op. cit. ; H. Guillaud, Les algorithmes contre la société, op. cit. ; H. Pauliat, « L’intelligence artificielle et les risques de rupture d’égalité dans l’accès aux droits et aux services publics », RFDA 2025 p. 45.
41 D. Hadwick, S. Lan, « Lessons to Be Learned from the Dutch Childcare Allowance Scandal: A Comparative Review of Algorithmic Governance by Tax Administrations in the Netherlands, France and Germany », World Tax Journal, vol. 2021, n° 4, nov. 2021, pp. 609-645 ; Amnesty International, Xenophobic Machines: Discrimination Through Unregulated Use of Algorithms in the Dutch Childcare Benefits Scandal, 25 oct. 2021, EUR 35/4686/2021.
42 Défenseur des droits, Lutte contre la fraude aux prestations sociales : à quel prix pour les droits des usagers ?, sept. 2017, p. 21.
43 H. Guillaud, Les algorithmes contre la société, op. cit., pp. 41-46.
44 La Quadrature du Net, « Notation des allocataires : l’indécence des pratiques de la CAF désormais indéniable », 27 nov. 2023, https://www.laquadrature.net/2023/11/27/notation-des-allocataires-lindecence-des-pratiques-de-la-caf-desormais-indeniable/. V. aussi G. Geiger, S. Pénicaud, M. Romain, A. Sénécat, « Profilage et discriminations : enquête sur les dérives de l’algorithme des caisses d’allocations familiales », Le Monde, 4 déc. 2023, https://www.lemonde.fr/les-decodeurs/article/2023/12/04/profilage-et-discriminations-enquete-sur-les-derives-de-l-algorithme-des-caisses-d-allocations-familiales_6203796_4355770.html.
45 La Quadrature du Net, « L’algorithme de notation de la CNAF attaqué devant le Conseil d’État par 15 organisation », 16 oct. 2024, https://www.laquadrature.net/2024/10/16/lalgorithme-de-notation-de-la-cnaf-attaque-devant-le-conseil-detat-par-15-organisations/.
46 Solidaires Finances Publiques, L’intelligence artificielle aux impôts…, op. cit., p. 23.
47 Cour des comptes, La détection de la fraude fiscale des particuliers…, préc., p. 68.
48 S. Ellouze, « Quand les algorithmes révolutionnent les méthodes d’investigation fiscale », in C. Derave, B. Frydman, N. Genicot (dir.), L’intelligence artificielle face à l’État de droit, Bruylant, coll. « Penser le droit », pp. 265-298, spéc. p. 288.
49 C. Lequesne-Roth, « La science des données numériques au service du contrôle fiscal français… », op. cit., p. 191.
50 Solidaires Finances Publiques, L’intelligence artificielle aux impôts…, op. cit., pp. 61-62.
51 Ibid., p. 59.
52 Ibid., p. 92.
53 Assemblée nationale, « Rapport d’information déposé en application de l’article 146 du Règlement par la Commission des finances, de l’économie générale et du contrôle budgétaire sur l’usage des nouvelles technologies dans le contrôle fiscal… », préc., p. 15.
54 CNIL, délibération n° 2023-150 du 14 déc. 2023, NOR : CNIX2430698X. V. aussi CNIL, délibération n° 2024-081 du 14 nov. 2024, NOR : CNIX2434790V.
55 Conseil d’État, Intelligence artificielle et action publique…, préc., p. 104. V. aussi Défenseur des droits, Algorithmes, systèmes d’IA et services publics…, préc., pp. 25-26. S’agissant plus spécifiquement de la détection de la fraude fiscale, v. C. Lequesne-Roth, « La science des données numériques au service du contrôle fiscal français… », op. cit., pp. 186-187 ; Solidaires Finances Publiques, L’intelligence artificielle aux impôts…, op. cit., p. 59.
56 Pour des réflexions à ce sujet, v. CNIL, Comment permettre à l’homme de garder la main ? Les enjeux éthiques des algorithmes et de l’intelligence artificielle, déc. 2017 ; W. Maxwell, Le contrôle humain des systèmes algorithmiques. Un regard critique sur l’exigence d’un « humain dans la boucle », mémoire d’HDR, Paris 1 – Panthéon-Sorbonne, 2022 ; N. Nevejans (dir.), Décision humaine, décision de l’IA. Analyses interdisciplinaires sur le contrôle humain des systèmes d’IA, Mare & Martin, coll. « Droit privé et sciences criminelles », 2025.
57 Solidaires Finances Publiques, L’intelligence artificielle aux impôts…, op. cit., pp. 52-53.
58 Cour des comptes, La lutte contre la fraude fiscale, préc., p. 42.
59 Solidaires Finances Publiques, L’intelligence artificielle aux impôts…, op. cit., p. 62.
60 Sénat, IA, impôts, prestations sociales et lutte contre la fraude, préc., p. 40.
61 Cour des comptes, La détection de la fraude fiscale des particuliers…, préc., p. 46.
62 Sénat, IA, impôts, prestations sociales et lutte contre la fraude, préc., p. 43.
63 Assemblée nationale, « Rapport d’information déposé en application de l’article 146 du Règlement par la Commission des finances, de l’économie générale et du contrôle budgétaire sur l’usage des nouvelles technologies dans le contrôle fiscal… », préc., p. 20.
64 Cour des comptes, La détection de la fraude fiscale des particuliers…, op. cit., pp. 55-56.
65 On pourrait aussi évoquer l’impact négatif sur les conditions de travail des agents de la DGFiP chargés du contrôle fiscal. V. à ce sujet Solidaires Finances Publiques, L’intelligence artificielle aux impôts…, op. cit.
66 Art. 10 de la loi n° 2018-898 du 23 oct. 2018 relative à la lutte contre la fraude.
67 CNIL, délibération n° 2019-114 du 12 sept. 2019.
68 Cons. const., décision n° 2019-796 DC du 27 déc. 2019, Loi de finances pour 2020, cons. 93.
69 Ibid., cons. 92.
70 En juillet 2022, le Conseil d’État a validé le décret du 11 février 2021 mettant en œuvre le nouveau dispositif, reprenant largement à son compte l’analyse du Conseil constitutionnel et s’en remettant cette fois à « l’administration, sous le contrôle de la [CNIL] et du juge » pour veiller à ce que des critères adéquats de collecte des données soient fixés, en vue d’éviter une collecte généralisée et indifférenciée de données à caractère personnel (CE, 22 juil. 2022, Association La Quadrature du Net, n° 451653).
71 Cons. const., décision n° 2019-796 DC du 27 déc. 2019, préc., cons. 83.
72 Ibid., cons. 87.
73 CNIL, délibération n° 2023-090 du 21 sept. 2023.
74 CNIL, délibération n° 2024-081 du 14 nov. 2024, préc.
75 Décret n° 2024-1274 du 31 déc. 2024, NOR : ECOE2429193D.
76 V. les chiffres indiqués à la fin de la première sous-partie.
77 Art. 2, §1, b) du RIA.
78 V. en ce sens E. J. Kindt, C. Jasserand, « Article 5: Prohibited AI Practices », in C. Necati Pehlivan, N. Forgó, P. Valcke (dir.), The EU Artificial Intelligence (AI) Act…, op. cit., pp. 105-192, spéc. p. 151.
79 Commission européenne, « Communication de la Commission : Lignes directrices de la Commission sur les pratiques interdites en matière d’intelligence artificielle au sens du règlement (UE) 2024/1689 (règlement sur l’IA) », C(2025) 5052 final, 29 juillet 2025, §166. Les « données dissociées » renvoient à des données « générées ou collectées dans des contextes sociaux dissociés de celui dans lequel la notation a lieu ».
80 Tel que défini par l’art. 4 du règlement général sur la protection des données (règlement (UE) 2016/679 du 27 avril 2016).
81 Point 42 du préambule du RIA. La Commission européenne mentionne quant à elle la double nationalité, le lieu de naissance et le nombre d’enfants, ou encore « des variables opaques, en particulier des informations déduites qui sont prédictives et qui ne sont donc pas objectives tout en étant difficiles à vérifier » (Commission européenne, « Communication de la Commission : Lignes directrices de la Commission sur les pratiques interdites… », préc., §202).
82 G. Roebling, B. Necula, « Reflections on Introducing Artificial Intelligence Tools in Support of Anti-Fraud », Eucrim, 2024/3, pp. 206-214, spéc. p. 211.
83 V. à cet égard l’analyse de D. Hadwick, « Slipping Through the Cracks, the Carve-Outs for AI Tax Enforcement Systems in the EU AI Act », European Papers, vol. 9, 2024, pp. 936-955, spéc. pp. 946 et s.
84 Ibid., pp. 953-954.
85 Jusqu’à l’automne 2024, l’art. 2 de l’arrêté du 21 févr. 2014 mentionnait explicitement comme but de l’algorithme le fait de « mener des actions de prévention, de recherche, de constatation ou de poursuite d’infractions pénales ». La CNIL considérait en 2019 que la finalité répressive pouvait être considérée comme prépondérante (délibération n° 2019-115 du 12 sept. 2019, préc.).
86 Pour une analyse détaillée en ce sens, v. D. Hadwick, « Slipping Through the Cracks… », op. cit., pp. 946-952.
87 Art. 14 du RIA.
88 Direction générale des entreprises, « Les autorités compétentes pour la mise en œuvre du règlement européen sur l’intelligence artificielle », 9 sept. 2025, https://www.entreprises.gouv.fr/priorites-et-actions/transition-numerique/soutenir-le-developpement-de-lia-au-service-de-0.
89 Art. 80 du RIA.
90 Art. 79, §5 du RIA.
91 Art. 80, §7 du RIA.
92 Art. 4 du RIA.
93 Art. 3, point 2 du RIA.
94 Art. 6, §4 du RIA.
95 Art. 95 du RIA.
96 Art. 9 à 15 du RIA.
97 V. aussi l’art. 15 du RIA.
98 Art. 13 du RIA.
99 Art. 14 du RIA.
100 V. spéc. l’art. 26 du RIA.
101 À ces SIA s’applique l’art. 13 de la directive (UE) 2016/680 du 27 avril 2016.
102 Art. 27 du RIA.
103 Pour une critique en ce sens, v. la déclaration conjointe d’une coalition d’organisations non gouvernementales (ONG) : « EU’s AI Act fails to set gold standard for human rights », 3 avril 2024, https://algorithmwatch.org/en/ai-act-fails-to-set-gold-standard-for-human-rights/.
104 V. en ce sens Marion Ho-Dac, Lamprini Xenou, « Fundamental Rights Impact Assessment (FRIA) under the AI Act », in Marion Ho-Dac, Cécile Pellegrini, Bernard Long (dir.), The Academic Guide to AI Act Compliance, 2025, https://dx.doi.org/10.2139/ssrn.5775382, pp. 129-140, spéc. p. 134.
105 Art. 49 du RIA.
106 Ce point est également critiqué par la coalition d’ONG susmentionnée (« EU’s AI Act fails to set gold standard for human rights », préc.).
107 A noter qu’à l’inverse, si l’algorithme devait tomber sous le coup des pratiques interdites par l’article 5 du règlement, l’interdiction s’appliquerait déjà puisque le chapitre II comprenant cette disposition est entré en vigueur le 2 février 2025 (art. 113, §3, a) du RIA).
108 Art. 111 du RIA.
109 V. spéc. l’art. 43 du RIA, qui prévoit une procédure d’évaluation de la conformité fondée sur le contrôle interne.
110 L. Cluzel-Métayer, Le droit de l’intelligence artificielle, Dalloz, coll. « À savoir », 2025, p. 112.
111 V. spéc. l’art. 99 du RIA.
112 Art. 85 du RIA.
113 L. Cluzel-Métayer, Le droit de l’intelligence artificielle, op. cit., p. 112
114 Pour une telle proposition, v. p. ex. C. Lequesne-Roth, « La science des données numériques au service du contrôle fiscal français… », op. cit., p. 193.
115 H. Guillaud, Les algorithmes contre la société, op. cit., p. 146. Pour une stimulante réflexion à ce sujet, v. D. G. Robinson, Voices in the Code: A Story About People, Their Values, And the Algorithms They Made, Russel Sage Foundation, 2022.
116 H. Guillaud, Les algorithmes contre la société, op. cit., p. 151.


