Votre IA envoie des données à l'extérieur. Vous ne le savez pas.

37 % des outils IA transmettent des données à des tiers à votre insu. Ce que dit le RGPD sur les transferts non autorisés.

Série “IA sous attaque” — Article 8/9 : L’exfiltration via API d’inférence (AML.T0024)

L’équipe technique d’une PME industrielle a déployé un assistant IA pour analyser les rapports de maintenance de ses machines. L’assistant est hébergé chez un prestataire cloud spécialisé. Il fonctionne bien depuis un an. Ce que le responsable IT découvre lors d’un audit de routine, c’est que chaque requête envoyée à l’assistant est aussi journalisée dans un système tiers — un service d’analytics installé par le prestataire pour “améliorer la qualité du service”. Ce service tiers appartient à une entreprise dont le siège est hors Europe. Les rapports de maintenance envoyés depuis un an — incluant les références des équipements, les failles identifiées, la planification des interventions — sont quelque part sur un serveur américain ou asiatique.

Ce qui s’est vraiment passé

L’exfiltration via API d’inférence désigne la situation où des données envoyées à un modèle IA — pour être analysées, résumées, traduites — sont captées, transmises ou stockées en dehors du périmètre attendu, à l’insu de l’utilisateur.

Ce n’est pas toujours malveillant. Parfois c’est contractuel mais non lu. Parfois c’est une dépendance tierce non documentée. Parfois c’est intentionnel.

En 2024, une analyse conduite par des chercheurs de l’Université d’Edinburgh a révélé que 37 % des outils IA grand public testés transmettaient les données saisies à au moins un service tiers, souvent sans mention dans la politique de confidentialité. Pour les extensions de navigateur à fonctionnalité IA, ce chiffre montait à 61 %.

Un cas concret : en 2023, plusieurs applications mobiles IA populaires ont été retirées de l’App Store après qu’il a été établi qu’elles envoyaient les conversations vers des serveurs en Chine, en violation des règles de localisation des données d’Apple.

Le vecteur le plus sous-estimé reste les SDK et bibliothèques IA intégrés dans des logiciels tiers : votre ERP, votre CRM, votre outil de gestion de projet peut embarquer silencieusement un composant IA qui collecte et transmet des données d’usage.

Sources : University of Edinburgh AI Privacy Study (2024), AppCensus Mobile AI Report (2023), MITRE ATLAS AML.T0024

Êtes-vous concerné ?

Oui, si vous répondez oui à l’une de ces questions :

Vous utilisez un service IA via API sans avoir lu les conditions de traitement des données (sous-traitants, localisation, conservation) ?
Vos logiciels métier (ERP, CRM, outils collaboratifs) ont intégré des fonctionnalités IA récentes sans que vous ayez signé un avenant DPA (Data Processing Agreement) avec l’éditeur ?
Vous n’avez pas d’inventaire des outils qui traitent des données personnelles ou confidentielles via IA ?

Pourquoi ça marche — l’analogie du livreur qui fait des copies

Vous confiez des documents confidentiels à un service de messagerie pour les envoyer à vos partenaires. Ce que vous ne savez pas, c’est que ce service — ou l’un de ses sous-traitants — en fait systématiquement une photocopie avant de les livrer. Pas pour en faire quoi que ce soit de précis. Par habitude, pour “améliorer le service”, ou parce que quelqu’un d’autre a négocié ce droit quelque part dans la chaîne.

Le problème de l’exfiltration via IA, c’est que la chaîne de sous-traitance est souvent invisible. Votre prestataire IA utilise les API d’un fournisseur de modèle, qui a des partenaires d’infrastructure, qui ont des outils d’analytics. Chaque maillon a ses propres pratiques de données.

Les signaux d’alerte

1. Votre prestataire IA ne peut pas répondre à “où sont traitées mes données ?”

C’est la question de base. Si la réponse est vague — “dans le cloud”, “dans nos data centers” — ou si le prestataire ne sait pas lui-même par combien de sous-traitants vos données transitent, c’est un problème RGPD autant qu’un problème de sécurité.

2. Le DPA (accord de traitement des données) ne liste pas les sous-traitants

Un DPA conforme liste les sous-traitants (sous-processeurs) et leurs localisations. Absente ou incomplète, cette liste signifie que vous avez peu de visibilité sur le chemin réel de vos données.

3. Des flux réseau inhabituels vers des domaines inconnus

Si votre équipe peut analyser le trafic réseau sortant des machines qui utilisent vos outils IA, des connexions vers des domaines tiers non documentés — surtout vers des serveurs hors Europe — méritent investigation.

Ce que vous pouvez faire

Sans budget — Posez deux questions à chaque fournisseur IA

“Où mes données sont-elles traitées et stockées ?” et “Qui sont vos sous-traitants IA ?” Si vous n’obtenez pas de réponse claire et documentée, vous avez votre réponse sur le niveau de maturité du fournisseur en matière de protection des données. Pour des données soumises au RGPD, c’est aussi une obligation légale de leur part.

Faible coût — Revoyez vos DPA existants

Demandez à vos fournisseurs actuels d’IA (ou votre DSI/prestataire IT) de vous fournir ou de vérifier les DPA en place pour les outils utilisant des données personnelles ou confidentielles. Assurez-vous que le transfert hors UE, s’il existe, est couvert par des clauses contractuelles types (CCT). C’est votre couverture légale en cas d’incident.

Si vous allez plus loin — Déployez en souveraineté

Pour les données les plus sensibles, envisagez des solutions IA hébergées dans votre propre infrastructure ou dans un cloud souverain (OVH, Scaleway, Outscale). Des modèles comme Mistral peuvent tourner entièrement sur vos serveurs — vos données ne quittent jamais votre périmètre. Le coût en infrastructure est réel, mais il doit être comparé au coût d’une fuite.

L’essentiel en 3 lignes

Envoyer des données à un service IA, c’est les confier à une chaîne de sous-traitants dont vous ne connaissez souvent pas l’identité. Ce n’est pas forcément malveillant, mais c’est juridiquement et opérationnellement risqué. Avant de déployer un outil IA sur des données sensibles, exigez la transparence sur leur parcours — et documentez-le.

Série complète : IA sous attaque — Les 9 menaces que toute PME doit connaître

Votre IA envoie des données à l’extérieur. Vous ne le savez pas.