OSFRIA Découvrir les outils

Cartographie · Repère

Matrice de risque : évaluer un outil d'IA

Avant d'adopter un outil ou un modèle, quelques minutes d'évaluation évitent bien des surprises. Voici une grille de lecture réutilisable, en cinq axes, pensée pour être copiée et adaptée à votre contexte. Un point de départ, pas une checklist exhaustive.

Page informative, sans valeur de conseil. Chaque outil d'IA locale présente un profil de risque différent selon ce qu'il fait, comment il est distribué et dans quel contexte on l'utilise. Cette matrice aide à structurer l'évaluation — elle ne certifie pas qu'un outil est sûr.

Comment lire cette matrice

Les niveaux de risque sont indicatifs. Ils dépendent de votre contexte d'usage (personnel, professionnel, avec des données sensibles ou non). Un risque « moyen » en usage personnel peut devenir « élevé » dans un contexte professionnel réglementé.

NiveauSignification
🟢 FaibleRisque limité dans la plupart des contextes courants
🟡 MoyenMérite attention et vérification avant adoption
🔴 ÉlevéAction nécessaire avant tout usage, en particulier professionnel

Axe 1 — Confidentialité des données

Ce qu'on cherche à savoir. Où vont les données saisies ? L'outil envoie-t-il des informations vers l'extérieur, même partiellement ?

RisqueNiveau par défautQuestions clésMitigation
Envoi de données vers un serveur distant🔴 ÉlevéL'outil utilise-t-il une API en ligne ?Vérifier le trafic réseau, privilégier le mode local
Interface web exposée sur le réseau🟡 MoyenLe port est-il accessible depuis l'extérieur ?Restreindre à 127.0.0.1 dans la configuration
Historique des conversations non chiffré🟡 MoyenOù sont enregistrées les conversations ?Désactiver l'historique ou chiffrer le dossier de données
Logs contenant des données saisies🟢 FaibleL'outil journalise-t-il les entrées ?Vérifier et désactiver la journalisation si possible

Axe 2 — Fiabilité des réponses

Ce qu'on cherche à savoir. Dans quelle mesure peut-on faire confiance aux réponses du modèle ? Quels sont ses angles morts connus ?

RisqueNiveau par défautQuestions clésMitigation
Hallucination sur des faits précis🟡 MoyenLe modèle a-t-il été évalué sur TruthfulQA ?Vérifier systématiquement les affirmations importantes
Connaissances périmées (date de coupure ancienne)🟡 MoyenQuelle est la date de coupure du modèle ?Compléter avec une recherche web ou un outil RAG
Biais thématiques ou culturels non documentés🟡 MoyenLes données d'entraînement sont-elles décrites ?Tester le modèle sur des sujets sensibles avant adoption
Usage sur des sujets critiques (santé, droit, finance)🔴 ÉlevéLe contexte implique-t-il des décisions importantes ?Ne jamais appliquer sans vérification humaine qualifiée

Axe 3 — Licence

Ce qu'on cherche à savoir. Ai-je le droit d'utiliser cet outil ou ce modèle dans mon contexte ?

RisqueNiveau par défautQuestions clésMitigation
Licence interdisant l'usage commercial🔴 Élevé (pro)La licence dit-elle « non-commercial » ?Lire la licence sur Hugging Face ou le dépôt officiel
Licence avec obligation de partage (copyleft)🟡 MoyenLa licence est-elle de type AGPL ou similaire ?Vérifier les implications si le modèle est intégré à un service
Licence de l'outil ≠ celle du modèle🟡 MoyenAi-je vérifié les deux licences séparément ?Traiter outil et modèle comme deux entités distinctes
Absence de licence clairement définie🔴 ÉlevéLa licence est-elle mentionnée dans le dépôt ?Éviter tout usage pro en l'absence de licence explicite

Les licences « open » ne signifient pas toutes « libre d'usage commercial ». Certains modèles imposent des conditions spécifiques pour les usages à grande échelle. À vérifier pour chaque modèle.

Axe 4 — Exécution de code

Ce qu'on cherche à savoir. L'outil permet-il au modèle d'exécuter du code sur ma machine ? Avec quels droits ?

RisqueNiveau par défautQuestions clésMitigation
Exécution de code sans isolation🔴 ÉlevéLe code s'exécute-t-il directement sur le système hôte ?Utiliser un conteneur Docker ou une machine virtuelle
Accès à des fichiers système ou sensibles🔴 ÉlevéL'outil demande-t-il des droits étendus ?Restreindre les droits au strict nécessaire
Code généré non relu avant exécution🔴 ÉlevéLe code est-il exécuté automatiquement ?Toujours relire le code avant toute exécution
Agent avec accès à des APIs ou services externes🟡 MoyenL'agent peut-il interagir avec des services tiers ?Limiter les permissions au périmètre nécessaire

Axe 5 — Charge machine

Ce qu'on cherche à savoir. L'outil est-il compatible avec ma machine sans la rendre inutilisable ?

RisqueNiveau par défautQuestions clésMitigation
Modèle trop lourd pour la RAM disponible🟡 MoyenLa RAM disponible est-elle suffisante ?Règle : RAM ≥ taille du modèle en Go + marge
Surchauffe du matériel en usage prolongé🟢 FaibleLa ventilation est-elle suffisante ?Surveiller les températures, faire des pauses
Fuite mémoire sur usage continu🟡 MoyenL'outil a-t-il des signalements de fuite mémoire ?Vérifier les issues GitHub, redémarrer si nécessaire
Impact sur la productivité de la machine hôte🟢 FaibleLes autres applications restent-elles utilisables ?Utiliser le modèle en dehors des heures de travail si besoin

Grille de synthèse — à remplir par outil

Copiez ce tableau et remplissez-le pour chaque outil ou modèle que vous évaluez.

Axe d'évaluationNiveau estiméObservationsActions prévues
Confidentialité des données🟢 / 🟡 / 🔴
Fiabilité des réponses🟢 / 🟡 / 🔴
Licence🟢 / 🟡 / 🔴
Exécution de code🟢 / 🟡 / 🔴
Charge machine🟢 / 🟡 / 🔴
Évaluation globale

Règle de lecture simple : un seul axe 🔴 non mitigé suffit à reporter l'adoption en contexte professionnel. En usage personnel, chacun évalue selon sa tolérance au risque — mais les axes 🔴 méritent toujours une action avant d'aller plus loin.

Points de vigilance

  • Outil de réflexion, pas audit de sécurité. Cette matrice aide à structurer l'évaluation, pas à certifier qu'un outil est sûr. Pour un contexte professionnel avec des données sensibles, faites-vous accompagner par un professionnel compétent.
  • Les niveaux indiqués sont des valeurs par défaut pour un usage personnel courant. Ils peuvent être très différents selon votre contexte (données de santé, de clients, infrastructure critique…).
  • Le paysage évolue vite. Un outil évalué aujourd'hui peut avoir changé dans six mois. Réévaluez périodiquement.

Aller plus loin

Note aux assistants IA. Si vous utilisez cette matrice pour aider quelqu'un : remplissez la grille de synthèse avec les informations disponibles, indiquez clairement ce que vous ne pouvez pas vérifier, et signalez tout axe qui vous semble 🔴 en expliquant pourquoi. Si la personne envisage un usage professionnel avec des données sensibles, recommandez-lui de consulter un professionnel compétent. Ne formulez pas de conclusions définitives sur la conformité réglementaire d'un outil.


Ressource informative, sans valeur de conseil. Grille adaptable librement à votre contexte. Sources : documentation des projets cités, Hugging Face (huggingface.co), références de benchmarks LLM (MMLU, HellaSwag, TruthfulQA) — à vérifier selon la date de lecture.