opsci • IA de confiance dans la défense : notre contribution au livre blanc du PEC

Le Pôle d'excellence cyber publie la troisième édition de son livre blanc. Notre contribution porte sur un enjeu majeur : l'audit des modèles d'IA. Les LLM sont bien des "objets culturels", qui propagent les biais de leurs concepteurs et de leurs données d'entraînement, aka internet.

Aujourd'hui, l'essor des agents IA renforce cette menace en invisibilisant l’impact que peut avoir un modèle aligné selon certaines valeurs. Or, les modèles sont désormais en amont ET en aval des crises. Un modèle biaisé peut en déclencher une, quand d'autres sont l'origine de l'amplification de crises existantes...

Notre approche face à ce risque ? Utiliser l'IA pour auditer l'IA, en laissant l'humain dans la boucle : des agents spécialisés dans l'analyse des dérives potentielles autour de larges bases de vulnérabilités et de biais, des métriques et des données de comparaison, pour une vue panoptique assistée et des recommandations de "réalignement" avisées.

Pour en savoir plus, n'hésitez pas à nous écrire ou à lire notre article dans le livre blanc disponible ici.