Dans la boîte noire des IA
Cela s’appelle « dompter l’IA ». Un modèle de langage peut se révéler dangereux et instable : il est capable de mentir, de manipuler sans scrupules. Pour y remédier, les géants du secteur, aidés par une armée de petites mains, inculquent certaines valeurs fondamentales aux LLM. Dans cette série en quatre épisodes, Frédéric Filloux s’est intéressé à cette science – encore largement approximative – qui vise à s’assurer que l’intelligence artificielle ne se retournera pas contre son maître, et à ceux qui cherchent à la contourner.
