Analyse comparative des grands modèles de langage et de protection de la vie privée
Organisation
Université d’Ottawa
Publication
2025
Responsable du projet
Rafal Kulik
Résumé
À l’ère numérique actuelle, la croissance rapide des données générées par les personnes a stimulé les progrès dans le domaine de l’intelligence artificielle (IA), en particulier l’élaboration et l’utilisation de grands modèles de langage (GML). Ces modèles, qui imitent la compréhension humaine et la génération du langage, sont intégrés à divers outils sociétaux. En ce qui a trait à l’évolution du déploiement des GML, il faut adopter une stratégie appropriée pour assurer la protection de la vie privée des utilisateurs. Pour relever les défis liés à la protection de la vie privée, il faut aller au-delà des moyens habituels utilisés pour la protection de la vie privée et composer soigneusement avec les besoins en matière de performance des modèles et la contrainte liée à la confidentialité des données sensibles. Le défi est qu’il faut exploiter le potentiel des GML pour stimuler l’innovation et améliorer les services, tout en assurant la confidentialité et la protection des données utilisées pour entraîner ces modèles.
Dans le cadre du projet, il a été question de plusieurs aspects liés à la protection des données dans les GML complexes.
Tout d’abord, le projet permet d’expliquer les techniques et applications de base des GML ainsi que les mécanismes de protection de la vie privée et leur pertinence pour les GML. Ensuite, des techniques d’anonymisation et de protection des données ont été appliquées, et leur effet sur la performance du modèle a été étudié. Plus particulièrement, le projet permet d’analyser en profondeur les problèmes actuels en matière de protection des données liés à ChatGPT.
En plus de la partie technique, le projet présente une analyse rigoureuse des cadres juridiques et stratégiques existants qui régissent les GML, en relevant les lacunes et en prévoyant les besoins juridiques futurs.
Le rapport final comprend une description non technique, des analyses stratégiques et juridiques ainsi que des codes et des analyses numériques. Le rapport final est accompagné de la page Web du projet qui comporte de nombreux documents d’information (en anglais seulement).
Accessibles dans la langue suivante
Anglais :
Site Web du projet (en anglais seulement)
Projet financé par le CPVP
Ce projet a été financé dans le cadre du Programme des contributions du Commissariat à la protection de la vie privée du Canada. Les opinions exprimées dans les résumés et les rapports sont celles des auteurs et ne reflètent pas nécessairement l’opinion du Commissariat. Les résumés ont été fournis par les auteurs des projets. Veuillez noter que les projets sont publiés dans leur langue d’origine.
Coordonnées
Rafal Kulik
Département de mathématiques et de statistiques
Université d’Ottawa
150, rue Louis-Pasteur, édifice des sciences, de la technologie de l’ingénierie et des mathématiques (STIM)
Ottawa (Ontario) K1N 6N5
rkulik@uottawa.ca
- Date de modification :