Convergence des mégadonnées et du droit

Commentaires au Congrès annuel de l’Institut canadien d’administration de la justice (ICAJ)

St. John’s (Terre-Neuve-et-Labrador)
Le 17 octobre 2014

Allocution prononcée par Patricia Kosseim
Avocate générale principale et directrice générale, Direction des services juridiques, des politiques, de la recherche et de l’analyse des technologies

(Le texte prononcé fait foi)


Les mégadonnées sont une technologie transformationnelle de rupture qui remet fondamentalement en question notre façon de produire des connaissances, notre vision du monde qui nous entoure et notre compréhension de ce qu’est « la vérité ».

En réalité, les mégadonnées ne sont pas à proprement parler une nouvelle technologie. Il s’agit plutôt d’une nouvelle tendance technologique. En termes simples, les mégadonnées désignent la capacité de traiter d’énormes quantités de données provenant de sources variées, en utilisant des algorithmes très puissants, pour dégager les constantes sous-jacentes et les corrélations afin de prédire les résultats à venir.

Les mégadonnées sont sur le point de modifier à peu près tous les aspects de notre vie – et nos lois et nos traditions judiciaires ne feront pas exception.

Parmi les premiers exemples de la convergence des mégadonnées et du droit, citons l’étude menée en 2002 par des chercheurs de Harvard et de l’Université de Washington. Ces chercheurs ont comparé deux méthodes pour prédire l’issue de 68 affaires inscrites au rôle de la Cour suprême des États-Unis cette année-là. Ils ont conçu un modèle de prévision par ordinateur analysant des centaines d’arrêts prononcés auparavant par la Cour suprême et ont comparé les résultats avec les prévisions qualitatives établies par 87 juristes qui avaient travaillé à la Cour Suprême ou plaidé devant elle et qui connaissaient très bien la doctrine de la Cour. Bien sûr, l’ordinateur a gagné!

Si, à l’époque, cette histoire avait des airs d’intrigue romanesque à la John Grisham, les mégadonnées ont depuis lors fait monter les enjeux de manière fondamentale tant pour les avocats que pour les juges. Aujourd’hui, je ne citerai que cinq exemples.

1. Les mégadonnées remettent en question notre conception traditionnelle du lien de cause à effet.

Le fait que l’on peut établir une corrélation entre deux ou plusieurs facteurs ne prouve pas la validité des conclusions et ne dit rien de leur lien de cause à effet. Et cela peu importe qu’il s’agisse de corrélations logiques ou douteuses.

Les tendances de la grippe déduites par Google ont été présentées comme un excellent exemple du pouvoir que recèlent les mégadonnées. En 2009, Google a publié dans la prestigieuse revue scientifique Nature des conclusions montrant comment elle pouvait établir une correspondance entre certains termes de recherche et le nombre de cas de grippe déclarés par les Centers for Disease Control. Le fait de savoir si les personnes utilisant ces termes étaient malades ou non n’avait guère d’importance, non plus que celui de connaître la cause de la grippe. En fait, Google affirmait pouvoir suivre l’utilisation de ces termes pour prédire d’éventuelles éclosions en temps réel avant la publication des rapports de surveillance de la santé publique.

En 2013, des chercheurs ont affirmé que Google surestimait considérablement la prévalence réelle de la grippe. Ils attribuaient cette erreur à deux failles méthodologiques : premièrement, Google avait trop misé sur les mégadonnées en excluant les modes traditionnels de collecte et d’analyse de données (certains commentateurs ont alors parlé d’une « arrogance associée aux mégadonnées »); deuxièmement, les ingénieurs de Google utilisaient des algorithmes cachés qui changeaient constamment pour améliorer ses services commerciaux, ce qui mettait en péril la validité et la fiabilité des résultats et la possibilité de les reproduire.

Dans le contexte judiciaire, des déductions fondées sur des corrélations établies à partir d’analyses de mégadonnées seront de plus en plus souvent présentées sous la forme de « preuve d’expert ». Les juges auront le rôle peu enviable d’en évaluer la validité et de leur accorder l’importance qui convient dans une affaire donnée.

2. Les mégadonnées remettent en question les seuils traditionnels qui nous protègent du regard de l’État.

Au lieu de chercher une aiguille dans une botte de foin, les organismes d’application de la loi peuvent tirer parti des mégadonnées pour scruter des bottes de foin entières afin de voir s’il y aurait des aiguilles à chercher. Les mégadonnées peuvent révéler des associations éventuelles entre des individus et des « personnes d’intérêt » avec deux ou trois degrés de séparation, voire davantage. Elles permettent de détecter une activité suspecte à partir des habitudes de voyage, des comportements d’achat ou des métadonnées associées à des communications ou à des recherches en ligne. La plus grande partie de cette information est censée être analysée avant la délivrance d’un mandat, avant même qu’il y ait des motifs raisonnables de croire ou de soupçonner quelque chose, car le seul objectif est alors de découvrir de nouvelles pistes à partir de déductions probabilistes.

Les manières d’associer ces profils d’activité en ligne à l’information permettant d’identifier un individu, et les seuils de preuve requis pour permettre aux organismes d’application de la loi de suivre de nouvelles pistes font actuellement l’objet d’un débat dans le cadre du projet de loi C-13.

Dans l’affaire R. c. Spencer, le juge Cromwell a relevé le fil d’Ariane qui traverse des dizaines d’années de jurisprudence sur l’article 8 pour réaffirmer que l’analyse de l’attente raisonnable en matière de respect de la vie privée ne doit pas se limiter au renseignement distinct recherché. Il faut également prendre en compte toutes les autres données interreliées qui pourraient être révélées concernant une personne. À l’ère des mégadonnées, cela comprend non seulement les renseignements que l’on voit difficilement, mais aussi ceux que l’on peut à peine imaginer.

3. Les mégadonnées remettent en question nos modèles réglementaires traditionnels.

Un nouveau concept de réglementation algorithmique est en voie de remplacer la façon traditionnelle d’établir les règles. Au lieu de codifier des règles qui visent à prendre en compte tous les cas de figure possibles, dont l’application est inefficace et qu’il est difficile d’adapter à la réalité en pleine évolution, on pourrait s’en remettre aux mégadonnées. Ces données pourraient permettre l’autorégulation de certaines activités à partir d’algorithmes dynamiques et de boucles de rétroaction en temps réel.

Par exemple, nous savons tous que la raison d’être des limites de vitesse consiste à assurer la sécurité routière. Or, même avec l’utilisation des radars et des caméras, de nombreux policiers doivent être déployés et intervenir pour faire appliquer la loi. Imaginez un dispositif équipé d’un GPS qui pourrait signaler automatiquement les excès de vitesse à partir du véhicule même et transmettre les contraventions par voie électronique directement à son propriétaire. Mieux encore, imaginez un algorithme dynamique permettant de détecter l’état de la chaussée et la densité de la circulation et d’ajuster la limite de vitesse en fonction du niveau de risque. Plutôt que de mettre l’accent sur la règle proprement dite – « vous ne devez pas dépasser 100 km/h » –, une réglementation algorithmique se concentrerait sur le résultat escompté, c’est-à-dire « assurer la sécurité routière » et se modulerait en conséquence.

Ces nouvelles applications des mégadonnées soulèvent des questions fondamentales – Qui établirait les règles? Comment évaluerait-on l’équité et l’exactitude des données recueillies? Et comment limiterait-on l’utilisation de l’information aux fins réglementaires visées? Recueillir les données de l’indicateur de vitesse à des fins de sécurité routière, c’est une chose. Mais suivre les données de géolocalisation sans raison valable, c’en est une autre.

4. Les mégadonnées remettent en question nos principes traditionnels relatifs à l’équité dans le traitement de l’information.

Compte tenu du nouveau paradigme des mégadonnées, certains grands acteurs commerciaux ont commencé à réclamer une dilution des principes traditionnels énoncés par l’OCDE relativement à l’équité dans le traitement de l’information, à savoir les principes de consentement, de détermination des fins ainsi que de limitation de la collecte et de l’utilisation. En contrepartie, ils sont prêts à renforcer d’autres principes, comme celui de la responsabilité – proposant même l’idée de créer des comités d’éthique internes chargés d’examiner de nouveaux algorithmes avant leur déploiement dans le marché.

Dans un monde où les renseignements personnels sont devenus le nouvel or noir et où les algorithmes commerciaux, au même titre que les ingrédients d’un produit ou les nouvelles formules, sont jalousement protégés comme des secrets commerciaux, on ne peut s’empêcher d’être un peu sceptique concernant l’échange proposé.

À mon avis, malgré le rôle fort louable qu’ils jouent, les comités d’éthique assurant la protection des consommateurs ne pourraient nous offrir le niveau requis d’assurance indépendante à moins d’atteindre ce que les comités d’éthique de la recherche s’efforcent d’atteindre depuis des dizaines d’années dans le milieu scientifique : une véritable indépendance par rapport aux établissements dont ils sont censés examiner les pratiques et un régime de gouvernance externe qui « surveille les organismes de surveillance ».

Il y a deux jours, à Maurice, au large de l’Afrique, les autorités de protection des données du monde entier ont adopté à l’unanimité une résolution reconnaissant les avantages des mégadonnées, mais exhortant toutes les parties qui les utilisent à continuer de respecter les principes clés relatifs à l’équité dans le traitement de l’information. La résolution exhorte aussi les utilisateurs de mégadonnées à faire la démonstration que les décisions concernant leur utilisation sont équitables, transparentes et responsables et que tous les profils et tous les algorithmes utilisés seront continuellement évalués dans une perspective éthique.

5. Les mégadonnées remettent en question notre conception de préjudice.

Nous sommes nombreux à nous souvenir la façon dont Target a combiné l’information sur les habitudes d’achat et des données démographiques simples pour cibler les femmes susceptibles d’amorcer leur deuxième trimestre de grossesse (apparemment une mine d’or pour les détaillants) et leur envoyer des publicités personnalisées. L’important pour Target était de prédire juste la plupart du temps, et non forcément dans tous les cas. En fait, la seule raison pour laquelle cette technique de marketing évolué a été dévoilée dans un article publié en 2012 dans le New York Times – une affaire devenue tristement célèbre –, c’est que Target avait vu juste  avant même le père d’une adolescente visée.

Mais qu’arrive-t-il si Target ou d’autres annonceurs se trompent? Cette pratique est-elle moins choquante en pareil cas? Pas nécessairement, si l’on en croit les femmes qui se sont récemment dites consternées de recevoir des publicités d’articles pour bébés quelques mois après avoir eu le malheur de faire une fausse couche.

Ou encore d’après une étude récente menée à Harvard sous la direction de Latanya Sweeney, qui a découvert un préjugé racial dans des publicités en lien avec certains termes de recherche utilisés dans Google et Reuters. En utilisant dans des recherches en ligne des prénoms associés à des personnes d’origine afro-américaine (par exemple DeShawn, Darnell et Jermaine), les chercheurs recevaient une proportion plus élevée de publicités offrant des services de vérification du casier judiciaire qu’en utilisant des prénoms associés à des personnes de race caucasienne (par exemple Brad, Jill et Emma).

Et qu’en est-il lorsque les mégadonnées servent non seulement à vendre notre identité, mais aussi à la façonner? Lorsque les mégadonnées suivent à la trace nos amis et nos activités sur les sites de réseaux sociaux pour prédire nos penchants politiques et déclencher un effort ultime afin d’influencer notre vote? (Dans le cadre du référendum récemment tenu en Écosse, le camp du « oui » a d’ailleurs retenu à cette fin les services d’une société d’analyse des données établie à Ottawa.)

Et qu’en est-il lorsque des données sur notre parcours de navigation servent à cantonner notre profil dans certaines catégories d’intérêt pour ensuite nous présenter une version personnalisée des actualités qui renforce nos tendances initiales et nous empêche de voir les événements mondiaux dans une perspective plus large?

Faire de notre identité une marchandise, définir notre identité par déductions ou façonner notre identité, tout ce champ d’activité semble, du moins à première vue, porter atteinte à notre identité et à notre dignité.

Des lois reconnaissent les préjudices non pécuniaires qui découlent des atteintes à la vie privée, mais les tribunaux hésitent à accorder des dommages-intérêts dépassant un plafond théorique perçu.

Toutefois, on demandera de plus en plus aux tribunaux d’évaluer les préjudices découlant de l’utilisation de mégadonnées, même en l’absence de preuve de séquelle psychologique. Alors que nous pénétrons dans le monde obscur des algorithmes cachés où les gens n’ont presque plus de contrôle sur leurs renseignements personnels, je soupçonne que le droit à la dignité deviendra plus déterminant que la notion d’autonomie dans ces affaires. Et, au fil du temps, les tribunaux se sentiront plus à l’aise d’inférer les préjudices comme l’a fait la Cour suprême dans l’affaire A.B. c. Bragg en s’en remettant « au bon sens et à la logique ».

Conclusion

Dans un article de fond publié l’an dernier dans Foreign Affairs sous le titre « The Rise of Big Data », Kenneth Cukier et Victor Mayer-Schoenberger ont résumé ces défis et d’autres, d’une façon particulièrement éclairante (nous traduisons librement leurs propos) :

« Les mégadonnées bouleverseront inévitablement notre façon de vivre, de travailler et de penser. La prépondérance des corrélations remet en question une vision du monde fondée sur l’importance du lien de cause à effet. La connaissance, que l’on considérait jusqu’ici comme étant la capacité de comprendre le passé, est en train de devenir plutôt le pouvoir de prédire l’avenir. Il ne sera pas facile de relever les défis découlant des mégadonnées. Ces défis constituent simplement la prochaine étape du débat intemporel portant sur la meilleure façon de comprendre le monde. »

Je vous remercie.

Date de modification :