Partagez ce texte avec un ami : Stratégies de recrutement en ligne de sujets de recherche — conséquences sur le plan de l’éthique et de la protection de la vie privée

Supports de substitution

Commentaires dans le cadre de la Conférence nationale 2012 de l’Association canadienne des comités d’éthique de la recherche

Le 27 avril 2012
Toronto (Ontario)

Allocution prononcée par Patricia Kosseim
Avocate générale principale et directrice générale, Direction des services juridiques, des politiques et de la recherche, Commissariat à la protection de la vie privée du Canada

(La version prononcée fait foi)


(diapo 1) Bonjour. C’est un énorme privilège pour moi d’être ici aujourd’hui et, au nom de la Commissaire à la protection de la vie privée du Canada, je vous remercie sincèrement de votre gentille invitation. Mon allocution sera en anglais ce matin, mais soyez rassurés qu’il me ferait plaisir de répondre à toute question par la suite dans l’une ou l’autre langue.

(diapo 2) J’aimerais tout d’abord dire quelques mots sur le contexte en général. Nous entrons dans l’ère des « mégadonnées » à l’échelle planétaire. Ce terme (en anglais « Big Data ») a été créé récemment pour désigner l’émergence de données numériques en quantités astronomiques jamais vues ou même imaginées par le passé. Joe Hellerstein, professeur d’informatique à l’Université de Californie à Berkley, parle de « la révolution industrielle de l’information ». D’après un reportage spécial de The Economist intitulé « Data, Data Everywhere », les données sont en train de devenir la nouvelle matière première de l’activité économique — un intrant économique à peu près aussi important que les capitaux et la main-d’œuvre. Avec ces grandes quantités de données brutes associées à la puissance de calcul croissante et aux algorithmes évolués, on est désormais en mesure, plus que jamais auparavant, d’obtenir de nouvelles perspectives, de dégager des tendances et de relier entre eux des éléments.

La technologie permettant de regrouper, de stocker et d’analyser les données ainsi que la dégringolade des coûts y sont certainement pour beaucoup. Mentionnons aussi l’augmentation considérable des « données numériques dérivées » créées par les consommateurs eux-mêmes, c’est-à-dire les données générées en tant que sous-produits d’autres activités en ligne, par exemple les termes recherchés, les interrogations, les achats, les clavardages, les blogues, les demandes d’information, les photos, les vidéos, les données de localisation et les contacts. D’après un rapport publié en mai 2011 par le McKinsey Global Institute sous le titre Big data: The next frontier for innovation, competition and productivity, nous sommes à l’aube d’une formidable vague d’innovation, de productivité et de croissance, l’ampleur et la portée des changements suscités par les mégadonnées sont au point d’inflexion et ils devraient s’amplifier considérablement dans la foulée de l’accélération et de la convergence d’une série de tendances technologiques.

Toujours selon les auteurs du rapport, les entreprises et les consommateurs ont stocké collectivement plus de 13 exaoctets de nouvelles données pour la seule année 2010 — ce qui équivaut à plus de 52 000 fois l’information archivée dans la Bibliothèque du Congrès des États-Unis et à plus de deux fois la quantité de mots prononcés dans l’histoire de l’humanité! Ils prédisent que les entreprises et les États appelés à connaître le plus de succès sont ceux qui sauront rapidement se faire porter par la vague des mégadonnées et devancer leurs concurrents en prenant conscience de leur valeur économique et en la mettant à profit.

Un nombre croissant d’entreprises et de pouvoirs publics exploitent les mégadonnées. Par exemple, ils regroupent des données détaillées sur le rendement des personnes et des procédés pour améliorer la qualité et l’efficience; ils créent des segmentations extrêmement précises à partir des déductions concernant le statut, les intérêts et les besoins des gens pour mieux personnaliser leurs produits et services en fonction des populations cibles, ils recueillent des données sur les produits et l’emplacement grâce à des capteurs intégrés en temps réel (p. ex. données de GPS sur l’endroit où se rendent les gens, données de reconnaissance faciale sur qui s’arrête, pendant combien de temps et devant quelles publicités et données de navigation intelligente sur la façon dont les gens conduisent leur automobile), tout cela dans le but d’améliorer les stratégies de publicité, l’assurance des prix ou la prochaine génération de produits ou services.

Pratiquement tous les secteurs — tant publics que privés — sont entrés dans le bal et l’industrie pharmaceutique ne fait pas exception. Larry Risen, président de Patient Recruiters International Inc., a récemment déploré le fait que le nombre de sujets de recherche recrutés par site clinique a diminué de 10 % par an au cours des dix dernières années et que plus de 80 % des essais cliniques accusent un retard important parce que les entreprises doivent prendre en charge un coût de plus de 35 000 $ par jour par essai pour recruter les sujets. M. Risen et d’autres intervenants envisagent de se tourner vers de nouvelles sources, notamment les médias sociaux, pour accroître le bassin de sujets de recherche disponibles. Les médias sociaux en sont encore à leurs balbutiements, mais on considère qu’ils recèlent un énorme potentiel inexploité. D’autant plus que l’on prévoit une forte croissance des téléphones intelligents et des autres appareils portatifs d’ici quelques années, ce qui permettra de joindre directement de plus en plus de personnes, n’importe quand et de plus en plus souvent.

(diapo 3) Tim Benjamin, fondateur d’une entreprise britannique de recrutement de sujets de recherche appelée « Treatment Trials » abonde dans le même sens. Dans son blogue, il explique comment les entreprises peuvent élaborer des stratégies de recrutement en ligne efficaces. Il indique des moyens de renforcer la sensibilisation grâce à des annonces plus ciblées sur Facebook pouvant être mises en ligne en quelques minutes, de se faire diriger vers les utilisateurs appropriés en associant intérêt et emplacement géographique, d’obtenir des indicateurs concrets comme le taux de clics pour mesurer l’efficacité de la publicité — et tout cela, à un coût relativement modeste. M. Benjamin a aussi exposé les avantages de YouTube, où les entreprises peuvent diffuser des vidéos Web expliquant les essais cliniques en détail à l’intention des sujets éventuels. Il est possible de télécharger dans des appareils mobiles des vidéos que les sujets éventuels peuvent regarder aussi souvent qu’ils le veulent, ce qui réduit considérablement le temps et les efforts exigés du personnel de recherche.

(diapo 4) Si les médias sociaux sont aussi prometteurs pour le recrutement de sujets de recherche, le Canada est bien placé pour en tirer parti. D’après les estimations établies par eMarketer, le pays s’est classé au premier rang mondial pour la pénétration de ces médias en 2011.

(diapo 5) Déjà en 2010, comScore constatait que les internautes canadiens regardaient davantage YouTube que ceux du reste du monde (à hauteur de 71 %, bien au-dessus de la moyenne mondiale), « tweetaient » davantage que les Américains (13,7 % comparativement à 11,3 %) et utilisaient Facebook beaucoup plus que leurs homologues américains (83,1 % contre 71,5 %).

Comme les entreprises ont grandement intérêt à accroître le taux de recrutement de sujets de recherche en ligne, quelles sont les nouvelles stratégies dans le domaine? À titre indicatif, je donnerai quelques exemples d’un mouvement qui m’apparaît comme une intrusion croissante dans la vie privée.

Exemple 1 : Annonces en ligne pour les études de recherche

(diapo 6) Dans ce premier exemple, nous voyons une annonce publiée dans Kijiji en vue de recruter des enfants de trois à cinq ans pour qu’ils participent à une « activité amusante » aux fins de l’étude du lien entre la conscience de soi et la mémoire. Les chercheurs offrent une place de stationnement gratuite et un petit cadeau. Les parents intéressés sont invités à communiquer avec l’annonceur, qui donne l’assurance que la recherche a été approuvée par le comité d’éthique de la recherche en psychologie de l’Université Carleton.

Sur le plan qualitatif, il n’existe essentiellement aucune différence entre cette annonce et une annonce traditionnelle publiée dans un journal ou un magazine. Au fond, c’est la méthode de recrutement que les membres de comités d’éthique de la recherche connaissent bien, sauf que l’annonce est diffusée dans un nouveau média. Mais encore faut-il que les principes d’éthique de base soient respectés : consentement parental valide assorti d’un risque minimal pour l’enfant, absence d’influence indue ou d’incitations indues à participer bénévolement, etc.

Exemple 2 : Sondages en ligne

(diapo 7) Dans le deuxième exemple, nous voyons une annonce publiée dans Facebook pour un institut de recherche qui effectue des sondages en ligne auprès des consommateurs. Moyennant un montant modeste, Facebook achemine les annonces de l’entreprise aux utilisateurs dont le profil concorde avec les critères de recrutement, ce qui permet d’atteindre les répondants le plus susceptibles d’être admissibles pour chaque sondage. La recherche en ligne présente un autre avantage, car elle limite les coûts grâce à l’administration des questionnaires sous forme numérique plutôt par les méthodes traditionnelles par la poste ou par téléphone.

Certaines questions d’éthique méritent qu’on s’y attache, notamment le degré d’atteinte à la vie privée découlant des questions posées; les biais d’échantillonnage possibles en raison du manque de certitude quant à savoir qui, en réalité, voit les annonces et y donne suite; les problèmes de capacité qu’il n’est pas facile d’évaluer dans un monde virtuel; la question de savoir si le profil des utilisateurs correspond à leur identité (les répondants ne sont peut-être pas ceux qu’ils prétendent être).

Exemple 3 : Annonces ciblées pour la recherche

(diapo 8) Dans le troisième exemple, nous voyons une annonce plus ciblée. Cette campagne de publicité particulière pour les thermomètres Vicks derrière l’oreille utilise une combinaison de données sur les tendances de la grippe dans Google et de l’information sur les utilisateurs recueillie grâce à des appareils mobiles. Je m’explique.

Il s’avère que les tendances globales dégagées des requêtes de recherche Google destinées à obtenir de l’information concernant la grippe correspondent remarquablement aux tendances réelles de la grippe documentées par les données de surveillance en santé publique (pour les États-Unis, diapo 9; pour le Canada, diapo 10). Ici, les données de Google sur les tendances de la grippe ont été utilisées pour recenser les régions où les gens sont susceptibles d’être touchés par la grippe et, par le fait même, d’avoir besoin d’un thermomètre. Dans ces régions, certaines personnes ont été ciblées à partir des données de base recueillies grâce à leur appareil mobile, dans ce cas, le service de musique Pandora. Les utilisateurs de Pandora fournissent des données démographiques de base, notamment l’âge, le sexe, le code postal et la situation parentale, et leur appareil mobile peut révéler à tout moment leur emplacement approximatif. En combinant tous ces renseignements, Vicks a pu envoyer ses annonces de thermomètres derrière l’oreille uniquement aux utilisateurs de Pandora qui étaient des mères vivant dans une région où sévit la grippe, dans un rayon de trois kilomètres des détaillants vendant le produit (y compris Walmart, Target et Babies “R” Us).

Il s’agit d’un exemple documenté d’utilisation d’une annonce ciblée pour vendre un produit, mais on peut facilement imaginer comment une société pharmaceutique ou autre pourrait utiliser des méthodes « intelligentes » similaires pour cibler d’éventuels sujets répondant aux critères d’admissibilité à une étude. Cet exemple soulève une autre gamme de problèmes d’éthique concernant la protection de la vie privée des utilisateurs d’applications dans ce cas — à savoir s’ils étaient conscients que des tiers utiliseraient leurs renseignements personnels pour publier des annonces ciblées et si on leur offrait une véritable possibilité de refuser d’être ciblés par ce type de publicité.

Exemple 4 : Utilisation secondaire de données en ligne

(diapo 11) Un quatrième exemple montre comment améliorer les stratégies de recrutement grâce à une utilisation secondaire de données affichées ou recherchées en ligne à d’autres fins. Les sites proposant des tests génétiques directement aux consommateurs, les sites Web d’information sur la santé ou les forums de discussion réunissant des personnes atteintes de certaines maladies offrent une excellente occasion de repérer d’éventuels participants répondant aux critères d’admissibilité et de communiquer avec eux pour les inviter à participer à une étude donnée. Nombre de ces sites renferment des renseignements personnels de nature très délicate.

Ce sont les conditions d’utilisation qui déterminent s’il est possible d’utiliser ou de divulguer à des fins de recherche des renseignements permettant d’identifier des clients ou des membres. Mais qu’a-t-on dit aux utilisateurs concernant les conditions à remplir pour s’inscrire au site au départ? Le questionnement éthique est naturellement articulé autour de la question de savoir si les conditions d’utilisation de ces sites Web ou leur politique de protection de la vie privée mentionnent clairement que les renseignements personnels pourraient être utilisés aux fins de la recherche, sous quelle forme (renseignements permettant ou non d’identifier la personne) et par qui (propriétaires des sites Web ou tiers); si l’information était suffisamment claire afin de servir de fondement valable au principe du consentement éclairé et si la recherche proposée correspond réellement aux attentes raisonnables des utilisateurs.

Exemple 5 : Outils de veille — données autodéclarées en ligne par des patients

(diapo 12) Un exemple intéressant tiré d’une étude publiée en 2011 dans Nature Biotechnology montre comment on peut utiliser la veille en ligne à des fins de recherche. Les chercheurs ont recueilli des données de PatientsLikeMe.com, forum en ligne qui permet aux personnes atteintes de maladies graves de partager leurs expériences concrètes dans le domaine de la santé. Dans ce cas particulier, les auteurs de l’étude ont examiné les données autodéclarées par les clients décrivant les effets de l’utilisation de carbonate de lithium pour traiter la sclérose latérale amyotrophique. À terme, l’étude a montré que le traitement en question n’avait aucun effet sur la progression de la maladie au cours d’une période de 12 mois, soit une conclusion correspondant effectivement aux résultats d’essais aléatoires parallèles.

Les auteurs (employés et actionnaires de PatientsLikeMe) ont reconnu que les études par observation de cette nature ne sauraient remplacer adéquatement l’excellent modèle des essais aléatoires à double anonymat, mais l’étude n’en fait pas moins ressortir le potentiel des forums en ligne de patients comme milieu d’observation pour surveiller la progression d’une maladie et l’efficacité des traitements. Pourvu, bien sûr, que les intéressés sachent ce qui en est, comprennent les tenants et aboutissants et consentent à y participer — et pourvu que l’on prenne en compte avec respect et sensibilité la vulnérabilité particulière des groupes de patients en ligne dans ces types de situations.

Exemple 6 : Études par observation en ligne

(diapo 13) En 2005, le jeu en ligne World of Warcraft a permis d’obtenir de l’information cruciale sur la façon dont les êtres humains pourraient se comporter au cours d’une épidémie. À la suite d’une erreur de programmation, l’éditeur de jeux virtuels Blizzard Entertainment a créé un environnement ressemblant beaucoup à une épidémie de peste. Les joueurs ont pris le jeu très au sérieux et on a pu observer chez eux toute la gamme des réactions probables devant une menace réelle d’éclosion d’une maladie infectieuse. Certains choisissent d’aider les autres; d’autres ne pensent qu’à sauver leur peau; d’autres encore ne respectent pas les mesures de quarantaine et infectent délibérément d’autres personnes.

Des chercheurs des « Centres for Disease Control » se sont intéressés de près à ce jeu en ligne en tant que modèle pour simuler le comportement humain en période de flambée infectieuse et étudier ses effets sur la propagation de la maladie. Ils ont communiqué avec Blizzard afin d’utiliser ses données pour les besoins de leur étude.

Les épidémiologistes sont ravis d’avoir la possibilité d’utiliser des modèles de jeux en ligne comme celui-là pour reproduire des environnements réels et étudier le comportement humain comme ils ne pourraient le faire autrement en respectant les règles éthiques. De toute évidence, dans le monde réel, on ne peut décider d’infecter délibérément des gens pour ensuite attendre de voir ce qui se passe. Mais, même dans un monde de jeu virtuel, les considérations juridiques et éthiques nous obligent à prendre en compte les attentes raisonnables des joueurs, à respecter le contexte dans lequel l’information a été créée au départ et à demander leur consentement avant d’utiliser à une fin différente des renseignements qui pourraient permettre de les identifier.

Qu’en pensent les Canadiens?

(diapo 14) Compte tenu de toutes les nouvelles stratégies en ligne captivantes destinées à améliorer le recrutement de sujets de recherche, on doit se demander ce que les Canadiens pensent de cette nouvelle ère numérique.

En 2011, un sondage d’opinion publique mené par HarrisDecima à la demande du Commissariat a révélé que les Canadiens s’inquiètent de la protection de leur vie privée et de leur sécurité en ligne.

  • Soixante-cinq pour cent des répondants ont affirmé que la protection des renseignements personnels figurera parmi les problèmes les plus urgents auxquels se heurteront les Canadiens au cours des dix prochaines années.
  • Quarante pour cent des Canadiens interrogés s’inquiètent de la protection de la vie privée en général pour ce qui concerne Internet ou les ordinateurs (contre 26 % en 2009).
  • Cinquante-cinq pour cent des répondants ont fait part de leurs inquiétudes concernant la protection de la vie privée dans les sites de réseaux sociaux.

    (diapo 15)

  • Seulement 21 % ont mentionné lire toujours (7 %) ou souvent (14 %) la politique de protection de la vie privée des sites Web qu’ils fréquentent;
  • Vingt-huit pour cent ont déclaré lire parfois la politique de protection de la vie privée, tandis que 50 % la lisent rarement, voire jamais (25 % dans chaque cas).
  • Plus de la moitié estiment que les politiques de protection de la vie privée en ligne sont assez ou très vagues (respectivement 35 et 18 %).

Préoccupations sous-jacentes concernant la protection de la vie privée

Quels sont les problèmes de protection de la vie privée dont il est question?

La notion malléable de « renseignements personnels » est dans une large mesure à l’origine du débat sur la protection de la vie privée. Nombres de pratiques que nous observons en ligne reposent sur l’assurance que l’information regroupée, utilisée ou divulguée à des tiers ne permet pas d’identifier la personne visée. Toutefois, compte tenu de la portée et de l’ampleur de l’information recueillie, des puissants moyens maintenant accessibles pour regrouper et analyser des éléments d’information disparates et de la nature de plus en plus personnalisée des stratégies de ciblage, il sera souvent tout à fait possible d’établir un lien entre l’information et une personne. AOL Research a fourni à cet égard un exemple désormais célèbre en affichant en ligne une requête de recherche individuelle qu’elle croyait dépersonnalisée. Or, l’information publiée a permis d’identifier les personnes visées simplement en vérifiant les comptes d’utilisateurs et en les associant aux annuaires téléphoniques. Compte tenu de l’évolution rapide de la technologie, il est de plus en plus important de s’en tenir à une approche large et contextuelle en matière d’interprétation des renseignements personnels.

Selon une autre idée fausse fort répandue, l’information affichée en ligne par les internautes serait forcément accessible au public. D’ailleurs, nombre de courtiers en données ont adopté la position suivante : si l’information est accessible en ligne, il est de bonne guerre que quiconque l’utilise, aussi personnelle soit-elle et peu importe à quelle fin. Or, ce n’est pas le cas. Permettez-moi de vous donner un exemple.

En mai 2010, on a découvert qu’un représentant de la société Nielsen avait infiltré le forum de discussion en ligne PatientsLikeMe. Cet institut de recherche sur les médias, qui appartient à des intérêts privés américains, recueille de l’information dans le Web pour connaître l’opinion des consommateurs sur certains produits ou certains sujets en particulier et communique cette information à ses clients — c’est ce qu’on appelle les « services de veille ». En utilisant un logiciel très perfectionné, Nielsen a épluché tous les messages du forum de discussion en ligne renfermant des renseignements personnels de nature très délicate sur les membres. Cette pratique contrevient manifestement aux conditions d’utilisation du forum en ligne et elle n’aurait jamais dû avoir cours. L’intention et, en fait, les attentes raisonnables des membres qui se sont inscrits au forum étaient de trouver un lieu de rassemblement pour partager des témoignages extrêmement personnels avec d’autres personnes atteintes d’une maladie similaire. À sa décharge, Nielsen a mis fin à cette pratique de son propre gré, mais seulement après que des centaines de membres horrifiés eurent quitté le site Web PatientsLikeMe en proie à la colère et à la déception.

Cette situation nous amène à un autre problème de protection de la vie privée en ligne qui inquiète à juste titre les Canadiens — le manque de transparence en ce qui a trait aux pratiques secrètes de nombreux sites Web. On sait pertinemment que les conditions d’utilisation et les politiques de protection de la vie privée sont vagues — les Canadiens l’ont affirmé dans notre sondage d’opinion publique que je vous ai montré plus tôt. Il est souvent difficile, voire impossible d’en déduire ce que l’on fera des renseignements personnels affichés en ligne. À quelles autres fins seront-ils utilisés? Seront-ils communiqués ou vendus à des tiers? Sous quelle forme? D’une façon permettant ou non d’identifier la personne visée? Et dans quel but? Ce qui est énoncé (ou non énoncé) au départ influe bien entendu sur la validité du consentement des utilisateurs.

Dans un monde en ligne où les entreprises, les concepteurs de site Web et les annonceurs sont interconnectés, il devient de plus en plus difficile de comprendre les flux de données et de parler de consentement éclairé dans le vrai sens du terme — pour les adultes, et à plus forte raison pour les jeunes et les enfants. C’est tout particulièrement le cas en ligne, lorsque les paramètres de protection de la vie privée ne sont pas expliqués ou, le cas échéant, qu’ils constituent rarement l’option par défaut et sont généralement très difficiles à trouver. Parallèlement, on peut se demander comment assurer un consentement continu dans un monde en ligne où il est difficile, voire impossible de retirer son consentement et de supprimer en permanence des renseignements personnels dans Internet. Comme vous l’avez sans doute entendu dire, le Net a la mémoire longue.

Rôle des comités d’éthique de la recherche

Compte tenu de ce qui précède, où vous situez-vous comme membres de comités d’éthique de la recherche? Certes, vous êtes, d’une part, dans la position peu enviable de quelqu’un qui doit se débattre avec tous ces éléments complexes. Mais aussi, d’autre part, dans une position très stratégique au commencement du processus des propositions de recherche, lorsqu’il est possible de soulever bon nombre de ces questions d’éthique et de protection de la vie privée et qu’il reste encore assez de temps pour les examiner avant le début des projets. Personne ne s’attend à ce que vous ayez toutes les réponses, mais nous espérons que vous poserez les bonnes questions.

La Conférence annuelle de l’Association canadienne des comités d’éthique de la recherche, comme celle qui se déroule actuellement, et les tutoriels proposés par le Secrétariat en éthique de la recherche représentent d’excellentes occasions de vous faire une bonne idée des questions émergentes en matière d’éthique et de protection de la vie privée et ils vous offrent de l’aide pour les aborder. À bien y penser, c’est peut-être le moment de renforcer la composition de vos comités en recrutant des membres qui possèdent l’expertise et les compétences voulues dans le domaine de la technologie de l’information pour vous aider à explorer ces questions. En outre, il pourrait être utile de tirer parti des nombreuses ressources, notamment les lignes directrices et les fiches d’information, que les bureaux des commissaires à l’information et à la protection de la vie privée de toutes les régions du pays mettent à votre disposition. En fait, il est peut-être opportun que les comités d’éthique de la recherche et le milieu de la protection des données collaborent un peu plus étroitement.

(diapo 16) À mesure que vous commencerez à voir des propositions de recherche portées par la vague des mégadonnées et expérimentant les stratégies que je vous ai présentées et d’autres stratégies de recrutement en ligne, rappelez-vous ceci : « L’ordinateur ne nous impose aucun mode d’emploi; il comporte simplement certaines capacités technologiques et c’est à nous qu’il revient d’en tirer parti pour répondre de façon décente aux besoins des êtres humains. » [traduction ] — George Grant, Lament for a Nation.

(diapo 17) Merci!

Date de modification :