Biologique & ChimiqueONP n°107

Open data, big data, open-access et open science : quel impact pour la maîtrise des armements et la non-prolifération biologiques ?

Elisande Nexon

La politique d’ouverture et de partage des données publiques s’inscrit dans une perspective de dynamisation de la vie sociale, contribuant au renforcement de la transparence s’agissant de l’action de l’Etat, mais aussi à la promotion de l’innovation scientifique, économique et sociale. De façon concomitante s’est développé un mouvement pour un accès libre et ouvert à la science (« open access ») et donc aux publications scientifiques, avec comme événements fondateurs l’Initiative de Budapest pour l’Accès Ouvert en 2001 et la Déclaration de Berlin sur le libre accès à la connaissance en 2003. Le libre accès est défini dans cette dernière comme une source universelle de la connaissance humaine et du patrimoine culturel ayant recueilli l’approbation de la communauté scientifique.

Les données ouvertes, traduction adoptée pour l’« open data » par la Commission générale de terminologie et néologie, peuvent être définies comme les données qu’un organisme met à la disposition de tous sous forme de fichiers numériques, afin de permettre leur réutilisation. L’open data est souvent associé au concept de « big data » ou mégadonnées, qui correspond à des données, structurées ou non, dont le très grand volume requiert des outils d’analyse adaptés. Souvent fait, ce lien entre les deux n’est cependant pas évident, même si les données ouvertes peuvent être exploitées dans une approche big data, lorsqu’il faut exploiter une quantité massive de données.

Dans ce contexte, le concept d’ « open science » ou science ouverte a émergé, de plus en plus attractif tant au sein du monde universitaire que des organisations de la société civile. Il n’est cependant pas clairement défini et recouvre différentes dimensions, incluant le libre accès aux publications scientifiques et les nouvelles formes de production scientifique, l’open data, les logiciels Open Source (dont le code source est à la disposition du grand public), ou encore la recherche participative et collaborative. Un nombre croissant de chercheurs font le choix de donner librement accès à leurs travaux, publiant une version pré-éditée sur leur page personnelle ou dans des archives ouvertes (comme par exemple la HAL en France, dépôt national d’archives ouvertes). Ils peuvent également participer à des revues ou des ouvrages en accès libre.

Si elles favorisent la diffusion des connaissances et l’approche collaborative, ces pratiques émergentes posent néanmoins un certain nombre de questions d’ordre éthique, juridique, scientifique et technique. Les enjeux sont en particulier liés à la protection des données personnelles – afin notamment d’éviter le risque de ré-identification – et, plus globalement, à la nature et à la qualité des données. En matière de maîtrise des armements et non-prolifération, comme la convergence scientifique et technologique et le Do-it-yourself biology, les développements de l’open data, du big data et de l’open science font parties des tendances de fond dont doit être évalué l’impact potentiel – positif et négatif – sur la menace biologique, et donc pour les instruments multilatéraux de lutte contre la prolifération biologique.

La controverse sur la publication des résultats d’études sur la transmission par voie aérienne d’un virus H5N1 muté a ravivé le débat sur les risques liés à la diffusion intégrale et sans filtre des informations et au détournement à des fins hostiles. Cette problématique s’avère encore plus difficile à appréhender dans le contexte de l’essor de l’open science. S’agissant des risques relevant du phénomène de big data appliqué aux sciences de la vie et à la santé, qui peuvent dans certains cas se combiner à ceux associés à l’open data, deux sont plus particulièrement identifiés : l’accès non maîtrisé aux données collationnées, alors que les cyberattaques se multiplient, et la conception d’agents dangereux et d’armes biologiques à partir de l’intégration et de l’analyse des mégadonnées.  

Dans une optique positive, les nouvelles pratiques de partage de l’information peuvent faciliter l’acquisition de connaissances et les échanges, tandis que le traitement massif de données offre de nouvelles perspectives pour les sciences « omiques » (par ex. génomique, protéomique, métabolomique) et la recherche de santé publique. L’exploitation de très grands volumes de données, en accès libre ou non, peut contribuer significativement à la veille sanitaire et à la surveillance épidémiologique, un traitement adapté des informations rendant possible une plus grande réactivité, et donc une alerte plus précoce et une réaction plus rapide des autorités. Elle peut également favoriser le développement de traitements prophylactiques et curatifs, la mise au point de tests diagnostics, ou encore les progrès de la médecine prédictive, préventive, voire individualisée. Or, considérant l’article IV de la Convention sur l’interdiction des armes biologiques (CIABT) portant sur les mesures nationales, la déclaration finale de la dernière Conférence d’examen (2011) appelle entre autres les Etats parties à renforcer leurs capacités de surveillance et de détection des épidémies. S’agissant de l’article X sur la coopération et l’assistance internationale, la Conférence exhorte les Etats parties à améliorer leurs capacités en matière de diagnostics et de moyens de lutte contre les maladies infectieuses et autres menaces biologiques. Elle les incite à promouvoir le développement et la production de vaccins et médicaments contre ces maladies infectieuses grâce à la mise en place de coopérations internationales et, le cas échéant, de partenariats public-privé.

Enfin, l’analyse des données ouvertes pourrait contribuer au contrôle du respect des engagements internationaux et donc à la transparence. La société civile peut d’ailleurs être amenée à jouer un rôle à ce niveau. Cette approche impose d’identifier les données à collationner (publications scientifiques, articles de presse, réseaux sociaux, images satellitaires, etc.) et de développer une méthodologie d’analyse, avec des indicateurs. Une évaluation plus approfondie des bénéfices et des risques liés à l’open data, au big data et à l’open science, s’avère en définitive indispensable. Elle doit associer autorités institutionnelles et scientifiques, afin de permettre de définir les mesures juridiques, technologiques et organisationnelles permettant de répondre aux enjeux posés. Il sera par ailleurs nécessaire d’inclure ces dimensions dans le cadre de la sensibilisation à la menace biologique des acteurs des sciences de la vie.