C'est beau, mais, c'est loin.

Intelligence collective et prolifération des données : le projet Galaxy Zoo

Intelligence collective 4 juil. 2022

Une révolution qui fait consensus est celle de la production de données. La prolifération des senseurs, palpeurs, capteurs en tout genre présuppose que de l’accumulation des données produit de la valeur.

Pendant longtemps la démarche scientifique a cherché à contenir l’observation dans une théorie postulée, elle-même confirmée par l’expérience et devenant « fait scientifique ». C’est la méthode expérimentale.

Michel-Eugène Chevreul en donne une définition (1) au milieu du 19èmesiècle :

Un phénomène frappe vos sens ; vous l’observez avec l’intention d’en découvrir la cause, et pour cela, vous en supposez une dont vous cherchez la vérification en instituant une expérience. Si l’hypothèse n’est pas fondée, vous en faites une nouvelle que vous soumettez à une nouvelle expérience, et cela jusqu’à ce que le but soit atteint, si toutefois l’état de la science le permet. […] ce raisonnement constitue la méthode que j’appelle expérimentale parce qu’en définitive l’expérience est le contrôle, le criterium de l’exactitude du raisonnement dans la recherche de la vérité (2)».
Ce qui se conçoit bien s'énonce clairement...

Ce qui passait jadis par l’observation d’une ou plusieurs personnes, avec la contrainte des capacités des individus, est aujourd’hui (et de plus en plus) assisté par les appareils de mesure. L’immersion de la « donnée » comme « matière première » sans intention de principe dans sa collecte bouleverse un petit peu la donne. On va pouvoir établir des corrélations grâce à des données compilées sans que leur collecte soit liée à une intention. Les corrélations qui naitront pourront constituer la rampe de lancement pour des recherches scientifiques.

Mais la quantité de donnée, peut poser un problème quand elle excède la capacité de traitement, et c’est là que l’intelligence collective ou collaborative intervient.


Galaxy Zoo


Mulder, Scully, au secours!

L’exemple de Galaxy Zoo illustre ce point. Kevin Schawinsly, à l’origine du projet s’est vu confier la tâche de classer 900.000 galaxies rapportées par le Sloan Digital Sky Survey (3). En vulgarisant, lors de la première initiative, il s’agissait de définir le sens de rotation de ces galaxies. Préalablement au projet, tous les programmes informatiques ont échoué à classer de manière fiable ces galaxies. Le fondateur de Galaxy Zoo déclara:

“The human brain is actually much better than a computer at these pattern-recognition tasks (4).”

L’homme a encore quelques beaux jours devant lui…

Face à l’absence de solution technique de traitement de masse fiable, il a été imaginé que l’intelligence collective pourrait être la clé. Chris Lintott, le cofondateur du projet Galaxy Zoo déclara à ce propos:

“In many parts of science, we're not constrained by what data we can get. We're constrained by what we can do with the data we have. Citizen science is a very powerful way of solving that problem (5)”.

C’est bien le traitement de données en ultra-disponibilité qui devient le nœud à défaire, et non pas la collecte de la donnée à proprement parler.

Le projet Galaxy Zoo procède de cette intention, et montrera rapidement son efficacité. Il avait été estimé qu’un excellent doctorant ne dormant, ni ne mangeant, travaillant 24/7 prendrait 3 à 5 ans à réaliser le travail attendu. Lors de la première initiative, Galaxy Zoo réunit plus de 100.000 personnes réalisant 40 millions de classifications en 175 jours, pour une moyenne de 38 classifications par galaxie. Le succès était au rendez-vous, et excéda même l’intention de départ.

Un forum a été ouvert mettant en discussion les volontaires « observateurs » et les scientifiques, qui a permis de mettre en évidence des anomalies. Certaines de ces anomalies, n’entrant pas dans le champ des connaissances recensées, ont permis la découverte de nouveaux objets astronomiques. L'intelligence collective permit de dépasser la stricte ambition de recensement pour produire de la connaissance nouvelle.

Qui cela ne mettrait-il pas en joie?

En définitive Galaxy Zoo, excède la possibilité offerte par l’ordinateur en conjuguant la puissance de calcul, et le traitement de données à très large échelle avec la finesse de l’intelligence humaine. C’est un formidable exemple d’intelligence collective.  Celle-ci, convoquée à bon escient apporte une hybridation entre la grande échelle, la quantité, les méga-données, et la finesse d’analyse ou la capacité d’abstraction de l’intelligence individuelle.

L’initiative Galaxy Zoo a essaimée et permis la création de Zooniverse (6). Zooniverse réunit plus d’un million de personne dans le monde pour résoudre le défi de l’interprétation d’un nombre toujours plus grand de données et d’information. A ce jour près de 400 publications scientifiques de premier ordre sont issus de cet extraordinaire initiative d’intelligence collective.


Les outils de mobilisation de l’intelligence collective sont nombreux. Le numérique est un facilitateur et Quaeso apporte une solution pour les organisations soucieuses de faire émerger l’intelligence de leur groupe. Les équipes de Quaeso sauront le cas échéant apporter leur expertise pour vous permettre de mener à bien tous vos projets d’intelligence collective.

Quaeso propose des solutions expertes pour des initiatives collectives et communautaires de co-création, d'amélioration continue, d'innovation.

Quaeso : votre plateforme de co-création!


(1) Lettres adressées à M. Villemain sur la méthode en général et sur la définition du mot "fait" : relativement aux sciences, aux lettres, aux beaux-arts  

(2) https://books.google.fr/books?id=mZ9TMh6iP48C&printsec=frontcover&hl=fr#v=onepage&q=Un%20ph%C3%A9nom%C3%A8ne%20frappe%20vos%20sens&f=false

(3) https://www.sdss.org/

(4) https://www.nature.com/news/2007/070709/full/news070709-7.html

(5) https://web.archive.org/web/20100331061938/http://www.time.com/time/health/article/0,8599,1975296,00.html

(6) https://www.zooniverse.org/about

Mots clés