Mon ancien collègue Boris m’a conseillé de lire le livre Pourquoi la société ne se laisse pas mettre en équations de Pablo Jensen et je dois le remercier de ce conseil 🙂
L’auteur Pablo Jensen – sa page personnelle et celle de wikipedia vous en diront plus sur lui – est un physicien et son livre tente d’expliquer pourquoi les équations en sciences sociales (et même en physique d’ailleurs) peuvent être délicates. La vérité est un sujet compliqué. Mais alors qu’il existe une certaine vérité dans les sciences de la nature, qui peut toujours être réexaminée, le concept de vérité dans les sciences sociales est encore plus difficile, simplement parce que le comportement humain est rempli de boucles de rétroaction de sorte que ce qui est vrai aujourd’hui, pour ne pas dire hier pourra être pris en compte par l’homme pour modifier l’avenir…
Jensen mentionne comment Galilée s’est débattu avec les mécanismes de la chute des corps [pages 42-5].
Source: Galileo’s notes on motion, Folio 116, Biblioteca Nazionale Centrale, Florence; Istituto e Museo di Storia della Scienza, Florence; Max Planck Institute for the History of Science, Berlin
Galileo n’a jamais publié ses données car il ne comprenait pas pourquoi elles paraissaient fausses. La réponse est qu’une balle qui glisse n’a pas la même vitesse que celle qui roule. La rotation absorbe une fraction de l’énergie (apparemment √ (5/7) ou 0,84) qui était proche de l’erreur apparente de Galilée.
Ensuite, Jensen nous rappelle combien il est difficile de prévoir les conditions météorologiques et les changements climatiques (chapitre 4). Alors, lorsqu’il se lance dans l’analyse des sciences sociales, il est assez convaincant sur les raisons pour lesquelles la modélisation mathématique peut être une tâche très difficile. Sur une analyse de tweets pour prédire le succès, il écrit ce qui suit : Le résultat de leur étude est clair: même si l’on connaît toutes les caractéristiques des messages et des utilisateurs, le succès reste largement imprévisible. Techniquement, seule 20% de la variabilité du succès des différents messages est expliquée par ce modèle, portant très complexe, et d’ailleurs incompréhensible, comme cela arrive souvent pour les méthodes utilisant l’apprentissage automatique. Il est intéressant de noter qu’on peut doubler le niveau de prédiction en ajoutant une seule variable supplémentaire. Il s’agit du succès passé de l’utilisateur. de son nombre moyen de retweets jusque-là. […] La vie sociale est intrinsèquement imprédictible, de par les fortes interactions entre les personnes. […] La masse des données permet d’opérationnaliser des vieux dictions comme « qui se ressemble s’assemble », « dis-moi ce que tu lis, je te dirai qui tu es » et surtout « je suis qui je suis ». [Chapitre 12, Prédire grâce au big data? – Pages 150-3].
Un exemple encore plus frappant de la nature incompréhensible du machine learning concerne la reconnaissance d’images : le meilleur moyen de prédire la présence de rideaux dans une pièce est d’y trouver un pied de lit. Tout simplement parce que la plupart des chambres ont les deux [Pages 154-5]. Jensen critique également le classement des universités et des chercheurs (pages 246 à 253), un sujet que j’avais déjà abordé dans La crise et le modèle américain. Au chapitre 20 – Sommes-nous des atomes sociaux? – il ajoute à propos des être humains [Page 263] : pour le moment, on ne connaît pas de caractéristiques internes à la fois pertinentes et stables », sans lesquelles l’analyse des êtres humains en tant que groupe devient problématique.
Déjà au chapitre 13, Jensen explique qu’il existe quatre facteurs essentiels qui rendent les simulations de la société qualitativement plus difficiles que celles de la matière: l’hétérogénéité des humains; le manque de stabilité de quoi que ce soit; les nombreuses relations à prendre en compte, aussi bien au niveau temporel que spatial; la réflexivité des humains, qui réagissent aux modèles qu’on fait de leur activité. […] Aucun facteur isolé ne produit quoi que ce soit tout seul […] En sciences sociales, il faut un réseau dense de conditions causales pour produire un résultat. […] Rien ne garantit que la conséquence [d’un facteur] sera la même dans d’autres situations qunad on le combinera à d’autres facteurs causaux. La seule réponse possible est « ça dépend ». [Pages 162-4]
Pour discuter de la plus ou moins grande stabilité qu’on peut attendre de ces caractéristiques internes, il faut remonter à leur origine. Pour les physiciens, la réponse est claire : l’origine des forces entre atomes est à chercher dans les interactions entre ces particules vraiment stables que sont les noyaux et les électrons. […] L’origine des actions humaines est au cœur de la sociologie. Son intuition première a été de chercher les déterminants des pratiques non dans le for intérieur des personnes étudié par la psychologie, ni dans une nature humaine universelle, ais dans les influences sociales. [Page 264] Le social ressemble plus à un fluide tourbillonnant qu’à de nettes combinaisons de briques. […] Bien sûr cette image est trop simple, car elle néglige la mémoire, la viscosité forte du social. Mais elle montre les limites de la vision statique de l’économie ou de la physique sociale, qui partent d’individus déjà faits, prêts à fonctionner, à générer de la vie sociale par association, sous l’impulsion de leurs natures indépendantes. [Page 270] La vie sociale ne consiste pas donc en une suite d’interactions ponctuelles comme le supposent la formule ou les simulations. Il faut plutôt la concevoir comme résultant du déploiement de relations. La distinction entre interaction et relation est cruciale, car cette dernière implique une série d’interactions suivies, entre des personnes qui se connaissent et gardent la mémoire des échanges passés. Dans une relation, chaque interaction repose sur les interactions passées et influencera à son tour celles qui viendront. Une relation n’est donc pas une simple suite d’interactions ponctuelles, mais un processus en création continue, de la relation et par conséquent des personnes impliquées. [Page 271]
Jensen ne dit pas que la société ne peut être analysée qualitativement ou quantitativement. Il propose une analyse subtile de la complexité de la société et des comportements sociaux qu’il convient de toujours garder à l’esprit avant de considérer comme des faits des analyses souvent trop simplistes issues du big data …
Ce qui est amusant, c’est de penser qu’il y a des gens qui se proposent d’appliquer des modèles mathématiques aux comportements sociaux sans même envisager que le réel puisse, durablement, résister à leurs efforts, moi qui n’ai pas le courage de ranger mon disque dur, je contemple avec incrédulité.
Tu pourrais ajouter un « u » à « collège » dans les premières lignes.
J’ai corrigé!