Archives par mot-clé : statistiques

Loi des petits nombres vs loi des grands nombres

Dans leurs calculs, les statisticiens utilisent la loi des grands nombres. La française des jeux n’opère pas autrement pour gagner de l’argent ! Le hasard n’intervient que pour les joueurs, pas pour elle ! Les compagnies d’assurance agissent de même. Si elles assurent cent mille voitures, elles savent d’avance combien auront d’accidents et quel en sera le coût. La prime d’assurance est calculée en fonction de ce risque qui n’en est plus un dès que l’on applique la loi des grands nombres ! Si 5% des automobilistes ont un accident chaque année, vous ne pouvez prévoir si vous en aurez un. En revanche, votre compagnie d’assurance sait que, sur ses cent mille assurés, cinq mille auront un accident.

La loi des petits nombres

Les particuliers ne raisonnent pas ainsi. Si un événement malheureux mais peu probable se produit deux fois de suite à une année d’intervalle, ils se diront que jamais deux sans trois et prévoiront un troisième pour l’année suivante. A l’inverse, plusieurs années sans accident leur feront croire que plus rien ne peut leur arriver. Autrement dit, ils utilisent une loi des petits nombres et non la loi des grands nombres. Bien entendu, il ne s’agit pas de mathématique mais de psychologie !

Une question de psychologie

Pour un mathématicien, cette loi des petits nombres peut passer pour un canular. C’est pourtant de manière tout à fait scientifique et en utilisant correctement la loi des grands nombres que Daniel Kahneman l’a mise en évidence. Plus précisément, il a étudié expérimentalement le comportement moyen des américains devant l’assurance ! Il apparaît que plusieurs années sans accident pousse la moyenne des américains à résilier ses contrats d’assurance ! Pour cette étude, ce professeur de psychologie à Princeton a obtenu le Prix Nobel d’économie en 2002.

Il semblerait que certains états appliquent cette loi des petits  nombres et suppriment des équipements de précaution, comme des masques de protection, quand ils se sont révélés inutiles plusieurs années de suite. D’autres, dans l’affolement, feront des tests de médicaments sur des petits nombres pour en déduire avoir trouvé le traitement miracle.

Comment évaluer l’espérance de vie d’un bébé qui vient de naître ?

Une fille vient de naître. Les médias nous apprennent qu’elle a une espérance de vie de 85 ans. D’où vient cette prédiction ? Que signifie l’espérance de vie ? Pour le comprendre, dans un premier temps, oubliez le sens commun du verbe « espérer » car la définition n’est claire que pour les générations entièrement décédées ! La voici. L’espérance de vie est la durée moyenne de vie des personnes nées la même année. La définition est étrange puisque, toutes ces personnes étant décédées, leur vie n’est plus une espérance. Si ce n’était le côté macabre, peut-être vaudrait-il mieux parler d’âge moyen à la mort ? La notion est identique, même si l’espérance de vie devient équivalente à celle de mort. Toutefois, le terme « espérance de vie » se comprend mieux pour les vivants.

Une définition macabre

Pour l’instant, restons malgré tout sur les générations passées car ce sont les seules qui permettent des calculs certains. Pour déterminer l’espérance de vie des gens nés en 1850 par exemple, il suffit de connaître tous les actes de naissance de 1850 et tous les actes de décès postérieurs. On en déduit les âges au décès et on en fait la moyenne… on trouve 41 ans. Cependant, ce calcul n’est possible que pour les générations entièrement décédées, pas pour les enfants qui viennent de naître !

Un modèle de la réalité

Pour prévoir l’espérance de vie de ceux qui viennent de naître, on imagine qu’ils subiront à chaque âge de leur vie la mortalité de l’année en cours. Plus précisément, on calcule le quotient de mortalité des deux sexes à chaque âge grâce à des estimations de population et de décès. En l’absence de toute migration, l’idée est très simple. Le premier janvier 2009, on compte 440428 hommes de 40 ans et 815 décès d’hommes de 40 ans pendant l’année 2 009. Le quotient de mortalité des hommes de 40 ans est donc estimé à 815 divisé par 440 428, soit 1,850 ‰. La méthode est fiable si on peut appliquer la loi des grands nombres. Ses résultats sont fantaisistes quand ce n’est pas le cas, particulièrement pour les grands âges.

À partir de ces quotients de mortalité des personnes de chaque âge, les statisticiens reconstruisent des tables de mortalité. On ne considère donc plus une population réelle mais une génération fictive de 100000 individus qui connaîtrait toute sa vie les conditions de mortalité par âge de l’année considérée. La table que l’on peut construire chaque année sur cette génération fictive est appelée la table du moment. C’est à partir de cette table qu’on calcule l’espérance de vie des enfants dès leur naissance. Cette méthode est fondée sur l’hypothèse que la situation de la mortalité restera identique à ce qu’elle est actuellement, et ceci alors même que nous savons qu’il n’en est rien ! Malgré tout, ces résultats donnent une idée plus vraisemblable de la réalité du futur que l’utilisation de tables de mortalité de générations décédées. Mieux vaut parfois une approximation raisonnable qu’une précision illusoire.

 

La taille des œufs de coucous

Certaines espèces de coucous font couver leurs œufs par des oiseaux de tailles très différentes. Chacune a sa stratégie de parasitage. Certains, dont le coucou gris, semblent adapter la taille de leurs œufs à celle de ceux de leur hôte involontaire.

Le coucou gris

Le coucou gris, qui a la taille d’un pigeon, parasite des passereaux. À première vue, le scénario est simple. La femelle coucou pond un œuf dans le nid de rousserolles, de roitelets, de fauvettes, ou d’autres. Son œuf est le premier à éclore. Le petit coucou expulse alors la couvée entière du nid. Les passereaux nourrissent ensuite l’intrus jusqu’à ce qu’il soit adulte.

Jeune coucou se faisant nourrir par une rousserolle.

Stratégies du coucou

Pour atteindre son but, le couple de coucous repère puis guette un nid de passereau, de l’espèce qui les a élevés de préférence. Ce choix n’est pas toujours possible, et une erreur peut être fatale au jeune coucou. Par exemple, si la femelle pond dans un nid de granivores, son petit mourra de faim, car le coucou est insectivore.

Quand la femelle passereau a pondu, celle du coucou profite de son absence, pour gober un œuf et le remplacer rapidement par l’un des siens. Son œuf éclot avant ceux des passereaux car il a commencé à incuber dans son corps. Sitôt né, encore aveugle, le petit coucou expulse tous les œufs du nid afin d’être nourri seul par ses parents adoptifs.

Oisillon coucou jetant un œuf hors du nid.

Les mathématiques du coucou

Bien que le coucou soit cinq à six fois plus grand que les passereaux qu’il parasite, sa femelle pond des œufs de taille comparable aux leurs. Plus étrange, elle semble adapter la taille de ses œufs à celle de ceux qui se trouvent dans le nid dans lequel elle pond. L’un des premiers scientifiques à avoir étudié la question quantitativement, Oswald Latter en 1902, a récolté 29 œufs de coucous dans des nids de roitelets et de fauvettes et notés les diamètres. En réunissant ces données dans deux histogrammes, nous obtenons deux courbes en cloche distinctes ce qui indique que nous avons affaire à deux populations distinctes. Autrement dit, la femelle coucou adapte bien la taille de ses œufs à ceux déjà présents dans le nid dans lequel elle pond.

Distributions des diamètres des œufs pondus dans les nids de roitelets (en orange) et de fauvettes (en vert).Cette étude a depuis été confirmée pour plusieurs espèces de coucous. La recherche est d’autant plus active sur la question que, suivant les espèces, les coucous pratiquent le parasitisme de couvée, ou non et, parmi les coucous parasites, certains sont éjecteurs (ils détruisent les œufs de leur hôte dès leur éclosion) et d’autres, non. Les seconds parasitent des espèces de taille comparable à la leur alors que les autres choisissent des oiseaux plus petits.

Le parasitisme de couvée

Les canards colverts pratiquent le parasitisme de couvée, mais à l’intérieur de leur espèce. © Hervé Lehning

Le parasitisme de couvée ne se limite pas à certaines espèces de coucous. Cependant, le phénomène d’adaptation de la taille de l’œuf à celle de ceux de l’hôte n’a pas forcément lieu. Par exemple, certaines canes colverts pondent dans des nids d’autres colverts. Les flamands roses font de même ainsi que bien d’autres espèces d’oiseaux (on en a dénombré 236). Dans d’autres cas, les oiseaux parasitent des espèces de taille similaire à la leur. Seuls ceux qui parasitent des oiseaux plus petits connaissent ce phénomène d’adaptation de la taille de leurs œufs.

 

 

 

Loi des petits nombres versus loi des grands nombres

La théorie des probabilités permet de démontrer que les jeux de casino comme la roulette sont conçus pour ruiner les joueurs, même si ce jeu a des failles … que nous ne dévoilerons pas ici. La loi des grands nombres assure un bénéfice confortable aux organismes de jeu. Le hasard intervient pour les joueurs, pas pour eux ! Les compagnies d’assurance agissent de même. Si elles assurent cent mille voitures, elles savent d’avance combien auront d’accidents et quel en sera le coût. La prime d’assurance est calculée en fonction de ce risque qui n’en est plus un dès que l’on applique la loi des grands nombres ! Si 5% des automobilistes ont un accident chaque année, vous ne pouvez prévoir si vous en aurez un. En revanche, votre compagnie d’assurance sait que, sur ses cent mille assurés, cinq mille environ auront un accident.

La loi des petits nombres

Contrairement aux organismes de jeu et aux assureurs, les particuliers n’utilisent pas la loi des grands nombres. Si un événement malheureux mais peu probable se produit deux fois de suite à une année d’intervalle, ils se diront que « jamais deux sans trois » et prévoiront un troisième pour l’année suivante. À l’inverse, plusieurs années sans accident leur feront croire que plus rien ne peut leur arriver. Autrement dit, ils utilisent une loi des petits nombres et non la loi des grands nombres. Bien entendu, il ne s’agit pas de mathématique mais de psychologie ! Pour un mathématicien, cette loi des petits nombres peut passer pour un canular. C’est pourtant de manière tout à fait scientifique et en utilisant correctement la loi des grands nombres que Daniel Kahneman (né en 1934) l’a mise en évidence. Plus précisément, il a étudié expérimentalement le comportement des individus devant l’assurance ! Il apparaît que plusieurs années sans accident poussent l’américain moyen à résilier ses contrats d’assurance !

 

Dénombrer l’invisible

Certains chiffres entendus sur les médias sont surprenants, surtout quand ils sont donnés sans explication.

Dénombrer les migrants

Aujourd’hui, vous apprenez que, selon le ministère de l’intérieur, il y aurait entre 200000 et 400000 clandestins présents sur le territoire français. D’où viennent ces chiffres ? Le propre des clandestins … est de l’être, et donc d’échapper à tout recensement.

Comment dénombrer ceux qui se cachent ?

La démographie permet cependant d’évaluer leur nombre. Pour commencer, nous connaissons les taux de mortalité par âge et par origine. Nous pouvons estimer que les taux sont environ les mêmes pour les clandestins. Du nombre de décédés sans papiers, nous pouvons donc déduire une approximation du nombre de vivants sans papiers. La même opération est possible grâce aux naissances. Les recensements permettent aussi de se douter de la présence de clandestins, quand les nombres recensés ne correspondent pas aux nombres prévus.

Dénombrer les séropositifs

De même, vous apprenez que 150000 personnes sont porteuses du virus du sida (c’est-à-dire séropositives) en France, dont 40000 l’ignorent. Comment peut-on faire une telle estimation ? S’ils l’ignorent, comment le savons-nous ? Ici encore, l’idée est de faire des recoupements. Sans rentrer dans toute la subtilité des détails, voyons le principe du calcul. Imaginons que nous connaissions le nombre de cas de sida diagnostiqués une certaine année, 500 par exemple. Parmi ceux-ci, 370 correspondent à des personnes dont la séropositivité était connue. Ainsi 130 étaient des séropositifs inconnus les années précédentes. Il est donc légitime d’estimer que pour 370 séropositifs connus, il en existe 130 inconnus. Nous multiplions le nombre de séropositifs connus (110000 par exemple) par le rapport 130 / 370 pour en déduire le nombre de séropositifs inconnus, ce qui donne un peu moins de 40 000. Bien sûr, le modèle est un peu plus raffiné que cela car certains milieux sont plus conscients du danger de cette maladie que d’autres et pratiquent les tests plus volontiers. Les taux entre connus et inconnus diffèrent alors selon le milieu. Dans tous les cas, à défaut d’un vaccin, l’idéal pour enrayer l’épidémie et mieux soigner les malades serait un test annuel pour tous. Ce serait malgré tout coûteux et difficile à mettre en place.