vendredi 1 août 2008

La Loi des Grands Nombres

Je me souviens la première fois dans mon cours de statistiques et probabilité se prononçait la célèbre loi des grands nombres, il était une révélation, un miracle. Pour savoir une charactéristique d'une population--par exemple, l'âge moyen, le pourcentage des hommes, ou le nombre des francophiles--il ne faut qu'en faire un tirage aléatoire d'une centaine de personnes. Le charactéristique du tirage sera plus ou moins celui de la population. Cela veut dire d'un geste aléatoire on peut dénicher un trésor caché qui contient les charactéristiques fixes d'une population.

Et cette loi s'applique pour n'importe quelle population de n'importe quelle taille. De l'état de Rhode Island à la Californie, du Chile à la Chine, il ne faut qu'une échantillon d'une centaine de personnes tirée au sort pour estimer leurs charactéristiques.

Quel miracle pour les statisticiens chinois ! La corvée d'interviewer plus d'un milliard de personnes s'évapore avec la découverte de cette loi. Mais quel malheur pour celui qui ne la comprend pas, et il y en a beaucoup. Ils courent le risque de confondre la science avec la démagogie, de chercher en vain une personne ou un groupe de personnes qui peut-être n'existe pas, et de se faire abuser par des gens crapuleux.

(Voilà ma thèse, mais malheureusement l'idée de ma rédaction dépasse mes habilités. Le reste est le fondement du sujet.)

Sans avoir assisté à un seul cour de statistiques, le profane réintérprète cette loi d'une manière qui démontre un potentiel exceptionnel pour les mathématiques mais qui mène directement à la confusion. Combien de fois avez-vous pensé, « dans une ville, un pays, un monde si grand ne s'ensuit pas qu'il y ait quelques personnes qui ont les mêmes intérêts que moi ? » Autrement dit, ce corollaire imaginaire de la loi des grands nombres veut dire plus la taille de la population augmente, plus la possibilité augmente de trouver un charactéristique particulier et rare.

Or comparez ce corollaire à notre loi écrit plus formellement : plus la taille de l'échantillion, plus ses charactéristiques se rapprochent de ceux de la population. La resemblance est frappante, mais notre loi est la loi, et son corollaire imaginaire n'est qu'un souhaite d'une réalité qui peut-être n'existe pas. Notre loi nous dit qu'il faut former un échantillon tiré au sort pour savoir les charactéristiques de la population, et la corollaire ? Qu'il doit y avoir un charactéristique particulier sans jamais avoir la moindre évidence de son existence. Notre loi est le fondement de la science et du pouvoir de l'observation, la corollaire est basé sur les préjugés et la foi. Ce corollaire n'est pas la première fois que la science et les croyances se sont mêlés.

Pour ceux qui adorent se perdre dans les dédales de la logique, il est vrai qu'on peut imaginer des exemples qui semblent valider la corollaire. Imaginez une population d'un seul homme, si on y ajoute une autre personne, la possibilité augmente certainement qu'on peut trouver une femme entre les deux. Cet exemple porte sur le fait que des changements à la population peuvent changer ses characteristiques, mais prudence, on voulait en savoir d'un certain période d'une population. Et n'oubliez pas qu'il faille travailler pour en savoir !

Cela veut dire qu'il faut former un échantillon tiré au sort. Ignorons pour l'instant comment les statisticiens et les sondeurs le font, mais plutôt imaginez le cas parfait pour le faire. On a une liste qui contient tous les coordonnées de la population--imaginez un annuaire parfait qui contient les coordonnées de toute personne, même des gens exclus de la société--, on tire au sort seulement une centaine de noms de cet annuaire, et puis, on les contacte, on leur pose des questions, et on note bien les réponses. Beaucoup de travail, n'est-ce pas ? Et qu'est-ce que vous pensiez ? Ces gens qui avaient les mêmes intérêts que vous se pointeraient sans lever le petit doigt ? Non ! Il faut se mettre en contact avec beaucoup de personnes. Gare aux timides qui veulent être sondeurs.

Et dire que les sondeurs ont beaucoup de problèmes en leur posant des questions. Imaginez celle-ci « Est-ce que la langue française vous plaît ? » posée dans l'un des sondages sur les sujets suivants : le patriotisme, les vacances, ou la romance ? Auprès les mêmes personnes et avec la même question, on peut bien imaginer que le taux des gens qui répondent affirmativement serait bien inférieur quand la question est abordée dans un sondage du patriotisme. L'autre problème de ces questions est que les attitudes, les intérêts et les sentiments sont souvent en conflit l'un avec l'autre. C'est sûr qu'on adore manger et qu'on adore rester en bonne santé, mais comment manger et rester en bonne santé à la fois ? C'est sûr qu'on adorait être adoré, mais est-ce qu'il faut sortir avec chaque personne pour trouver l'adoration ? Pas très prudent.

Vivre sa vie, pas si simple. Vivre avec les autres, très difficile, savoir ce que les gens pensent, vous voulez rire !

On l'essaie quand même.