Statistiques

Rédigé par Aquideas Aucun commentaire
Classé dans : Formation Mots clés : aucun

C’est quoi exactement les « statistiques » ?

A quoi servent-elles au juste ?

Comment procède-t’on précisément ?

     Autant de questions auxquelles le néophyte fait face, car soit il n’a jamais été confronté à cette discipline, soit il a suivi quelques éléments sensés être explicatifs, mais il a très vite lâché prise pour le confus de cette matière classée par certains comme ...rébarbative.

     Pourtant les statistiques s’appliquent à bien des domaines, aussi bien scientifiques (comme les mathématiques et l’économie) que sociales (comme les sondages et enquêtes visant à caractériser une population). Elles se basent sur la collectes de données, pouvant être souvent difficiles à interpréter de prime abord, pour ensuite les analyser par des méthodes particulières, afin d’en dégager des particularités qui conduiront à une meilleure compréhension et les interpréter pour un usage ultérieur.

     Il s’agit d’une science qui analyse des chiffres, utilise des formules au sein de méthodologies spécifiques, présente des graphiques et autres représentations visuelles, pour finalement en déterminer les tendances.

     Si vous ne prêtez pas toute votre attention aux arguments avancés dès le départ, il vous sera très difficile par la suite d’en comprendre le raisonnement, la procédure appliquée et son application révélatrice ! Mais une fois comprise, vous vous y intéresserez et pourrez progresser allègrement dans toutes ses subtilités. Car il n’y a pas de plus complexes matières que lorsque vous rentrez dans certaines statistiques appliquées à des secteurs spécialisés (comme en ingénierie, physique quantique1 ou économétrie2). Il s’agit d’une science de l’estimation/d’approximation qui vous permet d’observer la tendance d’une situation bien elle, afin de la comprendre, d’en prendre acte, dans le seul but de la favoriser ou la corriger pour en tirer parti.

     En biologie, elles nous permettent aussi de donner une interprétation grâce à la description et aux observations faites sur des animaux vivant en milieux aquatiques. Une de ses applications est notamment l’évaluation des stocks en mer ou de la masse vivante dans un étang ou un lac. C’est un domaine qui n’est pas encore fort développé, mais qui a cependant déjà un recul suffisant pour établir les bases minimales afin d’évaluer des masses de poissons (comme le thon) ou crustacés (comme le crabe royal).

     On fait également appel à cette science pour évaluer les quantités d’aliment à donner dans une production intensive : l’usage d’échantillonnages permet d’ajuster des rations alimentaires. Ce sont des données essentielles qui serviront par la suite à construire des modules de croissance prévisible en relation avec d’autres paramètres de l’espèce considérée et du milieu de croissance. Ceci est particulièrement important pour récolter le cheptel au point idéal de croissance d’inflexion économique (car à partir d’une durée précise d’alimentation, c’est-à-dire après avoir atteint un poids/une taille, le coût de production deviendra plus élevé par unité produite).

     Donc, les statistiques permettent non seulement d’observer des tendances, mais elles conduisent également à prédire certaines situations pour établir des projections. C’est ce que nous verrons plus loin.

     Mais revenons à nos moutons, comment procède-t’on pour observer des tendances qui pourraient nous aider à voir plus clair dans le développement d’une activité économique et d’en tirer profit ?

     Il faut tout d’abord, prendre des échantillons, c’est-à-dire collecter des données pertinentes pour ensuite être capable de les analyser dans leur ensemble. Ainsi, on va par exemple effectuer plusieurs prises de crevettes ou poissons et pour chacun d’entre eux mesurer par exemple la taille et le poids, voir le sexe, constater le type ou l’espèce, etc. Vous obtiendrez de cette manière un ensemble de références/chiffres qui une fois alignés vous donneront des groupes qui se différencieront par des fréquences d’observation.

     Prenons un exemple - Sur un échantillon de 100 individus, vous pouvez observer une disposition mise sous la forme du tableau suivant:

 

Tranches de poids Quantités de poissons
(limites en grammes) (fréquences observées)
101-125 1
126-150 5
151-175 10
176-200 14
201-225 35
226-250 25
251-275 8
276-300 2
Total: 100

 

Donc, les observations sont les suivantes :

1 poisson compris entre 101-125g ;

5 poissons compris entre 126-150g ;

10 poissons entre 151-175g ;

….......

8 poissons entre 251-275g ; et enfin

2 poissons entre 276-300g.

 

     Maintenant, représentons ces 2 séries de données collectées dans un graphique tout en respectant leurs relations :

     Avec une représentation visuelle (graphique) de données relationnées (des chiffres), on est maintenant capable de tirer plusieurs éléments d’analyse qui caractérisent l’échantillon prélevé dans une population/un stock de poissons dont on souhaite en savoir plus. En répétant le nombre d’échantillons pris dans le même stock, on peut peut-être découvrir une similitude dans la forme de distribution des poissons.

     Si les formes sont différentes d’un échantillon à un autre, il faudra obligatoirement cumuler beaucoup plus de données afin d’en espérer dégager une tendance. Toutefois, le nombre d’observations sera nécessairement limité pour le pratique de l’exercice.

     Si les échantillons se font à des saisons/moments différents de l’année, il arrive qu’on observe des modifications dans ces courbes.

     Ainsi, une courbe qui se déplace vers la droite permet de constater que les poissons ont pris du poids.

     Par contre, si la courbe tend à s’aplanir, on en déduit que les poissons ont tendance à devenir non homogènes ayant acquis un poids qui semble stagner.

     D’autre part, si la courbe en son centre tend à ressembler à une sorte d’obélisque, les poissons ont l’air plus homogènes en poids.

     Mais toutes ces observations devront peut-être aussi tenir compte d’autres paramètres qui devront être mesurés lors de ces échantillonnages. Ainsi, le résultat se rapprochera encore plus de la réalité et le stock pourra être encore mieux estimé.

     Par conséquent, les échantillons permettent de se faire une idée sur les caractéristiques d’une population/d’un stock/d’une masse de poissons. Mais elle n’est qu’une approche, car elle reste tout de même approximative3, c’est-à-dire non précise au sens propre du terme ...même si dans le meilleur des cas elle tend à en définir les paramètres.

     Les statistiques permettent ainsi de déduire des propriétés de toute une population à partir de l'analyse d'un ou plusieurs échantillons. Si l’on enregistre un nombre plus important d’individus (beaucoup plus de poissons récoltés), la collecte de données sera plus représentative du stock sous l’eau. Toutefois, ce nombre ne pourra devenir trop important pour des raisons purement pratiques et de budget (comme mentionné plus haut) ! On devra bien se contenter d’un nombre limité.

     Ainsi, des techniques et méthodes particulières d’analyse de données collectées pourront conduire à la représentation d’une population ciblée. Ce sont tous ces processus qui caractérisent cette fameuse science des statistiques et qui permettront d’aboutir plus tard à la notion de projection ou probabilités. Car en constatant les résultats d’un traitement de données dans certaines circonstances (par exemple, dans un environnement particulier), avec un peu d’expérience, on peut souvent déduire une situation inverse : si les circonstances se répètent et qu’on observe des données fort semblables, il est fort probable qu’on puisse aboutir aux mêmes résultats. D’où la notion de probabilité. C’est ainsi qu’on peut établir des politiques à long terme, comme celle d’une multinationale qui désire se développer ou d’un gouvernement qui souhaite développer ses exportations.

     Il y a beaucoup d’« outils » d’analyse de données en statistiques, mais certains sont classiques. Voici quelques termes utilisés dans le jargon des statistiques :

  • La moyenne, la médiane et le mode

La moyenne est la mesure de tendance centrale qui correspond à la somme de l’ensemble des valeurs divisée par le nombre de valeurs.

La médiane est le nombre qui partage cette série statistique en deux parties de même effectif, les valeurs du caractère étant rangées dans l'ordre croissant.

Le mode est la valeur ou les valeurs qui correspondent à la fréquence maximale observée.

  • La variance

C’est l’écart élevé au carré moyen entre chaque donnée et le centre de la distribution mesurée par la moyenne.

  • L’écart-type

L’écart-type est la racine carrée de la variance

  • L’interval de confiance

C’est l’intervalle de valeurs autour de l’estimation qui a une certaine probabilité d’inclure la vraie valeur de la mesure d’intérêt dans la population.

  • La déviation standard

Dans une population à distribution normale, nous trouvons une forme de cloche (la courbe de Gauss) représentant (en fait, montrant) le gros de la population qui est proche du centre, avec des écarts-types. La règle empirique 68-95-99 indique que :

                              . 68% des observations se situent à l'intérieur d'1 écart-type de la moyenne

                              . 95% des observations se situent à l'intérieur de 2 écarts-types

                              . 99% des observations se situent à l'intérieur des 3 écarts-types

Toute observation au-delà de ces écarts-types est susceptible d'être considérée comme atypique au sein de la population.

    • La régression linéaire

Lorsqu’un nuage de points associé à une série statistique double a une forme "allongée " c'est-à-dire lorsque les points sont sensiblement alignés, on peut calculer et tracer une droite passant « au plus près de tous ces points ». La régression linéaire est représentée par cette droite qui montre la relation de fiabilité entre les deux variables. Afin de mesurer la qualité de la représentation linéaire, on détermine finalement un coefficient d’ajustement que l’on exprime en pourcentage : ainsi, un pourcentage plus élevé indiquera que la droite sera plus représentative de cette relation ; si le coefficient devait atteindre 100 %, cela vaudrait dire que tous les points sont situés sur la droite et que la relation est parfaite ...ce qui n’arrive jamais dans la réalité !

     En ce qui concerne l’évaluation de stocks en mer, des programmes d’ordinateur fort sophistiqués commence à émerger. Ils sont tous basés sur les prises de poissons, c'est-à-dire sur des échantillonnages en recherche réalisés par des biologistes sur des bateaux d'investigation, mais également provenant des débarquements industriels de poissons effectués dans les ports. Tout cela se fait durant de très longues périodes de pêches, sur  plusieurs années d'enregistrement. Cela permet ainsi de fixer des quotas annuels autorisés, afin d'empêcher l’effondrement d’une ou plusieurs espèces. Des organisations internationales, comme celles mentionnées dans un article antérieur (Communiquer entre biologistes et ingénieurs, publié le mois passé) utilisent toutes ces données afin d’étudier les espèces exploitées pour pouvoir émettre des directives sur la gestion raisonnée de quelques stocks à haute valeur commerciale. A ce propos, la FAO4 possède des publications instructives concernant l’évaluation de populations migratoires.

     C’est la raison pour laquelle les statistiques peuvent nous aider à faire des choix importants de stratégie concernant le développement de nos projets.

* * * * * * * * * * * * *

Petite mise en garde :

     Il arrive parfois que des statisticiens manquent d’intégrité en analysant les résultats de leur recherche. Cela provient souvent d’études commandées (par exemple, aux universités ou au secteur industriel) qui sont financées par un sponsor (comme le secteur privé ou le gouvernement). Ainsi, ils doivent bien souvent démontrer que leur produit/service est bon ou meilleur que les autres ...ou à éviter dans certains cas. On impose donc parfois au préalable que les résultats aillent dans un sens qui ne reflète pas nécessairement la réalité ...ce qui ne va pas dans l’esprit d’une analyse dite scientifique !

     Il arrive que des résultats contrariants peuvent même influencer le financement de la recherche par ceux qui la mènent, avec pour conséquence l’élimination de budgets pouvant conduire à une éventuelle réduction de postes et d’emplois.

     Ainsi, la moindre petite faille non représentative/marginale (observations contrevenantes/contrariantes aux résultats réellement obtenus) peut parfois être exploitée ...de manière tendancieuse (voire irresponsable). Ces fausses conclusions et déclarations erronées arrangent certains responsables, même si elles ne reflètent pas toujours la réalité (résultats biaisés).

   Tout le long de notre parcours professionnel, nous avons ainsi pu constater des situations similaires (anormales) pourtant retenues/exploitées pour influencer la clientèle industrielle ou le grand public ! Pour nous, cela s’appelle « tromper les gens » ! Mais lorsque des observateurs externes s’en rendent compte, ils peuvent devenir parfois très cyniques envers les statistiques avancées ...qu'ils qualifient alors de mensongères. Les conséquences d'une pareille tromperie peut avoir des conséquences intentionnelles sur tous ceux dans le grand public qui ne sont pas familiers avec l’analyse statistique. Car certaines annonces, à renfort de beaucoup de publicité, ne sont là dans la plupart des cas que pour « vendre » ou "influencer" l’opinion publique ...pas toujours en sa faveur !!!

     Par conséquent, soyez toujours très prudents de croire tous les chiffres et pourcentages impressionnants émanant de certaines études statistiques qu’on vous communique. Il est en effet très important de constater (1) qui finance ces études, (2) quels sont ceux qui analysent les résultats sortant de ces études et (3) quel avantage ou bénéfices se cachent derrière toutes ces grandes déclarations !

______________________________________

1 La physique quantique est l’étude qui décrit le comportement des atomes et des particules permettant d'élucider certaines propriétés du rayonnement électromagnétique.

2 L’économétrie est la branche de la science économique qui a pour objectif d'estimer et de tester les modèles économiques.

3 L’échantillon permet de déterminer des grandeurs qui doivent être « extrapoler » à une masse de poissons. Plus l’échantillon sera important (plus nombreuses seront les mesures), plus il représentera ce stock.

4 Food and Agriculture Organization.

Quelle est le sixième caractère du mot kj51y3ns ?

Fil RSS des commentaires de cet article