socio
Le raisonnement statistique en sociologie
Extraits
« I- Parlez-vous statistique(s) ?
Les statistiques font partie du quotidien, tour à tour adulées ou honnies pour leurs services. Elles suscitent respect des uns, dédain des autres, voire sarcasmes et frayeurs.
Des réactions aussi contrastées ne peuvent que surprendre et suggèrent l'existence d'un malentendu profond. Des avis aussi opposés jugent-ils vraiment la même chose ? On peut supposer que non et, en effet, le terme « statistique » a plusieurs significations qui sont souvent confondues ou ignorées et sont ainsi à l'origine de fausses croyances ou d'idées reçues, voire d'opinions contradictoires forgées au cours du temps. Pour lever ces ambiguïtés, ce chapitre est consacré aux différents sens du terme « statistique » suivant qu'il se décline au singulier ou au pluriel. Il présente l'ensemble des étapes nécessaires à l'élaboration d'une recherche en sociologie et la place que peuvent y occuper les statistiques et, d'une manière générale, la méthode statistique. Un tableau synthétique résume les opérations essentielles pour élaborer un bon raisonnement statistique en sociologie.
1- Statistique(s) : chiffres et production de chiffres
Une des premières sources de malentendu autour des statistiques vient de la méconnaissance du fait qu'elles ne désignent pas la même chose que la statistique.
a – Les statistiques et la statistique
L'étymologie du mot « statistique » est le mot allemand statistik (1749) lui-même dérivé du mot italien statista (XVIIe siècle) « homme d'État ». Elle forge le premier sens du terme « statistique » (La statistique) comme étant « l'étude méthodique des faits sociaux, par des procédés numériques (classements, dénombrements, inventaires chiffrés, recensements), destinée à renseigner et aider les gouvernements » (Le Robert). La statistique désigne alors une discipline mathématique permettant d'effectuer différents types de comptages présentant un intérêt pour la société.
Dans le sens le plus courant, le terme statistique est généralement employé comme synonyme de chiffre. Une statistique – ou des statistiques – désigne d'après la définition du Robert un « ensemble de données numériques concernant une catégorie de faits ». Employées dans le domaine de la sociologie, elles apparaissent alors comme des mesures du phénomène social que l'on cherche à étudier, une représentation quantifiée. On parle ainsi des statistiques du chômage (le taux de chômage à telle date par exemple), des statistiques démographiques (l'âge au premier mariage, le taux de naissance hors mariage, etc.), de statistiques carcérales (le nombre de détenus ou l'évolution des types de peine, etc.).
Une première source de confusion lorsqu'on parle de statistique(s) a pour origine l'utilisation d'un même terme pour désigner à la fois un procédé et les résultats de ce procédé. Une ou des statistiques désignent en effet « les quantités », c'est-à-dire les résultats d'un processus de formalisation mathématique et d'analyse : la statistique. Une partie des malentendus à l'égard des statistiques en général vient de ce que la distinction cruciale qui existe entre une méthode et ce qu'elle permet d'élaborer n'est pas identifiée : de nombreuses critiques à leur encontre concernent souvent indifféremment le chiffre – supposé représenter la réalité – et la façon de le produire. »
Le raisonnement statistique en sociologie, Première partie: place et rôle des statistiques en sociologie, pages 19 et 20.
« IV. Analyses qualitative et quantitative
La plupart des ouvrages d'histoire de la pensée sociologique opposent deux traditions de recherche qui se sont constituées à la même époque mais sur des principes différents.
Nées dans deux cultures distinctes (la France et l'Allemagne), reliées à des pères fondateurs différents (Émile Durkheim et Max Weber), ancrées dans des postulats opposés (holisme ou individualisme), elles se distinguent aussi bien par leur but (description ou compréhension) que par leurs attributions (recherche de causes sociales extérieures ou recherche des raisons individuelles) et leurs moyens (recours à l'analyse statistique ou développement d'idéaux-types). Elles constituent les racines d'une sociologie quantitative d'une part et qualitative d'autre part. L'approche quantitative repose principalement sur l'exploitation statistique de données issues de recensements ou d'enquêtes construites selon un échantillon représentatif ; l'approche qualitative porte essentiellement sur des matériaux qualitatifs et ne prétend pas à la représentativité.
Les manuels de méthode sociologique, nourris d'exemples concrets de recherches actuelles, sont plus nuancés dans l'opposition de ces deux approches. Les auteurs concèdent de plus en plus la possibilité de les combiner. Les articulations entre elles sont toutefois limitées à quelques figures imposées qui laissent entrevoir – en France chez les quantitativistes du moins – une hiérarchie implicite entre les méthodes. L'analyse qualitative serait réduite à un rôle d'exploration (avant de lancer la recherche) ou éventuellement d'illustration (pour rendre les résultats statistiques plus imagés) alors que l'analyse quantitative permettrait la véritable validation et confirmation de la thèse.
Ce chapitre remet en cause la stricte distinction entre sociologie qualitative et sociologie quantitative. Il affine la notion vague « d'articulation » en l'envisageant sous trois angles interrogeant leurs frontières, leurs attributions respectives ainsi que leurs modes de collaboration entre elles. Il apparaît en effet que des outils peuvent être considérés comme étant à la fois qualitatifs et quantitatifs ; une approche peut n'être ni typiquement qualitative ni typiquement quantitative mais utiliser diverses combinaisons de méthodes ; enfin, une analyse quantitative est toujours, aussi, qualitative.
1- Une certaine porosité entre les outils et leur usage
Certaines combinaisons de données et de méthodes d'analyse développées récemment, notamment en raison du progrès de la micro-informatique, mettent en évidence un effacement progressif de la frontière entre le quantitatif et le qualitatif.
En effet, comment classer, au sein de cette dichotomie les méthodes d'analyse textuelle automatique ? Celles-ci permettent de faire des analyses de contenu de textes et d'en tirer des résultats statistiques sur les occurrences et co-occurrences de mots ou d'expressions, sans passer par l'étape préalable de catégorisation ou de mise en indicateurs. Appliquées, au moyen de logiciels spécialisés, à des ensembles d'entretiens ou bien à des réponses à des questions ouvertes de questionnaires, elles constituent bien une formalisation et une quantification de matériaux qualitatifs.
Par exemple, lors d'une enquête sur « Les dilemmes dans les situations difficiles », Véronique Guienne a posé cette question ouverte aux soignants de deux services respectivement d'hématologie et d'obstétrique : « Ces dernières années, quelles situations ou cas de patients vous ont paru particulièrement difficiles ? »
L'analyse de plus de 100 réponses à l'aide d'un logiciel d'analyse de contenu lui a permis d'établir la catégorisation suivante correspondant aux différents registres dans lesquels on peut situer les réponses. Les trois plus fréquents sont les registres du diagnostic, de la pratique et du relationnel. Apparaissent plus rarement les registres social, administratif, éthique et émotionnel.
De façon un peu comparable, il est possible de faire des analyses systématisées d'images ou photographies issues d'observations de chercheurs, donnant lieu à des informations chiffrées sur les événements, objets, scènes ou topographies représentés. Des analyses quantitatives de données qualitatives qui étaient traditionnellement soumises à des analyses de contenu lexicales ou sémantiques se développent actuellement.
Réciproquement, il est souvent fait un usage qualitatif de données quantitatives comme dans le cas de monographies mobilisant des outils de description statistique. Le recueil d'informations approfondies auprès d'une population localisée (une entreprise ou un quartier par exemple) donne parfois lieu à la construction d'une base de données ne prétendant pas à la généralité. Les statistiques exprimées sont alors principalement utilisées pour décrire des ordres de grandeur et asseoir son argumentation dans un cadre très limité. Cette pratique est courante chez les doctorants qui souvent n'ont pas les moyens de faire des enquêtes représentatives sur leur sujet d'étude. »
Le raisonnement statistique en sociologie, Première partie: place et rôle des statistiques en sociologie, pages 77 et 78.
+ En savoir plus
Tous les ouvrages

