Mise au point
Validation des échelles d'évaluation en médecine physique et de réadaptation : comment apprécier correctement leurs qualités psychométriquesValidation of assessment scales in physical medicine and rehabilitation: how are psychometric properties determined?

https://doi.org/10.1016/j.annrmp.2005.04.004Get rights and content

Résumé

Les qualités psychométriques d'une échelle d'évaluation sont malheureusement mal mesurées en pratique. On étudie donc de manière approfondie chaque qualité : i) la validité avec ses différentes facettes : validité de contenu, contre critère, du construit, d'apparence. On définit chacune d'elles et on détaille les méthodes expérimentales et statistiques employées ; ii) la fidélité évaluée au moyen du coefficient de corrélation intraclasse et de la technique de Bland et Altman. Des directives permettent, lors d'une situation expérimentale donnée, de choisir le coefficient intraclasse approprié ; iii) la sensibilité au changement mesurée au moyen des indices : taille de l'effet et réponse moyenne standardisée. Des recommandations pratiques terminent l'exposé.

Abstract

The psychometric properties of a rating scale are, unfortunately, badly assessed in practice. Each property is thoroughly studied. Validity has different facets: content, criterion, construct, face validity. Each facet is accurately defined and the experimental and statistical methods used are explained in detail. Reliability is assessed with use of the intraclass correlation coefficient and the Bland and Altman method. Guidelines are given for choosing, in a specific experimental situation, the appropriate coefficient. Responsiveness is evaluated with use of effect size and standardized response mean. Finally practical recommendations are given.

Introduction

Très utilisées dans de nombreux travaux, les échelles d'évaluation sont composées de plusieurs items dont la cotation est combinée en un score global ou des sous scores dimensionnels. Elles permettent d'évaluer des phénomènes subjectifs ou complexes tels la douleur, la qualité de vie, le handicap, etc.

Pour donner des résultats fiables, elles doivent posséder les trois qualités psychométriques d'un bon instrument de mesure : validité, fidélité, sensibilité du changement.

Malheureusement, les méthodologistes constatent que ces qualités sont très souvent mal étudiées par les promoteurs et utilisateurs d'échelles. Ainsi, plusieurs facettes importantes ne sont pas investiguées, les méthodes expérimentales sont approximatives, les techniques statistiques mal adaptées.

Afin de clarifier les différents concepts et leur mise en œuvre, les psychométriciens américains ont rédigé après de longues discussions des standards [1]. Ce sont eux que nous utiliserons dans la suite de cet exposé pour étudier les principaux aspects d'une bonne validation. Celle-ci repose essentiellement sur l'analyse exhaustive de chacune des qualités de l'échelle, que nous allons successivement étudier.

Section snippets

La validité

La validité présente plusieurs facettes :

Les situations expérimentales

La fidélité peut être évaluée dans diverses situations expérimentales. Par exemple, on peut dans un échantillon de 33 patients mesurer soit :

  • la fidélité interjuges : chaque patient est alors coté au même moment par deux (ou plus) juges différents, de manière indépendante ;

  • la fidélité intrajuge : un seul juge côte deux fois (ou plus) chaque patient à quelques jours de distance, l'état du sujet restant inchangé durant ce laps de temps ;

  • la fidélité test–retest : c'est une situation semblable à la

Mesure quantitative

Il s'agit par exemple d'évaluer un score global d'échelle. Deux méthodes sont alors employées : les coefficients de corrélation intraclasse (ICC) et la technique de Bland et Altman.

Mesure qualitative

Par exemple dans une échelle de qualité de vie, un item évalue la consommation d'antalgiques en cinq modalités de réponse : nulle, faible, modérée, importante, très importante. Cet item est donc une variable qualitative à cinq modalités dont la fidélité (inter- ou intrajuges et test–retest) s'évalue au moyen de deux coefficients : Kappa ou Kappa pondéré.

Ces coefficients sont calculés par de nombreux logiciels. Le lecteur intéressé par la problématique sous jacente et le détail des calculs peut

La cohérence interne (internal consistency) et le coefficient alpha de cronbach

Alpha évalue la cohérence interne d'un ensemble d'items, échelle ou sous-échelle, correspondant à une dimension clinique unique ; c'est-à-dire la force des intercorrélations entre items. Plus les items sont liés entre eux, plus la valeur d'alpha est grande.

Habituellement ce coefficient est étudié avec la fidélité, car il peut être considéré comme un cas particulier d'ICC. Soit par exemple, une échelle unidimensionnelle dont les 8 items évaluent la même dimension : l'anxiété. On peut donc

Sensibilité au changement (responsiveness)

Un instrument est dit sensible au changement s'il est capable de mesurer avec précision les variations en plus ou en moins, du phénomène mesuré.

Conclusion : recommandations pratiques

  • Pour choisir judicieusement une échelle parmi toutes celles qui sont disponibles sur le marché, il faut pouvoir les comparer. Cela suppose que l'on possède des informations détaillées sur les études de validations faites auparavant : les facettes étudiées, les méthodes utilisées, les résultats quantitatifs obtenus etc. Il faut tout faire pour réunir ces informations, malgré les nombreux obstacles pratiques, car sinon un choix rigoureux est impossible.

  • La validité du construit est la facette la

Références (7)

There are more references available in the full text version of this article.

Cited by (117)

  • Aqua: A new questionnaire assessing anticholinergic side effects in neurogenic population (Aqua: Anticholinergic side effects questionnaire)

    2022, Progres en Urologie
    Citation Excerpt :

    Alpha coefficient of Cronbach was considered as very good if > 0.7 [11]. Test–retest reliability was tested using the intraclass correlation coefficient (ICC) which was significant over 0.7 [11]. The first questionnaire was filled at the end of the first consultation and patients had to answer a second questionnaire (filled at home) 7 days after the first consultation.

View all citing articles on Scopus
View full text