Exactitude et précision

Un article de Wikipédia, l'encyclopédie libre
Aller à la navigation Aller à la recherche

L'exactitude et la précision sont deux mesures de l'erreur d'observation . La précision est la proximité ou l'éloignement d'un ensemble donné de mesures ( observations ou lectures) par rapport à leur valeur réelle , tandis que la précision est la proximité ou la dispersion des mesures les unes par rapport aux autres.

En d'autres termes, la précision est une description des erreurs aléatoires , une mesure de la variabilité statistique . La précision a deux définitions :

  1. Plus communément, il s'agit d'une description des seules erreurs systématiques , une mesure du biais statistique d'une mesure donnée de tendance centrale ; une faible précision entraîne une différence entre un résultat et une valeur vraie ; L' ISO appelle cela justesse .
  2. Alternativement, l'ISO définit la précision [1] comme décrivant une combinaison des deux types d'erreur d'observation (aléatoire et systématique), de sorte qu'une précision élevée nécessite à la fois une précision élevée et une justesse élevée.

Dans la première définition plus courante de "précision" ci-dessus, le concept est indépendant de la "précision", de sorte qu'un ensemble particulier de données peut être considéré comme exact, précis, les deux ou aucun.

En termes plus simples, étant donné un échantillon statistique ou un ensemble de points de données provenant de mesures répétées de la même quantité, l'échantillon ou l'ensemble peut être considéré comme précis si sa moyenne est proche de la valeur réelle de la quantité mesurée, tandis que l'ensemble peut être dit précis si leur écart -type est relativement faible.

Définition technique commune

La précision est la proximité des résultats de mesure avec la valeur réelle ; la précision est le degré auquel des mesures répétées (ou reproductibles ) dans des conditions inchangées donnent les mêmes résultats.

Dans les domaines de la science et de l' ingénierie , la précision d'un système de mesure est le degré de proximité des mesures d'une quantité par rapport à la valeur réelle de cette quantité . [2] La précision d'un système de mesure, liée à la reproductibilité et à la répétabilité , est le degré auquel des mesures répétées dans des conditions inchangées donnent les mêmes résultats . [2] [3] Bien que les deux mots précision et exactitude puissent être synonymes dans l'usage familier , ils sont délibérément opposés dans le contexte de laméthode scientifique .

Le domaine des statistiques , où l'interprétation des mesures joue un rôle central, préfère utiliser les termes biais et variabilité au lieu d'exactitude et précision : le biais est la quantité d'inexactitude et la variabilité est la quantité d'imprécision.

Un système de mesure peut être précis mais pas précis, précis mais pas précis, ni l'un ni l'autre, ou les deux. Par exemple, si une expérience contient une erreur systématique , l'augmentation de la taille de l'échantillon augmente généralement la précision mais n'améliore pas l'exactitude. Le résultat serait une série cohérente mais inexacte de résultats de l'expérience défectueuse. L'élimination de l'erreur systématique améliore la précision mais ne change pas la précision.

Un système de mesure est considéré comme valide s'il est à la fois exact et précis . Les termes connexes comprennent le biais (effets non aléatoires ou dirigés causés par un facteur ou des facteurs non liés à la variable indépendante ) et l'erreur (variabilité aléatoire).

La terminologie s'applique également aux mesures indirectes, c'est-à-dire aux valeurs obtenues par une procédure de calcul à partir de données observées.

En plus de l'exactitude et de la précision, les mesures peuvent également avoir une résolution de mesure , qui est le plus petit changement de la quantité physique sous-jacente qui produit une réponse dans la mesure.

En analyse numérique , la précision est aussi la proximité d'un calcul à la vraie valeur ; tandis que la précision est la résolution de la représentation, généralement définie par le nombre de chiffres décimaux ou binaires.

En termes militaires, la précision se réfère principalement à la précision du tir ( justesse de tir ), la précision du tir exprimée par la proximité d'un groupement de tirs au centre et autour du centre de la cible. [4]

Quantification

En instrumentation industrielle, la précision est la tolérance de mesure, ou transmission de l'instrument et définit les limites des erreurs commises lorsque l'instrument est utilisé dans des conditions normales de fonctionnement. [5]

Idéalement, un appareil de mesure est à la fois exact et précis, avec des mesures toutes proches et étroitement regroupées autour de la valeur réelle. L'exactitude et la précision d'un processus de mesure sont généralement établies en mesurant à plusieurs reprises un étalon de référence traçable . Ces normes sont définies dans le Système international d'unités (en abrégé SI du français : Système international d'unités ) et maintenues par des organismes nationaux de normalisation tels que le National Institute of Standards and Technology aux États-Unis.

Cela s'applique également lorsque les mesures sont répétées et moyennées. Dans ce cas, le terme erreur standard est correctement appliqué : la précision de la moyenne est égale à l'écart type connu du processus divisé par la racine carrée du nombre de mesures moyennées. De plus, le théorème central limite montre que la distribution de probabilité des mesures moyennées sera plus proche d'une distribution normale que celle des mesures individuelles.

En ce qui concerne la précision, nous pouvons distinguer:

  • la différence entre la moyenne des mesures et la valeur de référence, le biais . L'établissement et la correction du biais sont nécessaires pour l' étalonnage .
  • l'effet combiné de cela et de la précision.

Une convention courante en science et en ingénierie consiste à exprimer implicitement l'exactitude et/ou la précision au moyen de chiffres significatifs . Lorsqu'elle n'est pas explicitement indiquée, la marge d'erreur est comprise comme étant la moitié de la valeur de la dernière place significative. Par exemple, un enregistrement de 843,6 m, ou 843,0 m, ou 800,0 m impliquerait une marge de 0,05 m (la dernière place significative est la dixième place), tandis qu'un enregistrement de 843 m impliquerait une marge d'erreur de 0,5 m ( les derniers chiffres significatifs sont les unités).

Une lecture de 8 000 m, avec des zéros à la fin et sans point décimal, est ambiguë; les zéros à droite peuvent ou non être considérés comme des chiffres significatifs. Pour éviter cette ambiguïté, le nombre pourrait être représenté en notation scientifique : 8,0 × 10 3  m indique que le premier zéro est significatif (d'où une marge de 50 m) tandis que 8,000 × 10 3  m indique que les trois zéros sont significatifs, ce qui donne un marge de 0,5 m. De même, on peut utiliser un multiple de l'unité de mesure de base : 8,0 km équivaut à 8,0 × 10 3  m. Il indique une marge de 0,05 km (50 m). Cependant, se fier à cette convention peut conduire à de fausses précisionserreurs lors de l'acceptation de données provenant de sources qui ne lui obéissent pas. Par exemple, une source rapportant un nombre comme 153 753 avec une précision de +/- 5 000 semble avoir une précision de +/- 0,5. Selon la convention, il aurait été arrondi à 154 000.

Alternativement, dans un contexte scientifique, si l'on souhaite indiquer la marge d'erreur avec plus de précision, on peut utiliser une notation telle que 7,54398(23) × 10 −10 m, soit une plage comprise entre 7,54375 et 7,54421 × 10 −10 M.

La précision comprend :

  • répétabilité - la variation survenant lorsque tous les efforts sont faits pour maintenir des conditions constantes en utilisant le même instrument et le même opérateur, et se répétant pendant une courte période de temps ; et
  • reproductibilité - la variation résultant de l'utilisation du même processus de mesure entre différents instruments et opérateurs, et sur des périodes de temps plus longues.

En ingénierie, la précision est souvent considérée comme trois fois l'écart type des mesures prises, ce qui représente la plage dans laquelle 99,73 % des mesures peuvent se produire. [6] Par exemple, un ergonome mesurant le corps humain peut être sûr que 99,73 % de ses mesures extraites se situent à ± 0,7 cm - s'il utilise le système de traitement GRYPHON - ou à ± 13 cm - s'il utilise des données non traitées. [sept]

Définition ISO (ISO 5725)

Selon la norme ISO 5725-1, l'exactitude se compose de la justesse (proximité des résultats de mesure avec la valeur réelle) et de la précision (répétabilité ou reproductibilité de la mesure)

Un changement dans le sens de ces termes est apparu avec la publication de la série de normes ISO 5725 en 1994, qui se reflète également dans l'édition 2008 du "Vocabulaire international de métrologie du BIPM" (VIM), points 2.13 et 2.14. [2]

Selon l'ISO 5725-1, [1] le terme général "précision" est utilisé pour décrire la proximité d'une mesure par rapport à la valeur réelle. Lorsque le terme est appliqué à des ensembles de mesures du même mesurande , il implique une composante d'erreur aléatoire et une composante d'erreur systématique. Dans ce cas, la justesse est la proximité de la moyenne d'un ensemble de résultats de mesure avec la valeur réelle (vraie) et la précision est la proximité de l'accord entre un ensemble de résultats.

L'ISO 5725-1 et le VIM évitent également l'utilisation du terme « biais », précédemment spécifié dans BS 5497-1, [8] car il a des connotations différentes en dehors des domaines de la science et de l'ingénierie, comme en médecine et en droit.

Dans le classement

En classification binaire

La précision est également utilisée comme mesure statistique de la façon dont un test de classification binaire identifie ou exclut correctement une condition. Autrement dit, la précision est la proportion de prédictions correctes (à la fois de vrais positifs et de vrais négatifs ) parmi le nombre total de cas examinés. [9] En tant que tel, il compare les estimations de probabilité pré-test et post-test . Pour rendre le contexte clair par la sémantique, on l'appelle souvent la "précision de Rand" ou " l'indice de Rand ". [10] [11] [12] C'est un paramètre du test. La formule pour quantifier la précision binaire est :

TP = Vrai positif ; FP = faux positif ; TN = Vrai négatif ; FN = faux négatif

A noter que, dans ce contexte, les notions de justesse et de fidélité telles que définies par l'ISO 5725-1 ne sont pas applicables. L'une des raisons est qu'il n'y a pas une seule "valeur vraie" d'une quantité, mais plutôt deux valeurs vraies possibles pour chaque cas, tandis que la précision est une moyenne sur tous les cas et prend donc en compte les deux valeurs. Cependant, le terme précision est utilisé dans ce contexte pour désigner une métrique différente issue du domaine de la recherche d'informations ( voir ci-dessous ).

En classification multiclasse

Lors du calcul de la précision dans la classification multiclasse, la précision est simplement la fraction des classifications correctes : [13]

Ceci est généralement exprimé en pourcentage. Par exemple, si un classificateur fait dix prédictions et que neuf d'entre elles sont correctes, la précision est de 90 %.

La précision est également appelée précision top-1 pour la distinguer de la précision top-5, courante dans l' évaluation des réseaux neuronaux convolutifs . Pour évaluer la précision du top 5, le classificateur doit fournir des probabilités relatives pour chaque classe. Lorsque ceux-ci sont triés, une classification est considérée comme correcte si la classification correcte se situe n'importe où dans les 5 meilleures prédictions faites par le réseau. La précision du Top 5 a été popularisée par le défi ImageNet . Il est généralement supérieur à la précision du top 1, car toute prédiction correcte de la 2e à la 5e position n'améliorera pas le score du top 1, mais améliore le score du top 5.

En psychométrie et psychophysique

En psychométrie et en psychophysique , le terme exactitude est utilisé de manière interchangeable avec validité et erreur constante . La précision est synonyme de fiabilité et d'erreur variable . La validité d'un instrument de mesure ou d'un test psychologique est établie par l'expérience ou la corrélation avec le comportement. La fiabilité est établie avec une variété de techniques statistiques, classiquement par un test de cohérence interne comme l'alpha de Cronbach pour s'assurer que les ensembles de questions connexes ont des réponses connexes, puis la comparaison de ces questions connexes entre la population de référence et la population cible. [citation nécessaire ]

En simulation logique

Dans la simulation logique , une erreur courante dans l'évaluation de modèles précis consiste à comparer un modèle de simulation logique à un modèle de simulation de circuit à transistor . Il s'agit d'une comparaison des différences de précision, pas d'exactitude. La précision est mesurée par rapport au détail et l'exactitude est mesurée par rapport à la réalité. [14] [15]

Dans les systèmes d'information

Les systèmes de recherche d'informations, tels que les bases de données et les moteurs de recherche Web , sont évalués par de nombreuses métriques différentes , dont certaines sont dérivées de la matrice de confusion , qui divise les résultats en vrais positifs (documents correctement récupérés), vrais négatifs (documents correctement non récupérés), faux positifs (documents mal récupérés) et faux négatifs (documents mal récupérés). Les métriques couramment utilisées incluent les notions de précision et de rappel . Dans ce contexte, la précision est définie comme la fraction de documents récupérés qui sont pertinents pour la requête (vrais positifs divisés par vrais + faux positifs), en utilisant un ensemble de vérité terrainrésultats pertinents sélectionnés par l'homme. Le rappel est défini comme la fraction de documents pertinents récupérés par rapport au nombre total de documents pertinents (vrais positifs divisés par vrais positifs + faux négatifs). Moins fréquemment, la métrique de précision est utilisée, est définie comme le nombre total de classifications correctes (vrais positifs plus vrais négatifs) divisé par le nombre total de documents.

Aucune de ces métriques ne prend en compte le classement des résultats. Le classement est très important pour les moteurs de recherche Web, car les lecteurs dépassent rarement la première page de résultats et il y a trop de documents sur le Web pour les classer tous manuellement afin de déterminer s'ils doivent être inclus ou exclus d'une recherche donnée. L'ajout d'un seuil à un nombre particulier de résultats prend en compte le classement dans une certaine mesure. La précision de la mesure à k , par exemple, est une mesure de la précision portant uniquement sur les dix premiers résultats de recherche (k=10). Des mesures plus sophistiquées, telles que le gain cumulé actualisé , tiennent compte de chaque classement individuel et sont plus couramment utilisées lorsque cela est important.

Voir aussi

Références

  1. ^ a b BS ISO 5725-1 : "Exactitude (justesse et précision) des méthodes de mesure et des résultats - Partie 1 : Principes généraux et définitions.", p.1 (1994)
  2. ^ a b c JCGM 200: 2008 Vocabulaire international de métrologie - Concepts de base et généraux et termes associés (VIM)
  3. ^ Taylor, John Robert (1999). Une introduction à l'analyse d'erreurs : l'étude des incertitudes dans les mesures physiques . Livres scientifiques universitaires. p. 128–129. ISBN 0-935702-75-X.
  4. ^ Organisation du Traité de l'Atlantique Nord, Agence de normalisation de l'OTAN AAP-6 - Glossaire des termes et définitions, p 43.
  5. ^ Creus, Antonio. Instrumentación Industrial [ citation nécessaire ]
  6. ^ Noir, J.Temple (21 juillet 2020). Matériaux et procédés de DeGarmo dans la fabrication . ISBN 978-1-119-72329-5. OCLC  1246529321 .
  7. ^ Parker, Christopher J.; Gill, Siméon ; Harwood, Adrien; Hayes, Steven G.; Ahmed, Maryam (2021-05-19). "Une méthode pour augmenter la précision du balayage corporel 3D : Gryphon et balayage consécutif" . Ergonomie . 65 (1): 39–59. doi : 10.1080/00140139.2021.1931473 . ISSN 0014-0139 . PMID 34006206 .  
  8. ^ BS 5497-1 : "Précision des méthodes de test. Guide pour la détermination de la répétabilité et de la reproductibilité pour une méthode de test standard." (1979)
  9. ^ Metz, CE (octobre 1978). "Principes de base de l'analyse ROC" (PDF) . Semin Nucl Med . 8 (4) : 283–298. doi : 10.1016/s0001-2998(78)80014-2 . PMID 112681 .  
  10. ^ "Copie archivée" (PDF) . Archivé de l'original (PDF) le 2015-03-11 . Récupéré le 09/08/2015 . {{cite web}}: Maint CS1 : copie archivée comme titre ( lien )
  11. ^ Pouvoirs, David MW (2015). "Ce que la mesure F ne mesure pas". arXiv : 1503.06410 [ cs.IR ].
  12. ^ David MW Powers. "Le problème avec Kappa" (PDF) . Anthology.aclweb.org . Récupéré le 11 décembre 2017 .
  13. ^ "3.3. Métriques et notation : quantifier la qualité des prédictions" . scikit-learn . Récupéré le 17 mai 2022 .
  14. ^ Acken, John M. (1997). "rien". Encyclopédie de l'informatique et de la technologie . 36 : 281–306.
  15. ^ Glasser, marque; Mathews, Rob; Acken, John M. (juin 1990). "Atelier de 1990 sur la modélisation au niveau logique pour ASICS". Bulletin SIGDA . 20 (1).

Liens externes