Taxonomie

Un article de Wikipédia, l'encyclopédie libre
Aller à la navigation Aller à la recherche

La taxonomie est la pratique et la science de la catégorisation ou de la classification . Le mot trouve ses racines dans la langue grecque τάξις , taxis (qui signifie 'ordre', 'arrangement') et νόμος , nomos ('loi' ou 'science').

Une taxonomie (ou classification taxonomique) est un schéma de classification, en particulier une classification hiérarchique, dans laquelle les choses sont organisées en groupes ou types. Entre autres, une taxonomie peut être utilisée pour organiser et indexer les connaissances (stockées sous forme de documents, d'articles, de vidéos, etc.), comme par exemple sous la forme d'un système de classification de bibliothèque , ou d'une taxonomie de moteur de recherche , afin que les utilisateurs puissent plus facilement trouver les informations qu'ils recherchent. De nombreuses taxonomies sont des hiérarchies (et ont donc une structure arborescente intrinsèque ), mais toutes ne le sont pas.

À l'origine, la taxonomie ne faisait référence qu'à la catégorisation des organismes ou à une catégorisation particulière des organismes. Dans un sens plus large, plus général, il peut se référer à une catégorisation de choses ou de concepts, ainsi qu'aux principes qui sous-tendent une telle catégorisation. La taxonomie organise des unités taxonomiques appelées "taxons" (singulier "taxon").

La taxonomie est différente de la méronomie , qui traite de la catégorisation des parties d'un tout.

Applications

Les catégories Wikipédia illustrent une taxonomie, [1] et une taxonomie complète des catégories Wikipédia peut être extraite par des moyens automatiques. [2] À partir de 2009 , il a été démontré qu'une taxonomie construite manuellement, telle que celle des lexiques informatiques comme WordNet , peut être utilisée pour améliorer et restructurer la taxonomie des catégories Wikipedia. [3]

Dans un sens plus large, la taxonomie s'applique également aux schémas de relations autres que les hiérarchies parent-enfant, telles que les structures de réseau . Les taxonomies peuvent alors inclure un seul enfant avec plusieurs parents, par exemple, « Voiture » ​​peut apparaître avec les deux parents « Véhicule » et « Mécanismes en acier » ; pour certains cependant, cela signifie simplement que « voiture » ​​fait partie de plusieurs taxonomies différentes. [4] Une taxonomie pourrait aussi simplement être une organisation de types de choses en groupes, ou une liste alphabétique ; ici, cependant, le terme vocabulaire est plus approprié. Dans l'usage courant au sein de la gestion des connaissances , les taxonomies sont considérées comme plus étroites que les ontologies car les ontologies appliquent une plus grande variété de types de relations. [5]

Mathématiquement, une taxonomie hiérarchique est une structure arborescente de classifications pour un ensemble donné d'objets. Elle est également nommée hiérarchie de confinement . Au sommet de cette structure se trouve une classification unique, le nœud racine, qui s'applique à tous les objets. Les nœuds situés en dessous de cette racine sont des classifications plus spécifiques qui s'appliquent à des sous-ensembles de l'ensemble total d'objets classés. La marche du raisonnement va du général au plus spécifique.

En revanche, dans le contexte de la terminologie juridique, une taxonomie contextuelle ouverte est utilisée - une taxonomie qui ne s'applique qu'à un contexte spécifique. Dans des scénarios tirés du domaine juridique, un compte rendu formel de la texture ouverte des termes juridiques est modélisé, ce qui suggère des notions variables du «noyau» et de la «pénombre» des significations d'un concept. Le cheminement du raisonnement va du particulier au plus général. [6]

Histoire

Les anthropologues ont observé que les taxonomies sont généralement ancrées dans les systèmes culturels et sociaux locaux et remplissent diverses fonctions sociales. Peut-être le plus connu et l' étude influent des taxinomies populaires est Durkheim « s Les formes élémentaires de la vie religieuse . Un traitement plus récent de taxonomies populaires (y compris les résultats de plusieurs décennies de recherches empiriques) et la discussion de leur relation avec la taxonomie scientifique se trouve dans Scott Atran de fondations cognitives d'histoire naturelle.Les taxonomies populaires des organismes se sont avérées en grande partie d'accord avec la classification scientifique, au moins pour les espèces les plus grandes et les plus évidentes, ce qui signifie qu'il n'est pas vrai que les taxonomies populaires sont basées uniquement sur des caractéristiques utilitaires. [7]

Au XVIIe siècle, le mathématicien et philosophe allemand Gottfried Leibniz , à la suite des travaux du philosophe majorquin du XIIIe siècle Ramon Llull sur son Ars generalis ultima , un système de génération procédurale de concepts en combinant un ensemble fixe d'idées, a cherché à développer un alphabet de pensée humaine . Leibniz voulait que sa caractéristiques universalis soit une « algèbre » capable d'exprimer toute la pensée conceptuelle. Le concept de création d'un tel « langage universel » a été fréquemment examiné au XVIIe siècle, notamment par le philosophe anglais John Wilkins dans son ouvrageEssai vers un vrai caractère et un langage philosophique (1668), dont le système de classification dans Roget de thésaurus dérivefincompte.

Taxonomie dans diverses disciplines

Sciences naturelles

La taxonomie en biologie englobe la description, l'identification, la nomenclature et la classification des organismes. Les utilisations de la taxonomie comprennent :

Affaires et économie

Les utilisations de la taxonomie dans les affaires et l'économie comprennent :

Informatique

Génie logiciel

Vegas et al. [8] plaident en faveur de l'avancement des connaissances dans le domaine du génie logiciel grâce à l'utilisation de taxonomies. De même, Ore et al. [9] fournissent une méthodologie systématique pour aborder la construction de taxonomie dans des sujets liés au génie logiciel.

Plusieurs taxonomies ont été proposées dans la recherche sur les tests logiciels pour classer les techniques, les outils, les concepts et les artefacts. Voici quelques exemples de taxonomies :

  1. Une taxonomie des techniques de test basées sur des modèles [10]
  2. Une taxonomie des outils d'analyse de code statique [11]

Engström et al. [12] suggèrent et évaluent l'utilisation d'une taxonomie pour faire le pont entre les chercheurs et les praticiens engagés dans le domaine des tests de logiciels. Ils ont également développé un outil Web [13] pour faciliter et encourager l'utilisation de la taxonomie. L'outil et son code source sont disponibles pour un usage public. [14]

Autres utilisations de la taxonomie en informatique

Éducation et université

Les utilisations de la taxonomie dans l'éducation comprennent :

Sécurité

Les utilisations de la taxonomie en matière de sécurité comprennent :

Autres taxonomies

Publication de recherche

Citant des insuffisances avec les pratiques actuelles dans la liste des auteurs d'articles dans les revues de recherche médicale, Drummond Rennie et ses co-auteurs ont cité dans un article de 1997 du JAMA , le Journal de l'American Medical Association for

un changement conceptuel et systématique radical, afin de refléter les réalités de la paternité multiple et de renforcer la responsabilité. Nous proposons d'abandonner la notion dépassée d'auteur au profit de celle, plus utile et réaliste, de contributeur. [15] : 152 

Depuis 2012, plusieurs grands organismes d'édition académiques et scientifiques ont monté le Projet CRediT pour développer un vocabulaire maîtrisé des rôles des contributeurs. [16] Connu sous le nom de CRediT (Contributor Roles Taxonomy) , il s'agit d'un exemple de taxonomie plate et non hiérarchique ; cependant, il comprend une classification facultative et large du degré de contribution : plomb , égal ou de soutien . Amy Brand et ses co-auteurs résument le résultat escompté comme suit :

L'identification de contributions spécifiques à la recherche publiée conduira à un crédit approprié, à moins de conflits d'auteurs et à moins de désincitations à la collaboration et au partage de données et de code. [15] : 151 

À la mi-2018, cette taxonomie limite apparemment sa portée aux résultats de la recherche , en particulier aux articles de revues ; cependant, il « espère de manière plutôt inhabituelle… soutenir l'identification des évaluateurs par les pairs ». [16] (En tant que tel, il n'a pas encore défini de termes pour de tels rôles d'éditeur ou d'auteur d'un chapitre dans un livre de résultats de recherche.) La version 1, établie par le premier groupe de travail à l'automne (nord) de 2014, identifie 14 rôles de contributeur spécifiques utilisant les termes définis suivants :

  • Conceptualisation
  • Méthodologie
  • Logiciel
  • Validation
  • Analyse formelle
  • Enquête
  • Ressources
  • Curation des données
  • Rédaction – Ébauche originale
  • Rédaction – Révision et édition
  • Visualisation
  • Surveillance
  • Gestion de projet
  • Acquisition de financement

La réception a été mitigée, plusieurs grands éditeurs et revues prévoyant d'avoir mis en œuvre CRediT d'ici la fin de 2018, tandis que presque autant ne sont pas convaincus de la nécessité ou de l'intérêt de l'utiliser. Par exemple,

La National Academy of Sciences a créé une page Web TACS (Transparency in Author Contributions in Science) pour répertorier les revues qui s'engagent à établir des normes de paternité, à définir les responsabilités des auteurs correspondants, à exiger des ID ORCID et à adopter la taxonomie CRediT. [17]

La même page Web contient un tableau répertoriant 21 revues (ou familles de revues), dont :

  • 5 ont mis en place ou auront mis en place fin 2018 le CRediT,
  • 6 exigent une déclaration de contribution de l'auteur et suggèrent d'utiliser CRediT,
  • 8 n'utilisent pas CRediT, dont 3 donnent des raisons de ne pas le faire, et
  • 2 ne sont pas informatifs.

La taxonomie est une norme ouverte conforme aux principes OpenStand [18] et est publiée sous une licence Creative Commons . [16]

Taxonomie pour le web

Les sites Web avec une taxonomie ou une hiérarchie bien conçues sont facilement compris par les utilisateurs, en raison de la possibilité pour les utilisateurs de développer un modèle mental de la structure du site. [19]

Les lignes directrices pour la rédaction d'une taxonomie pour le Web comprennent :

  • Des catégories mutuellement exclusives peuvent être bénéfiques. Si les catégories apparaissent à plusieurs endroits, cela s'appelle cross-listing ou polyhiérarchique. La hiérarchie perdra de sa valeur si la cotation croisée apparaît trop souvent. La liste croisée apparaît souvent lorsque vous travaillez avec des catégories ambiguës qui correspondent à plus d'un endroit. [19]
  • Avoir un équilibre entre largeur et profondeur dans la taxonomie est bénéfique. Trop d'options (largeur), surchargeront les utilisateurs en leur donnant trop de choix. En même temps, avoir une structure trop étroite, avec plus de deux ou trois niveaux de clics, rendra les utilisateurs frustrés et pourraient abandonner. [19]

Relations is-a et has-a, et hyponymie

Deux des types prédominants de relations dans les systèmes de représentation des connaissances sont la prédication et le conditionnel universellement quantifié . Les relations de prédication expriment la notion qu'une entité individuelle est un exemple d'un certain type (par exemple, John est célibataire ), tandis que les conditionnels quantifiés universellement expriment la notion qu'un type est un sous-type d'un autre type (par exemple, " Un chien est un mammifère" , ce qui signifie la même chose que " Tous les chiens sont des mammifères" ). [20]

La relation « has-a » est tout à fait différente : un éléphanta a une trompe ; une trompe est une partie, pas un sous-type d'éléphant. L'étude des relations partie-tout est méréologie .

Les taxonomies sont souvent représentées comme des hiérarchies is-a où chaque niveau est plus spécifique (en langage mathématique "un sous-ensemble de") le niveau au-dessus. Par exemple, une taxonomie de base de la biologie aurait des concepts tels que mammifère , qui est un sous-ensemble d' animal , et chiens et chats , qui sont des sous-ensembles de mammifère . Ce type de taxonomie est appelé un modèle is-a car les objets spécifiques sont considérés comme des instances d'un concept. Par exemple, Fido est une instance du concept dog et Fluffy est un chat . [21]

En linguistique , les relations est-a sont appelées hyponymie . Lorsqu'un mot décrit une catégorie, mais qu'un autre décrit un sous-ensemble de cette catégorie, le plus grand terme est appelé un hyperonyme par rapport au plus petit, et le plus petit est appelé un "hyponyme" par rapport au plus grand. Un tel hyponyme, à son tour, peut avoir d'autres sous-catégories pour lesquelles il s'agit d'un hyperonyme. Dans l'exemple de biologie simple, dog est un hyperonyme par rapport à sa sous-catégorie colley , qui à son tour est un hyperonyme par rapport à Fido qui est l'un de ses hyponymes. En règle générale, cependant, l' hyperonyme est utilisé pour désigner des sous-catégories plutôt que des individus isolés.

Recherche

Comparaison des catégories de petites et grandes populations

Les chercheurs ont signalé que les grandes populations développent systématiquement des systèmes de catégories très similaires. Cela peut être pertinent pour les aspects lexicaux des grands réseaux de communication et des cultures telles que les folksonomies et le langage ou la communication humaine, et la création de sens en général. [22] [23]

Voir aussi

Remarques

  1. ^ Zirn, Cäcilia, Vivi Nastase et Michael Strube. 2008. "Distingushing Between Instances and Classes in the Wikipedia Taxonomy" (conférence vidéo). 5e Conférence annuelle européenne du Web sémantique (ESWC 2008).
  2. ^ S. Ponzetto et M. Strube. 2007. "Dériver une taxonomie à grande échelle de Wikipedia" . Proc. de la 22e Conférence sur l'avancement de l'intelligence artificielle, Vancouver, BC, Canada, pp. 1440-1445.
  3. ^ S. Ponzetto, R. Navigli. 2009. « Cartographie taxonomique à grande échelle pour la restructuration et l'intégration de Wikipedia » . Proc. de la 21e Conférence internationale conjointe sur l'intelligence artificielle (IJCAI 2009), Pasadena, Californie, pp. 2083-2088.
  4. ^ Jackson, Joab. "La taxonomie n'est pas seulement du design, c'est un art", Government Computer News (Washington, DC). 2 septembre 2004.
  5. ^ Suryanto, Hendra et Paul Compton. "Apprentissage des taxonomies de classification à partir d'un système basé sur les connaissances de classification." Université de Karlsruhe ; « Définition de la « taxonomie » », site Web Straights Knowledge.
  6. ^ Grossi, Davide, Frank Dignum et John-Jules Charles Meyer. (2005). "Taxonomies contextuelles" dans Computational Logic in Multi-Agent Systems, pp. 33-51 [ lien mort ] .
  7. ^ Kenneth Boulding; Elias Khalil (2002). Évolution, ordre et complexité . Routledge. ISBN 9780203013151.p. 9
  8. ^ Vegas, S. (2009). « Maturation des connaissances en génie logiciel par les classifications : une étude de cas sur les techniques de tests unitaires ». Transactions IEEE sur le génie logiciel . 35 (4) : 551-565. CiteSeerX 10.1.1.221.7589 . doi : 10.1109/TSE.2009.13 . S2CID 574495 .  
  9. ^ Minerai, S. (2014). « Taxonomie des facteurs de succès critiques pour le déploiement de processus logiciels ». Journal de la qualité des logiciels . 22 (1) : 21-48. doi : 10.1007/s11219-012-9190-y . S2CID 18047921 . 
  10. ^ Utting, Marc (2012). « Une taxonomie des approches de test basées sur des modèles » . Tests de logiciels, vérification et fiabilité . 22 (5) : 297-312. doi : 10.1002/stvr.456 . S2CID 6782211 . 
  11. ^ Novak, Jernej. "Taxonomie des outils d'analyse de code statique" . Actes de la 33e Convention internationale MIPRO : 418-422.
  12. ^ Engström, Emelie (2016). "SERP-test: une taxonomie pour soutenir la communication industrie-université". Journal de la qualité des logiciels . 25 (4) : 1269-1305. doi : 10.1007/s11219-016-9322-x . S2CID 34795073 . 
  13. ^ "SERP-connexion" .
  14. ^ Engstrom, Emelie. "Backend SERP-connect" .
  15. ^ une marque b , Amy ; Allen, Liz ; Altman, Michée ; Hlava, Marjorie ; Scott, Jo (1er avril 2015). "Au-delà de la paternité : attribution, contribution, collaboration et crédit" . L'édition savante . 28 (2) : 151-155. doi : 10.1087/20150211 . S2CID 45167271 . 
  16. ^ A b c "crédit" . CASRAI . CASRAI . 2 mai 2018. Archivé de l'original (en ligne) le 12 juin 2018 . Consulté le 13 juin 2018 .
  17. ^ "Transparence des contributions de l'auteur à la science (TACS)" (en ligne) . Académie nationale des sciences . Académie nationale des sciences. 2018 . Consulté le 13 juin 2018 .
  18. ^ "OpenStand" . OpenStand . Consulté le 13 juin 2018 .
  19. ^ A b c Peter., Morville (2007). Architecture de l'information pour le World Wide Web . Rosenfeld, Louis., Rosenfeld, Louis. (3e éd.). Sébastopol, Californie : O'Reilly. ISBN 9780596527341. OCLC  86110226 .
  20. ^ Ronald J. Brachman ; Qu'est-ce que IS-A est et n'est pas. Une analyse des liens taxonomiques dans les réseaux sémantiques . Ordinateur IEEE, 16 (10) ; octobre 1983.
  21. ^ Brachman, Ronald (octobre 1983). "Qu'est-ce qu'IS-A est et n'est pas. Une analyse des liens taxonomiques dans les réseaux sémantiques". Ordinateur IEEE . 16 (10) : 30-36. doi : 10.1109/MC.1983.1654194 . S2CID 16650410 . 
  22. ^ « Pourquoi les cultures indépendantes pensent de la même manière en ce qui concerne les catégories : ce n'est pas dans le cerveau » . phys.org . Récupéré le 13 février 2021 .
  23. ^ Guilbeault, Douglas; Baronchelli, Andréa; Centola, Damon (12 janvier 2021). "Preuve expérimentale de la convergence des catégories induite par l'échelle entre les populations" . Communications naturelles . 12 (1): 327. bibcode : 2021NatCo..12..327G . doi : 10.1038/s41467-020-20037-y . ISSN 2041-1723 . PMC 7804416 . PMID 33436581 .    CC-BY icon.svgDisponible sous CC BY 4.0 .

Références

Liens externes