Taxonomie

Un article de Wikipédia, l'encyclopédie libre
Aller à la navigation Aller à la recherche

La taxonomie est la pratique et la science de la catégorisation ou de la classification .

Une taxonomie (ou classification taxonomique) est un schéma de classification, en particulier une classification hiérarchique, dans lequel les choses sont organisées en groupes ou types. Entre autres choses, une taxonomie peut être utilisée pour organiser et indexer les connaissances (stockées sous forme de documents, d'articles, de vidéos, etc.), comme sous la forme d'un système de classification de bibliothèque , ou d'une taxonomie de moteur de recherche , afin que les utilisateurs puissent plus facilement trouver les informations qu'ils recherchent. De nombreuses taxonomies sont des hiérarchies (et ont donc une arborescence intrinsèque ), mais toutes ne le sont pas.

À l'origine, la taxonomie se référait uniquement à la catégorisation des organismes ou à une catégorisation particulière d'organismes. Dans un sens plus large, plus général, il peut faire référence à une catégorisation de choses ou de concepts, ainsi qu'aux principes qui sous-tendent une telle catégorisation. La taxonomie organise des unités taxonomiques appelées "taxons" (singulier "taxon")."

La taxonomie est différente de la méronomie , qui traite de la catégorisation des parties d'un tout.

Étymologie

Le mot a été inventé en 1813 par le botaniste suisse AP de Candolle et est irrégulièrement composé du grec τάξις , taxis 'ordre' et νόμος , nomos 'loi', reliés par la forme française -o- ; la forme régulière serait la taxinomie , telle qu'utilisée dans le réemprunt grec ταξινομία . [1] [2]

Candidatures

Les catégories de Wikipédia forment une taxonomie, [3] qui peut être extraite par des moyens automatiques. [4] Depuis 2009 , il a été démontré qu'une taxonomie construite manuellement, telle que celle des lexiques informatiques comme WordNet , peut être utilisée pour améliorer et restructurer la taxonomie des catégories de Wikipédia. [5]

Dans un sens plus large, la taxonomie s'applique également aux schémas de relations autres que les hiérarchies parent-enfant, telles que les structures de réseau . Les taxonomies peuvent alors inclure un seul enfant avec plusieurs parents, par exemple, "Voiture" peut apparaître avec les deux parents "Véhicule" et "Mécanismes en acier" ; pour certains cependant, cela signifie simplement que «voiture» fait partie de plusieurs taxonomies différentes. [6] Une taxonomie peut aussi être simplement une organisation de types de choses en groupes, ou une liste alphabétique ; ici, cependant, le terme vocabulaire est plus approprié. Dans l'usage courant dans la gestion des connaissances , les taxonomies sont considérées comme plus étroites que les ontologies puisque les ontologies appliquent une plus grande variété de types de relations. [sept]

Mathématiquement, une taxonomie hiérarchique est une arborescence de classifications pour un ensemble donné d'objets. Il est également nommé hiérarchie de confinement . Au sommet de cette structure se trouve une classification unique, le nœud racine, qui s'applique à tous les objets. Les nœuds sous cette racine sont des classifications plus spécifiques qui s'appliquent à des sous-ensembles de l'ensemble total d'objets classifiés. La progression du raisonnement va du général au plus spécifique.

En revanche, dans le contexte de la terminologie juridique, une taxonomie contextuelle ouverte est employée - une taxonomie valable uniquement par rapport à un contexte spécifique. Dans les scénarios tirés du domaine juridique, un compte rendu formel de la texture ouverte des termes juridiques est modélisé, ce qui suggère des notions variables du « cœur » et de la « pénombre » des significations d'un concept. La progression du raisonnement va du particulier au plus général. [8]

Historique

Les anthropologues ont observé que les taxonomies sont généralement intégrées dans les systèmes culturels et sociaux locaux et remplissent diverses fonctions sociales. L'étude la plus connue et la plus influente sur les taxonomies folkloriques est peut- être celle d' Émile Durkheim , Les Formes élémentaires de la vie religieuse . Un traitement plus récent des taxonomies folkloriques (y compris les résultats de plusieurs décennies de recherche empirique) et la discussion de leur relation avec la taxonomie scientifique peuvent être trouvés dans Cognitive Foundations of Natural History de Scott Atran .Les taxonomies folkloriques d'organismes se sont avérées en grande partie conformes à la classification scientifique, du moins pour les espèces les plus grandes et les plus évidentes, ce qui signifie qu'il n'est pas vrai que les taxonomies folkloriques soient basées uniquement sur des caractéristiques utilitaires. [9]

Au XVIIe siècle, le mathématicien et philosophe allemand Gottfried Leibniz , suivant les travaux du philosophe majorquin du XIIIe siècle Ramon Llull sur son Ars generalis ultima , un système de génération procédurale de concepts en combinant un ensemble fixe d'idées, a cherché à développer un alphabet de pensée humaine . Leibniz voulait que sa featurea universalis soit une « algèbre » capable d'exprimer toute pensée conceptuelle. Le concept de création d'un tel « langage universel » a été fréquemment examiné au XVIIe siècle, notamment par le philosophe anglais John Wilkins dans son ouvrageUn essai vers un personnage réel et un langage philosophique (1668), dont dérive finalement le schéma de classification duThésaurus de Roget .

Taxonomie dans diverses disciplines

Sciences naturelles

La taxonomie en biologie englobe la description, l'identification, la nomenclature et la classification des organismes. Les utilisations de la taxonomie comprennent :

Affaires et économie

Les utilisations de la taxonomie dans les affaires et l'économie comprennent:

Informatique

Génie logiciel

Végas et al. [10] présentent des arguments convaincants pour faire progresser les connaissances dans le domaine du génie logiciel grâce à l'utilisation de taxonomies. De même, Ore et al. [11] fournissent une méthodologie systématique pour aborder la construction de taxonomie dans des sujets liés au génie logiciel.

Plusieurs taxonomies ont été proposées dans la recherche sur les tests de logiciels pour classer les techniques, les outils, les concepts et les artefacts. Voici quelques exemples de taxonomies :

  1. Une taxonomie des techniques de test basées sur des modèles [12]
  2. Une taxonomie des outils d'analyse de code statique [13]

Engstrom et al. [14] suggèrent et évaluent l'utilisation d'une taxonomie pour relier la communication entre les chercheurs et les praticiens engagés dans le domaine des tests de logiciels. Ils ont également développé un outil en ligne [15] pour faciliter et encourager l'utilisation de la taxonomie. L'outil et son code source sont disponibles pour un usage public. [16]

Autres utilisations de la taxonomie en informatique

Éducation et milieu universitaire

Les utilisations de la taxonomie dans l'éducation comprennent:

Sécurité

Les utilisations de la taxonomie en matière de sécurité comprennent :

Autres taxonomies

Publication de recherche

Citant des insuffisances avec les pratiques actuelles dans la liste des auteurs d'articles dans les revues de recherche médicale, Drummond Rennie et ses co-auteurs ont appelé dans un article de 1997 dans JAMA , le Journal de l'American Medical Association for

un changement conceptuel et systématique radical, pour refléter les réalités de la pluralité des auteurs et pour renforcer la responsabilité. Nous proposons d'abandonner la notion désuète d'auteur au profit de celle, plus utile et réaliste, de contributeur. [17] : 152 

Depuis 2012, plusieurs grands corps éditoriaux académiques et scientifiques ont monté le projet CRediT pour développer un vocabulaire maîtrisé des rôles des contributeurs. [18] Connu sous le nom de CRediT (Contributor Roles Taxonomy) , il s'agit d'un exemple de taxonomie plate et non hiérarchique ; cependant, il inclut une large classification facultative du degré de contribution : lead , equal ou supporting . Amy Brand et les co-auteurs résument leur résultat attendu comme suit :

L'identification de contributions spécifiques à la recherche publiée conduira à un crédit approprié, à moins de conflits d'auteurs et à moins de désincitations à la collaboration et au partage de données et de code. [17] : 151 

Depuis la mi-2018, cette taxonomie limite apparemment sa portée aux résultats de la recherche , en particulier aux articles de revues ; cependant, il « espère de manière assez inhabituelle… soutenir l'identification des pairs examinateurs ». [18] (En tant que tel, il n'a pas encore défini les termes pour des rôles tels que l'éditeur ou l'auteur d'un chapitre dans un livre de résultats de recherche.) La version 1, établie par le premier groupe de travail à l'automne (nord) de 2014, identifie 14 rôles de contributeur spécifiques utilisant les termes définis suivants :

  • Conceptualisation
  • Méthodologie
  • Logiciel
  • Validation
  • Analyse formelle
  • Enquête
  • Ressources
  • Conservation des données
  • Rédaction – Brouillon original
  • Rédaction – révision et édition
  • Visualisation
  • Surveillance
  • Gestion de projet
  • Acquisition de financement

L'accueil a été mitigé, plusieurs grands éditeurs et revues prévoyant d'avoir mis en œuvre CRediT d'ici la fin de 2018, alors que presque autant ne sont pas convaincus de la nécessité ou de l'intérêt de l'utiliser. Par exemple,

L' Académie nationale des sciences a créé une page Web TACS (Transparency in Author Contributions in Science) pour répertorier les revues qui s'engagent à établir des normes d'auteur, à définir les responsabilités des auteurs correspondants, à exiger des identifiants ORCID et à adopter la taxonomie CRediT. [19]

La même page web comporte un tableau répertoriant 21 revues (ou familles de revues), dont :

  • 5 ont, ou auront d'ici fin 2018, mis en place le CRediT,
  • 6 exiger une déclaration de contribution de l'auteur et suggérer d'utiliser CRediT,
  • 8 n'utilisent pas le CRediT, dont 3 donnent les raisons de ne pas l'utiliser, et
  • 2 ne sont pas informatifs.

La taxonomie est une norme ouverte conforme aux principes OpenStand , [20] et est publiée sous une licence Creative Commons . [18]

Taxonomie pour le web

Les sites Web avec une taxonomie ou une hiérarchie bien conçue sont facilement compris par les utilisateurs, en raison de la possibilité pour les utilisateurs de développer un modèle mental de la structure du site. [21]

Les lignes directrices pour la rédaction d'une taxonomie pour le Web comprennent :

  • Des catégories mutuellement exclusives peuvent être bénéfiques. Si les catégories apparaissent à plusieurs endroits, cela s'appelle du cross-listing ou polyhiérarchique. La hiérarchie perdra de sa valeur si les listes croisées apparaissent trop souvent. Les listes croisées apparaissent souvent lorsque vous travaillez avec des catégories ambiguës qui correspondent à plusieurs endroits. [21]
  • Il est avantageux d'avoir un équilibre entre l'étendue et la profondeur de la taxonomie. Trop d'options (largeur), surchargeront les utilisateurs en leur donnant trop de choix. En même temps, avoir une structure trop étroite, avec plus de deux ou trois niveaux de clics, rendra les utilisateurs frustrés et pourraient abandonner. [21]

hyponymie

Deux des types prédominants de relations dans les systèmes de représentation des connaissances sont la prédication et le conditionnel universellement quantifié . Les relations de prédication expriment la notion qu'une entité individuelle est un exemple d'un certain type (par exemple, John est célibataire ), tandis que les conditions universellement quantifiées expriment la notion qu'un type est un sous-type d'un autre type (par exemple, " Un chien est un mammifère" , ce qui signifie la même chose que " Tous les chiens sont des mammifères" ). [22]

La relation « a-a » est tout à fait différente : un éléphant a une trompe ; une trompe est une partie, pas un sous-type d'éléphant. L'étude des relations partie-tout relève de la méréologie .

Les taxonomies sont souvent représentées comme des hiérarchies is-a où chaque niveau est plus spécifique (en langage mathématique "un sous-ensemble de") le niveau supérieur. Par exemple, une taxonomie biologique de base aurait des concepts tels que mammifère , qui est un sous-ensemble d' animal , et chiens et chats , qui sont des sous-ensembles de mammifère . Ce type de taxonomie est appelé un modèle is-a car les objets spécifiques sont considérés comme des instances d'un concept. Par exemple, Fido est une instance du concept chien et Fluffy est un chat . [23]

En linguistique , les relations is-a sont appelées hyponymie . Lorsqu'un mot décrit une catégorie, mais qu'un autre décrit un sous-ensemble de cette catégorie, le terme le plus large est appelé un hypernyme par rapport au plus petit, et le plus petit est appelé un "hyponyme" par rapport au plus grand. Un tel hyponyme, à son tour, peut avoir d'autres sous-catégories pour lesquelles il est un hypernyme. Dans l'exemple de la biologie simple, chien est un hypernyme par rapport à sa sous-catégorie colley , qui à son tour est un hypernyme par rapport à Fido qui est l'un de ses hyponymes. En règle générale, cependant, l'hypernyme est utilisé pour désigner des sous-catégories plutôt que des individus uniques.

Recherche

Comparaison des catégories de petites et grandes populations

Les chercheurs ont rapporté que de grandes populations développent systématiquement des systèmes de catégories très similaires. Cela peut être pertinent pour les aspects lexicaux des grands réseaux et cultures de communication tels que les folksonomies et le langage ou la communication humaine, et la création de sens en général. [24] [25]

Voir aussi

Remarques

  1. ^ Dictionnaire anglais d'Oxford . Presse universitaire d'Oxford. 1910.(partiellement mis à jour décembre 2021), sv
  2. ^ critique des Aperçus de Taxinomie Générale dans Nature 60 : 489–490 (1899)
  3. ^ Zirn, Cäcilia, Vivi Nastase et Michael Strube. 2008. "Distinguishing Between Instances and Classes in the Wikipedia Taxonomy" (conférence vidéo). 5e conférence européenne annuelle sur le Web sémantique (ESWC 2008).
  4. ^ S. Ponzetto et M. Strube. 2007. "Dériver une taxonomie à grande échelle de Wikipedia" . Proc. de la 22e Conférence sur l'avancement de l'intelligence artificielle, Vancouver, Colombie-Britannique, Canada, pp. 1440-1445.
  5. ^ S. Ponzetto, R. Navigli. 2009. " Cartographie taxonomique à grande échelle pour la restructuration et l'intégration de Wikipédia " . Proc. de la 21e Conférence conjointe internationale sur l'intelligence artificielle (IJCAI 2009), Pasadena, Californie, pp. 2083-2088.
  6. ^ Jackson, Joab. "La taxonomie n'est pas seulement du design, c'est un art", Government Computer News (Washington, DC). 2 septembre 2004.
  7. ^ Suryanto, Hendra et Paul Compton. "Apprentissage des taxonomies de classification à partir d'un système basé sur les connaissances de classification." Université de Karlsruhe ; "Définir la 'taxonomie'", site Web de Straights Knowledge.
  8. ^ Grossi, Davide, Frank Dignum et John-Jules Charles Meyer. (2005). "Taxonomies contextuelles" dans la logique computationnelle dans les systèmes multi-agents, pp. 33-51 [ lien mort ] .
  9. ^ Kenneth Boulding; Elias Khalil (2002). Évolution, ordre et complexité . Routledge. ISBN 9780203013151.p. 9
  10. ^ Vegas, S. (2009). « Faire mûrir les connaissances en génie logiciel grâce aux classifications: une étude de cas sur les techniques de test unitaire ». Transactions IEEE sur le génie logiciel . 35 (4): 551–565. CiteSeerX 10.1.1.221.7589 . doi : 10.1109/TSE.2009.13 . S2CID 574495 .  
  11. ^ Minerai, S. (2014). "Taxonomie des facteurs de succès critiques pour le déploiement de processus logiciels". Journal de la qualité des logiciels . 22 (1): 21–48. doi : 10.1007/s11219-012-9190-y . S2CID 18047921 . 
  12. ^ Utting, Mark (2012). "Une taxonomie des approches de test basées sur des modèles" . Test, vérification et fiabilité des logiciels . 22 (5): 297–312. doi : 10.1002/stvr.456 . S2CID 6782211 . 
  13. ^ Novak, Jernej (mai 2010). "Taxonomie des outils d'analyse de code statique" . Actes de la 33ème Convention Internationale MIPRO : 418–422.
  14. ^ Engström, Emelie (2016). "SERP-test: une taxonomie pour soutenir la communication industrie-université". Journal de la qualité des logiciels . 25 (4) : 1269-1305. doi : 10.1007/s11219-016-9322-x . S2CID 34795073 . 
  15. ^ "SeRP-connecter" .
  16. ^ Engstrom, Emelie (4 décembre 2019). "Backend de connexion SERP" . GitHub .
  17. ^ une marque b , Amy ; Allen, Liz; Altman, Michée ; Hlava, Marjorie; Scott, Jo (1er avril 2015). "Au-delà de la paternité : attribution, contribution, collaboration et crédit" . Édition savante . 28 (2): 151–155. doi : 10.1087/20150211 . S2CID 45167271 . 
  18. ^ un bc " CRediT " . CASRAI . CASRAI . 2 mai 2018. Archivé de l'original (en ligne) le 12 juin 2018 . Récupéré le 13 juin 2018 .
  19. ^ "Transparence dans les contributions des auteurs en science (TACS)" (en ligne) . Académie nationale des sciences . Académie nationale des sciences. 2018 . Récupéré le 13 juin 2018 .
  20. ^ "OpenStand" . OpenStand . Récupéré le 13 juin 2018 .
  21. ^ un bc Peter., Morville (2007) . Architecture de l'information pour le World Wide Web . Rosenfeld, Louis., Rosenfeld, Louis. (3e éd.). Sébastopol, Californie : O'Reilly. ISBN 9780596527341. OCLC  86110226 .
  22. ^ Ronald J. Brachman ; Qu'est-ce qu'IS-A est et n'est pas. Une analyse des liens taxonomiques dans les réseaux sémantiques . Ordinateur IEEE, 16 (10); Octobre 1983.
  23. ^ Brachman, Ronald (octobre 1983). "Ce qu'est et n'est pas IS-A. Une analyse des liens taxonomiques dans les réseaux sémantiques". Ordinateur IEEE . 16 (10): 30–36. doi : 10.1109/MC.1983.1654194 . S2CID 16650410 . 
  24. ^ "Pourquoi les cultures indépendantes pensent de la même manière en ce qui concerne les catégories : ce n'est pas dans le cerveau" . phys.org . Récupéré le 13 février 2021 .
  25. ^ Guilbeault, Douglas; Baronchelli, Andrea; Centola, Damon (12 janvier 2021). "Preuve expérimentale de la convergence des catégories induite par l'échelle à travers les populations" . Communication Nature . 12 (1): 327. Bibcode : 2021NatCo..12..327G . doi : 10.1038/s41467-020-20037-y . ISSN 2041-1723 . PMC 7804416 . PMID 33436581 .    CC-BY icône.svgDisponible sous CC BY 4.0 .

Références

Liens externes