Catégorisation

Un article de Wikipédia, l'encyclopédie libre
Aller à la navigation Aller à la recherche

La catégorisation est la capacité et l'activité de reconnaître des caractéristiques communes ou des similitudes entre les éléments de l' expérience du monde (tels que des objets , des événements ou des idées ), d'organiser et de classer l'expérience en les associant à un groupe plus abstrait (c'est-à-dire une catégorie , classe ou type), [1] [2] sur la base de leurs traits, caractéristiques, similitudes ou autres critères. La catégorisation est considérée comme l'une des capacités cognitives les plus fondamentales , et en tant que telle, elle est particulièrement étudiée par la psychologie et la linguistique cognitive .

La catégorisation est parfois considérée comme synonyme de classification (cf., Les synonymes de classification ). La catégorisation et la classification permettent aux humains d'organiser les choses, les objets et les idées qui existent autour d'eux et de simplifier leur compréhension du monde. [3] La catégorisation est quelque chose que les humains et d'autres organismes font : "faire la bonne chose avec le bon genre de chose." L'activité de catégorisation des choses peut être non verbale ou verbale. Pour les humains, les objets concrets et les idées abstraites sont reconnus, différenciés et compris par catégorisation. Les objets sont généralement classés à des fins adaptatives ou pragmatiques.

La catégorisation est fondée sur les caractéristiques qui distinguent les membres de la catégorie des non-membres. La catégorisation est importante dans l'apprentissage, la prédiction, l' inférence , la prise de décision , le langage et de nombreuses formes d'interaction des organismes avec leur environnement.

Aperçu de la catégorisation

Les catégories sont des collections distinctes d'instances concrètes ou abstraites (membres de catégorie) qui sont considérées comme équivalentes par le système cognitif. L'utilisation de la connaissance des catégories nécessite d'accéder à des représentations mentales qui définissent les caractéristiques fondamentales des membres de la catégorie (les psychologues cognitifs appellent ces représentations mentales spécifiques à la catégorie des concepts ). [4] [5]

Pour les théoriciens de la catégorisation, la catégorisation des objets est souvent envisagée à l'aide de taxonomies à trois niveaux hiérarchiques d' abstraction . [6] Par exemple, une plante pourrait être identifiée à un niveau d'abstraction élevé en l'étiquetant simplement comme une fleur, un niveau d'abstraction moyen en spécifiant que la fleur est une rose, ou un faible niveau d'abstraction en spécifiant davantage cette rose particulière comme un chien rose. Les catégories d'une taxonomie sont liées les unes aux autres via l'inclusion de classes, le niveau d'abstraction le plus élevé étant le plus inclusif et le niveau d'abstraction le plus bas étant le moins inclusif. [6] Les trois niveaux d'abstraction sont les suivants :

  • Niveau supérieur (par exemple, Fleur) - Le niveau d'abstraction le plus élevé et le plus inclusif. Présente le plus haut degré de généralité et le plus faible degré de similarité intra-catégorie. [7]
  • Niveau de base (par exemple, Rose) - Le niveau moyen d'abstraction. Rosch et ses collègues (1976) suggèrent que le niveau de base est le plus efficace sur le plan cognitif. [6] Les catégories de niveau de base présentent de fortes similitudes au sein des catégories et de fortes dissemblances entre les catégories . De plus, le niveau de base est le niveau le plus inclusif auquel les exemplaires de catégorie partagent une forme identifiable généralisée. [6] Les adultes utilisent le plus souvent des noms d'objets de base, et les enfants apprennent d'abord les noms d'objets de base. [6]
  • Niveau subordonné (par exemple, Dog Rose) - Le niveau d'abstraction le plus bas. Présente le plus haut degré de spécificité et un degré élevé de similitude au sein de la catégorie. [7]

Théories de la catégorisation

Vue classique

La théorie classique de la catégorisation est un terme utilisé en linguistique cognitive pour désigner l'approche de la catégorisation qui apparaît chez Platon et Aristote et qui a été très influente et dominante dans la culture occidentale, en particulier en philosophie, linguistique et psychologie. [8] [9] La vue classique des catégories peut se résumer en trois hypothèses: une catégorie peut être décrit comme une liste de nécessaire et suffisanteles caractéristiques que doit posséder son membre ; les catégories sont discrètes, elles ont des frontières clairement définies (un élément appartient à l'un ou non, sans aucune possibilité entre les deux) ; tous les membres d'une catégorie ont le même statut (c'est-à-dire qu'il n'y a pas de meilleurs membres de la catégorie qui appartiennent plus que d'autres). [1] [10] [8] Dans la vision classique, les catégories doivent être clairement définies, mutuellement exclusives et collectivement exhaustives ; ainsi, toute entité de l'univers de classification donné appartient sans équivoque à une, et une seule, des catégories proposées. [ citation nécessaire ]

La vision classique des catégories est apparue pour la première fois dans le contexte de la philosophie occidentale dans l'œuvre de Platon , qui, dans son dialogue Statesman , introduit l'approche consistant à regrouper les objets en fonction de leurs propriétés similaires . Cette approche a été explorée et systématisée par Aristote dans son traité des Catégories , où il analyse les différences entre les classes et les objets.. Aristote a également appliqué intensivement le schéma de catégorisation classique dans son approche de la classification des êtres vivants (qui utilise la technique consistant à appliquer des questions restrictives successives telles que « Est-ce un animal ou un végétal ? », « Combien de pieds a-t-il ? », » A-t-il de la fourrure ou des plumes ?", "Peut-il voler ?"...), établissant ainsi la base de la taxonomie naturelle .

Des exemples de l'utilisation de la vue classique des catégories peuvent être trouvés dans les travaux philosophiques occidentaux de Descartes , Blaise Pascal , Spinoza et John Locke , et au 20e siècle chez Bertrand Russell , GE Moore , les positivistes logiques . Il a été la pierre angulaire de la philosophie analytique et de son analyse conceptuelle , avec des formulations plus récentes proposées dans les années 1990 par Frank Cameron Jackson et Christopher Peacocke . [11] [12] [13]

Le modèle classique de catégorisation a été utilisé au moins depuis les années 1960 par les linguistes du paradigme de la sémantique structurelle , par Jerrold Katz et Jerry Fodor en 1963, qui à leur tour ont influencé son adoption également par des psychologues comme Allan M. Collins et M. Ross Quillian . [1] [14]

Les versions modernes de la théorie de la catégorisation classique étudient comment le cerveau apprend et représente les catégories en détectant les caractéristiques qui distinguent les membres des non-membres. [15] [16]

Théorie des prototypes

Les recherches pionnières de la psychologue Eleanor Rosch et de ses collègues depuis 1973 ont introduit la théorie des prototypes , selon laquelle la catégorisation peut également être considérée comme le processus de regroupement d'éléments sur la base de prototypes . Cette approche a été très influente, en particulier pour la linguistique cognitive . [1] Il est en partie basée sur des idées précédentes, en particulier la formulation d'un modèle de catégorie fondée sur la ressemblance de famille par Wittgenstein (1953), et par Roger Brown est Comment une chose doit être appelé? (1958). [1]

La théorie des prototypes a ensuite été adoptée par des linguistes cognitifs comme George Lakoff . La théorie du prototype est un exemple d'une approche de catégorisation basée sur la similitude, dans laquelle une représentation de catégorie stockée est utilisée pour évaluer la similitude des membres de la catégorie candidats. [17] Selon la théorie du prototype, cette représentation stockée consiste en une représentation sommaire des membres de la catégorie. Ce prototype de stimulus peut prendre diverses formes. Il peut s'agir d'une tendance centrale qui représente le membre moyen de la catégorie, d'un stimulus modal représentant soit l'instance la plus fréquente, soit un stimulus composé des caractéristiques les plus courantes de la catégorie, ou, enfin, le membre de catégorie « idéal », ou une caricature qui met l'accent sur le caractéristiques distinctes de la catégorie. [18]Une considération importante de cette représentation prototype est qu'elle ne reflète pas nécessairement l'existence d'une instance réelle de la catégorie dans le monde. [18] De plus, les prototypes sont très sensibles au contexte. [19] Par exemple, alors que le prototype de la catégorie de boissons peut être un soda ou un seltz, le contexte du brunch peut les conduire à choisir le mimosa comme boisson prototype.

La théorie du prototype prétend que les membres d'une catégorie donnée partagent un air de famille , et les catégories sont définies par des ensembles de caractéristiques typiques (par opposition à tous les membres possédant des caractéristiques nécessaires et suffisantes). [20]

Théorie exemplaire

Autre exemple de l'approche de la catégorisation basée sur la similitude, la théorie de l'exemple compare également la similitude des membres de la catégorie candidats aux représentations de la mémoire stockée. Selon la théorie des exemplaires, toutes les instances connues d'une catégorie sont stockées en mémoire en tant qu'exemplaires. Lors de l'évaluation de l'appartenance à une catégorie d'une entité inconnue, des exemplaires de catégories potentiellement pertinentes sont récupérés de la mémoire, et la similitude de l'entité avec ces exemplaires est additionnée pour formuler une décision de catégorisation. [18] Le modèle de contexte de Medin et Schaffer (1978) utilise un voisin le plus procheapproche qui, plutôt que de résumer les similitudes d'une entité avec des exemplaires pertinents, les multiplie pour fournir des similitudes pondérées qui reflètent la proximité de l'entité avec des exemplaires pertinents. [21] Cela biaise efficacement les décisions de catégorisation vers les exemplaires les plus similaires à l'entité à catégoriser. [21] [22]

Clustering conceptuel

Regroupement conceptuel est un apprentissage machine paradigme pour la classification non supervisée qui a été défini par Ryszard S. Michalski en 1980. [23] [24] Il est une variante moderne de l'approche classique de la catégorisation, et découle de tentatives d'expliquer comment la connaissance est représentée . Dans cette approche, les classes (clusters ou entités) sont générées en formulant d'abord leurs descriptions conceptuelles puis en classant les entités selon les descriptions. [25]

Le clustering conceptuel s'est développé principalement au cours des années 1980, en tant que paradigme machine pour l'apprentissage non supervisé . Il se distingue du regroupement de données ordinaire en générant une description de concept pour chaque catégorie générée.

Le clustering conceptuel est étroitement lié à la théorie des ensembles flous , dans laquelle les objets peuvent appartenir à un ou plusieurs groupes, à divers degrés de fitness. Une approche cognitive accepte que les catégories naturelles soient graduées (elles ont tendance à être floues à leurs frontières) et incohérentes dans le statut de leurs membres constitutifs. L'idée de conditions nécessaires et suffisantes n'est presque jamais rencontrée dans les catégories de choses naturelles.

Catégorie apprentissage

Bien qu'une discussion exhaustive de l'apprentissage par catégorie dépasse le cadre de cet article, un bref aperçu de l'apprentissage par catégorie et de ses théories associées est utile pour comprendre les modèles formels de catégorisation.

Si la recherche sur la catégorisation étudie comment les catégories sont maintenues et utilisées, le domaine de l'apprentissage des catégories cherche à comprendre comment les catégories sont acquises en premier lieu. Pour ce faire, les chercheurs emploient souvent de nouvelles catégories d'objets arbitraires (par exemple, des matrices de points) pour s'assurer que les participants ne connaissent pas du tout les stimuli. [26] Les chercheurs en apprentissage par catégorie se sont généralement concentrés sur deux formes distinctes d'apprentissage par catégorie. L'apprentissage de la classification charge les participants de prédire les étiquettes de catégorie pour un stimulus en fonction de ses caractéristiques fournies. L'apprentissage de la classification est centré sur l'apprentissage des informations entre les catégories et les caractéristiques de diagnostic des catégories. [27] En revanche, l' apprentissage par inférencecharge les participants de déduire la présence/la valeur d'une caractéristique de catégorie sur la base d'une étiquette de catégorie fournie et/ou de la présence d'autres caractéristiques de catégorie. L'apprentissage par inférence est centré sur l'apprentissage des informations au sein de la catégorie et des caractéristiques prototypiques de la catégorie. [27]

Les tâches d'apprentissage par catégorie peuvent généralement être divisées en deux catégories, l'apprentissage supervisé et l'apprentissage non supervisé. Les tâches d' apprentissage supervisé fournissent aux apprenants des étiquettes de catégorie. Les apprenants utilisent ensuite les informations extraites des catégories d'exemples étiquetées pour classer les stimuli dans la catégorie appropriée, ce qui peut impliquer l' abstraction d'une règle ou d'un concept reliant les caractéristiques des objets observés aux étiquettes de catégorie. Les tâches d' apprentissage non supervisées ne fournissent pas aux apprenants d'étiquettes de catégorie. Les apprenants doivent donc reconnaître les structures inhérentes à un ensemble de données et regrouper les stimuli par similarité dans les classes. L'apprentissage non supervisé est donc un processus de génération d'une structure de classification. Les tâches utilisées pour étudier l'apprentissage par catégorie prennent diverses formes :

  • Les tâches basées sur des règles présentent des catégories que les participants peuvent apprendre à travers des processus de raisonnement explicites. Dans ce genre de tâches, la classification des stimuli est accomplie via l'utilisation d'une règle acquise (c'est-à-dire, si le stimulus est grand sur la dimension x, répondez A).
  • Les tâches d'intégration de l'information nécessitent que les apprenants synthétisent les informations perceptives à partir de plusieurs dimensions de stimulus avant de prendre des décisions de catégorisation. Contrairement aux tâches basées sur des règles, les tâches d'intégration d'informations n'offrent pas de règles facilement articulables. Lire une radiographie et essayer de déterminer si une tumeur est présente peut être considéré comme une instanciation réelle d'une tâche d'intégration d'informations.
  • Les tâches de distorsion de prototype nécessitent que les apprenants génèrent un prototype pour une catégorie. Des exemplaires candidats pour la catégorie sont ensuite produits en manipulant au hasard les caractéristiques du prototype, que les apprenants doivent classer comme appartenant ou non à la catégorie.

Théories d'apprentissage par catégorie

Les chercheurs en apprentissage par catégorie ont proposé diverses théories sur la façon dont les humains apprennent les catégories. [28] Les théories dominantes de l'apprentissage par catégorie incluent la théorie du prototype, la théorie de l'exemple et la théorie de la décision. [26]

La théorie du prototype suggère que pour apprendre une catégorie, il faut apprendre le prototype de la catégorie. La catégorisation ultérieure des nouveaux stimuli est ensuite effectuée en sélectionnant la catégorie avec le prototype le plus similaire. [26]

La théorie des exemplaires suggère que pour apprendre une catégorie, il faut se renseigner sur les exemplaires qui appartiennent à cette catégorie. La catégorisation ultérieure d'un nouveau stimulus est ensuite accomplie en calculant sa similarité avec les exemplaires connus des catégories potentiellement pertinentes et en sélectionnant la catégorie qui contient les exemplaires les plus similaires. [21]

La théorie des limites de décision suggère que pour apprendre une catégorie, il faut soit apprendre les régions d'un espace de stimulus associées à des réponses particulières, soit les limites (les limites de décision) qui divisent ces régions de réponse. La catégorisation d'un nouveau stimulus est ensuite accomplie en déterminant dans quelle région de réponse il est contenu. [29]

Modèles formels de catégorisation

Des modèles informatiques de catégorisation ont été développés pour tester des théories sur la façon dont les humains représentent et utilisent les informations de catégorie. [18] Pour ce faire, les modèles de catégorisation peuvent être ajustés aux données expérimentales pour voir dans quelle mesure les prédictions fournies par le modèle s'alignent sur les performances humaines. Sur la base du succès du modèle à expliquer les données, les théoriciens sont en mesure de tirer des conclusions sur l'exactitude de leurs théories et la pertinence de leur théorie pour les représentations des catégories humaines.

Pour capturer efficacement comment les humains représentent et utilisent les informations de catégorie, les modèles de catégorisation fonctionnent généralement sous des variations des trois mêmes hypothèses de base. [30] [18] Premièrement, le modèle doit faire une sorte d'hypothèse sur la représentation interne du stimulus (par exemple, représenter la perception d'un stimulus comme un point dans un espace multidimensionnel). [30] Deuxièmement, le modèle doit émettre une hypothèse sur les informations spécifiques auxquelles il faut accéder pour formuler une réponse (par exemple, les modèles exemplaires nécessitent la collecte de tous les exemplaires disponibles pour chaque catégorie). [21] Troisièmement, le modèle doit faire une hypothèse sur la façon dont une réponse est sélectionnée compte tenu des informations disponibles. [30]

Bien que tous les modèles de catégorisation fassent ces trois hypothèses, ils se distinguent par la manière dont ils représentent et transforment une entrée en une représentation de réponse. [18] Les structures de connaissances internes de divers modèles de catégorisation reflètent la ou les représentations spécifiques qu'ils utilisent pour effectuer ces transformations. Les représentations typiques utilisées par les modèles incluent les exemplaires, les prototypes et les règles. [18]

  • Les modèles exemplaires stockent toutes les instances distinctes de stimuli avec leurs étiquettes de catégorie correspondantes en mémoire. La catégorisation des stimuli ultérieurs est déterminée par la similitude collective du stimulus avec tous les exemplaires connus.
  • Les modèles prototypes stockent une représentation récapitulative de toutes les instances d'une catégorie. La catégorisation des stimuli ultérieurs est déterminée en sélectionnant la catégorie dont le prototype est le plus similaire au stimulus.
  • Les modèles basés sur des règles définissent des catégories en stockant des listes récapitulatives des fonctionnalités nécessaires et suffisantes requises pour l'appartenance à une catégorie. Les modèles de limites peuvent être considérés comme des modèles de règles atypiques, car ils ne définissent pas de catégories en fonction de leur contenu. Au contraire, les modèles de frontières définissent les limites (frontières) entre les catégories, qui servent ensuite de déterminants pour la façon dont un stimulus est catégorisé.

Exemples de modèles de catégorisation

Modèles prototypes

Modèle de prototype de caractéristiques pondérées [31] Une première instanciation du modèle de prototype a été produite par Reed au début des années 1970. Reed (1972) a mené une série d'expériences pour comparer les performances de 18 modèles sur l'explication des données d'une tâche de catégorisation qui obligeait les participants à trier les visages dans l'une des deux catégories. [31]Les résultats suggèrent que le modèle dominant était le modèle prototype de caractéristiques pondérées, qui appartenait à la famille des modèles de distance moyenne. Contrairement aux modèles traditionnels de distance moyenne, cependant, ce modèle a pondéré de manière différentielle les caractéristiques les plus distinctives des deux catégories. Compte tenu des performances de ce modèle, Reed (1972) a conclu que la stratégie utilisée par les participants lors de la tâche de catégorisation des visages consistait à construire des représentations prototypes pour chacune des deux catégories de visages et à classer les motifs de test dans la catégorie associée au prototype le plus similaire. De plus, les résultats suggèrent que la similarité est déterminée par les caractéristiques les plus discriminantes de chaque catégorie.

Modèles exemplaires

Modèle de contexte généralisé [32] Le modèle de contexte de Medin et Schaffer (1978) a été développé par Nosofsky (1986) au milieu des années 80, aboutissant à la production du modèle de contexte généralisé (GCM). [32] Le GCM est un modèle exemplaire qui stocke des exemplaires de stimuli en tant que combinaisons exhaustives des caractéristiques associées à chaque exemplaire. [18] En stockant ces combinaisons, le modèle établit des contextes pour les caractéristiques de chaque exemplaire, qui sont définis par toutes les autres caractéristiques avec lesquelles cette caractéristique coexiste. Le GCM calcule la similarité d'un exemplaire et d'un stimulus en deux étapes. Tout d'abord, le GCM calcule la distance psychologiqueentre l'exemplaire et le stimulus. Ceci est accompli en additionnant les valeurs absolues de la différence dimensionnelle entre l'exemplaire et le stimulus. Par exemple, supposons qu'un exemplaire a une valeur de 18 sur la dimension X et le stimulus a une valeur de 42 sur la dimension X ; la différence dimensionnelle résultante serait de 24. Une fois la distance psychologique évaluée, une fonction de décroissance exponentielle détermine la similitude de l'exemplaire et du stimulus, où une distance de 0 entraîne une similitude de 1 (qui commence à diminuer de façon exponentielle à mesure que la distance augmente) . Les réponses catégorielles sont ensuite générées en évaluant la similitude du stimulus avec les exemplaires de chaque catégorie, où chaque exemplaire fournit un « vote » [18]à leurs catégories respectives dont la force varie en fonction de la similitude de l'exemplaire avec le stimulus et de la force de l'association de l'exemplaire avec la catégorie. Cela attribue effectivement à chaque catégorie une probabilité de sélection qui est déterminée par la proportion de votes qu'elle reçoit, qui peut ensuite être ajustée aux données.

Modèles basés sur des règles

Modèle RULEX (Rule-Plus-Exception) [33] Alors que des règles logiques simples sont inefficaces pour apprendre des structures de catégories mal définies, certains partisans de la théorie de la catégorisation basée sur des règles suggèrent qu'une règle imparfaite peut être utilisée pour apprendre de telles structures de catégories si des exceptions à cette règle sont également stockés et pris en compte. Pour formaliser cette proposition, Nosofsky et ses collègues (1994) ont conçu le modèle RULEX. Le modèle RULEX tente de former un arbre de décision [34] composé de tests séquentiels des valeurs d'attribut d'un objet. La catégorisation de l'objet est ensuite déterminée par le résultat de ces tests séquentiels. Le modèle RULEX recherche des règles de la manière suivante : [35]

  • Recherche exacte d'une règle qui utilise un seul attribut pour distinguer les classes sans erreur.
  • Recherche imparfaite d'une règle qui utilise un seul attribut pour discriminer entre les classes avec peu d'erreurs
  • Recherche conjonctive d'une règle qui utilise plusieurs attributs pour distinguer les classes avec peu d'erreurs.
  • Exception Rechercher des exceptions à la règle.

La méthode utilisée par RULEX pour effectuer ces recherches est la suivante : [35]Tout d'abord, RULEX tente une recherche exacte. En cas de succès, RULEX appliquera continuellement cette règle jusqu'à ce qu'une mauvaise classification se produise. Si la recherche exacte ne parvient pas à identifier une règle, une recherche imparfaite ou conjonctive commencera. Une règle suffisante, bien qu'imparfaite, acquise au cours d'une de ces phases de recherche deviendra définitivement mise en œuvre et le modèle RULEX commencera alors à rechercher des exceptions. Si aucune règle n'est acquise, alors le modèle tentera la recherche qu'il n'a pas effectuée lors de la phase précédente. En cas de succès, RULEX implémentera définitivement la règle, puis commencera une recherche d'exception. Si aucune des méthodes de recherche précédentes ne réussit, RULEX recherchera par défaut uniquement les exceptions, malgré l'absence d'une règle associée, ce qui équivaut à acquérir une règle aléatoire.

Modèles hybrides

SUSTAIN (Supervised and Unsupervised STratified Adaptive Incremental Network) [36] Il arrive souvent que les représentations des catégories apprises varient en fonction des objectifs de l'apprenant, [37] ainsi que de la manière dont les catégories sont utilisées pendant l'apprentissage. [5] Ainsi, certains chercheurs en catégorisation suggèrent qu'un modèle de catégorisation approprié doit être capable de tenir compte de la variabilité présente dans les objectifs, les tâches et les stratégies de l'apprenant. [36] Cette proposition a été réalisée par Love et ses collègues (2004) grâce à la création de SUSTAIN, un modèle de clustering flexible capable de s'adapter à des problèmes de catégorisation simples et complexes grâce à une adaptation incrémentale aux spécificités des problèmes.

En pratique, le modèle SUSTAIN convertit d'abord les informations perceptives d'un stimulus en caractéristiques organisées selon un ensemble de dimensions. L'espace de représentation qui englobe ces dimensions est ensuite déformé (par exemple, étiré ou rétréci) pour refléter l'importance de chaque caractéristique basée sur les entrées d'un mécanisme attentionnel. Un ensemble de clusters (instances spécifiques regroupées par similarité) associés à des catégories distinctes rivalisent alors pour répondre au stimulus, le stimulus étant ensuite attribué au cluster dont l'espace de représentation est le plus proche du stimulus ». La valeur de dimension de stimulus inconnue (par exemple, l'étiquette de catégorie) est ensuite prédite par le cluster gagnant, qui, à son tour, informe la décision de catégorisation.

La flexibilité du modèle SUSTAIN est réalisée grâce à sa capacité à employer à la fois l'apprentissage supervisé et non supervisé au niveau du cluster. Si SUSTAIN prédit à tort un stimulus comme appartenant à un groupe particulier, une rétroaction corrective (c'est-à-dire un apprentissage supervisé) signalerait à Sustain de recruter un groupe supplémentaire qui représente le stimulus mal classé. Par conséquent, les expositions ultérieures au stimulus (ou à une alternative similaire) seraient attribuées au bon groupe. SUSTAIN utilisera également un apprentissage non supervisé pour recruter un cluster supplémentaire si la similitude entre le stimulus et le cluster le plus proche ne dépasse pas un seuil, car le modèle reconnaît la faible utilité prédictive qui résulterait d'une telle affectation de cluster. SUSTAIN fait également preuve de flexibilité dans la façon dont il résout les problèmes de catégorisation simples et complexes.En fait, la représentation interne de SUSTAIN ne contient qu'un seul cluster, biaisant ainsi le modèle vers des solutions simples. À mesure que les problèmes deviennent de plus en plus complexes (par exemple, nécessitant des solutions composées de plusieurs dimensions de stimulus), des groupes supplémentaires sont progressivement recrutés afin que SUSTAIN puisse gérer l'augmentation de la complexité.

Catégorisation sociale

La catégorisation sociale consiste à regrouper les êtres humains afin de les identifier selon différents critères. La catégorisation est un processus étudié par les chercheurs en sciences cognitives, mais peut également être étudiée en tant qu'activité sociale. La catégorisation sociale est différente de la catégorisation d'autres choses car elle implique que les gens créent des catégories pour eux-mêmes et pour les autres en tant qu'êtres humains. [3] Des groupes peuvent être créés en fonction de l'ethnicité, du pays d'origine, de la religion, de l'identité sexuelle, des privilèges sociaux, des privilèges économiques, etc. Différentes manières de trier les gens existent selon ses schémas. Les gens appartiennent à divers groupes sociaux en raison de leur origine ethnique, de leur religion ou de leur âge. [38]

Les catégories sociales basées sur l'âge, la race et le sexe sont utilisées par les personnes lorsqu'elles rencontrent une nouvelle personne. Parce que certaines de ces catégories font référence à des traits physiques, elles sont souvent utilisées automatiquement lorsque les gens ne se connaissent pas. [39] Ces catégories ne sont pas objectives et dépendent de la façon dont les gens voient le monde qui les entoure. Ils permettent aux gens de s'identifier à des personnes similaires et d'identifier des personnes différentes. Ils sont utiles dans la formation de son identité avec les gens qui l'entourent. On peut construire sa propre identité en s'identifiant dans un groupe ou en rejetant un autre groupe. [40]

La catégorisation sociale est similaire aux autres types de catégorisation car elle vise à simplifier la compréhension des personnes. Cependant, créer des catégories sociales implique que les personnes se positionnent par rapport à d'autres groupes. Une hiérarchie dans les relations de groupe peut apparaître à la suite d'une catégorisation sociale. [40]

Les chercheurs soutiennent que le processus de catégorisation commence à un jeune âge lorsque les enfants commencent à en apprendre davantage sur le monde et les gens qui les entourent. Les enfants apprennent à connaître les gens selon des catégories basées sur des similitudes et des différences. Les catégories sociales créées par les adultes ont également un impact sur leur compréhension du monde. Ils se renseignent sur les groupes sociaux en écoutant des généralités sur ces groupes de la part de leurs parents. Ils peuvent alors développer des préjugés sur les gens en raison de ces généralités. [39]

Un autre aspect de la catégorisation sociale est mentionné par Stephen Reicher et Nick Hopkins et est lié à la domination politique. Ils soutiennent que les dirigeants politiques utilisent des catégories sociales pour influencer les débats politiques. [38]

Aspects négatifs

L'activité de trier les personnes selon des critères subjectifs ou objectifs peut être considérée comme un processus négatif en raison de sa tendance à conduire à la violence d'un groupe à un autre. [41] En effet, les similitudes rassemblent des personnes qui partagent des traits communs mais les différences entre groupes peuvent conduire à des tensions puis à l'usage de la violence entre ces groupes. La création de groupes sociaux par les personnes est responsable d'une hiérarchisation des relations entre les groupes. [41]Ces relations hiérarchiques participent à la promotion de stéréotypes sur les personnes et les groupes, parfois basés sur des critères subjectifs. Les catégories sociales peuvent encourager les gens à associer des stéréotypes à des groupes de personnes. Associer des stéréotypes à un groupe, et aux personnes qui appartiennent à ce groupe, peut conduire à des formes de discrimination envers les personnes de ce groupe. [42] La perception d'un groupe et les stéréotypes qui lui sont associés ont un impact sur les relations et les activités sociales.

Certaines catégories sociales ont plus de poids que d'autres dans la société. Par exemple, dans l'histoire et encore aujourd'hui, la catégorie « race » est l'une des premières catégories utilisées pour trier les gens. Cependant, seules quelques catégories de race sont couramment utilisées telles que "Noir", "Blanc", "Asiatique" etc. Cela participe à la réduction de la multitude d'ethnies à quelques catégories basées principalement sur la couleur de peau des gens. [43]

Le processus de tri des personnes crée une vision de l'autre comme « différent », conduisant à la déshumanisation des personnes. Les chercheurs parlent des relations intergroupes avec le concept de théorie de l'identité sociale développé par H. Tajfel. [41] En effet, dans l'histoire, de nombreux exemples de catégorisation sociale ont conduit à des formes de domination ou de violence d'un groupe dominant vers un groupe dominé. Les périodes de colonisation sont des exemples de moments où des personnes d'un groupe ont choisi de dominer et de contrôler d'autres personnes appartenant à d'autres groupes parce qu'elles les considéraient comme inférieures. Le racisme, la discrimination et la violence sont des conséquences de la catégorisation sociale et peuvent survenir à cause d'elle. Lorsque les gens voient les autres comme différents, ils ont tendance à développer des relations hiérarchiques avec d'autres groupes. [41]

Mauvaise catégorisation

Il ne peut y avoir de catégorisation sans possibilité de mauvaise catégorisation. [44] Pour faire "la bonne chose avec le bon genre de chose.", [45] il doit y avoir à la fois une bonne et une mauvaise chose à faire. Non seulement une catégorie dont « tout » est membre conduit logiquement au paradoxe de Russell (« est-ce ou n'est-il pas un membre de lui-même ? »), mais sans possibilité d'erreur, il n'y a aucun moyen de détecter ou de définir ce qui distingue les membres de la catégorie des non-membres.

Un exemple de l'absence de non-membres est le problème de la pauvreté du stimulus dans l'apprentissage de la langue par l'enfant : les enfants apprenant la langue n'entendent pas ou ne font pas d'erreurs dans les règles de la Grammaire Universelle (UG). Par conséquent, ils ne sont jamais corrigés pour les erreurs dans UG. Pourtant, le discours des enfants obéit aux règles de l'UG, et les locuteurs peuvent immédiatement détecter que quelque chose ne va pas si un linguiste génère (délibérément) un énoncé qui viole l'UG. Par conséquent, les locuteurs peuvent catégoriser ce qui est conforme à UG et non conforme à UG. Les linguistes en ont conclu que les règles de l'UG doivent être codées d'une manière innée dans le cerveau humain. [46]

Les catégories ordinaires, cependant, telles que les "chiens", ont de nombreux exemples de non-membres (les chats, par exemple). Il est donc possible d'apprendre, par essais et erreurs, avec correction d'erreurs, à détecter et à définir ce qui distingue les chiens des non-chiens, et donc à les catégoriser correctement. [47] Ce type d'apprentissage, appelé apprentissage par renforcement dans la littérature comportementale et apprentissage supervisé dans la littérature informatique, dépend fondamentalement de la possibilité d'erreur et de la correction d'erreur. Une mauvaise catégorisation - des exemples de non-membres de la catégorie - doit toujours exister, non seulement pour rendre la catégorie apprenable, mais pour que la catégorie existe et puisse être définie du tout.

Voir aussi

Références

  1. ^ A b c d e Croft et Cruse (2004) cognitive linguistique ch.4 pp.74-77
  2. ^ Pothos, E. et Wills, A. (éds.) 2011 Approches formelles dans la catégorisation , Introduction, ch.1 p.1
  3. ^ un b McGarty, Craig, et al. « Catégorisation sociale ». Encyclopédie internationale des sciences sociales et comportementales, 2015, pp. 186-191.
  4. ^ Murphy, GL et Medin, DL (1985). Le rôle des théories dans la cohérence conceptuelle. Revue psychologique, 92, 289-315
  5. ^ un b Markman, AB et Ross, BH (2003). Utilisation des catégories et apprentissage des catégories. Bulletin psychologique, 129(4), 592.
  6. ^ A b c d e Rosch E, CB Mervis, Gris WD, Johnson DM, Boyes-P. Bream de base des objets dans les catégories naturelles. Psychologie cognitive. 1976;8:382-439.
  7. ^ un Markman b , AB et Wisniewski, EJ (1997). Similaire et différent : La différenciation des catégories de niveau de base. Journal of Experimental Psychology: Learning, Memory, and Cognition, 23 (1), 54.
  8. ^ un b John R Taylor (1995) Catégorisation linguistique : Prototypes dans la théorie linguistique , 2e éd., ch.2 pp.21-24
  9. ^ George Lakoff (1987) Les femmes, le feu et les choses dangereuses , ch.1
  10. ^ Embley, DW Olivé, A. (2006) Modélisation conceptuelle - ER 2006 : 25e Conférence internationale sur la modélisation conceptuelle
  11. ^ Raatikainen, Panu Classical Theory of Concepts , dans Pashler, Harold (2012) Encyclopédie de l'esprit
  12. ^ Jackson, F. (1998) De la métaphysique à l'éthique : une défense de l'analyse conceptuelle
  13. ^ Peacocke, C. (1992) Une étude de concepts, MIT.
  14. ^ Katz, JJ et Fodor, JA (1963). La structure d'une théorie sémantique. Langue, 39(2), avril-juin, 170-210.
  15. ^ Ashby, FG, & Valentin, VV (2017). Systèmes multiples d'apprentissage des catégories perceptives : théorie et tests cognitifs. Dans : Cohen, H., & Lefebvre, C. (Eds.). (2017). Manuel de catégorisation en sciences cognitives (2e édition) . Elsevier.
  16. ^ Pérez-Gay Juárez, F., Thériault, C., Gregory, M., Rivas, D., Sabri, H., & Harnad, S. (2017). Comment et pourquoi l'apprentissage par catégorie provoque-t-il une perception catégorielle ? Journal international de psychologie comparée , 30.
  17. ^ Roseau, SK (1972). Reconnaissance des formes et catégorisation. Psychologie cognitive, 3, 382–407.
  18. ^ A b c d e f g h i Kruschke, JK (2008). Modèles de catégorisation. Le manuel de Cambridge de psychologie informatique, 267-301.
  19. ^ Rosch, E. (1999). Reconquérir des concepts. Journal d'études sur la conscience, 6 (11-12), 61-77.
  20. ^ Rosch, E., & Mervis, CB (1975). Ressemblances familiales : Études de la structure interne des catégories. Psychologie cognitive, 7(4), 573-605.
  21. ^ A b c d Medin, DL, et Schaffer, MM (1978). Théorie du contexte de l'apprentissage de la classification. Revue psychologique, 85(3), 207.
  22. ^ Goldstone, RL, Kersten, A., & Carvalho, PF (2012). Concepts et catégorisation. Manuel de psychologie, deuxième édition, 4.
  23. ^ Fisher, Douglas H. (1987). "Acquisition de connaissances via clustering conceptuel incrémental" . Apprentissage automatique . 2 (2) : 139-172. doi : 10.1007/BF00114265 .
  24. ^ Michalski, RS (1980). « L'acquisition de connaissances par le regroupement conceptuel : un cadre théorique et un algorithme pour partitionner les données en concepts conjonctifs ». Journal international d'analyse des politiques et des systèmes d'information . 4 : 219-244.
  25. ^ Kaufman KA (2012) Regroupement conceptuel. Dans : Seel NM (eds) Encyclopédie des sciences de l'apprentissage. Springer, Boston, MA
  26. ^ A b c Ashby, FG, et Maddox, WT (2005). Apprentissage de la catégorie humaine. Annu. Rev. Psychol., 56, 149-178.
  27. ^ un b Higgins, E., & Ross, B. (2011). Comparaisons dans l'apprentissage par catégorie : comment comparer au mieux pour quoi. Dans Actes de la réunion annuelle de la Cognitive Science Society (Vol. 33, No. 33).
  28. ^ Ashby, FG et Maddox, WT (1998). Catégorisation des stimuli. Dans Mesure, jugement et prise de décision (pp. 251-301). Presse Académique.
  29. ^ Maddox, WT et Ashby, FG (1996). Séparabilité perceptive, séparabilité décisionnelle et relation identification-classification accélérée. Journal of Experimental Psychology: Perception et performance humaines, 22(4), 795.
  30. ^ A b c Ashby, FG, et Maddox, WT (1993). Relations entre les modèles de catégorisation prototype, exemplaire et décisionnel. Journal de psychologie mathématique, 37(3), 372-400.
  31. ^ un roseau b , SK (1972). Reconnaissance des formes et catégorisation. Psychologie cognitive, 3(3), 382-407.
  32. ^ un b Nosofsky, RM (1986). Attention, similarité et relation identification-catégorisation. Journal de psychologie expérimentale : général, 115 (1), 39.
  33. ^ Nosofsky, RM, Palmeri, TJ et McKinley, SC (1994). Modèle règle-plus-exception de l'apprentissage de la classification. Revue psychologique, 101(1), 53.
  34. ^ Hunt, EB, Marin, J., & Stone, PJ (1966). Expériences d'induction.
  35. ^ un b Navarro, DJ (2005). Analyse du modèle RULEX d'apprentissage des catégories. Journal de psychologie mathématique, 49(4), 259-275.
  36. ^ un b Love, BC, Medin, DL et Gurecis, TM (2004). SUSTAIN : un modèle de réseau d'apprentissage par catégorie. Revue psychologique, 111(2), 309.
  37. ^ Barsalou, LW (1985). Idéaux, tendance centrale et fréquence d'instanciation en tant que déterminants de la structure graduée des catégories. Journal de psychologie expérimentale : apprentissage, mémoire et cognition, 11(4), 629.
  38. ^ un b Reicher, S et N Hopkins. « La psychologie et la fin de l'histoire : une critique et une proposition pour la psychologie de la catégorisation sociale ». Psychologie politique, vol. 22, non. 2, 2001, p. 383-407.
  39. ^ un b Liberman, Zoe, et al. « Les origines de la catégorisation sociale ». Tendances des sciences cognitives, vol. 21, non. 7, 2017, p. 556–568.
  40. ^ un b Bodenhausen, Galen & Kang, SK & Peery, D.. (2012). Catégorisation sociale et perception des groupes sociaux. 10.4135/9781446247631.n16.
  41. ^ A b c d Tajfel, H. « Psychologie sociale des relations intergroupes. » Revue annuelle de psychologie, vol. 33, non. 1, 1982, p. 1-39.
  42. ^ Hugenberg, Kurt et Galen V. Bodenhausen. « Ambigüité dans la catégorisation sociale : le rôle des préjugés et de l'affect facial dans la catégorisation raciale ». Sciences psychologiques, vol. 15, non. 5, 2004, p. 342-345.
  43. ^ Nadine Chaurand. Stéréotypisation. Catégorisation sociale. Dictionnaire historique et critique du racisme, PUF, 10p, 2013. ffhal-00966930
  44. ^ Magidor, Ofra (2019), "Category Mistakes" , dans Zalta, Edward N. (éd.), The Stanford Encyclopedia of Philosophy (Fall 2019 ed.), Metaphysics Research Lab, Stanford University , récupéré 2020-01-17
  45. ^ Cohen & Lefebvre 2017
  46. ^ Lasnik, H., & Lidz, JL (2017). L'argument de la pauvreté du stimulus. Dans : Ian Roberts (éd.) The Oxford Handbook of Universal Grammar .
  47. ^ Burt, JR, Torosdagli, N., Khosravan, N., RaviPrakash, H., Mortazi, A., Tissavirasingham, F., ... & Bagci, U. (2018). Apprentissage en profondeur au-delà des chats et des chiens : avancées récentes dans le diagnostic du cancer du sein avec les réseaux de neurones profonds British Journal of Radiology , 91 (1089), 20170545.

Liens externes