Psychometria

Z Wikipedii, wolnej encyklopedii
Przejdź do nawigacji Przejdź do wyszukiwania

Psychometria to kierunek studiów w psychologii zajmujący się teorią i techniką pomiaru . Psychometria ogólnie odnosi się do wyspecjalizowanych dziedzin psychologii i edukacji poświęconych testowaniu, pomiarom, ocenie i czynnościom pokrewnym. [1] Psychometria zajmuje się obiektywnym pomiarem ukrytych konstruktów , których nie można bezpośrednio zaobserwować. Przykłady ukrytych konstruktów obejmują inteligencję , introwersję , zaburzenia psychiczne i osiągnięcia edukacyjne . [2] Wywnioskowano poziomy jednostek na nieobserwowalnych zmiennych latentnychpoprzez modelowanie matematyczne w oparciu o to, co można zaobserwować w odpowiedziach osób na pozycje w testach i skalach. [2]

Praktycy określani są jako psychometrycy, chociaż nie wszyscy, którzy zajmują się badaniami psychometrycznymi, nazywają ten tytuł. Psychometrycy zwykle posiadają określone kwalifikacje, takie jak stopnie naukowe lub certyfikaty, a większość to psychologowie z zaawansowanym wykształceniem podyplomowym w zakresie psychometrii i teorii pomiarów. Poza tradycyjnymi, akademickimi instytucjami praktycy pracują również dla takich organizacji jak Educational Testing Service czy Psychological Corporation . Niektórzy badacze psychometryczni koncentrują się na konstruowaniu i walidacji narzędzi oceny, w tym ankiet , skal i otwartych lub zamkniętych kwestionariuszy. Inni skupiają się na badaniach związanych z teorią pomiaru (np. teoria odpowiedzi na przedmiot ; korelacja wewnątrzklasowa ) lub specjalizują się jako specjaliści ds. uczenia się i rozwoju .

Fundacja historyczna

Testy psychologiczne wywodzą się z dwóch nurtów myślenia: pierwszy od Darwina , Galtona i Cattella dotyczący pomiaru różnic indywidualnych, a drugi od Herbarta , Webera , Fechnera i Wundta oraz ich psychofizycznych pomiarów podobnego konstruktu. Druga grupa osób i ich badania doprowadziły do ​​rozwoju psychologii eksperymentalnej i standaryzowanych testów. [3]

strumień wiktoriański

Charles Darwin był inspiracją dla Sir Francisa Galtona, naukowca, który przyspieszył rozwój psychometrii. W 1859 roku Darwin opublikował swoją książkę O powstawaniu gatunków . Darwin opisał rolę doboru naturalnego w powstawaniu z biegiem czasu różnych populacji gatunków roślin i zwierząt. Książka pokazała, jak poszczególni członkowie gatunkuróżnią się między sobą i posiadają cechy, które są mniej lub bardziej adaptacyjne do ich środowiska. Osoby z bardziej adaptacyjnymi cechami mają większe szanse na przeżycie, aby się rozmnażać i dać początek kolejnemu pokoleniu. Osoby o mniej adaptacyjnych cechach są mniej prawdopodobne. Te idee pobudziły zainteresowanie Galtona badaniem istot ludzkich i różnic między sobą oraz, co ważniejsze, sposobem mierzenia tych różnic.

Galton napisał książkę zatytułowaną Dziedziczny geniusz . Książka opisuje różne cechy, które posiadają ludzie i jak te cechy sprawiają, że niektórzy są bardziej „pasowi” niż inni. Dziś te różnice, takie jak funkcjonowanie sensoryczne i motoryczne (czas reakcji, ostrość wzroku i siła fizyczna), są ważnymi dziedzinami psychologii naukowej. Wiele wczesnych prac teoretycznych i stosowanych w psychometrii podjęto w celu zmierzenia inteligencji . Galton, często określany mianem „ojca psychometrii”, wymyślił i umieścił testy umysłowe wśród swoich pomiarów antropometrycznych . James McKeen Cattell , pionier w dziedzinie psychometrii, rozszerzył pracę Galtona. Cattell ukuł termin „ test umysłowy”i odpowiada za badania i wiedzę, które ostatecznie doprowadziły do ​​opracowania nowoczesnych testów. [4]

niemiecki strumień

Geneza psychometrii ma również powiązania z pokrewną dziedziną psychofizyki . Mniej więcej w tym samym czasie, kiedy Darwin, Galton i Cattell dokonywali swoich odkryć, Herbart był również zainteresowany „odkryciem tajemnic ludzkiej świadomości” za pomocą metody naukowej. [4] Herbart był odpowiedzialny za stworzenie matematycznych modeli umysłu, które miały wpływ na praktyki edukacyjne w nadchodzących latach.

EH Weber opierał się na pracy Herbarta i próbował udowodnić istnienie progu psychologicznego, mówiąc, że do aktywacji systemu sensorycznego konieczny jest minimalny bodziec. Po Weberze GT Fechner rozszerzył wiedzę, którą zebrał od Herbarta i Webera, aby obmyślić prawo, zgodnie z którym siła doznań rośnie jako logarytm intensywności bodźca. Zwolennikowi Webera i Fechnera, Wilhelmowi Wundtowi, przypisuje się twórcę nauki o psychologii. To wpływ Wundta utorował drogę innym do opracowania testów psychologicznych. [4]

XX wiek

W 1936 psychometryk LL Thurstone , założyciel i pierwszy prezes Towarzystwa Psychometrycznego, opracował i zastosował teoretyczne podejście do pomiaru zwane prawem oceny porównawczej , podejście, które ma bliskie związki z psychofizyczną teorią Ernsta Heinricha Webera i Gustava Fechnera. . Ponadto Spearman i Thurstone wnieśli ważny wkład w teorię i zastosowanie analizy czynnikowej , metody statystycznej opracowanej i szeroko stosowanej w psychometrii. [5] Pod koniec lat 50. Leopold Szondidokonał historycznej i epistemologicznej oceny wpływu myślenia statystycznego na psychologię w ciągu ostatnich kilkudziesięciu lat: „w ostatnich dziesięcioleciach myślenie specyficznie psychologiczne zostało prawie całkowicie wyparte i zastąpione myśleniem statystycznym. testologii i testomanii dnia dzisiejszego”. [6]

Ostatnio teoria psychometryczna została zastosowana do pomiaru osobowości , postaw i przekonań oraz osiągnięć akademickich . Tych ukrytych konstruktów nie można naprawdę zmierzyć, a wiele badań i nauki w tej dyscyplinie zostało opracowanych w celu zmierzenia tych konstruktów tak blisko prawdziwego wyniku, jak to możliwe.

Osoby, które wniosły znaczący wkład w psychometrię to między innymi Karl Pearson , Henry F. Kaiser, Carl Brigham , LL Thurstone , EL Thorndike , Georg Rasch , Eugene Galanter , Johnson O'Connor , Frederic M. Lord , Ledyard R Tucker , Louis Guttman i Jane Kochanie .

Definicja pomiaru w naukach społecznych

Definicja pomiaru w naukach społecznych ma długą historię. Zgodnie z obecną powszechną definicją, zaproponowaną przez Stanleya Smitha Stevensa , miarą jest „przyporządkowanie liczb do przedmiotów lub zdarzeń według jakiejś zasady”. Definicja ta została wprowadzona w artykule Science z 1946 r., w którym Stevens zaproponował cztery poziomy pomiaru . [7] Chociaż powszechnie przyjęta, definicja ta różni się w ważnych aspektach od bardziej klasycznej definicji pomiaru przyjętej w naukach fizycznych, mianowicie, że pomiar naukowy pociąga za sobą „oszacowanie lub odkrycie stosunku pewnej wielkości atrybutu ilościowego do jednostki ten sam atrybut” (s. 358) [8]

Rzeczywiście, definicja pomiaru Stevensa została wysunięta w odpowiedzi na brytyjski Komitet Fergusona, którego przewodniczącym, A. Ferguson, był fizyk. Komitet został powołany w 1932 roku przez Brytyjskie Stowarzyszenie Postępu Naukowego w celu zbadania możliwości ilościowego szacowania zdarzeń sensorycznych. Chociaż jej przewodniczącym i pozostałymi członkami byli fizycy, w skład komitetu wchodziło również kilku psychologów. W sprawozdaniu komisji podkreślono znaczenie definicji pomiaru. Chociaż odpowiedzią Stevensa było zaproponowanie nowej definicji, która wywarła znaczny wpływ w tej dziedzinie, nie była to bynajmniej jedyna odpowiedź na raport. Inną, szczególnie odmienną reakcją było przyjęcie klasycznej definicji, co znajduje odzwierciedlenie w następującym stwierdzeniu:

Pomiary w psychologii i fizyce nie różnią się w żaden sposób. Fizycy mogą mierzyć, kiedy mogą znaleźć operacje, dzięki którym mogą spełnić niezbędne kryteria; psychologowie muszą zrobić to samo. Nie muszą się martwić tajemniczymi różnicami między znaczeniem pomiaru w obu naukach (Reese, 1943, s. 49). [9]

Te rozbieżne odpowiedzi znajdują odzwierciedlenie w alternatywnych podejściach do pomiaru. Na przykład metody oparte na macierzach kowariancji są zwykle stosowane przy założeniu, że liczby, takie jak nieprzetworzone wyniki uzyskane z ocen, są pomiarami. Takie podejścia domyślnie pociągają za sobą definicję pomiaru Stevensa, która wymaga jedynie przypisania liczb zgodnie z jakąś regułą. Za główne zadanie badawcze uważa się zatem ogólnie odkrycie powiązań między wynikami oraz czynników leżących u podstaw takich powiązań. [10]

Z drugiej strony, gdy stosuje się modele pomiarowe, takie jak model Rascha , liczby nie są przypisywane na podstawie reguły. Zamiast tego, zgodnie z powyższym stwierdzeniem Reese'a, określone są określone kryteria pomiaru, a celem jest skonstruowanie procedur lub operacji, które zapewnią dane spełniające odpowiednie kryteria. Pomiary są szacowane na podstawie modeli, a testy przeprowadzane są w celu ustalenia, czy spełnione zostały odpowiednie kryteria. [ potrzebne cytowanie ]

Instrumenty i procedury

Pierwsze instrumenty psychometryczne zostały zaprojektowane do pomiaru inteligencji . [11] Jedno z historycznych podejść obejmowało test Stanforda–Bineta IQ , opracowany pierwotnie przez Alfreda Bineta i Theodore'a Simona .

Innym ważnym punktem w psychometrii jest badanie osobowości . Istniało wiele teoretycznych podejść do konceptualizacji i mierzenia osobowości, chociaż nie ma szeroko uzgodnionej teorii. Niektóre z bardziej znanych instrumentów to Minnesota Multiphasic Personality Inventory , model pięcioczynnikowy (lub „Wielka 5”) oraz narzędzia, takie jak Personality and Preference Inventory oraz Myers-Briggs Type Indicator . Postawy były również szeroko badane przy użyciu podejść psychometrycznych. [ potrzebne cytowanie ]Alternatywna metoda polega na zastosowaniu rozkładających się modeli pomiarowych, z których najbardziej ogólnym jest hiperboliczny model kosinusowy (Andrich i Luo, 1993). [12]

Podejścia teoretyczne

Psychometrycy opracowali szereg różnych teorii pomiaru. Obejmują one klasyczną teorię testów (CTT) i teorię odpowiedzi na przedmiot (IRT). [13] [14] Podejście, które wydaje się matematycznie podobne do IRT, ale też dość charakterystyczne pod względem genezy i cech, reprezentuje model pomiaru Rascha . Rozwój modelu Rascha i szerszej klasy modeli, do których on należy, został wyraźnie oparty na wymaganiach pomiaru w naukach fizycznych. [15]

Psychometrycy opracowali również metody pracy z dużymi macierzami korelacji i kowariancji. Techniki w tej ogólnej tradycji obejmują: analizę czynnikową , [16] metodę określania podstawowych wymiarów danych. Jednym z głównych wyzwań stojących przed użytkownikami analizy czynnikowej jest brak konsensusu co do odpowiednich procedur określania liczby czynników ukrytych . [17] Zwykłą procedurą jest zatrzymanie faktoryzacji, gdy wartości własne spadną poniżej jednego, ponieważ oryginalna sfera się kurczy. Brak punktów cięcia dotyczy również innych metod wielowymiarowych. [ potrzebne cytowanie ]

Skalowanie wielowymiarowe [18] to metoda znajdowania prostej reprezentacji danych o dużej liczbie ukrytych wymiarów. Analiza skupień to podejście do wyszukiwania obiektów, które są do siebie podobne. Analiza czynnikowa, skalowanie wielowymiarowe i analiza skupień to wielowymiarowe metody opisowe używane do wydestylowania prostszych struktur z dużych ilości danych.

Ostatnio modelowanie równań strukturalnych [19] i analiza ścieżek reprezentują bardziej wyrafinowane podejścia do pracy z dużymi macierzami kowariancji . Metody te umożliwiają dopasowywanie wyrafinowanych statystycznie modeli do danych i testowanie ich w celu określenia, czy są one odpowiednie. Ponieważ na poziomie granularnym badania psychometryczne dotyczą zakresu i charakteru wielowymiarowości w każdym z elementów zainteresowania, pomocna może być stosunkowo nowa procedura znana jako analiza dwuczynnikowa [20] [21] [22] . Analiza dwuczynnikowa może rozłożyć „systematyczną wariancję elementu w kategoriach, najlepiej, dwóch źródeł, czynnika ogólnego i jednego źródła dodatkowej systematycznej wariancji”. [23]

Kluczowe pojęcia

Kluczowymi pojęciami w klasycznej teorii testów są rzetelność i trafność . Wiarygodna miara to taka, która konsekwentnie mierzy konstrukt w czasie, osobach i sytuacjach. Prawidłowa miara to taka, która mierzy to, co ma mierzyć. Niezawodność jest konieczna, ale niewystarczająca dla ważności.

Zarówno wiarygodność, jak i trafność można ocenić statystycznie. Spójność w powtarzanych pomiarach tego samego testu można ocenić za pomocą współczynnika korelacji Pearsona i często nazywa się to rzetelnością test-retest. [24] Podobnie, równoważność różnych wersji tej samej miary może być indeksowana przez korelację Pearsona i jest nazywana rzetelnością form równoważnych lub podobnym terminem. [24]

Spójność wewnętrzną, która odnosi się do jednorodności pojedynczej formy testu, można ocenić poprzez skorelowanie wyników na dwóch połówkach testu, co określa się mianem niezawodności połówkowej ; wartość tego współczynnika korelacji iloczynu Pearsona dla dwóch testów połówkowych jest korygowana za pomocą wzoru przewidywania Spearmana-Browna, aby odpowiadała korelacji między dwoma testami pełnej długości. [24] Być może najczęściej używanym wskaźnikiem rzetelności jest współczynnik α Cronbacha , który odpowiada średniej wszystkich możliwych współczynników połówkowych. Inne podejścia obejmują korelację wewnątrzklasową, czyli stosunek wariancji pomiarów danego celu do wariancji wszystkich celów.

Istnieje wiele różnych form ważności. Trafność kryterialna odnosi się do zakresu, w jakim test lub skala przewiduje próbkę zachowania, tj. kryterium, które jest „zewnętrzne w stosunku do samego instrumentu pomiarowego”. [25] Ta zewnętrzna próbka zachowania może obejmować wiele rzeczy, w tym inny test; średnia ocen z college'u, jak wtedy, gdy szkolny SAT jest używany do przewidywania wyników w college'u; a nawet zachowanie, które miało miejsce w przeszłości, na przykład, gdy test obecnych objawów psychologicznych jest używany do przewidywania wystąpienia wiktymizacji w przeszłości (co dokładnie odzwierciedla postdykcję). Gdy miara kryterialna jest zbierana w tym samym czasie, co miara podlegająca walidacji, celem jest ustalenie trafności równoległej; gdy kryterium zostanie zebrane później, celem jest ustalenie trafności predykcyjnej . Miara ma trafność konstrukcyjną, jeśli jest powiązana z miarami innych konstruktów, zgodnie z wymogami teorii. Trafność treści to wykazanie, że elementy testu wykonują odpowiednią pracę obejmującą mierzoną domenę. W przykładzie doboru personelu treść testu opiera się na określonym stwierdzeniu lub zestawie stwierdzeń dotyczących wiedzy, umiejętności, zdolności lub innych cech uzyskanych na podstawie analizy pracy .

Teoria odpowiedzi na przedmiot modeluje związek między ukrytymi cechamii odpowiedzi na elementy testowe. IRT daje między innymi podstawę do uzyskania oszacowania lokalizacji zdającego na daną cechę utajoną, a także standardowy błąd pomiaru tej lokalizacji. Na przykład wiedza historyczna studenta uniwersytetu może być wywnioskowana z jego wyniku na teście uniwersyteckim, a następnie rzetelnie porównana z wiedzą licealisty wyprowadzoną z mniej trudnego testu. Wyniki uzyskane przez klasyczną teorię testów nie mają tej cechy, a ocena rzeczywistej zdolności (a nie zdolności względem innych zdających) musi być oceniana poprzez porównanie wyników z wynikami „grupy norm” losowo wybranej z populacji. W rzeczywistości wszystkie miary wywodzące się z klasycznej teorii testów zależą od badanej próbki, podczas gdy w zasadziete wywodzące się z teorii odpowiedzi na przedmiot nie są.

Standardy jakości

Rozważania dotyczące trafności i rzetelności są zazwyczaj postrzegane jako zasadnicze elementy określające jakość każdego testu. Jednak stowarzyszenia zawodowe i praktyków często umieszczały te obawy w szerszym kontekście podczas opracowywania standardów i dokonywania ogólnych osądów na temat jakości dowolnego testu jako całości w danym kontekście. W wielu kontekstach badań stosowanych należy rozważyć, czy metryka danego inwentarza psychologicznego jest znacząca, czy arbitralna. [26]

Standardy testowania

W 2014 roku, American Educational Research Association (AERA), American Psychological Association (APA), a Krajowa Rada na Measurement in Education (NCMe) opublikował rewizję Standardów Edukacyjnych i testów psychologicznych , [27] , która opisuje standardy dla rozwoju testowym , ocena i wykorzystanie. Te standardy obejmują istotne tematy w tym badania ważności, niezawodność / błędów pomiaru i rzetelności w testowaniu. Książka ustanawia również standardy związane z operacjami testowymi, w tym projektowanie i tworzenie testów, wyniki, skale, normy, łączenie wyników, wyniki cięcia, administrowanie testami, scoring, raportowanie, interpretację wyników, dokumentację testów oraz prawa i obowiązki osób testujących i użytkowników testów . WreszcieNormy obejmują tematy związane z testowaniem aplikacji, w tym testami i oceną psychologiczną , testowaniem i uwierzytelnianiem w miejscu pracy , testowaniem i oceną edukacyjną oraz testowaniem w ramach oceny programów i polityki publicznej.

Normy oceny

W dziedzinie ewaluacji , aw szczególności ewaluacji edukacyjnej , Wspólny Komitet ds. Standardów Ewaluacji Edukacyjnej [28] opublikował trzy zestawy standardów ewaluacji. The Personnel Evaluation Standards [29] opublikowano w 1988 roku, Program Evaluation Standards (wydanie drugie) [30] opublikowano w 1994 roku, a Student Evaluation Standards [31] opublikowano w 2003 roku.

Każda publikacja przedstawia i opracowuje zestaw standardów do wykorzystania w różnych sytuacjach edukacyjnych. Standardy zawierają wytyczne dotyczące projektowania, wdrażania, oceny i doskonalenia zidentyfikowanej formy ewaluacji. [32] Każdy ze standardów został umieszczony w jednej z czterech podstawowych kategorii, aby promować właściwe, użyteczne, wykonalne i dokładne oceny edukacyjne. W tych zestawach standardów kwestie dotyczące ważności i niezawodności są omówione w temacie dotyczącym dokładności. Na przykład standardy dokładności uczniów pomagają zapewnić, że oceny uczniów dostarczą rzetelnych, dokładnych i wiarygodnych informacji o nauce i wynikach uczniów.

Kontrowersje

Ponieważ psychometria opiera się na ukrytych procesach psychologicznych mierzonych za pomocą korelacji , pojawiły się kontrowersje dotyczące niektórych miar psychometrycznych. [33] [ strona potrzebna ] Krytycy, w tym praktycy nauk fizycznych , argumentowali, że taka definicja i kwantyfikacja jest trudna i że takie pomiary są często nadużywane przez laików, na przykład w przypadku testów osobowości stosowanych w procedurach zatrudnienia. Standards for Educational and Psychological Measurement podaje następujące stwierdzenie dotyczące trafności testu : „trafność odnosi się do stopnia, w jakim dowody i teoria wspierają interpretację wyników testów wynikających z proponowanych zastosowań testów”.[34] Mówiąc najprościej, test nie jest ważny, jeśli nie jest używany i interpretowany zgodnie z jego przeznaczeniem. [35]

Obecnie nie ma powszechnie akceptowanego sposobu pomiaru teoretycznego konstruktu osobowości jako całości ze względu na fakt, że osobowość jest pojęciem złożonym, a wymiary osobowości i skale takich testów są różne i często są słabo zdefiniowane. Dwa główne narzędzia do pomiaru cech osobowości to testy obiektywne i miary projekcyjne. Przykłady takich testów są: Big Pięć zapasów (BFI), Minnesota Wielofazowy inwentarza osobowości (MMPI-2), testy Rorschach Inkblot , osobowość neurotyczna Kwestionariusz KON-2006 , [36] lub EysenckaKwestionariusz Osobowości (EPQ-R). Wszystkie te testy są korzystne, ponieważ mają zarówno wiarygodność, jak i trafność , dwa czynniki, które sprawiają, że test jest dokładny. Narzędzie psychometryczne Myers-Briggs Type Indicator (MBTI), choć powszechnie znane, było przedmiotem wielu krytyki. Specjalista od psychometrii, Robert Hogan, napisał o tym środku: „Większość psychologów osobowości uważa MBTI za niewiele więcej niż wyszukane chińskie ciasteczko z wróżbą”. [37]

Lee Cronbach zauważył w American Psychologist (1957), że „psychologia korelacyjna, choć w pełni stara jak eksperymentowanie, wolniej dojrzewała. Kwalifikuje się jednak równie dobrze jako dyscyplina, ponieważ zadaje odrębny typ pytań i ma techniczne metody badania czy pytanie zostało właściwie postawione, a dane właściwie zinterpretowane." Mówił dalej: „Metoda korelacji ze swej strony może badać to, czego człowiek nie nauczył się kontrolować lub nigdy nie może mieć nadziei na kontrolowanie… Wymagana jest prawdziwa federacja dyscyplin. błędne odpowiedzi lub brak odpowiedzi w odniesieniu do niektórych ważnych problemów”. [38]

Nie-ludzie: zwierzęta i maszyny

Psychometria zajmuje się ludzkimi zdolnościami, postawami, cechami i ewolucją edukacyjną. Warto zauważyć, że badanie zachowań, procesów umysłowych i zdolności zwierząt innych niż ludzie jest zwykle przedmiotem psychologii porównawczej lub kontinuum między zwierzętami innymi niż ludzie i resztą zwierząt za pomocą psychologii ewolucyjnej . Niemniej jednak istnieją zwolennicy bardziej stopniowego przejścia między podejściem przyjętym dla ludzi a podejściem przyjętym dla zwierząt (nie będących ludźmi). [39] [40] [41] [42]

Ocena zdolności, cech i ewolucji uczenia się maszyn była w większości niezwiązana z przypadkiem ludzi i zwierząt, ze specyficznymi podejściami w obszarze sztucznej inteligencji . Zaproponowano również bardziej zintegrowane podejście, pod nazwą psychometria uniwersalna. [43]

Zobacz także

Referencje

 1. ^ Krajowa Rada ds. Pomiarów w Edukacji http://www.ncme.org/ncme/NCME/Resource_Center/Glossary/NCME/Resource_Center/Glossary1.aspx?hkey=4bb87415-44dc-4088-9ed9-e8515326a061#anchorP Zarchiwizowane 2017-07 -22 w Wayback Machine
 2. ^ B Tabachnick BG; Fidell, LS (2001). Korzystanie z analizy wielowymiarowej . Boston: Allyn i Bacon. ISBN 978-0-321-05677-1.[ potrzebna strona ]
 3. ^ Kaplan, RM i Saccuzzo, DP (2010). Testy psychologiczne: zasady, zastosowania i problemy. (wyd. 8). Belmont, Kalifornia: Wadsworth, Cengage Learning.
 4. ^ B c Kaplan, RM, i Saccuzzo DP (2010). Testy psychologiczne: zasady, zastosowania i problemy (wyd. 8). Belmont, Kalifornia: Wadsworth, Cengage Learning.
 5. ^ Nunnally, J. i Berstein, IH (1994). Teoria psychometryczna (3rd ed.). Nowy Jork: McGraw-Hill.
 6. ^ Leopold Szondi (1960) Das zweite Buch: Lehrbuch der Experimentellen Triebdiagnostik . Huber, Berno i Stuttgart, wydanie 2.. Rozdz.27, Z przekładu hiszpańskiego, B)II Las condiciones estadisticas , s.396. Cytat:

  el pensamiento psicologico especifico, en las ultima decadas, fue suprimido y eliminado casi totalmente, siendo sustituido por un pensamiento estadistico. Precisamente aqui vemos el cáncer de la testología y testomania de hoy.

 7. ^ Stevens, SS (7 czerwca 1946). „O teorii skal miar”. Nauka . 103 (2684): 677-680. Kod Bibcode : 1946Sci...103..677S . doi : 10.1126/science.103.2684.677 . PMID 17750512 . S2CID 4667599 .  
 8. ^ Michell, Joel (sierpień 1997). „Nauka ilościowa i definicja pomiaru w psychologii”. Brytyjskie czasopismo psychologii . 88 (3): 355-383. doi : 10.1111/j.2044-8295.1997.tb02641.x .
 9. ^ Reese, TW (1943). Zastosowanie teorii pomiaru fizycznego do pomiaru wielkości psychologicznych na trzech przykładach eksperymentalnych. Monografie psychologiczne, 55 , 1-89. doi : 10.1037/h0061367
 10. ^ http://www.assessmentpsychology.com/psychometrics.htm
 11. ^ Massachusetts General Hospital kompleksowa psychiatria kliniczna (druga red.). Londyn. 2016. s. 73. Numer ISBN 978-0323295079. Źródło 31 października 2021 .
 12. ^ Andrich, D. i Luo, G. (1993). Hiperboliczny cosinusowy model cech utajonych do rozwijania dychotomicznych odpowiedzi na pojedynczy bodziec. Applied Psychological Measurement, 17, 253–276.
 13. ^ Embretson, SE i Reise, SP (2000). Teoria odpowiedzi na przedmiot dla psychologów . Mahwah, NJ: Erlbaum.
 14. ^ Hambleton, RK i Swaminathan, H. (1985). Teoria reakcji na przedmiot: zasady i zastosowania. Boston: Kluwer-Nijhoff.
 15. ^ Rasch, G. (1960/1980). Modele probabilistyczne dla niektórych testów inteligencji i osiągnięć . Kopenhaga, Duński Instytut Badań Edukacyjnych, wydanie rozszerzone (1980) z przedmową i posłowiem autorstwa BD Wright. Chicago: Wydawnictwo Uniwersytetu Chicago.
 16. ^ Thompson, BR (2004). Eksploracyjna i potwierdzająca analiza czynnikowa: zrozumienie pojęć i zastosowań. Amerykańskie Stowarzyszenie Psychologiczne.
 17. ^ Zwick, William R.; Velicer, Wayne F. (1986). „Porównanie pięciu zasad określania liczby elementów do zachowania”. Biuletyn Psychologiczny . 99 (3): 432–442. doi : 10.1037//0033-2909.99.3.432 .
 18. ^ Davison, ML (1992). Skalowanie wielowymiarowe. Kriegera.
 19. ^ Kaplan, D. (2008). Modelowanie równań strukturalnych: fundamenty i rozszerzenia , wyd. Szałwia.
 20. ^ DeMars, CE (2013). Samouczek dotyczący interpretacji wyników modelu dwuczynnikowego. International Journal of Testing, 13 , 354-378. http://dx.doi.org/10 .1080/15305058.2013.799067
 21. ^ Reise, SP (2012). Ponowne odkrycie modelowania dwuczynnikowego. Wielowymiarowe badania behawioralne, 47 , 667–696. http://dx.doi.org/10.1080/00273171.2012.715555
 22. ^ Rodriguez, A., Reise, SP i Haviland, MG (2016). Ocena modeli dwuczynnikowych: Obliczanie i interpretacja wskaźników statystycznych. Metody psychologiczne, 21 , 137-150. http://dx.doi.org/10.1037/met0000045
 23. ^ Schonfeld, IS, Verkuilen, J. & Bianchi, R. (2019). Eksploracyjne równanie strukturalne modelujące dwuczynnikowe podejście analityczne do odkrywania, co mierzą skale wypalenia, depresji i lęku. Ocena psychologiczna, 31 , 1073–1079. http://dx.doi.org/10.1037/pas0000721 s. 1075
 24. ^ a b c „Strona główna – Podstawy badań edukacyjnych autorstwa Del Siegle” . www.uconn.uconn.edu . 17 lutego 2015 r.
 25. ^ Nunnally, JC (1978). Teoria psychometryczna (wyd. 2). Nowy Jork: McGraw-Hill.
 26. ^ Blanton, H. i Jaccard, J. (2006). Miary arbitralne w psychologii. Zarchiwizowane 2006-05-10 w Wayback Machine American Psychologist, 61 (1), 27-41.
 27. ^ „Standardy badań edukacyjnych i psychologicznych” . apa.org .
 28. ^ Wspólny Komitet ds. Standardów Oceny Edukacyjnej Zarchiwizowane 15.10.2009 w Wayback Maszynie
 29. ^ Wspólny Komitet ds. Standardów Oceny Edukacyjnej. (1988). Standardy oceny personelu: jak oceniać systemy do oceny nauczycieli. Zarchiwizowane 2005-12-12 w Wayback Machine Newbury Park, Kalifornia: Sage Publications.
 30. ^ Wspólny Komitet ds. Standardów Oceny Edukacyjnej. (1994). Standardy oceny programu, wydanie II. Zarchiwizowane 2006-02-22 w Wayback Machine Newbury Park, Kalifornia: Sage Publications.
 31. ^ Komitet ds. Standardów Ewaluacji Edukacyjnej. (2003). Standardy oceny uczniów: jak poprawić ocenę uczniów. Zarchiwizowane 2006-05-24 w Wayback Machine Newbury Park, Kalifornia: Corwin Press.
 32. ^ [ E. Cabrera-Nguyen. „Wytyczne autora dotyczące raportowania wyników rozwoju i walidacji skali w Journal of the Society for Social Work and Research]” . Akademia.edu . 1 (2): 99–103.
 33. ^ Tabachnick, BG; Fidell, LS (2001). Korzystanie z analizy wielowymiarowej . Boston: Allyn i Bacon. ISBN 978-0-321-05677-1.
 34. ^ Amerykańskie Stowarzyszenie Badań Edukacyjnych, Amerykańskie Towarzystwo Psychologiczne i Narodowa Rada ds. Pomiarów w Edukacji. (1999) Standardy testów edukacyjnych i psychologicznych . Waszyngton, DC: Amerykańskie Stowarzyszenie Badań Edukacyjnych.
 35. ^ Bandalos, Deborah L. (2018). Teoria pomiaru i zastosowania w naukach społecznych . Nowy Jork. P. 261. ISBN 978-1-4625-3215-5. OCLC  1015955756 .
 36. ^ Aleksandrowicz JW, Klasa K, Sobański JA, Stolarska D (2009). „Kwestionariusz Osobowości Nerwicowej KON-2006” (PDF) . Archiwum Psychiatrii i Psychoterapii . 1 : 21–22.
 37. ^ Hogan Robert (2007). Osobowość i losy organizacji . Mahwah, NJ: Lawrence Erlbaum Associates . P. 28. Numer ISBN 978-0-8058-4142-8. OCLC  65400436 .
 38. ^ Cronbach, LJ (1957). „Dwie dyscypliny psychologii naukowej”. Psycholog amerykański . 12 (11): 671–684. doi : 10.1037/h0043943 – za pośrednictwem EBSCO.
 39. ^ Humphreys, LG (1987). „Rozważania psychometryczne w ocenie wewnątrzgatunkowych różnic w inteligencji”. Behav Brain Sci . 10 (4): 668–669. doi : 10.1017/s0140525x0005514x .
 40. ^ Eysenck, HJ (1987). „Kilka znaczeń inteligencji”. Behav Brain Sci . 10 (4): 663. doi : 10.1017/s0140525x00055060 .
 41. ^ Locurto, C. i Scanlon, C (1987). „Indywidualne różnice i czynnik uczenia przestrzennego w dwóch szczepach myszy”. Behav Brain Sci . 112 : 344–352.
 42. ^ Król, James E i Figueredo, Aurelio Jose (1997). „Model pięcioczynnikowy plus dominacja w osobowości szympansa”. Journal of Research in Personality . 31 (2): 257–271. doi : 10.1006/jrpe.1997.2179 .
 43. ^ J. Hernández-Orallo; DL Dowe; MV Hernández-Lloreda (2013). „Psychometria uniwersalna: pomiar zdolności poznawczych w królestwie maszyn” (PDF) . Badania systemów poznawczych . 27 : 50–74. doi : 10.1016/j.cogsys.2013.06.001 . hdl : 10251/50244 . S2CID 26440282 .  

Bibliografia

Dalsze czytanie

Linki zewnętrzne

0.096381187438965