pagina anterioară

eBooks

Cuprins

pagina următoare

CARACTERISTICILE STATISTICE ALE TESTULUI PSIHOLOGIC*

1. Definiţiile testului psihologic

Asociaţia Internaţională de Psihotehnică oferă următoarele definiţii:

Sarcină identică

Tehnici precise

Testul psihologic înseamnă proba care implica o sarcină identică de executat pentru toţi subiectii examinaţi şi care dispune de tehnici precise pentru aprecierea succesului sau esecului sau/şi pentru notarea numerica a reuşitei.

Măsură obiectivă, standardizată

Eşantion de comportament

Ana Anastasi, în lucrarea “Enciclopedii de teste” defineşte testul drept ,,o măsură obiectivă şi standar-dizată a unui eşantion de comportament“.

Încercările de definire sunt extrem de variate, deoarece pot surprinde aspectele esenţiale ale acestui concept. Astfel, L. Cronbach consideră testul ,,o procedura sistematică pentru compararea comportamentului a două sau mai multe persoane“. Este vorba de o comparare statistică, cantitativă şi calitativă a rezultatelor unui individ cu cele ale altei persoane plasate în aceeaţi situatie. Compararea se face pe baza unui etalon, adică a unui sistem metric de referinţă şi ea are drept scop clasarea individului uman într-o ierarhie cantitativă sau calitativă (tipologică - pe baza de profil).

Situaţie standardizată

Mariana Rosca (1972) defineşte testul ca o situatie standardizată, ce permite o măsurare obiectivă a unui eşantion din manifestările psihice.

Examinarea prin test este o estimare probabilistă, dar putem îmbunătăţi această probabilitate, adică putem creşte această probabilitate şi mări gradul de încredere în predicţia unui test, printr-o cât mai riguroasă fundamentare statistică. Prin aceasta se urmăreşte în fapt reducerea tot mai accentuată a erorii, a distorsiunilor în evaluarea psihometrică şi apropierea progresivă a testului de faptul real.

2. Principalele criterii de apreciere a testului psihologic

2.1. Obiectivitatea sau concordanţa interpersonală a testului psihologic

Aceast prim criteriu se referă la gradul în care rezultatele unui test psihologic sunt independente faţă de persoana examinatorului care exploatează psihodiagnostic acest instrument. Putem aprecia că un test este deplin obiectiv atunci când mai mulţi examinatori obţin aceleaşi rezultate la acelaşi subiect.

Subiectivitatea poate surveni în trei faze diferite ale derulării examinării psihologice, de aceea, vorbim de tot atâtea tipuri de obiectivitate:

  • Obiectivitatea de examinare,
  • Obiectivitatea de evaluare,
  • Obiectivitatea de interpretare.

Prima se referă la faptul că modul de administrare a testului de către un examinator nu ar trebui să ducă la obţinerea unor rezultate semnificativ diferite la aceeaşi persoană faţă de cele obţinute de un alt examinator. O condiţie importantă ce trebuie respectată în acest sens este cea de a menţine condiţiile de administrare a probelor cât mai asemănătoare, chiar identice, iar instructajul probei - specificat în caietul testului - trebuie respectat cu stricteţe.

Obiectivitatea de evaluare este mai greu de atins decât cea de realizare, iar cea de interpretare mai dificilă decât cea de evaluare.

Astfel, testele sunt diferenţiate în funcţie de dificultatea asigurării obiectivităţii sau concordanţei interpersonale. Această condiţie este mai uşor de realizat în cazul testelor de tip creion-hârtie, care au, în cea mai mare parte, reguli stricte de producere a răspunsului corect, de corectare şi de evaluare. În cazul celor proiective, unde experienţa psihologului este deosebit de importantă,  intervine un număr mai mare de criterii de evaluare şi de interpretare.

Metoda statistică utilizată pentru calcularea indicelui de concordanţă interpersonală este cea a corelaţiilor simple şi multiple.

2.2. Validitatea testului psihologic

Conceptul de validitate este central în psihologie, fiind considerat aspectul central al psihometriei. Problematica validităţii unui procedeu diagnostic trebuie să fie privită în raport cu stabilirea măsurii în care un test îndeplineşte exigenţele fixate aprioric faţă de el.

Validitatea unui test se referă la calitatea lui de a fi valabil în raport cu măsurarea unui fenomen real. Există o corespondentă, adică o corelaţie între test şi situaţia reală, de exemplu între o trăsătură măsurată prin test şi manifestarea reală a trăsăturii respective. Această corelaţie ţine de validitatea testului şi exprimă forţa lui de a fi valabil.

În concepţia lui Serge Legendre (apud Bernier şi Pietrulewicz, 1997, p. 179), validitatea este ,,capacitatea unui instrument de a măsura realmente ceea ce trebuie să măsoare, după utilizarea pe care vrea să o facă“. Pe aceeaşi linie, a teoriei clasice a testului psihologic, Gustave Lienert (1967, p. 255) considera că validitatea unui test dă gradul de precizie cu care acest test măsoară faptic acea caracteristică a personalităţii sau acel mod de comportament pe care trebuie să-l măsoare ori pretinde să-l măsoare.

Una din definiţiile operaţionale - în sensul înţelegerii facile a conceptului - consideră că validitatea unui test indică gradul în care testul măsoară ceea ce îşi propune să măsoare. Un test valid este un test care măsoară în mod adecvat trăsătura psihică propusă, care are o valoare predictivă bună, fiind capabil să anticipeze cât mai corect manifestările, trăirile, trăsăturile din viitoarea situaţie reală.

Validitatea este în ultimă instanţă o problemă de paralelism între rezultatele la test şi cele obţinute în situaţia reală (de muncă, conducere, învăţare). Acest paralelism este estimat cu ajutorul coeficientului de corelaţie. Validitatea testului este cu atât mai mare, cu cât este mai mare valoarea coeficientului de corelaţie (de legatură) între test şi un anumit criteriu de validare.

Problema criteriului de validare - în funcţie de acest criteriu, există mai multe procedee de validare a unui test, de stabilire a valorii lui de diagnostic şi prognostic.

Pentru testele psihologice, condiţiile standard de validitate sunt definite, în general, în termeni de valoare predictivă, fiind exprimate prin intermediul unor corelaţii ale valorilor testului cu valori ale variabilelor-criteriu care presupun înglobarea a ceea ce testele sunt investite să diagnosticheze (nivelul de dezvoltare, inteligenţa, trăsătura de personalitate, etc).

Validarea unui test psihologic reprezintă un ansamblu de proceduri cantitative şi calitative care au drept finalitate asigurarea valabilităţii lui. Validarea este întotdeuna legată de o situaţie particulară, ea ar avea o finalitate diferită dacă ar fi obţinută în alte condiţii, folosind alte eşantioane sau alte metode de analiză. 

2.2.1. Tipuri de validare

a. Validare predictiva sau empirica (empiric în sens practic)

Este cea mai tare formă de validare a unui test, deşi cea mai complicată; constă în a urmări prin studii sistematice, practice, desfăşurate în timp. Ea arată în ce măsură subiecţii care au avut o bună reuşită în cadrul testului vor avea o reuşită asemănătoare în activitatea reală pentru care ei au fost testaţi.

Acest tip de validare presupune administrarea testului urmată de recoltarea unor indici de eficienţă în activitate, după un interval de 6 luni, 1 an, 1 an şi jumătate de la aceleaşi persoane. În această situaţie se ia drept criteriu activitatea practică, dar problema rămâne ce anume din situaţia reală, care este foarte complexă se ia drept criteriu de validare capabil care să confirme sau să infirme corectitudinea predicţiei făcute prin test.

Ex.: Testele de inteligenţă au fost adesea validate în raport cu reuşita şcolară, dar s-a constatat că acest criteriu este insuficient de consistent şi de pur, pentru că performanţa şcolară ţine şi de alţi factori, nu doar de inteligenţă: motivaţia elevului, starea de sănătate, sistemul de evaluare al profesorului etc.

Problema validării, în funcţie de dificultatea alegerii unui criteriu pur se rezolvă cu ajutorul câtorva metode. În baza metodelor, rezultatele reale (performanţa şcolară, activitate de conducere) vor fi apreciate:

-  de mai mulţi evaluatori,

-  pe baza unor criterii clare care se dau evaluatorilor,

-  pe baza unor punctaje puse la îndemâna evaluatorilor,

-  fără ca evaluatorul să cunoască rezultatele obţinute la test de către persoanele respective, pentru a nu fi influenţate în aprecierile pe care le fac.

Instrumentele ideale pentru validare şi care corespund cerinţelor de mai sus sunt: fişele de observaţie, testele de preferinţe interpersonale, testele sociometrice.

Se pune întrebarea: ce corelaţie trebuie să existe între reuşita la test şi reuşita în activitatea utilizată drept criteriu de validare. Aceasta depinde de scopul utilizării testului şi de maniera utilizării lui.

În ceea ce priveşte scopul (selecţie, promovare, orientare şcolară, tratament, terapie) forţa corelaţiei variază între un criteriu de validare ce trebuie să depăşească 0,25 pentru selecţie şi 0,75 pentru psihoterapie.

În funcţie de maniera de utilizare a testului, validitatea variază şi ea de la un coeficient de 0,75 când testul este unicul criteriu de apreciere, la o valoare de 0,25 când alături de test mai există şi alte criterii: examen de cunoştinte, proba practică, examen clinic în cazul bolnavului.

b. Validarea concurentă (de concurenţă)

Validarea concurentă ne dă aspectul de funcţionalitate şi utilizare certă a probelor. Se subîmparte în 2 maniere de validare:

1. Validare concurentă cu ajutorul unui test deja validat - constă în stabilirea corelaţiei dintre rezultatele la testul pe care dorim să îl validăm şi rezultatele obţinute de acelaşi lot de subiecţi la un test de validat. Este evident că cele 2 teste trebuie să fie asemănătoare.

Dacă rezultatele obţinute de acelaşi lot de subiecţi la testul ce trebuie validat sunt asemănătoare cu cele obţinute la testul deja valid primul test este şi el valid.

2. Validare concurentă cu ajutorul unui lot de subiecţi valizi - constă în stabilirea corelaţiei dintre rezultatele obţinute de un lot oarecare la testul pe care dorim să-l validăm şi rezultatele obţinute la acelaşi test de un lot ale cărui performanţe în activitate sunt deja cunoscute. Dacă testul dă rezultate asmănătoare (ca ierarhizare a persoanelor) într-un lot oarecare şi în cel performant, testul este valid.

Corelaţia perfectă este de 1,00, ea este ideală. De regulă se combină mai multe maniere de validare.

c. Validitatea de aspect sau aparenţă - Este vorba mai mult de o problemă de imagine a testului în ochii persoanelor testate care atunci când sunt adulţi trebuie să vadă în test ceva legat într-o anume măsură de profesia lor, de specializarea lor şi nu ceva complet lipsit de legatură (Ex.: pentru mecanici - teste de mecanică, pentru lideri - teste de decizie).

Validitatea de aparenţă nu poate fi întotdeauna respectată şi nici nu este strict necesară, dar cel puţin testul nu trebuie să contrarieze. Aparenţa testului mobilizează-demobilizează în rezolvarea sarcinilor propuse de test şi contribuie de asemenea la acceptarea-neacceptarea rezultatelor la test. Sunt mai uşor acceptate de subiect rezultatele slabe la un test ce are o bună validitate de aparenţă.

d. Validarea conceptuală

Validitatea unui test nu este un parametru statistic ce se analizează doar în finalul testului atunci când el este elaborat ca instrument de lucru. Validitatea este o preocupare constantă ce începe odată cu construcţia testului. Ca urmare, orice test trebuie să aibă o validitate conceptuală care se referă la ipotezele şi teoriile explicative în funcţie de care el a fost construit şi pe baza cărora se vor interpreta rezultatele obţinute. În spatele fiecărui test se află un fundament teoretic care trebuie cunoscut de către cel care il utilizează.

Tot de validitatea conceptuală ţine alegerea şi formularea itemilor: a problemelor pentru testele de inteligenţă şi a întrebărilor pentru testele de personalitate. De fapt, orice test debutează ca un experiment de-a lungul căruia se rulează un număr foarte mare de itemi din care în final vor fi selecţionaţi cei care se dovedesc cu adevărat relevanţi pentru scopurile testului.

Autorul unui test trebuie să se asigure nu doar că toate aspectele reprezentative ale situaţiei sunt surprinse de test, ci şi că ele apar în test conform proportiei reale de manifestare. Dozarea incorectă a categoriilor de itemi scade validitatea şi produce distorsiuni în predicţia făcută de test.

Când se indică gradul de validitate al unui test, trebuie să se specifice natura grupului pe care a fost el validat. Un test poate avea o validitate ridicată în predicţia unei trăsături când se aplică unui grup şi o validitate redusă când se aplică altui grup, dacă cele două diferă ca vârstă, nivel de şcolarizare, pregătire profesională de specialitate.

Nu trebuie neglijat că, atunci când se utilizează un test, el este validat în raport cu un scop strict precizat: pentru selecţie, orientare şcolară profesională (O.S.P), diagnoză clinică.

Un test căruia nu i s-a stabilit validitatea constituie o simplă ipoteză şi nu un instrument de lucru propriu-zis.

2.3. Fidelitatea testului psihologic

Fidelitatea reprezintă calitatea statistică ce face ca subiecţii să obţină rezultate relativ constante la testări succesive făcute cu aceeaşi probă psihodiagnostică. Fidelitatea testului indică până la urmă dacă rezultatele obţinute cu ajutorul lui sunt într-adevăr caracteristice persoanelor respective sau sunt efectul unor factori externi sau chiar accidentali.

Fidelitatea testului se calculează în funcţie de:

1. Stabilitatea în timp a rezultatelor obţinute la acelaşi test de către aceleaşi persoane. Se aplică proba de mai multe ori aceloraşi subiecţi la un anumit interval de timp şi se calculează corelaţiile dintre seriile de rezultate obţinute. Cu cât ele sunt mai mari fidelitatea testului este mai ridicată.

Limitele procedeului rezidă în faptul că o identitate absolută a rezultatelor nu se poate atinge, dată fiind variabilitatea comportamentală a indivizilor şi intervenţia unor factori secundari de tipul: gradul motivaţiei, oboseala, condiţii de mediu perturbante, etc.

Valoarea acestui procedeu numit examinare/reexaminare sau testare/retestare depinde de lungimea intervalului de timp dintre evaluări:

·   interval prea scurt – atunci este posibil ca subiecţii să-şi amintească unele dintre răspunsurile date anterior, fie ele corecte sau greşite, ceea ce face ca cele 2 testări
să nu fie total independente şi ca urmare să se obţină o fidelitate înaltă doar aparentă şi eronată.

·   interval prea lung – existând riscul să se obţină rezultate mult diferite determinate însă nu de lipsa de fidelitate a testului ci de faptul că trăsătura respectivă s-a modificat în mod real. (Ex.: vezi cazul testelor de inteligenţă aplicate copiilor la care se constată modificări majore în dezvoltarea reală din 6 în 6 luni).

·   intervalul rezonabil când perioada dintre aplicarea testelor este de 2-4 săptămâni.

2. Stabilirea rezultatelor aceloraşi persoane testate cu 2 forme echivalente (2 variante) ale aceluiaşi test.

Construirea de teste paralele are o mare importanţă teoretică şi practică, deoarece frecvent apare necesitatea examinării aceloraşi persoane în scopuri diagnostice sau în scopul stabilirii efectului produs asupra lor de anumiţi factori externi: educativi, medicali, de stress.

Testele paralele trebuie să conţină un număr egal de itemi care să abordeze aceleaşi funcţii, să aibă acelaşi grad de dificultate.

Condiţiile şi timpul necesar executării trebuie să fie similare.

Limitele acestor metode constau în:

·   dificultatea de a construi forme paralele deplin echivalente, chiar probele cu acelaşi principiu de construire (dimensiuni, scale denumite la fel) nu sunt identice.

·   la a 2-a examinare (cu forma a 2-a) intervine exercitiul realizat la prima examinare, lucru valabil mai ales în cazul testelor de inteligenţă.

3. Stabilirea rezultatelor atunci când aceiaşi subiecţi sunt examinaţi cu acelaşi test de către examinatori diferiţi.

Subiecţii supuşi examinării sunt evaluaţi de mai mute ori cu testul respectiv de către psihologi diferiţi, iar în măsura în care rezultatele la teste corelează între ele, proba este fidelă.

Limitele acestui procedeu sunt legate de efectele pe care le pot avea particularităţile psihice diferite ale examinatorilor asupra rezultatelor obţinute de subiecţi. Distorsiuni în modul de răspuns al subiecţilor generate de personalitatea diferită a psihologilor se înregistrează la testele de personalitate şi la testele de inteligenţă, dacă subiecţii sunt copii (cărora le trebuie stimulată motivaţia şi învinsă teama de însăşi activitatea de testare).

Atitudinea diferită a examinatorului în timpul aplicării unui test ţine de structura de personalitate, starea psihică şi fizică de moment, experienţa sa în lucrul cu proba.

2.4. Coerenţa internă a testului este calitatea statistică exprimând nevoia de ,,puritate internă” a probei. Coerenţa este data de 2 aspecte:

a) Convergenţa tuturor itemilor testului către obiectivul vizat în test. Este necesar ca testul să nu cuprindă itemi nesemnificativi pentru ca răspunsurile la itemii nesemnificativi în amestec cu răspunsurile la itemii semnificativi le fac pe cele din urmă să-şi piardă relevanţa. Itemii nesemnificativi parazitează proba inducând distorsiuni.

Coerenţa testului presupune examinarea particulară a fiecărui item pentru a stabili gradul său de relevanţa faţă de dimensiunea vizată. Pentru aceasta se va stabili procentul de reuşită sau de alegere (de primire a unui răspuns semnificativ) pentru fiecare item în parte.

·   Itemii cu procent de alegere mai mare de 80% (aleşi de mai mult de 80% dintre subiecţi) se elimină, deoarece ei sunt: ori prea uşori pentru testul de inteligenţă, ori banali, nesemnificativi pentru testul de personalitate.

·   Itemii cu procent de alegere mai mic de 20% (aleşi de mai puţin de 20% din subiecţi) se elimină deoarece: sunt prea grei pentru testul inteligenţă sau accidentali pentru un test de personalitate.

b) Omogenitatea testului exprimă coerenţa internă a testului în funcţie de utilizarea unui procedeu de divizare. Testul se aplică în întregime, după care se stabilesc rezultatele pentru fiecare jumătate din totalul itemilor care îl compun. Un test este omogen şi implicit coerent dacă rezultatele obţinute de acelaşi subiect la cele 2 jumătăţi ale testului este ridicată.

În realitate, această înjumătăţire şi mai ales egalitatea pe cele 2 jumătăţi se obţine mai uşor la un test de inteligenţă, memorie, atenţie, decât la cele de personalitate.

Omogenitatea este absolut necesară în testele de nivel mental şi de dorit în cele de personalitate.

Limitele procedeului de omogenitate constau în dificultatea de a găsi modalitatea optimă de distribuire a itemilor pentru a obţine jumătăţi egale sub aspect psihometric.

Exista 3 posibilităţi de îmbunătăţire a probei:

·   îmbunătăţirea prin simpla divizare (se imparte suma la 2) iar consecinţa este că adesea, prima jumătate e mai uşoară decât a 2-a în cazul testelor de nivel mental, iar la testele de personalitate, prima jumătate a unei scale are itemi mai de suprafaţă, de acomodare şi abia a 2-a jumatate atinge problemele de profunzime; jumătăţile nu pot fi egale din punct de vedere al greutăţii sau simplităţii lor.

·   înjumătăţirea prin gruparea itemilor pari într-o parte şi a celor impari în cealaltă,
fapt care face ca dificultăţile să se distribuie egal, să se grupeze în funcţie de gradul
de dificultate.

·   înjumătăţirea prin analiză şi calcul statistic în funcţie de indicii de dificultate
ai itemilor.

Concluzii:

Fidelitatea depinde de calităţile de construire ale unui test dar şi de natura trăsăturilor măsurate fiind mai mare pentru testele de inteligenţă, pentru probele care măsoară funcţii senzoriale şi mai mică pentru testele de personalitate.

√ Se consideră satisfăcătoare o fidelitate bazată pe o corelaţie de .75 între rezultatele obţinute de acelaşi subiect la examinări diferite cu aceeaşi probă. De asemenea, este necesară cunoaşterea coeficientului de fidelitate al unui test pentru a aprecia gradul de încredere care i se poate acorda. Trebuie însă cunoscută şi natura grupului examinat pentru stabilirea respectivei fidelităţi pentru că ea este variabilă şi rămâne constantă numai pentru un grup similar.

√  Sensibilitatea este calitatea statistică a testului care defineşte fineţea discriminativă a acestuia, adică numărul de clase pe care îl permite în cadrul unui grup. Altfel spus sensibilitatea ţine de capacitatea testului de a diferenţia cât mai mult pe o plajă cât mai largă indivizii testaţi între ei. Un test este cu atât mai sensibil cu cât împarte în mai multe categorii indivizii, aceasta desigur în concordanţă şi cu diferenţele reale care există între ei.

  Standardizarea este calitatea statistică ce exprimă uniformitatea lucrului cu testul, uniformitate ce decurge dintr-un ansamblu de norme bine precizate şi care trebuie respectate. Din chiar definiţia sa testul ni se propune ca un instrument standardizat sub trei aspecte: conţinut, aplicare şi interpretare.

Standardizarea depinde de o serie de factori, cum ar fi:

·   uniformitatea stimulilor prezentaţi pentru a provoca reacţiile subiectului (sarcină identică pentru toţi).

·   uniformitatea instructajului dat subiecţilor în legatură cu sarcina care trebuie executată.

·   respectarea timpilor de lucru prezenţi pentru rezolvarea sarcinii şi notarea precisă a timpului de lucru al fiecărui subiect dacă timpul nu se măsoară (acest lucru are o valoare simptomatică).

·   uniformitatea modului de cotare a reacţiilor (raspunsurilor) astfel încât subiec-tivitatea examinatorului să intervină cât mai puţin.

·   uniformitatea interpretării rezultatelor în funcţie de procedee statistico-matematice precise.

În concluzie, standardizarea este o cerinţă statistică prin care se urmăreşte uniformizarea de ansamblu a examenului psihologic pe baza de test. Nivelul standardizării exprimă gradul de obiectivitate al testului şi, prin urmare, există o cerinţă permanentă în psihodiagnoză şi psihometrie pentru creşterea sa.

3. Eşantionarea testelor – Populaţie – Eşantion – Lot

Interpretarea rezultatelor unui test bazată pe un întreg aparat matematic, presupune măsurarea rezultatelor individuale prin raportarea lor la o populaţie, la rezultatele unei populaţii cât mai reprezentative din punct de vedere numeric şi a compoziţiei sale sub aspectul unor factori relevanţi.

Această cerinţă ne duce la problema etalonării testelor. Performanţele obţinute la teste în absenţa unor indici interpretativi nu sunt operante. Semnificaţia reală a rezultatelor o putem cunoaşte în condiţiile în care efectuăm un studiu comparativ de raportare a performanţei obţinute la test de către un individ, la rezultatele unei populaţii de referinţă, care poate constitui un tabel de norme, un etalon.

Etalonul reprezintă performanţele standard, prelucrate statistic, obţinute de un eşantion reprezentativ de indivizi.

Din punct de vedere statistic, populaţie înseamnă orice mulţime de obiecte, fiinţe, grupuri de fiinţe, fenomene, manifestări, observaţii delimitate cu precizie pe baza unor criterii clare. Populaţia de referinţă sau de bază defineşte o mulţime din care s-a extras un eşantion.

Eşantionul este partea unei populaţii a cărei reprezentativitate în raport cu populaţia din care a fost extras permite extinderea cu o precizie determinată a concluziilor obţinute din studiul eşantionului pe ansamblul intregii populaţii din care el a fost extras.

Lotul reprezintă o grupare de subiecţi  constituită pe alte criterii decât în baza unor tehnici de eşantionare. Astfel, putem exemplifica: o clasă de elevi, grupă de studenţi, angajaţii unui departament. Criteriile de constituire ale unui lot lot sunt: vecinătatea spaţială, vârsta identică, statutul educaţional şi profesional, etc.

Avantajele realizării unei cercetări pe eşantion şi nu pe toată populaţia se circumscriu volumului de date culese şi prelucrate ce poate fi redus de zeci, sute, mii de ori. Aceasta asigură executarea operativă şi reduce costurile de realizare. În plus, datorită acestor implicaţii de ordin operaţional o cercetare completă nu este posibilă.

Eşantionarea ridică pentru statistică 2 probleme esenţiale:

·  stabilirea unor tehnici de eşantionare cât mai corecte,

·   stabilirea acelor proceduri de analiză statistică care să permită extinderea rezultatelor obţinute pe eşantion asupra întregii populatţii.

Prima cerinţă se referă la tehnicile de alegere a eşantionului din cadrul populaţiei de bază astfel încât el să reprezinte populaţia respectivă cu o precizie determinată. Aceasta înseamnă că include în structura sa părţi direct proporţionale cu grupele ce constituie respectiva populaţie de bază. Structura eşantionului trebuie să reproducă diversitatea calitativă a populaţiei ca vârstă, sex, profesie, etnie, religie, etc. Eşantionului i se calculează mai întâi numărul (N), semnificativ pentru eşantion: câţi membri trebuie să aibă eşantionul. Pentru determinarea lor exactă există 2 tehnici: eşantionarea aleatoarie (extragerea din urnă la întâmplare) şi eşantionarea cu pas statistic, ce presupune sortarea ,,în paşi” – în sensul că se extrag de exemplu din 3 în 3, din 5 în 5, din 6 în 6.

Cea de a 2-a cerinţă vizează stabilirea acelor proceduri de analiză statistică ce permit extinderea rezultatelor de la un eşantion la o populaţie. Generalizarea rezultatelor are totdeauna o cotă de eroare mai mare sau mai mică în funcţie de reprezentativitatea eşantionului (corecta lui construire) cât şi în funcţie de mărimea lui. Cu cât eşantionul este mai mic eroarea creşte pentru că există riscul ca fenomene accidentale sau cu frecvenţă mai mică, dar reale, prezente în populaţia de bază să nu fie ,,developate” într-un eşantion foarte mic.

Demersul generalizator al extinderii rezultatelor obţinute asupra altor subiecţi decât cei pe care s-a intreprins cercetarea sau în alte situaţii decât cele iniţiale implică pentru cercetător o problemă deosebit de importantă şi anume, validarea concluziilor obţinute. La sfârşitul cercetării el trebuie să răspundă la următoarele întrebări:

·  Concluziile deduse din fapte sunt justificate, sunt compatibile cu faptele, sunt singurele posibile?

·  Pot fi generalizate şi, dacă da, când, unde, asupra a ce anume?

·  Faptele recoltate permit să se răspundă corect problemei formulate?

·  Relaţiile statistice descriu corect ceea ce se întâmplă la nivelul individului?

MALATON (1988) consideră că  fiecare dintre aceste patru întrebări corespund celor patru tipuri de validitate:

1.    Validitate internă, se referă la concluziile ce sunt extrase din fapte. Spunem că o concluzie are o bună validitate internă în masura în care dispunem de argumente care ne fac să credem că este singura compatibilă cu faptele respective.

2.    Validitate externă, se referă la condiţiile în care şi asupra cărora în mod legitim pot fi generalizate concluziile.

3.    Validitate individuală, presupune adecvarea datelor statistice cu ceea ce se petrece la nivelul individului concret.

4.    Validitate de indicator şi validitate statistică referitoare la două aspecte de adecvare a dispozitivului statistic la problema formulată.

BRUNSWICK vorbea încă din 1974 de un alt tip de validitate – validitatea ecologică: necesitatea de a respinge ca non-valide concluziile extrase din situaţiile excepţionale. Astăzi, validitatea ecologică a devenit un aspect al validităţii externe, referindu-se la posibilitatea de a extinde concluziile cercetărilor de laborator asupra situaţiilor naturale.

Întrebarea oricărui specialist este “Cum am putea spori gradul de validitate?” ceea ce a determinat eforturi susţinute pentru a găsi modalităţi practice ale creşterii validităţii concluziilor. Astfel, pentru creşterea gradului de validitate internă pot fi folosite:

·   menţinerea factorilor controlaţi,

·   randomizarea (egalizarea valorilor medii ale factorilor liberi în diferite grupuri, echilibrând astfel grupurile experimentale),

·   ortogonalizarea (combinarea adecvată a factorilor experimentali).

Mai multe probleme apar la validitatea externă care este o noţiune heterogenă, insuficient definită. Este necesar să se stabilească câmpul generalizării şi condiţiile în care generalizarea poate rămâne valabilă. Generalizarea datelor diferă şi în funcţie de cele trei categorii de factori: experimentali, controlaţi şi liberi ce intervin într-un experiment. De aceea, modalităţile de creştere a  gradului de încredere presupun eşantioane reprezentative de subiecţi, care au reprezentativitate statistică. Se are în vedere cât de tipică este populaţia alesă.

Relaţiile dintre diferitele raţionamente de validitate ridică şi ele o multitudine de probleme:

·   concluzia care dispune de o validitate internă satisfăcătoare dar a cărei validitate externă este slabă (chiar nulă) nu deranjează atât de mult dacă intenţia cercetătorului este de a acţiona asupra unui teren determinat, asupra celui investigat şi nu a altuia;

·   validitatea externă îşi are importanţa ei, deoarece arată că sistemul cauzal nu este decât parţial;

·   situaţia inversă: validitatea internă este slab asociată cu o validitate externă satis-făcătoare este total diferită. O asemenea concluzie nu are nici o valoare explicativă, nu furnizează nimic pentru teorie, ea poate avea o valoare descriptivă şi predictivă.

Există o serie de ,,capcane” în care poate cădea cercetarea psihologică. SKINNER consideră că aceasta este ghidată de o serie de principii cât şi de un set de atitudini ale cercetătorului. De aici rezultă 6 seturi de atitudini care ar urma să guverneze cercetarea psihologică: precizia, obiectivitatea, empirismul, determinismul, economicitatea, indoiala. Pe aceeaşi linie, WORTMAN apreciază autoprofeţia (influenţarea rezultatelor de aşteptările cercetătorului), ,,caracteristicile cerute” (anticiparea de către subiecţi a aşteptărilor experi-mentatorului), formularea prematură a concluziilor (generalizarea nepermisă a unor concluzii) drept  ,,capcane” ale cercetării psihologice.

Pentru evitarea primei capcane se recomandă folosirea tehnicii ,,dublu – orb”, nici experimentatorul, nici subiecţii nu ştiu cine a fost repartizat în grupul experimental şi cine în grupul de control. A 2-a capcană poate fi eliminată prin utilizarea mai multor căi: prin ascunderea adevăratelor scopuri ale cercetării, prin folosirea unor mijloace tehnice automate, procedeul răspunsurilor anonime. Cea de a 3-a capcană poate fi eliminată prin refacere: repetarea cercetărilor, prin investigaţii suplimentare care pot confirma sau infirma rezultatele iniţiale.

În vederea creşterii gradului ,,ştiinţific” al unei cercetări, în afara validării interne şi externe a concluziilor sau a evitării unor capcane se face apel  şi la o serie de alte mijloace. DESMET propune trei:

1.    triangularea: studiul comportamentului uman din mai multe puncte de vedere respectiv, ,,cavalcada metodelor”, ,,cercetarea prin metode multiple”;

2.    validitatea de semnificaţie, caracteristică pentru cercetările calitative;

3.    judecata critică, respectiv controlul critic al surselor de informare.

COHEN, MANION (1990) propun mai multe tipuri de triangulare: temporală (procesele de schimbare, utilizează metode longitudinale sau transversale), spaţială (cercetări în ţări, culturi diferite) prin combinarea nivelelor: individual, interpersonal, grupal, societal. Rezultă o triangulare de tip: teoretică (teorii alternative sau concurente), a observatorilor, metodologică (aceleaşi metode în scopuri diferite sau a unor metode diferite pentru acelaşi obiect de analiză), de resurse, internă: pune în legatură informaţiile culese cu elementele anamnestice, cu originea socială şi culturala a subiecţilor.

Validitatea de semnificatie porneşte de la premiza potrivit căreia datele rezultate depind de anumiţi factori. Între acestea enumerăm:

·   modul de înţelegere al instrumentului de către subiect,

·   concordanţă/neconcortanţa dintre sensul obiectiv al itemilor şi percepţia declanşată de ei la subiect,

·   înţelegerea exactă de către cercetător a răspunsurilor furnizate de subiecţi.

Ea se efectuează asupra a 2 planuri: planul denotaţiei şi planul conotaţiei.

Judecata critică. Au fost imaginate o multitudine de modalităţi de controlare a surselor de informare. Astfel, REZSOHAZY propune 6 modalităţi de critică, referitoare mai ales la istorie, dar care pot fi generalizate:

1.    critica identităţii;

2.    critica restituirii (stabilirea stării în care se află informaţia);

3.    critica originalităţii – legatura dintre informaţie şi cercetător;

4.    critica interpretării;

5.    critica autorităţii: critica de observare, critica de exactitate, critica de sinceritate;

6.    critica de tip confruntare.

Vom prezenta un instrument conceput în urmă cu aproximativ 30 ani şi utilizat în diverse cercetări, în prezent câştigând teren şi în psihologie. Cunoştinţelor de psihodiagnoză clinică le „ataşăm” acest mod ingenois de a definitiva ample cercetări în psihologie.

SPSS/Windows

Statistical Package for the Social Sciences (pe scurt, SPSS) este un produs al firmei americane SPSS Inc., destinat gestionării şi analizei statistice a datelor. Oferă o foarte mare varietate de prelucrări statistice, de la cele mai des folosite în practică (statistici descriptive, teste statistice) şi până la cele care pretind cunoştinte statistice avansate (modele liniare generale, analiza MANOVA etc.). Vizualizarea datelor este posibilă prin tabele cu una, două sau trei dimensiuni şi prin diverse reprezentări grafice, în plan şi în spaţiul tridimensional.

Firma SPSS este binecunoscută în întreaga lume. Având 18 oficii în 4 continente (America de Nord, Europa, Asia şi Australia), ea s-a impus în domeniul realizarii de soft pentru prelucrarea statistică a datelor prin două produse: SPSS şi SYSTAT. Versiunile
pentru Windows ale ambelor pachete de programe au fost alese în 1993 ca ,,PC-Magazine Editors’ Choice”.

Prima variantă a produsului SPSS a fost elaborată acum 20 de ani. De atunci, fiecare dintre marile schimbări care au avut loc în lumea calculatoarelor a fost urmată, la scurtă vreme, de apariţia unei noi versiuni. În prezent, versiunile cele mai folosite pe calculatoare personale sunt:

·   SPSS/PC+ 4.0, care funcţionează sub sistemele de operare PC-DOS şi MS-DOS;

·   SPSS/Windows 6.1, care funcţionează sub Windows 3.1, sub Windows NT 3.5 şi pe calculatoare Macintosh;

·   SPSS/Windows 7.0, care funcţionează sub sistemul de operare Windows 95 şi sub Windows NT 3.51;

·    SPSS/Windows 10.0, care funcţionează în reţea sub sistemul de operare Windows 98 şi sub Windows NT 3.51.

DATE GENERALE ALE PROGRAMULUI

Acest produs îmbină facilităţile oferite de programe cunoscute, cum sunt Excel şi Quattro Pro, pentru condensarea datelor în tabele şi pentru reprezentări grafice, cu posibi-lităţile de prelucrare statistică mai mult sau mai puţin sofisticată, în funcţie de complexitatea problemelor de rezolvat. Unele metode de calcul aplicate de SPSS/Windows nu sunt accesibile în alte programe de analiză statistică, precum BMDP, SYSTAT sau STATISTICA.

SPSS/Windows este realizat sub formă modulară. În consecinţă, fiecare utilizator are libertatea de a achiziţiona doar acele componente care îi sunt necesare. Prezentăm în continuare câteva dintre module cu denumirea sub care sunt comercializate.

Modulul bazal realizează gestionarea datelor şi a fişierelor, transformarea datelor, diverse reprezentări grafice (histograme, diagrame de structură, ,,nori” statistici etc.), precum şi prelucrările statistice cele mai cunoscute şi mai frecvent utilizate:

·   calculul frecventelor, al indicilor tendinţei centrale şi al indicatorilor variabilităţii;

·   calculul unor măsuri de asociere şi testarea independenţei probabilistice pentru date incluse în tabele de contingenţă;

·   compararea mediilor şi a dispersiilor eşantioanelor;

·   analiza de varianţă unifactorială;

·   calculul coeficienţilor de corelaţie Pearson, Kendall şi Spearman;

·   analiza de regresie liniară;

·   teste neparametrice.

Modulul Professional Statistics include proceduri care servesc la cercetarea relaţiilor dintre variabile, prin următoarele metode:

·   analiza de discriminant;

·   analiza factorială;

·   analiza de clusteri;

·   scalarea multidimensională;

·   regresia ponderată;

·   analiza fidelităţii.

 Modulul Advanced Statistics permite efectuarea unor prelucrări statistice complicate necesare atunci când datele nu îndeplinesc condiţiile de aplicare a prelucrărilor statistice obişnuite (mai simple). Asemenea metode sunt:

·   analiza de regresie logistică;

·   diverse extinderi ale analizei de varianţă unifactorială ANOVA;

·   analiza de varianţă multivariată MANOVA;

·   analiza logliniară;

·   analiza de regresie neliniară;

·   analiza probit şi logit;

·   analiza duratei de viaţă;

·   analiza de supravieţuire Kaplan-Meier;

·   modelul liniar general (GLM).

Modulul Tables serveşte la condensarea datelor în tabele cu una, două sau trei dimensiuni. Fiecare dimensiune este definită printr-o variabilă sau printr-un grup de variabile (de exemplu, pe linii se poate reprezenta profesia şi sexul subiecţilor, iar pe coloane răspunsurile posibile la un item dintr-un chestionar). Tabelele pot conţine alături de valorile variabilelor, frecvenţe şi valori ale unor indicatori statistici: media, abaterea standard etc.

Modulul Exact Tests determină nivelul de semnificaţie (valorile p) pentru:

·   teste neparametrice aplicate la un eşantion, la două eşantioane independente sau perechi şi la k eşantioane dependente sau independente;

·   teste aplicate tabelelor de contingenţă 2x2 şi rxc;

·   teste de semnificaţie pentru coeficienţii de corelaţie Pearson şi Spearman;

·   teste referitoare la relaţiile dintre variabile măsurate pe scala nominală sau pe scala ordinală.

 Acest modul calculează valori exacte pentru nivelele de semnificaţie ale statisticilor spre deosebire de modulul de baza, care calculează doar valori asimptotice.

Modulul CHAID (Chi-squared Automatic Interaction Detector) aplică algoritmi de segmentare, pentru împărţirea unei populaţii în grupe disjuncte, care diferă între ele în ceea ce priveşte un criteriu precizat. Grupele formate la fiecare pas al algoritmilor sunt vizualizate sub forma unei dendrograme.

Modulul Categories se foloseşte în scopul determinării influenţei exercitate de carac-teristicile produselor sau a serviciilor asupra preferinţei consumatorilor. El permite şi vizua-lizarea obiectelor analizate, prin puncte, în scopul identificării asemănării sau a deosebirii dintre acestea.

Modulul TRENDS serveşte la analiza şi reprezentarea grafică a seriilor de timp. El estimează coeficienţii modulului potrivit unei serii de timp, prin următoarele tehnici:

·   proceduri de netezire;

·   metode de regresie;

·   analiza Box-Jenkins (ARIMA), pentru modele sezoniere şi nesezoniere unidimensionale;

·   procedura de descompunere sezonieră pentru determinarea factorilor sezonieri, aditivi şi multiplicativi, din serii de timp periodice;

·   analiza componentelor de frecvenţă.

 

UTILIZAREA PROGRAMULUI SPSS

După cum se observă din descrierea modulelor acestui produs, SPSS/Windows se adresează tuturor celor care au de efectuat calcule statistice, indiferent de domeniul în care îşi desfăşoara activitatea: urmărirea producţiei şi a vânzarilor, marketing, cercetare ştiinţifică etc. Dintre cei care folosesc produsul SPSS la ora actuală, jumatate lucrează în industrie şi afaceri, peste o treime în cercetare şi învăţământ, iar majoritatea celorlalţi în instituţii guvernamentale.

Există 13 motive pentru a alege SPSS/Windows care poate fi caracterizat, pe scurt, prin:

§   Supleţe în stabilirea condiţiilor de prelucrare a datelor;

§   Prezentare sugestivă a rezultatelor, în tabele şi grafice;

§   Soluţionarea problemelor complexe prin metode statistice avansate;

§   Simplitate în manevrare.

Este foarte dificil de descris în câteva cuvinte un produs complex precum SPSS/ Windows. Vom încerca să enumerăm doar câteva dintre caracteristicile care îl fac atât de căutat pe piaţă.

 

A. CONDIŢII DE PRELUCRARE

Orice prelucrare se poate face în condiţii extrem de variate. Spre exemplu, calculul frecvenţelor poate fi însoţit sau nu de afişarea tabelului de frecvenţe, de reprezentarea grafică prin histogramă sau prin diagramă în coloane. De asemenea se poate folosi calculul unor indici statistici cum ar fi cuantile, indici ai tendinţei centrale: media, mediana, modul; parametri de împrăştiere: dispersia, valoarea minimă şi maximă. Reprezentarea grafică poate lua în considerare frecvenţele absolute ale valorilor sau procentele, iar peste histogramă se poate sau nu suprapune curba normală.

Este greu de imaginat o variantă de prelucrare a datelor pe care SPSS să nu o poată realiza inclusiv în domeniul psihologiei.

B. FACILITĂŢI ÎN PRELUCRARE ŞI ÎNVĂŢARE OFERITE DE SPSS

Utilizatorul nu are nevoie să citească un manual pentru a şti cum să comande o prelucrare. Opţiunea ,,Help” este accesibilă permanent şi poate explica semnificaţia diverşilor termeni din meniuri şi căsuţe de dialog.

 În plus, un program tutorial on-line oferă explicaţii şi exemple care ajută la orientarea rapidă printre prelucrările numeroase care pot fi realizate de acest produs.

 SPSS poate fi folosit şi de persoane puţin iniţiate în statistică. Pentru orice noţiune, dintr-o căsuţă de dialog sau chiar dintr-o listă de ieşire se obţine afişarea unui text explicativ dacă se indică denumirea respectivă, pe ecran, cu mouse-ul şi se alege din meniul care apare, opţiunea ,,What’s This?”

 Cu SPSS se pot chiar reactualiza şi completa cunoştinţele de statistică, întrucât butonul ,,Help” permite accesul la un glosar de termeni statistici.

 

C. INTRODUCEREA  ŞI PRELUCRAREA DATELOR

Introducerea şi modificarea datelor este o operaţie simplă, datorită existenţei unui editor gen ,,spreadsheet”. Pe ecran este afişat un tabel ale cărui linii corespund cazurilor respectiv subiecţi care răspund unui chestionar sau obiecte observate, în ale cărui coloane figurează variabilele (răspunsuri date de subiecţi ori rezultatele unor măsurători sau observaţii). Utilizatorul poate ,,naviga” prin acest tabel, după dorinţă, inspectând valorile existente, schimbând unele date, adaugând sau ştergând cazuri şi variabile. SPSS adaptează automat dimensiunile tabelului astfel încât să nu se piardă nici o valoare introdusă. Nu există limitări în privinţa numărului de cazuri sau de variabile care pot fi incluse în fişier.

Datele prelucrate de SPSS pot fi preluate şi din fişiere provenind din alte programe, cum sunt: tabele create de Lotus 1-2-3 şi Excel, baze de date create de dBase, fişiere de date salvate în format SYLK (symbolic link), fişiere de text A SC II. De asemenea, fişierele de date create de SPSS pot fi exportate în Lotus 1-2-3 şi Excel sau pot fi salvate în format SYLK ori ca fişiere de text ASCII.

Înainte de efectuarea prelucrărilor statistice, datele pot fi modificate automat de către SPSS, pe baza unor algoritmi indicaţi de utilizator pentru recodificarea valorilor sau prin aplicarea unor funcţii matematice. De exemplu, într-un fişier în care cazurile sunt reprezentate de diverse mărfuri iar variabilele de caracteristici ale acestora, toate preţurile pot fi schimbate prin adăugarea TVA-ului sau toate mărfurile produse înainte de 1995 pot primi o aceeaşi valoare a datei de fabricaţie care să semnifice ,,înainte de 1995”.

Utilizatorul poate alege cazurile care să fie luate în considerare la efectuarea prelucrărilor, formulând condiţii asupra valorilor uneia sau a mai multor variabile. De exemplu: în studiul relaţiei dintre nivelul de şcolarizare şi preferinţa pentru diverse genuri muzicale pot fi incluse, din întregul fişier de date, doar persoanele domiciliate în mediu urban.

Tratarea specială a datelor necunoscute. Utilizatorul poate decide cum să fie tratate în SPSS cazurile în care valoarea unei variabile nu este cunoscută sau nu prezintă interes pentru cercetare. Ele pot să fie sau să nu fie incluse în calcule.

D. EXCEPŢII

Grafice diverse permit depistarea rapidă a valorilor aberante. Acestea sunt
valori izolate, diferite mult de celelalte din fişier, care ar putea fi datorate unor erori la introducerea datelor.

Utilizatorul are controlul deplin asupra tuturor variabilelor prelucrate. El decide cum să se afişeze valorile în listele de ieşire (pe ce lungime, cu câte cifre zecimale) şi ce text să fie scris în locul denumirilor de variabile (dacă acestea nu sunt destul de sugestive) sau în locul valorilor variabilelor (dacă în fişierul de date s-au introdus coduri). De exemplu, dacă pentru variabila corespunzătoare mediului de domiciliu al subiecţilor, cu denumirea MEDDOM, s-au introdus în fişier valorile U şi R, în listele de iesire poate să apară scris ,,Urban” în loc de U şi ,,Rural” în loc de R, iar numele variabilei să fie înlocuit cu textul ,,Mediu de domiciliu”.

Alegerea modului de prelucrare a datelor este deosebit de simplă, datorită meniurilor şi a cutiilor de dialog la care se ajunge prin manevrarea mausului. Pentru utilizatorii cărora nu le place să folosească mausul, există posibilitatea de a indica prelucrările dorite prin scrierea de comenzi.

Dacă un grup de prelucrări se efectuează periodic.De exemplu, dacă interesează situaţia zilnică a vânzărilor pe magazine şi produse nu este nevoie să se repete de fiecare dată întreaga succesiune de căutari prin meniuri şi de alegeri de opţiuni. Se poate cere SPSS-ului să înregistreze într-un fisier de comenzi toate aceste operaţii executate de utilizator o singură data. Fişierul va fi rulat ori de câte ori este necesar. La nevoie, fişierul poate fi modificat, adăugându-se sau stergându-se comenzi.

Rezultatele prelucrărilor statistice se pot vizualiza prin tabele de diverse formate. Sunt posibile 16 stiluri de întocmire a tabelelor - şi multe tipuri de reprezentari grafice: histograme, diagrame în coloane - izolate sau grupate, diagrame de structură circulare, ,,nori” statistici în care punctele corespunzătoare unor grupe diferite de cazuri sunt colorate diferit, diagrame care indică în acelaşi timp media, valorile extreme şi repartiţia valorilor unei variabile pentru valori diferite ale altei variabile (de exemplu, reprezentarea grafică a vârstei persoanelor în funcţie de localitatea de domiciliu).

Listele de rezultate, tabelele şi graficele realizate de SPSS pot fi incluse în rapoarte aşa cum se prezintă pe ecran sau modificate. Utilizatorul poate interveni în ele prin:

·   editarea de text;

·   schimbarea caracteristicilor fontului (tip, stil, culoare, mărime);

·   modificarea desenelor prin deplasarea axelor, rotirea lor sau chiar schimbarea tipului de grafic;

·   ascunderea unor variabile din tabele;

·   reorganizarea informaţiilor din tabele (de exemplu: un tabel de frecvenţe, care conţine pe linii răspunsurile la un chestionar, iar pe coloane localitatea de domiciliu şi, în cadrul fiecărei localităţi, sexul clienţilor, poate fi transformat într-un tabel cu numai două coloane, corespunzator sexului şi cu grupe de linii, câte o grupă pentru fiecare localitate).

Toate aceste operaţii sunt uşor de executat datorită existenţei a trei editoare: de text, de tabele şi de grafice.

În concluzie, utilizarea SPSS pentru analiza datelor de către psihologi ar putea aduce nu numai performanţe legate de rapiditate şi evitarea erorilor de transcriere dar mai ales se creiază cadrul necesar pentru analize adecvate, pentru identificarea frecvenţelor fenomenelor psihice, variate şi abordate într-un context de mai mare flexibilitate.* Material redactat de psiholog Maria Zivari.

pagina anterioară | eBooks | cuprins | pagina următoare

© Universitatea din Bucuresti, 2004. All rights reserved.
No part of this text may be reproduced in any form without written permission of the University of Bucharest, except for short quotations with the indication of the website address and the web page.
This books was first published on paper by the
Editura Universitatii din Bucuresti, under ISBN-
Comments to: Ruxandra RASCANU - Last update: April, 2004 - Web design&Text editor:
Monica CIUCIU