Mit sau Real? Psi: Tehnica Rorschach

Poveste:

Felul în care interpretăm petele de cerneală din planșele lui Rorschach dezvăluie detalii despre personalitatea noastră.

Rorschach_blot_04

Planșa nr. 4 din testul Rorschach

Ce este?

Testul Rorschach (citit /ˈʁoːʁʃax/ sau /ˈʁoːɐʃax/, aproximativ rorșah) constă în 10 planșe cu pete de cerneală simetrice, unele colorate, altele alb-negre. Persoanele evaluate sunt puse să spună ce văd în aceste imagini ambigue. Asta, pe scurt. În continuare mai în detaliu.

Cele 10 figuri („pete de cerneală”) au fost date publicului în 1921 de către Hermann Rorschach și în următoarele decenii au devenit foarte populare printre psihoterapeuți pentru a evalua și diagnostica. De-a lungul timpului au existat mai multe variante ale testului, majoritatea fiind de tip proiectiv (cum este și testul desenează-o-persoană, de exemplu), iar începând cu anul 1970 John Exner a dezvoltat „sistemul comprehensiv”. Pentru că sistemul lui Exner este cel mai folosit în prezent și nu este de tip proiectiv, o să încerc să-l tratez separat. Dar, mai întâi, să vedem variantele proiective.

 Rorschach_blot_09

Planșa nr. 9

Cele 5 variante

Inițial, Herman Rorschach a încercat să găsească corelații între condiții psihologice (cum ar fi depresia, schizofrenia) și felul în care sunt interpretate figurile de cerneală. Din cauză că a murit la un an după ce a publicat cartea în care descria tehnica și pentru că psihanaliza începea să fie populară, evoluția tehnicii Rorschach a fost spre interpretări proiective. Până în 1957 au fost dezvoltate cinci sisteme diferite de interpretare, denumite după autorii lor. Varianta lui S.J. Beck a fost foarte apropiată de principiile inițiale ale lui Rorschach în ce privește codarea și punctarea. În schimb, varianta lui B. Klopfer era foarte apropiată de filozofiile lui Freud și Jung, insistând pe natura simbolică a răspunsului pacientului. Celelalte trei variante, dezvoltate de Piotrowski, Hertz și Rapaport s-au situat undeva între variantele extreme ale lui Beck și Klopfer.1

În ce privește folosirea acestor variante, un sondaj făcut de Exner în 1972 a arătat că aproape 3 din 5 clinicieni aveau specializare în sistemul lui Klopfer, iar 1 din 2 în sistemul lui Beck. Doar 1 din 5 aveau specializare în sistemul lui Piotrowski și doar 1 din 10 în celelalte. De menționat că mulți clinicieni făceau specializări în mai multe variante. Cea mai importantă diferență între aceste variante de Rorschach o reprezintă sistemul de notare. Ceea ce este interesant este că 22% dintre clinicieni au abandonat complet ideea de notare și interpretau doar în mod subiectiv. Mai mult, 75% dintre clinicieni au recunoscut că „personalizează” sistemul de notare, integrând modele de notare dintr-un sistem în altul și adăugând sisteme de notare dezvoltate din experiența personală. De asemenea, cei mai mulți au recunscut că nu folosesc întotdeauna modul de administrare din sistemul în care s-au specializat. Un alt sondaj, făcut de Jackson și Wohl în 1966, a arătat că 12%  dintre universitățile în care se predă o formă de evaluare Rorschach nici măcar nu predau sisteme de notare, iar în celelalte variază foarte mult ceea ce se predă.3 Pe de altă parte, metoda Rorschach era a treia între cele mai folosite metode de către clinicieni în 1969. Iar popularitatea n-a scăzut decât puțin (de la locul trei la locul cinci) în 1982 și 1995.4

 

Interpretarea proiectivă

Persoana care face testul primește câte o planșă cu pete de cerneală și este rugată să spună „cu ce seamănă”. Această întrebare e intenționat vagă pentru a-l lăsa pe participant să răspundă la întreaga figură, la părți mari din ea sau la detalii mărunte și să își bazeze răspunsul pe forma, umbra, textura și/sau culorea părții alese. Participantul este liber să răspundă și la părțile albe din jurul petelor sau din interiorul lor. De asemenea, este liber să rotească sau să întoarcă planșele (dar doar după ce a dat un răspuns inițial). După fiecare răspuns, examinatorul îl roagă să explice răspunsurile, întrebându-l lucruri cum ar fi „De ce arată ca un fluture?” sau, mai simplu, „Spune-mi mai multe”. În plus, participanții sunt încurajați să vadă mai multe lucruri într-o singură pată. În mod ideal, examinatorul nu trebuie să aibă nicio reacție evidentă la răspunsuri.

Teoria din spatele acestui test este că lumea conține situații ambigue, iar oamenii răspund la ambiguități în moduri specifice ce țin de personalitățile lor. Petele de cerneală sunt ambigue, deci răspunsurile participanților ar trebui să dea indicii despre ce gândesc și n-ar recunoaște în mod obișnuit. Preocupările și conflictele psihologice „adânci” ar trebui să fie „proiectate” pe figurile ambigue de cerneală – de aici și denumirea de „test proiectiv”. Participantul interpretează figurile, iar psihologul interpretează răspunsurile participantului, folosindu-se de experiența sa profesională.

Unul dintre lucrurile interpretate este dacă participantul încearcă să integreze toată pata într-o singură imagine sau este atent doar la detalii mărunte. Folosirea întregii imagini este un indicator al nevoii de a forma o „imagine de ansamblu”. Cu excepția cazurilor în care toată pata poate fi în mod rezonabil privită ca o singură imagine, situație în care un astfel de răspuns indică tendințe către grandiozitate și chiar paranoia și tendința de a nu lua în considerare aspectele realității care nu se potrivesc în „imaginea de ansamblu” a acelei persoane. Pe de altă parte, răspunsurile bazate pe detalii mărunte ale petei indică o personalitate obsesivă, o persoană care se ocupă de detalii în detrimentul aspectelor mai importante ale vieții, eventual pentru a le evita. Câteodată, participantul o să formeze o imagine din spațiile goale (albe) din jurul petelor. Pentru că această „inversare” trece dincolo de cerințele de a analiza petele, câteva răspunsuri legate de spațiile goale sunt indicatoare ale creativității, în timp ce prea multe astfel de răspunsuri (și asta ține de interpretarea psihologului) pot indica o personalitate opunătoare, sfidătoare. Integrarea mai multor trăsături ale petelor (ex.: culoare și formă) este semn al unui eu (ego) puternic, dar doar dacă integrarea nu este una ad hoc (cum ar fi „zebră verde”). Dacă participantul nu este în stare să dea un răspuns după ce vede prima planșă colorată înseamnă că e instabil din punct de vedere emoțional sau că are tendința de a reacționa emoțional în situații în care alții nu ar face-o. Rotirea planșei după câteva răspunsuri indică flexibilitate, dar doar dacă e după câteva răspunsuri – dacă, în schimb, participantul rotește planșa imediat, înseamnă că are capacitate redusă de a testa realitatea. Și așa mai departe.­2

Nu doar forma, ci și conținutul imaginilor generate de participant e important. Mulți văd animale, dar prea multe animale indică imaturitate și lipsă de imaginație. Oamenii în mișcare sunt un lucru bun de văzut pentru că indică putere de caracter și creativitate; organele sexuale nu sunt un lucru așa bun. Răspunsurile „anale” (prea rigide sau prea dezordonate) din partea bărbaților indică homosexualitate. Figurile care sunt parțial umane și parțial ne-umane (centauri, vrăjitoare, personaje din desene animate) sunt semne ale alienării și ale începerii retragerii schizofrenice. Cei care văd scene confabulate (care sunt formate din mai multe imagini aruncate împreună, indiferent de coerență; sau cele care conțin ceva ce nu este în pata de cerneală) nu se pricep la testarea realității. Iar cei care văd multe lucruri pe care alte persoane nu le văd sunt posibil schizofrenici (dar cei care nu văd nimic ieșit din comun au nevoi exagerate de control).2

Răspunsurile cele mai comune pot fi găsite uşor pe internet, ceea ce face falsificarea foarte ușoară. Câteva dintre ele sunt chiar în articolul de pe Wikiedia despre testul Rorschach.

Rorschach_blot_03

Planșa nr. 3.

 

Sistemul Comprehensiv al lui Exner

În anii ’60, John Exner a încercat să sistematizeze interpretările, procedurile și variabilele din versiunile existente la acea vreme pentru testul Rorschach, încercând să găsească corelații statistice între răspunsuri și ceea ce ar trebui să indice. Cu alte cuvinte, dacă majoritatea celor testați văd în prima planșă un fluture sau un liliac, acela este răspunsul „popular”. Dacă majoritatea persoanelor cu schizofrenie văd organe umane, atunci acela este răspunsul care indică schizofrenia. Nu contează ce explicații sunt date de psihanaliză sau de alte ramuri ale psihologiei, pentru Exner contează doar corelația statistică. Rezultatul a fost un sistem destul de complicat, cu notații specifice pe care, pentru a-l explica, e nevoie de o carte întreagă. Totuși, cum ar decurge notarea unui răspuns simplu?40

 Să luăm ca exemplu planșa nr. 3 și următorul răspuns:

Participant: Aici e o persoană, probabil un bărbat.
Evaluator: Unde, mai exact?
Participant: (indică spre D9)
Evaluator: Nu reușesc să văd, puteți să-mi detaliați?
Participant: Aici e capul, aici corpul și aici picioarele.

Toate planșele au fost împărțite de către Exner în regiuni. Regiunea D9 este următoarea:

Rorschach_blot_03 (D9)

Regiunea D9 a planșei III, evidențiată.41

Acest răspuns ar fi codat în felul următor:

Locație și DQ Determinant & FQ Conținut Popular
Do Fo H P

Codarea Do Fo H înseamnă că participantul a folosit o regiune comună a petei (D) și a identificat în aceasta un singur obiect unitar (o). Determinantul F arată că doar forma petei din acea regiune a justificat răspunsul. Codul pentru calitatea formei (o din Fo) indică folosirea convențională a formei, iar conținutul răspunului (H) indică un om (human). Iar P arată că este un răspuns dat frecvent (adică popular).40

Pentru răspunsuri mai complicate și codarea se complică pentru a indica sub-regiuni, mișcare, culoare, textură etc. Iar după codare, pentru a ajunge la indecșii relevanți (cum ar fi SCZI) e nevoie de combinarea codurilor obținute. Prin urmare, pregătirea pentru a putea administra un test Rorschach este laborioasă.

 

Este un mit sau e real?

Înainte de toate, trebuie să reamintesc că nu există un test Rorschach, ci există mai multe variante dezvoltate de-a lungul timpului. Acestea pot fi separate în două categorii: sistemele cu interpretare proiectivă și sistemul comprehensiv dezvoltat de John Exner. Prin urmare, o să le evaluez în mod separat. Să începem cu variantele proiective.

Variantele proiective

Versiunile existente înainte ca John Exner să încerce sintetizarea lor în Sistemul Comprehensiv erau foarte puțin studiate în mod științific. Bruno Klopfer, un student de-al lui Carl Jung și proponentul celei mai populare variante a testului Rorschach, chiar considera că nu este important ca testul să aibă norme (adică un set de reguli după care să fie interpretate rezultatele) și nici nu era preocupat de validitatea testului, importantă fiind integrarea intuitivă a informației. Mai mult, considera că testele de validitate sunt inutile și tot ce ar putea să facă ar fi să confirme ceea ce specialiștii în tehnica Rorschach știu deja.7 Cu toate astea, Klopfer, Piotrowski și alți experți au examinat scorurile Rorschach ale unor cadeți ai unei școli de aviație, încercând să-i identifice pe cei cu „tulburări clare de personalitate”. Precizia acestor experți a fost la fel de bună ca și dacă ar fi dat cu banul.8 După câțiva ani în care a fost pus în fața unor rezultate asemănătoare, adresând criticile, Klopfer declara «Poate că nu este necesar să ne preocupăm de validitate în sensul obișnuit; sau poate o nouă tehnică de validare este necesară».9 De asemenea, insista că expertiza este cel mai important lucru. Cercetarea ulterioară a demonstrat că și această noțiune este falsă, experții nefiind mai preciși în evaluări decât alți evaluatori (ex.: studenți care tocmai au învățat să folosească tehnica Rorschach).10 Mai mult, Klopfer recomanda clinicienilor să valideze tehnica pentru ei înșiși.7 Și se pare că psihologii clinicieni care foloseau această tehnică l-au luat în serios pentru că un sondaj făcut de Exner în 1972 a arătat că aproximativ unul din cinci specialiști nu notează scorul răspunsurilor, iar patru din cinci dintre cei care notează scorul, îl „personalizează”. Cei mai mulți au fost antrenați să folosească ori sistemul lui Klopfer, ori cel al lui Beck, însă cei mai mulți le alterează, le combină și adaugă și observații din experiența personală.11

Pentru a verifica dacă rezultatele metodei Rorschach sunt utile în realitate (și nu doar în declarațiile lui Klopfer), soții Chapman s-au gândit la un test. Unul dintre lucrurile pe care proponenții Rorschach le afirmau era că metoda Rorschach poate identifica persoanele homosexuale. Pentru a verifica acest lucru au urmat mai mulți pași. Prima dată au trimis chestionare mai multor psihologi clinicieni, cerându-le să spună care cred că sunt cele mai des asociate semne cu homosexualitatea. Rezultatele au corespuns cu cele mai frecvente semne convenționale folosite în testele Rorschach (referințe la anus, îmbrăcăminte feminină, organe sexuale, persoane de sex neclar sau persoane hermafrodite). Deși niciunul dintre aceste răspunsuri nu este dat de persoanele homosexuale mai des decât cele heterosexuale, psihologii erau convinși că au ajuns la aceste răspunsuri prin experiență clinică. Observând acest lucru, soții Chapman au formulat o ipoteză: aceste semne sunt doar ceea ce ne așteptăm în mod naiv să vadă homosexualii în petele de cerneală, nu sunt descoperite în urma „experienței clinice”. Așa că au întrebat niște studenți fără experiență clinică să aleagă ce simboluri sunt –pentru ei– asociate cel mai mult cu homosexualitatea. Deloc surprinzător, au făcut aproape aceleași asocieri ca și psihologii cu experiență. Mai mult decât atât, un alt set de studenți a primit 30 de planșe conținând o pată de cerneală, o descriere făcută de un pacient imaginar și două tulburări emoționale de care acesta suferea și după ce au examinat mai multe astfel de planșe, li s-a cerut să spună dacă au observat vreun răspuns dat mai des de homosexuali. Studenții au crezut în mod greșit că semnele false (îmbrăcăminte feminină și toate cele amintite mai sus) indică homosexualitate, dând astfel dovadă de corelație iluzorie. Acest test a fost făcut și „invers”, alți participanți primind semne valide, dar nereușind să facă evaluări corecte.12

Bun, ăsta e doar un test (cu mai multe variații). Există și evaluări mai cuprinzătoare? Există. Una dintre cele mai vechi este cea a lui Lee Cronbach, care concluzionează că eficiența evaluării prin metoda Rorschach nu este susținută în mod empiric.13 În anii care au urmat, au fost făcute evaluări ale metodei Rorschach de către Mental Measurements Yearbok, o carte standard publicată din 6 în 6 ani ce conține evaluări și recenzii ale principalelor metode de evaluare psihologică. Metoda Rorschach a fost evaluată în 1949, 1953, 1959, 1965, 1972 și 1978. În edițiile următoare nici nu a mai fost evaluată pentru că a fost considerată discreditată. În anii în care a fost evaluată, însă, obiceiul era să fie prezentate cel puțin două evaluări, una pro și una contra. Surprinzătoare sunt evaluările pro și „argumentele” aduse, ca de exemplu încercarea lui Morris Krugman în 1949 de a substitui dovezile cu retorica: „Tehnica Rorschach a rezistat testelor clinice de-a lungul anilor și a devenit mai puternică; pe de altă parte, încercările de validare atomistică au eșuat și probabil vor continua să eșueze” (italicele mele). Cu alte cuvinte, știm noi că funționează, așa că de ce să ne mai batem capul cu teste? În ediția următoare, din 1953, povestea se repetă, evaluarea pozitivă oferind doar retorică: „testul Rorschach este o tehnică clinică, nu o metodă psihometrică”. În 1959, Hans Eysenck reafirmă ceea ce a spus Lee Cronbach, iar Raymond J. McCall adaugă că majoritatea ipotezelor n-au fost niciodată validate empiric, deși au fost publicate peste 2000 de studii.6 În 1965, A. Jensen concluzionează că „testul Rorschach este un test foarte slab și nu are nicio valoare practică pentru vreunul dintre scopurile pentru care este recomandat de proponenții săi”.14 În 1978, Richard Davis concluzionează că lipsa validării empirice ridică mari semne de întrebare legate de folosirea în continuare a testului.6

Așa că în ceea ce privește interpretarea proiectivă a testului Rorschach, concluzia este simplă.

Rorschach Mit

 

Sistemul comprehensiv

Dacă în cazul interpretărilor proiective lucrurile sunt mai clare, când vine vorba de sistemul comprehensiv există o controversă. Funcționează sau nu? La o primă vedere răspunsul ar fi: depinde pe cine citești. Irving Weiner scrie că testul Rorschach este foarte bun, iar criticii nu au argumente de luat în seamă.15 Robert Kaplan scrie că testul nu este suficient de bine susținut de studii și că are probleme care trebuie rezolvate înainte să poată fi folosit.16 Iar acestea sunt doar două exemple. Prin urmare, e nevoie să urmărim controversa, așa că această secțiune va avea următoarea structură: prezentarea dezbaterii din anii 1998-2003 când a avut loc așa-numitul Rorschach Wars în Psychological Assessment, apoi prezentarea unor articole din anii de după dezbatere.

 

Pentru că la sfârșitul anilor ’90 au început să apară mai multe articole critice față de sistemul comprehensiv și a apărut o controversă, jurnalul științific Psychological Assessment, specializat în tehnici de evaluare psihologică, a propus o dezbatere structurată între critici și proponenți. La vremea respectivă, Gregory Meyer era redactor șef la acest jurnal, așa că a moderat dezbaterea. Au fost publicate mai multe articole, dintre care primul detaliază și structura dezbaterii:17

  • Partea I cuprinde 5 articole publicate în Secțiunea Specială. Autorii acestor articole au primit 445 de articole despre tehnica Rorschach, publicate în ultimii 20 ani (1977-1997) în cinci dintre cele mai importante jurnale științifice. Folosind aceste articole (și eventual și altele), au trebuit să analizeze starea curentă a sistemului comprehensiv. Cele cinci articole din prima parte sunt următoarele:
    • Dawes, R.M. (1999). Two methods for studying the incremental validity of a Rorschach variable, Psychological Assessment, 11, 297-302. Afirmă că variabila numită Ego Impairment Index din sistemul comprehensiv are validitate incrementală scăzută (validitatea incrementală se referă la puterea de predicție a unei variabile atunci când este adăugată unor informații deja cunoscute);
    • Hiller, J.B., Rosenthal, R., Bornstein, R.F., Berry, D.T.R., & Brunell-Neuleib, S. (1999). A comparative meta-analysis of Rorschach and MMPI validity, Psychological Assessment, 11, 278-296. Afirmă că sistemul comprehensiv și MMPI (Minesota Multiphasic Personality Inventory) sunt la fel de valide;
    • Hunsley, J. & Bailey, J.M. (1999). The clinical utility of the Rorschach: Unfulfilled promises and an uncertain future, Psychological Assessment, 11, 266-277. Afirmă că sistemul integrat are utilitate clinică foarte scăzută și nu există suficiente dovezi care să justifice folosirea acestuia în continuare;
    • Stricker, G., Gold, J.R. (1999). The Rorschach: Toward a nomothetically based, idiographically applicable configurational model, Psychological Assessment, 11, 240-250. Afirmă că sistemul comprehensiv poate fi folosit pentru evaluarea personalității;
    • Viglione, D.J. (1999). A review of recent research addressing the utility of the Rorschach, Psychological Assessment, 11, 251-265. Afirmă că multe dintre variabilele Rorschach sunt utile în contexte clinice, judiciare și educaționale;
  • Partea a II-a cuprinde câte un articol din fiecare tabără (critici și susținători), care au rolul de a analiza, dezbate și disputa concluziile articolelor din partea I. Cele două articole sunt următoarele:
    • Garb, H.N., Wood, J.M., Nezworski, M.T., Grove, W.M., Stejskal, W.J. (2001). Toward aresolution of the Rorschach controversy, Psychological Assessment, 13, 433-448;
    • Weiner, I.B. (2001). Advancing the science of psychological assessment: The Rorschach Inkblot Method as exemplar, Pychological Assessment, 13, 423-432;
  • Partea a III-a. Articolele din partea a II-a au fost trimise către autorii principali ai articolelor din partea I pentru a răspunde criticilor aduse meta-analizelor. De asemenea, Hunsley & Bailey și Viglione & Hilsenroth au avut oportunitatea de a răspunde și articolelor din partea I, fiind principalii critici și susținători ai dezbaterii. Au fost publicate trei articole:
    • Rosenthal, R., Hiller, J.B., Bornstein, R.F., Berry, D.T.R., & Brunell-Neuleib, S. (2001). Meta-analytic methods, the Rorschach and the MMPI, Psychological Assessment, 13, 449-451;
    • Viglione, D.J., & Hilsenroth, M.J. (2001). The Rorschach: Facts, fictions and future, Psychological Assessment, 13, 452-471;
    • Hunsley, J., & Bailey, J.M. (2001). Whither the Rorschach? An analysis of the evidence, Psychological Assessment, 13, 472-485;
  • Partea a IV-a. Toate articolele precedente au fost analizate de ultima serie de autori, care au scris și un sumar al dezbaterii:
    • Meyer, G.J., & Archer, R.P. (2001). The hard science of Rorschach research: What do we know and where do we go? Psychological Assessment, 13, 486-502;

Rorschach_blot_07

Planșa nr. 7

Pentru a înțelege mai bine dezbaterea, o să prezint și rezumatele articolelor din partea a II-a și partea a III-a (cu excepția celui al lui Rosenthal et al. care conține doar niște calcule refăcute ca urmare a criticilor primite).

A fost greu să mă decid dacă să includ rezumatele în acest articol, așa că m-am gândit la următorul compromis: le-am inclus, dar știu că este mult de citit, așa că puteți sări direct la partea a IV-a (articolul lui Meyer și Archer, după planșa nr. 5) dacă nu vă interesează detaliile dezbaterii.

Așadar, partea a II-a. Să începem cu articolul lui Howard Garb și să continuăm cu cel al lui Irving Weiner.

Garb et al. (2001)

  • Despre articolul lui Striecker & Gold (1999): prezintă afirmații exagerate în timp ce rezultatele studiilor sunt modeste. Variabila S-Con (Suicide Constellation) nu reușește să diferențieze pacienții cu tendințe de sinucidere de cei fără. Deși este adevărat că utilitatea variabilei RPRS (Rorschach Prognostic Rating Scale) este susținută de o meta-analiză recentă,18 este la fel de adevărat că majoritatea studiilor despre RPRS sunt mai vechi de 20 ani și nu au folosit sistemul comprehensiv. Garb și colaboratorii mai remarcă și că Striecker & Gold înceracă să găsească raționalizări în cazurile în care nu le convin rezultatele.
  • Despre articolul lui Viglione (1999): deși Viglione afirmă că majoritatea variabilelor au fost testate pentru fiabilitate, în realitate doar 51 au fost testate, iar când analizele au fost făcute de alte persoane, nu de John Exner (autorul sistemului comprehensiv), rezultatele au fost mai slabe.19 În ce privește fiabilitatea concordanței la notare, Viglione citează o meta-analiză (pe care Garb o consideră „forțată”), dar uită să citeze critica acelei meta-analize.20 De asemenea, Garb et al. prezintă singurul studiu bine realizat pe acest subiect și arată că rezultatele a 50% dintre variabile sunt sub ceea ce chiar Exner sau Groth-Marnat consideră acceptabil.21 În ce privește diversitatea culturală, există riscul ca în cazul non-americanilor să existe o supra-patologizare și prezintă mai multe studii care au observat acest fenomen.37 În ceea ce privește judecățile clinice, Garb et al. afirmă că majoritatea studiilor citate de Viglione sunt din anii ’60 și 70’ și nu folosesc sistemul comprehensiv și că, de asemenea, Viglione ignoră în mod consecvent descoperirile negative. În ce privește variabila DEPI (Depression Index), studiile prezentate sunt neconvingătoare, iar pentru SCZI (Schizophrenia Index) rezultatele sunt moderate.
  • Despre articolul lui Dawes (1999): Garb et al. sunt de acord că există validitate incrementală modestă când se folosește sistemul comprehensiv împreună cu MMPI.
  • Despre articolul lui Hiller et al. (1999): meta-analiza făcută de Hiller are erori statistice importante și folosește datele dintr-o altă meta-analiză22 ce a fost la rândul ei criticată pentru erori statistice,23 iar după corectarea acestora, rezultatele au fost că MMPI este superior testului Rorschach. Hiller a fost de acord cu critica acestei meta-analize, dar a descoperit alte erori statistice în meta-analiza originală, ceea ce face rezultatele ambelor meta-analize greu de evaluat. O altă problemă a meta-analizei lui Hiller este că evaluatorii nu au fost orbiți.
  • În concluzie, Garb susține că studiile individuale incluse în meta-analize au erori care nu au fost corectate, multe descoperiri nu au fost replicate (iar Viglione neglijează acest fapt). Variabila SCZI corelează puternic cu schizfrenia, iar R (numărul de răspunsuri) în mod invers cu dizabilitățile intelectuale. O listare a fiecărei variabile din sistemul comprehensiv, cu datele aferente (validitate, fiabilitate etc.) ar clarifica lucrurile. În meta-analize ar trebui incluse si studii nepublicate (ex.: disertații), iar o parte dintre studiile făcute de Rorschach Workshops sunt citate în favoarea testului, dar nu sunt disponibile pentru a fi verificate și ar trebui să fie făcute publice.

Weiner (2001)

  • Încă din abstract, Weiner adoptă o atitudine puternic în favoarea metodei Rorschach, afirmând că articolele pro au prezentat dovezi extensive, tehnica a fost standardizată, validată și a devenit fiabilă, fiind un exemplu robust de aplicare a principiilor științifice. În același timp, caracterizează articolele anti-Rorschach ca fiind superficiale, incomplete și neechilibrate și prezintă un scepticism care nu trebuie luat prea mult în serios.
  • În ce privește standardizarea, Weiner afirmă că Exner a făcut eforturi mari pentru a produce un set de reguli, iar în prezent sistemul comprehensiv este folosit de foarte multă lume. Criticii însă –susține Weiner– au ales exemple care nu folosesc sistemul lui Exner sau situații în care cei care au administrat testul nu l-au administrat bine și de aici rezultatele negative (țin să repet cu alte cuvinte: când sunt observate rezultate pozitive e pentru că testul e bun, iar când sunt rezultate negative e pentru că n-a fost administrat cum trebuie).
  • Concordanța la notare este în general mare (Meyer a obținut K = 0,88, iar Hunsley & Bailey n-au abordat problema pentru că orice sistem cu o consistență internă e de așteptat să aibă o concordanță mare). Fiabilitatea la retestare este relativ mare pentru multe dintre variabilele din sistemul comprehensiv (Weiner citează meta-analiza lui Viglione, 1999), chiar și Hunsley & Bailey fiind de acord cu asta.
  • Problema datelor normative de referință nu a fost abordată de celelalte articole, iar Weiner amintește faptul că Exner a folosit un grup de 700 de persoane pentru a obține aceste date.
  • În ce privește validitatea, Weiner amintește articolele lui Striecker & Gold (1999) și Viglione (1999), care susțin că sistemul comprehensiv are o validitate mare, amintește și de articolul lui Hiller (1999) care susține că validitatea SC este la fel de mare ca pentru MMPI, apoi prezintă dezbaterea dintre Hunsley & Bailey și Garb et al. pe de o parte și Parker et al. și Atkinson pe de altă parte. De asemenea, critică articolul lui Hunsley & Bailey din partea I, concentrându-se doar pe meta-analiza lui Hiller et al. (1999), tot din partea I.
  • În ce privește validitatea incrementală, Weiner critică articolul lui Hunsley & Bailey (1999) pe motiv că studiile citate nu foloseau sistemul comprehensiv. Referitor la celălalt studiu citat,24 Weiner se concentrează pe SCZI (care are validitate incrementală mare) și ignoră celelalte variabile (menționând, totuși, DEPI). Citându-l pe Dawes (1999), Weiner îi exagerează concluziile și menționează doar trei variabile care, întâmplător sau nu, au validitate incrementală mare.

Rorschach_blot_10

Planșa nr. 10

Și articolele din partea a III-a.

Viglione & Hilsenroth (2001)

  • Afirmă că există concordanță mare la notare pentru 95% dintre variabilele din sistemul comprehensiv. Fiabilitatea la retestare este, în general, bună, lucru cu care sunt de acord și Wood sau Lilienfeld. De asemenea, autorii critică două studii prezentate de Garb în articolul din partea a II-a.25
  • În ce privește datele normative și diversitatea culturală, autorii recunosc că există probleme (datele sunt învechite, nu există suficienți participanți non-caucazieni), iar unele unele game de interpretare ar trebui modificate (de exemplu pentru variabilele X-% și X+%).
  • Autorii susțin că meta-analizele oferă în general susținere pentru validitatea sistemului comprehensiv. Și validitatea incrementală este bună, iar motivul pentru care în meta-analiza lui Hunsley & Bailey (1999) nu au fost obținute valori ridicate este pentru că n-au luat în considerare toate studiile. Și Garb, și Weiner confirmă validitatea incrementală a variabilelor EII, Rorschach Oral Dependency Scale și RPRS. În plus, autorii prezintă și alte studii care au găsit validitate incrementală pentru mai multe variabile din sistemul comprehensiv, atunci când au fost folosite împreună cu MMPI. Chiar și studiul lui Dawes (1999) din prima parte, afirmă Viglione și Hilsenroth, susține validitatea incrementală, deși concluzile lui Dawes sunt mai rezervate.
  • Thought Disorder Index este strâns legat de psihoză, schizofrenie și tulburări de gândire (autorii citează mai multe studii care susțin acest lucru), iar S-Con (Suicide Constellation) poate indica risc de sinucidere, dar nu poate fi folosit pentru a-l exclude (are problema erorilor fals-pozitive).
  • Concluzia este că sistemul comprehensiv are limitările sale și este nevoie de mai multe studii care să evidențieze punctele slabe și punctele forte, însă scepticii (în special Hunsley & Bailey) cer standarde mult prea ridicate.

Hunsley & Bailey (2001)

  • Consideră că studiile existente sunt insuficiente pentru a justifica folosirea tehnicii Rorschach în domeniul clinic, remarcă neclaritatea din jurul acesteia (de exemplu, Exner îl consideră test psihometric, în timp ce Weiner nu) și critică studiile prezentate în favoarea folosirii sale.
  • Autorii consideră că meta-analiza lui Viglione (1999) a exclus în general datele self-reported, dar le-a inclus atunci când au avut rezultate pozitive, deși proponenții Rorschach susțin aceste date nu trebuie incluse în evaluare (ex: Weiner, Striecker, Gold). Cu toate acestea, Viglione nu este singurul care le-a folosit; Bornstein, Meyer și Hiller le-au folosit în meta-analizele lor.26
  • În urma concluziilor negative ale unor meta-analize27 care au analizat capacitatea testelor Rorschach de a identifica tulburările mentale, unii proponenți afirmă că scopul testului nu a fost niciodată diagnosticarea (ex.: Hiller, Weiner), ceea ce nu pare decât o raționalizare post-hoc (mai ales că până în 1997, Weiner susținea opusul). De asemenea, Weiner ignoră și alte critici și răspunde prin retorică.
  • Hunsley și Bailey ridică problema felului în care sunt administrate testele Rorschach, iar Weiner susține că aceasta nu este o problemă pentru că nici în cazul altor teste nu a fost analizat acest lucru. Hunsley și Bailey oferă un contraexemplu, WAIS (Wechsler Adult Intelligence Scale), și arată că s-a studiat problema felului în care este administrat. O altă problemă, descoperită de Wood et al., e tendința testului Rorschach de a supra-patologiza, lucru care ar putea explica opinia susținătorilor că testul Rorschach e atât de bun încât descoperă tulburările mentale chiar și atunci când alte teste nu pot face asta. Susținătorii mai afirmă și că eficiența testului este mai mare atunci când se fac interpretări „individualizate”, ceea ce nu este susținut de dovezi empirice și sună asemănător cu afirmațiile astrologilor.
  • În concluzie, autorii consideră că nu există suficiente dovezi obținute din studii de calitate pentru a stabili că sistemul comprehensiv este util în condiții clinice, legale sau de altă natură.

Rorschach_blot_05

Planșa nr. 5

În partea a IV-a a fost publicat un singur articol care a reanalizat niște date contestate în părțile anterioare și a tras concluziile. Articolul este scris de Meyer & Archer (2001):

  • Meyer, Archer și Parker au reanalizat datele lui Parker et al. (1988), folosind și date excluse inițial și au corectat greșelile statistice, iar rezultatele sunt asemănătoare cu cele originale, adică au arătat că există validitate asemănătoare între sistemul comprehensiv și MMPI. Autorii remarcă, totuși, compararea acestor metode este problematică pentru că acestea nu conțin predictori echivalenți și nu au fost evaluate relativ la un set comun de variabile. De asemenea, studiile folosite în meta-analiză nu au fost corectate de anumite aspecte de proiectare cunoscute ca având impact asupra rezultatelor și nu au fost aduse la același nivel de rigoare metodologică. Meta-analiza globală arată, însă, că și testul Rorschach (Sistemul Comprehensiv) și MMPI și WAIS (Wechsler Adult Intelligence Scale) au aspecte positive asemănătoare în ce privește validitatea.
  • Printre concluzii: indexul SCZI este util pentru identificarea schizofreniei, indexul DEPI nu este util pentru a identifica depresia. De asemenea, autorii menționează că nu există suficiente dovezi sistematice legate de virtuțiile și limitările răspunsurilor Rorschach, dar cu toatea astea testul e suficient de bun pentru a fi folosit.

Cred că e important să menționez că Gregory Meyer este unul dintre principalii proponenți ai testului Rorschach (și în prezent continuatorul muncii lui John Exner), iar Robert Archer s-a specializat în alte tehnici psihometrice (în special MMPI). Nu pare o practică foarte bună acordarea ultimului cuvânt unei părți dintr-o dezbatere. Ar fi fost mult mai potrivit ca în locul lui Meyer să fie ales un cercetător neutru. Tocmai de aceea am ales să prezint pe scurt dezbaterea pentru că nu cred că concluziile ultimului articol oferă o imagine echilibrată. De exemplu, articolul nu scoate în evidență principala critică a taberei „contra”, și anume că pentru variabilele (indecșii, scorurile) sistemului comprehensiv nu există suficiente studii care să arate în ce măsură funcționează (sau nu funcționează) fiecare. Există studii care arată că SCZI este foarte bun și că DEPI nu este bun, dar pentru foarte multe dintre variabile aceste date lipsesc. Și sunt în jur de 150 de astfel de variabile.

După cum era de așteptat, controversa nu s-a terminat după această dezbatere din revista Psychological Assessment, iar părerile au continuat să fie împărțite. Unii dintre proponenți (de exemplu, Weiner) au considerat disputa încheiată, dar din fericire alții au continuat să facă studii despre eficiența sistemului comprehensiv (Meyer, Exner, Mihura) și au contribuit la îmbunătățirea lui. Criticii au continuat să indice punctele slabe ale testului. A existat și o controversă legată de folosirea testului în justiție,28 au existat și cărți pentru publicul nespecialist.29

Rorschach_blot_02

Planșa nr. 2

În 2005, Garb și asociații30 au prezentat situația din punctul lor de vedere, rezumată în continuare (acesta fiind doar unul dintre articolele apărute după Rorschach Wars):

  • Mai multe studii arată că testele Rorschach au tendința de a supra-patologiza, dar proponenții testului vin doar cu explicații post-hoc (de exemplu, Weiner afirmă că persoanele evaluate inițial de Exner pentru stabilirea normelor sistemului comprehensiv erau mai sănătoase decât populația generală, ceea ce este fals, chiar Exner confirmând că între 15 și 20% au apelat la ajutor psihologic pentru diverse probleme).
  • Și criticii, și proponenții sunt de acord că unele scoruri din sistemul comprehensiv sunt valide, cum ar fi cele legate de detectarea tuburărilor de gândire, a dependenței sau a rezultatului tratamentului. Există de asemenea consens că unele scoruri nu au fost studiate suficient (ex.: Coping Deficit Index, Obsessive Style Index, Hypervigilance Index, raportul dintre mișcarea activă și cea pasivă, D-score, conținutul de mâncare, elemente anatomice și de raze X, Intellectualization Index, Isolation Index).
  • Rezultatele pozitive ale unor meta-analize arată că cel puțin unele scoruri sunt valide, dar nu nu spun care. Pe de altă parte, relevanța unor meta-analize este exagerată uneori de proponenți (ex.: Weiner, referindu-se la meta-analiza făcută de Parker, Hanson & Hunsley (1998), a susținut că coeficienții de validitate de 0,41 pentru Rorschach și 0,46 pentru MMPI sunt obținuți în urma a 411 studii, dar în realitate aceștia au fost obținuți în urma a doar 5 studii (pentru Rorschach), respectiv 30 (pentru MMPI).
  • Criteriile folosite de autori (Garb et al.) pentru a evalua validitatea sunt: studiile trebuie să fie calitative din punct de vedere metodologic, rezultatele semnificative să fie replicate independent, iar rezultatele trebuie să fie consecvente. Conform acestor criterii, următoarele scoruri au fost găsite a fi valide: Thought Disorder Index pentru evaluarea tulburărilor de gândire; Rorschach Prognostic Rating Scale pentru predicția rezultatului tratamentului; Rorschach Oral Dependency Scale pentru comportamente legate de dependență; și verbalizările deviante și calitatea slabă a formelor (precum și SCZI și alți indcși derivați din acestea) pentru detectarea schizofreniei. La acestea, autorii mai adaugă semnele lui Piotrowski pentru leziuni cerebrale și scalele de ostilitate și anxietate a lui Elizur.

Din păcate, John Exner a murit în 2006, iar ultima carte pe care a publicat-o despre sistemul comprehensiv a fost în 2005,31 dar ultima revizuire a sistemului a fost în 2003. Prin urmare, toate descoperirile făcute de atunci înainte nu sunt reflectate în metodologia sistemului comprehensiv, iar de atunci au fost făcute mai multe studii. Unele au întărit validitatea unor variabile (ex.: Perceptual Thinking Index pentru diagnosticarea schizofreniei32), altele au sugerat includerea unor variabile care nu sunt în sistemul comprehensiv (ex.: scala de ostilitate a lui Elizur sau variabilele de agresivitate ale lui Holt33), iar altele excluderea unor predicții ineficiente (ex.: analiza mai multor variabile pentru detectarea psihopatiei34). De asemenea, au fost propuse și modificări ale metodologiei pentru a repara unele probleme legate de administrare35 și a fost recomandat să nu se facă diagnosticări pentru copii și adolescenți din societăţi diferite de America pentru că datele sunt neclare.36

Având în vedere problemele existente, nu pot să pun eticheta „real” pe sistemul comprehensiv, dar nici „mit” nu pot să spun că este, pentru că unele părți funcționează, iar unele meta-analize (chiar dacă disputate) arată că are validitate asemănătoare cu alte teste din psihologie. Așadar, sistemul este bun, dar mai trebuie îmbunătățit, trebuie separate variabilele bune de cele inutile. Până n-o să se facă acest lucru, o să existe dubii în legătură cu precizia predicțiilor. Prin urmare, o să spun că este plauzibil.

Rorschach Plauzibil

 

A New Hope: Rorschach Performance Assessment System® (R-PAS®)

Înainte de a încheia, trebuie să scriu ceva și despre viitorul testului Rorschach. Cum am scris mai sus, John Exner a murit în 2006 și nu a desemnat în mod oficial pe nimeni să îi continue cercetarea. Deși inițial familia sa a fost de acord cu modificarea sistemului comprehensiv de către Consiliul de Cercetare Rorschach, pe urmă a decis ca sistemul comprehensiv să rămână așa cum l-a lăsat Exner, în semn de omagiu. Prin urmare, cei din consiliul de cercetare au decis să creeze un nou sistem, bazat în mare parte pe sistemul comprehensiv și l-au numit Rorschach Performance Assessment System® (R-PAS®). R-PAS își propune să își adapteze variabilele și criteriile de evaluare în funcție de cercetare și astfel să devină un instrument psihologic bazat pe dovezi. Un exemplu de astfel de modificare este renunțarea la unele variabile (ex.: Hx, PSV), reconfigurarea altora (ex.: umbrele nu mai indică dominanță) sau adăugarea unora noi (ex.: SR, SI, AGC). De asemenea, au fost colectate date noi pentru populații ne-americane.38 Din grupul de cercetare fac parte, printre alții, Gregory Meyer, Joni Mihura, Donald Viglione sau Robert Bornstein.

În 2013 a fost publicată o meta-analiză care –în sfârșit– prezintă informații despre relevanța fiecărei variabile în parte (așa cum încă din 1999 criticii indicau că este necesar).39 Pe lângă tabelele cu informații despre variabile, articolul discută pe larg unele aspecte. Sunt aduse critici la meta-analiza lui Hiller et al. (1999) și la re-analiza lui Meyer & Archer (2001) din care rezulta că sistemul comprehensiv are validitate asemănătoare cu MMPI, concluzionând că există prea multe erori și prea multe necunoscute pentru a considera rezultatele valide. Este scos în evidență și faptul că pentru unele variabile din sistemul comprehensiv nu există cercetare solidă sau rezultatele sunt negative, iar datele lui Exner sunt cel mai probabil exagerate. Sunt prezentate și alte studii (Jørgensen, Andersen, & Dam, 2000; 2001) care confirmă rezultatele lui Wood et al. (2010) conform cărora psihopații nu pot fi descoperiți folosind testul Rorschach. Așa că în viitorul apropiat s-ar putea să avem un test Rorschach care să funcționeze suficient de bine.

Rorschach_blot_06

Planșa nr. 6

 

Linkuri utile:

Giving up cherished ideas: The Rorschach Inkblot Test (Robyn Dawes despre interpretarea proiectivă);
Rorschach Comprehensive System: Current Issues;
Listă cu articole despre Rorschach;
Invisible ink? What the Rorschach really tells us (Association for Psychological Science);
An Introduction to Rorschach Assessment (Capitol scris de Meyer și Viglione în 2008);
What’s Right with the Rorschach? (la ce este folositor testul Rorschach);
Introducing Key Features of the Rorschach Performance Assessment System (R-PAS);
Articole despre R-PAS.

 

 

Note:

1: Gary Groth-Marnat (2003), pg. 409;
2: Robyn Dawes (1994), pg. 147-148;
3:John Exner (2003), pg. 22-26;
4: Lubin, Wallis, & Paine (1971); Lubin, Larsen, & Matarazzo (1984); Watkins, Campbell, Nieberding, & Hallmark (1995);
5: John Exner (2003), cap. 3 „Controversy, Criticism and Decisions”;
6: Robyn Dawes (1994, pg. 150-152; sau Extract din carte;
7: Garb, Wood, Lilienfeld, Nezworski (2005);
8: Holtzman & Sells (1954);
9: “Perhaps it is not necessary to be concerned with validity in the usual sense; or perhaps a new technique of validation is necessary” (Klopfer & Davidson, 1962, p. 24): citat în Garb, Wood, Lilienfeld, Nezworski (2005);
10: Garb (1989), Whitehead (1985): citate în Garb, Wood, Lilienfeld, Nezworski (2005);
11:Exner & Exner (1972);
12: Chapman & Chapman (1969);
13: Cronbach (1949), citat în Dawes (1994), pg. 151: “The test has repeatedly failed as a prediction of practical criteria. There is nothing in the literature to encourage reliance on Rorschach interpretation.“;
14: Jensen (1965), citat în Meyer (1999a);
15: Weiner & Roger (2008),  Cap. 11: Rorschach Inkblot Method; sau Weiner & Freedheim (2003), pg. 304;
16: Kaplan & Saccuzzo (2008), Cap. 14: Projective Personality Tests;
17: Meyer (1999b);
18: Meyer & Handler (1997);
19: Garb et al. citează disertația lui Erstad (1996) și studiul lui Adair & Wagner (1992);
20: Garb et al. citează pe Wood, Nezworski, & Stejskal (1997);
21: Garb et al. citează pe Acklin, McDowell, Verschell, & Chan (2000);
22: Garb et al. citează pe Parker, Hanson, & Hunsley (1988);
23: Garb et al. citează pe Garb, Florio, Grove (1998);
24: Archer & Krishnamurthy (1997);
25: articolele criticate sunt Erstad (1996) și Adair & Wagner (1992);
26: Bornstein (1996); Meyer (1999b); Hiller et al. (1999);
27: Hiller et al. (1999); Wood & Lilienfeld (1999); Wood, Lilienfeld, Garb, Nezworski (2000);
28: de exemplu, în favoarea folosirii: Ritzler, Erard, & Pettigrew (2002) și contra folosirii: Grove, Barden, Garb, Lilienfeld (2002);
29: Wood, Nezworski, Lilienfeld, & Garb (2003): What’s Wrong With The Rorschach?;
30: Garb, Wood, Lilienfeld, Nezworski (2005); alt articol asemănător: Wood (2006);
31: John Exner, Philip Erdberg (2005);
32: Dao, Prevatt (2006);
33: Katko, Meyer, Mihura, & Bombel (2009);
34: Wood, Lilienfeld, Nezworski, Garb, Allen, Wildermuth (2010);
35: Dean, Viglione, Perry, & Meyer (2007);
36: Meyer, Erdberg, & Shaffer (2007);
37: vezi și Wood, Nezworski, Garb, Lilienfeld (2001); și răspunsul ulterior la critici: Wood, Teresa, Garb, & Lilienfeld (2001);
38: Meyer & Viglione (2011);
39: Mihura, Meyer, Dumitrascu, Bombel (2013);
40: John Exner (2003), pg. 71-72;
41: John Exner (2003), pg. 598;

 

 

Referințe:

Acklin, M. W., McDowell, C. J., Verschell, M. S., & Chan, D. (2000). Interobserver agreement, intraobserver reliability, and the Rorschach Comprehensive System. Journal of Personality Assessment, 74, 15-47. (Abstract);

Adair, H. E., & Wagner, E. E. (1992). Stability of unusual verbalizations on the Rorschach for outpatients with schizophrenia. Journal of Clinical Psychology, 48, 250-256. (Abstract);

Archer, R. P., & Krishnamurthy, R. (1997). MMPI-A and Rorschach indices related to depression and conduct disorder. Journal of Personality Assessment, 69, 517-533. (Abstract);

Bornstein, R.F. (1996). Construct validity of the Rorschach Oral Dependency Scale: 1967-1995. Psychological Assessment, 8, 200-205. (Abstract);

Chapman, L. J., and Chapman. J. P. (1969). Illusory correlation as an obstacle to the use of valid psychodiagnostic signs, Journal of Abnormal Psychology, 74, 271-280. (Abstract);

Cronbach, L. J. (1949). Statistical methods applied to Rorschach scores: A review. Psychological Bulletin, 46, 393–429. doi:10.1037/h0059467. (Abstract);

Dao T.K., Prevatt F. (2006). A psychometric evaluation of the Rorschach comprehensive system’s perceptual thinking index. J Pers Assess.;86(2):180-9. (Abstract);

Dawes, Robyn. House of Cards: Psychology and Psychotherapy Built on Myth [1994], Free Press;

Dawes, R.M. (1999). Two methods for studying the incremental validity of a Rorschach variable, Psychological Assessment, 11, 297-302. (Abstract);

Dean, K. L., Viglione, D. J., Perry, W., & Meyer, G. J. (2007). A method to optimize the response range while maintaining Rorschach comprehensive system validity. Journal of Personality Assessment, 89(2), 149-161. (Abstract);

Erstad, D. (1996). An investigation of older adults’ less frequent human movement and color responses on the Rorschach (Doctoral dissertation, Marquette University, 1995). Dissertation Abstracts International, 57, 4084B.

Exner, John. The Rorschach, A Comprehensive System: Volume 1. Basic Foundations and Principles of Interpretation, 4th Edition (2003), John Wiley & Sons, Inc.;

Exner, John E., Erdberg, Philip. The Rorschach, A Comprehensive System: Volume 2. Advanced Interpretation, 3rd Edition (2005). Wiley;

Exner, J.E., Exner, D.E. (1972). How clinicians use the Rorschach. Journal of Personality Assessment (Impact Factor: 1.29). 11/1972; 36(5):403-8. DOI:10.1080/00223891.1972.10119784. (Abstract);

Garb, H. N., Florio, C. M., & Grove, W. M. (1998). The validity of the Rorschach and the Minnesota Multiphasic Personality Inventory: Results from meta-analyses, Psychological Science, 9, 402-404.

Garb, H.N., Wood, J.M., Nezworski, M.T., Grove, W.M., Stejskal, W.J. (2001). Toward aresolution of the Rorschach controversy, Psychological Assessment, 13, 433-448. (Abstract);

Garb H.N., Wood J.M., Lilienfeld S.O., Nezworski M.T. (2005). Roots of the Rorschach controversy. Clin Psychol Rev. 2005 Jan; 25(1):97-118. (Abstract);

Groth-Marnat, Gary. Handbook of Psychological Assessment, 4th Ed. (2003), John Wiley & Sons;

Grove, William M.; Barden, R. Christopher; Garb, Howard N.; Lilienfeld, Scott O. (2002). Failure of Rorschach-Comprehensive-System-based testimony to be admissible under the Daubert-Joiner-Kumho standard. Psychology, Public Policy, and Law, Vol 8(2), Jun 2002, 216-234. doi: 10.1037/1076-8971.8.2.216. (Abstract);

Hiller, J.B., Rosenthal, R., Bornstein, R.F., Berry, D.T.R., & Brunell-Neuleib, S. (1999). A comparative meta-analysis of Rorschach and MMPI validity, Psychological Assessment, 11, 278-296. (Abstract);

Holtzman, W. H.; Sells, S. B. (1954). Prediction of flying success by clinical analysis of test protocols. The Journal of Abnormal and Social Psychology, Vol 49(4, Pt.1), Oct 1954, 485-490. doi: 10.1037/h0059895. (Abstract);

Hunsley, J. & Bailey, J.M. (1999). The clinical utility of the Rorschach: Unfulfilled promises and an uncertain future, Psychological Assessment, 11, 266-277. (Abstract);

Hunsley, J., & Bailey, J.M. (2001). Whither the Rorschach? An analysis of the evidence, Psychological Assessment, 13, 472-485. (Abstract);

Jensen, A. R. (1965). Review of the Rorschach Inkblot Test. In O. K. Buros (Ed.), The sixth mental measurements yearbook (pp. 501–509). Highland Park, NJ: Gryphon;

Jørgensen, K., Andersen, T. J., & Dam, H. (2000). The diagnostic efficiency of the Rorschach Depression Index and the Schizophrenia Index: A review. Assessment, 7, 259 –280. doi:10.1177/107319110000700306. (Abstract);

Jørgensen, K., Andersen, T. J., & Dam, H. (2001). “The diagnostic efficiency of the Rorschach Depression Index and the Schizophrenia Index: A review”: Erratum. Assessment, 8, 355. doi:10.1177/107319110100800311;

Kaplan, Robert M., & Saccuzzo, Dennis P., Psychological Testing: Principles, Applications and Issues, 7th Edition (2008),  Wadsworth Cengage Learning;

Katko, N. J., Meyer, G. J., Mihura, J. L., & Bombel, G. (2009). The interrater reliability of Elizur’s hostility systems and Holt’s aggression variables: A meta-analytical review. Journal of Personality Assessment, 91, 357-364. doi: 10.1080/00223890902936116 (Abstract);

Lubin, B., Larsen, R.M., & Matarazzo, J.D. (1984). „Patterns of psychological test usage in the United States 1935-1982”. American Psychologist, 39, 451-454. (Abstract);

Lubin, B., Wallis, R.R., & Paine, C. (1971). „Psychometric instruments in psychological clinics”. Journal of Consulting Psychology, 11, 49-54. (Abstract);

Meyer, G.J. (1999a). Introduction to the Special Series on the Utility of the Rorschach for Clinical Assessment. Psychological Assessment, Vol 11(3), Sep 1999, 235-239. doi: 10.1037/1040-3590.11.3.235. Special Section: I. The Utility of the Rorschach in Clinical Assessment. (Abstract);

Meyer, G.J. (1999b). The convergent validity of the MMPI and Rorschach scales: An extension using profile scores to define response and character styles on both methods and a re-examination of simple Rorschach response frequency. Journal of Personality Assessment, 72, 1-35. (Abstract);

Meyer, G.J. (2001). Introduction to the final Special Section in the Special Series on the utility of the Rorschach for clinical assessment, Psychological Assessment, 13(4), 419-422. (Abstract);

Meyer, G.J., & Archer, R.P. (2001). The hard science of Rorschach research: What do we know and where do we go? Psychological Assessment, 13, 486-502. (Abstract);

Meyer, G. J., Erdberg, P., & Shaffer, T. W. (2007). Towards international normative reference data for the Comprehensive System. Journal of Personality Assessment, 89, S201-S216. (Abstract);

Meyer, G.J., & Handler, L. (1997). The ability of the Rorschach to predict subsequent outcome: A meta-analysis of the Rorschach Prognostic Rating Scale. Journal of Personality Assessment, 69, 1-38. (Abstract);

Meyer, Gregory J. & Viglione, Donald J. (2011). New Developments in Rorschach-Based Behavioral Assessment. (prezentare);

Mihura J.L., Meyer G.J., Dumitrascu N., Bombel G. (2013). The validity of individual Rorschach variables: systematic reviews and meta-analyses of the comprehensive system. Psychol Bull. 2013 May;139(3):548-605. doi: 10.1037/a0029406. (Abstract);

Parker, K. C. H., Hanson, R., & Hunsley, J. (1988). MMPI, Rorschach, and WAIS: A meta-analytic comparison of reliability, stability, and validity. Psychological Bulletin, 103, 367-373. (Abstract);

Ritzler, B., Erard, R., & Pettigrew, G. (2002). Protecting the integrity of Rorschach expert witnesses: A reply to Grove and Barden (1999) re: The admissibility of testimony under Daubert/Kumho analyses, Psychology, Public Policy and Law, 8, 201-215. (Abstract);

Rosenthal, R., Hiller, J.B., Bornstein, R.F., Berry, D.T.R., & Brunell-Neuleib, S. (2001). Meta-analytic methods, the Rorschach and the MMPI, Psychological Assessment, 13, 449-451. (Abstract);

Stricker, G., Gold, J.R. (1999). The Rorschach: Toward a nomothetically based, idiographically applicable configurational model, Psychological Assessment, 11, 240-250. (Abstract);

Viglione, D.J. (1999). A review of recent research addressing the utility of the Rorschach, Psychological Assessment, 11, 251-265. (Abstract);

Viglione, D.J., & Hilsenroth, M.J. (2001). The Rorschach: Facts, fictions and future, Psychological Assessment, 13, 452-471. (Abstract);

Watkins, C.E., Jr., Campbell, V.L., Nieberding, R., & Hallmark, R. (1995). „Contemporary practice of psychological assessment by clinical psychologists”. Professional Psychology: Research and Practice, 26, 54-60. (Abstract);

Weiner, I.B. (2001). Advancing the science of psychological assessment: The Rorschach Inkblot Method as exemplar, Pychological Assessment, 13, 423-432. (Abstract);

Weiner, Irving B., Freedheim, Donald K. Handbook of Psychology, Volume 1: History of Psychology(2003), John Wiley & Sons;

Weiner, Irving B. & Greene, Roger L., Handbook of Personality Assessment (2008), John Wiley & Sons;

James M. Wood. “The Controversy Over Exner’s Comprehensive System for the Rorschach: The Critics Speak” Independent Practitioner (2006). (Abstract);

Wood, J.M., & Lilienfeld, S.O. (1999). The Rorschach inkblot test: A case of overstatement? Assessment, 6, 341-349. (Abstract);

Wood, J.M., Lilienfeld, S.O., Garb, H.N., & Nezworski, M.T. (2000). The Rorschach test in clinical diagnosis: A critical review, with a backward look at Garfield (1947). Journal of Clinical Psychology, 56, 395-430. (Abstract);

Wood, James M.; Lilienfeld, Scott O.; Nezworski, M. Teresa; Garb, Howard N.; Allen, Keli Holloway; Wildermuth, Jessica L. (2010). Validity of Rorschach Inkblot scores for discriminating psychopaths from nonpsychopaths in forensic populations: A meta-analysis. Psychological Assessment, Vol 22(2), Jun 2010, 336-349. (Abstract);

James M. Wood, M. Teresa Nezworski, Howard N. Garb, and Scott O. Lilienfeld. “The Misperception of Psychopathology: Problems With the Norms of the Comprehensive System for the Rorschach” Clinical Psychology: Science and Practice (2001). (Abstract);

Wood, J., Nezworski, M., Lilienfeld, S., & Garb, H. (2003). What’s Wrong with the Rorschach? Science Confronts the Controversial Inkblot Test. San Francisco, CA: Jossey-Bass.

Wood, J. M., Nezworski, M. T., & Stejskal, W. J. (1997). The reliability of the Comprehensive System for the Rorschach: A comment on Meyer (1997). Psychological Assessment, 9, 490-494. (Abstract);

Wood, J. M., Teresa, M., Garb, H. N. and Lilienfeld, S. O. (2001), Problems With the Norms of the Comprehensive System for the Rorschach: Methodological and Conceptual Considerations. Clinical Psychology: Science and Practice, 8: 397–402. doi: 10.1093/clipsy.8.3.397. (Abstract);

 

 

29 martie, 2014 at 21:28 1 comentariu

Cine e Masaru Emoto?

 

1. Despre cine vorbesc?

masaru emotoMasaru Emoto (江本 勝; 江(e) = golf; 本(moto) = carte, origine; 勝(masaru) = a depăși, a excela) este un autor japonez care a devenit cunoscut pentru afirmațiile sale despre influența gândurilor, a intențiilor sau a cuvintelor asupra apei. Dacă nu știți cum arată, îl aveți în poză; iar ceea ce apare pe fundal sunt cristale de gheață, imagine care a devenit într-o anumită măsură asociată cu el. Emoto a devenit mai cunoscut prin 2004, când a apărut în documentarul What the Bleep Do We Know!? (Ce naiba știm noi, de fapt!?), deși prima carte a publicat-o în 1999 (Mesajele ascunse din apă). În 2011 a venit și în România (dacă aveți 4 ore libere, prezentarea sa este pe YouTube).

Emoto susține că intențiile noastre modifică „structura moleculară” a apei astfel încât dacă avem intenții bune o să se formeze cristale de gheață frumoase, iar dacă avem intenții rele, cristalele o să fie urâte. De asemenea, dacă o să căutați pe internet informații despre el (inclusiv pe saitul lui), aproape de fiecare dată o să citiți că este un „om de știință”, că a „revoluționat știința” sau, cum scrie pe un sait care vinde o carte de-a sa:

„«Mesajele ascunse din apă» prezintă munca revoluţionară a omului de ştiinţă de renume internaţional, Masaru Emoto, care a demonstrat ştiinţific că apa are puterea de a reflecta gândurile, cuvintele, rugăciunile, sentimentele şi muzica.”1

Așadar, afirmații mărețe!

Așa că am fost curios să caut detalii despre el, pentru că dacă într-adevăr a demonstrat ceea ce susține (sau ce susțin alții despre el) ar fi ceva extraordinar. Iar afirmațiile mărețe trebuie să aibă în spate dovezi solide. Să vedem.

2. Ce experimente a făcut?

Din păcate, chiar dacă susține că este un om de știință și a „demonstrat” efectele intenției asupra apei, nu am reușit să găsesc pe saitul său o listă cu experimentele pe care le-a făcut. Am găsit doar o ilustrare a pașilor pe care îi face pentru a obține acele fotografii cu cristale de gheață: se pun câte 0,5 ml de apă în 50 de plăci Petri; se pun plăcile în congelator la -25°C pentru 3 ore; pe urmă se scot pentru observare într-o încăpere cu temperatura de -5°C. Și am mai dat și peste multe lucruri de vânzare.

În continuare o să prezint experimentele pe care le-am găsit eu. Dacă mai știți și altele făcute de Masaru Emoto, aș fi interesat.

2.1.Experimentele cu apa

Am găsit trei experimente făcute de Masaru Emoto et al., legate de cristalele de gheață, deși pe primul nu-l pot numi experiment. Dar înainte de asta, să clarificăm niște lucruri legate de apă.

Există multe stări în care apa poate îngheța. În imaginea de mai jos sunt prezentate toate cele cunoscute până acum. Ne interesează doar cele de la presiune normală (1 bar) și între -25°C și -5°C (pentru că în aceste condiții a făcut Emoto pozele). Din fericire avem doar un tip de gheață, cea numită Ih (h vine de la forma hexagonală pe care o au cristalele). Alte stări au cristale de alte forme (ex.: Ic conține cristale de formă cubică). Dacă vreți mai multe informații despre cum se formează cristalele de gheață, puteți citi, de exemplu, aici.

Phase_diagram_of_water.svg

(Sursă: Wikimedia Commons)

Aș vrea să menționez și fenomenul de suprafuziune (supercooling) care apare când un lichid este răcit sub limita de solidificare, fără să se solidifice. În cazul apei, se poate afla la temperaturi negative fără să înghețe. Asta se întâmplă când apa este foarte pură. Puteți vedea aici o demonstrație, în care este folosită apă Fiji care, întâmplător este folosită și în experimentele lui Emoto, care insistă că apa trebuie să fie cât mai pură pentru a se forma cristale de gheață. Dar formarea cristalelor pleacă de la „nuclee” de impurități.

emoto_prayer_large

De asemenea, este promovată ideea că intențiile modifică „structura moleculară a apei”, ceea ce e greșit. În imaginea de mai sus nu este o „moleculă” de apă, ci un cristal, adică mai multe molecule ținute împreună de legături de hidrogen. Moleculele de apă sunt tot H2O, indiferent cum arată cristalul.

Masaru Emoto: Healing with Water (2004).2

Este un eseu de fotografii! Puteți vedea aici una dintre pagini, iar restul costă. Masaru Emoto a făcut multe poze, le-a ales pe cele mai frumoase și le-a publicat. Asta nu demonstrează nimic (decât eventual că nu știe ce înseamnă o lucrare științifică). E rușinos. Acest eseu de fotografii n-ar trebui să fie niciodată citat ca dovadă. Dacă vreți o comparație, e ca și când ar fi dat cu banul de 100 de ori, ar fi făcut poze și apoi ar fi ales doar fotografii în care ar fi fost monede cu stema în sus, le-ar fi publicat și ar fi susținut că are o metodă de a face monedele să cadă cu stema în sus. Poate că are o metodă, dar modul în care a ales să o demonstreze este complet inutil și irelevant. N-o să mai insist cu eseul de fotografii pentru că deja i-am dat mult prea multă importanță.

Dean Radin, Masaru Emoto et al.: Double-Blind Test of the Effects of Distant Intention on Water Crystal Formation (2006).3

Un experiment pilot făcut împreună cu Dean Radin (un parapsiholog), publicat într-un periodic numit Explore: The Journal of Science and Healing, la care e redactor-șef… ghici cine? – Dean Radin. Cu alte cuvinte, și-a publicat propriul studiu și astfel a evitat verificarea de către un comitet de referenți, proces cunoscut în domeniul științific sub numele de peer-review. De ce e important acest peer-review? Păi, dacă scrii o lucrare științifică și nu te verifică nimeni, e posibil să ai greșeli (ca să nu mai zic de situațiile în care „greșelile” sunt intenționate), însă dacă știi că o să te verifice specialiști în domeniu o să fii mult mai atent.

În ce a constat experimentul:  Unul dintre autori a mers la un magazin și a cumpărat cea mai pură apă pe care a găsit-o (marca Fiji), mai exact patru sticle, le-a pus câte o etichetă la întâmplare (de la A la D) și a ales sticlele A și B pentru a fi „tratate”, iar C și D au folosit pentru control. Apoi a dus sticlele A și B într-o încăpere izolată electromagnetic, iar pe C și D le-a pus într-o altă cameră (unde era aproximativ aceeași temperatură).  O poză cu sticlele A și B a fost trimisă în Japonia, lui Masaru Emoto. De asemenea, locația aproximativă a sticlelor a fost indicată prin Google Earth. Apoi, Masaru Emoto a adunat 2000 de persoane în Tokio și le-a pus să transmită intenții bune către apa din sticle timp de 5 minute, cu voce tare. Pe urmă toate cele patru sticle au fost trimise în Japonia, unde au fost urmați pașii tipici de înghețare și fotografiere (i-am descris mai sus; sau aici). Fotograful a încercat să obțină cât mai multe poze cu cristale. A obținut 40, în felul următor: 12 din sticla A, 12 din B, 7 din C și 9 din D. Apoi un grup de 100 de voluntari a notat pe internet frumusețea cristalelor, pe o scară de la 0 (urât) la 6 (foarte frumos). Rezultatele au fost următoarele: cristalele din apa „tratată” au primit note un pic mai bune (în medie aproape 3) decât cele de control (în medie aproape 2).

Rezultatele ar fi promițătoare dacă ar fi fost niște condiții mai stricte. În primul rând, numărul de eșantioane este prea mic pentru a scoate din calcul întâmplarea. În al doilea rând, pozele au fost făcute într-o ordine stabilită (întâi apa tratată, apoi cea de control, chiar dacă fotograful n-aș știut asta), nu întâmplător (cum ar fi trebuit pentru a elimina erori subconștiente). În al treilea rând, numărul de eșantioane „tratate” (24) a fost mai mare decât numărul eșantioanelor de control (16). Dar cea mai importantă critică e că au fost prea puține eșantioane. Acest lucru este de înțeles dacă luăm în considerare că studiul a fost unul pilot și că a fost urmat de unul mai bine realizat, adică următorul:

Dean Radin, Masaru Emoto et al.: Effects of Distant Intention on Water Crystal Formation, A Triple-Blind Replication (2008).4

Este un studiu făcut pentru a verifica mai bine rezultatele studiului anterior. Cum ziceam, studiul anterior a fost doar unul pilot și, prin urmare, nu e suficient de bine realizat, lucru acceptat și de către autori, motiv pentru care au făcut unul mai bun. Acesta a fost publicat în periodicul Journal of Scientific Exploration, un jurnal care publică aproape orice.

În ce a constat experimentul: în mare parte a fost ca studiul pilot, dar cu niște îmbunătățiri. De data asta au fost două categorii de control; două sticle au fost plasate în cameră cu cele „tratate”, iar două în altă cameră. De asemenea, acum au fost trei grupuri care au transmis intenții bune apei (1000 de persoane din Tokio, 450 din Nürnberg și 500 din München). Au fost folosite 50 de eșantioane din fiecare sticlă (de data asta au fost 6 sticle), iar eșantioanele au fost distribuite la întâmplare în congelator și toate cele 300 de fotografii au fost folosite. Evaluarea lor a fost făcută după două criterii (frumusețe și interes), pe o scară de la 0 la 6. Fiecare participant din cei 2679 a notat 50 din cele 300 de poze, alese întâmplător. În plus, a mai fost făcută și o evaluare a contrastului, folosind Matlab.

Rezultatele: în medie, nota pentru frumusețe a fost de 1,77, adică foarte mică. Dacă 0 înseamnă „deloc frumos”, iar 6 „foarte frumos”, scorul obținut e undeva pe la „cam urât”. Dar ce note au avut cristalele „tratate” comparativ cu cele de control? În studiu avem următorul grafic:

grafic emoto

Explicații: Coloanele negre prezintă rezultatele (nota medie) pentru frumusețea tuturor cristalelor. Coloanele gri prezintă rezultatele pentru frumusețea cristalelor, ignorându-le pe cele ce au luat note sub 1. Coloanele gri sunt un truc pentru a face datele să indice ceea ce vor autorii, și chiar și așa diferența e nesemnificativă. Coloanele din stânga reprezintă grupul de control ținut într-o cameră diferită, cele din mijloc reprezintă cristalele provenite din apa „tratată”, iar cele din dreapta sunt din celălalt grup de control.

Așadar, observăm că, în medie, cristalele netratate din stânga au fost considerate un pic mai frumoase decât cele tratate (1,9 vs. 1,8). Chiar și dacă luăm în calcul propunerea făcută de autori (să excludem unele cristale), diferența este nesemnificativă. Cu alte cuvinte, acest studiu, făcut de Masaru Emoto și colaboratorii lui, arată că nu există niciun efect.

2.2.Experimentul cu orezul

Căutând pe internet, am văzut că multă lume vorbește despre un așa-zis eperiment cu orezul. O descriere scurtă găsiți în videoclipul următor:

(În caz că a dispărut: se iau trei vase, se pune orez în toate, apoi apă; în următoarea perioadă de câteva săptămâni primului vas i se mulțumește (ありがとう, arigatō), celuilalt i se spune că-i prost (ばかやろう, bakayarō), iar cel de-al treilea este ignorat; în final, în vasele 2 și 3 orezul se strică, iar în primul rămâne bun)

Acum, deși pare interesant (ar fi fain să fie adevărat), nu strică un pic de îndoială. Am văzut cazul experimentelor anterioare: dacă alegem ce  fotografii ne plac, putem să ajungem să credem că într-adevăr există un efect, însă dacă facem verificări bine controlate (cum a făcut și Emoto), efectul dispare. La fel ar trebui să procedăm și cu ipoteza că orezul nu se strică dacă îi spunem lucruri frumoase sau îi lipim pe vas cuvântul „mulțumesc”. O sugestie ar fi următoarea: să se facă un experiment în care multe vase cu orez (50, 100, poate mai multe) să aibă lipite pe ele câte un cuvânt (ori „mulțumesc”, ori „ești prost”, ori nimic), dar etichetele să nu fie vizibile decât când se sfârșește experimentul, să fie lăsate o vreme (stabilită de la început) în aceleași condiții de temperatură, lumină, umezeală (asta-i foarte important!), iar după ce trece această perioadă, să fie evaluate și doar după ce evaluările au fost notate pentru toate vasele, să se dezlipească etichetele pentru a vedea care din ce categorie face parte. Astfel am putea fi mai siguri că nu ne auto-amăgim. Dacă încercăm doar cu două sau trei vase, avem șanse de 50% (respectiv 33%) să obținem un rezultat pozitiv chiar dacă nu există niciun efect al cuvintelor asupra orezului. Dacă 10 oameni încearcă experimentul ăsta acasă, 5 dintre ei o să creadă că funcționează și o să posteze pe YouTube sau pe bloguri. Iar acei 5 o să fie sinceri și o să fie convinși că Masaru Emoto are dreptate. Acestea sunt rezultatele pe care ar trebui să le așteptăm dacă nu există niciun efect.

N-am reușit să găsesc niciun experiment (riguros) în legătură cu orezul. Am găsit încercări cu două sau trei vase, majoritatea încercate de curioși acasă, filmate și puse pe YouTube. Unii au găsit diferențe, alții nu. Unii au deschis în mod repetat cutiile, alții le-au ținut în locuri diferite etc. Condițiile în care au fost făcute aceste încercări nu sunt potrivite. Vă recomand următorul experiment: Partea 1, Partea 2, care arată adevărata cauză din care se strică orezul: bacteriile. Atunci când borcanele sunt sterilizate și izolate, orezul nu se strică, indiferent de cuvintele pe care le spunem sau le lipim de ele. Când nu sunt sterilizate, unele se strică mai mult, altele mai puțin, chiar și fără cuvinte pozitive sau negative.

Nu mai știu alte presupuse experimente pe care le-ar fi făcut Masaru Emoto. Există variații, în care apa înainte de a fi înghețată și fotografiată este expusă la muzică (iar Emoto zice că muzica clasică produce cristale frumoase, iar muzica heavy metal produce cristale urâte), sau sursa apei diferă (apă „poluată” din Tokio vs. apă pură de la un izvor) și altele. Având în vedere experimentele nereușite făcute chiar de el și ținând cont de felul în care alege fotografiile pe care le publică în cărțile sale, concluzia logică este că afirmațiile sale sunt cel mai probabil false.

Trebuie să repet: Masaru Emoto face zeci sau sute de poze și din ele le alege doar pe cele mai frumoase și le publică. Dacă ar susține că e artă, n-ar fi nicio problemă, însă el susține că e știință. În acest caz, nu pot decât să-l bănuiesc de înșelătorie. Și, în plus, mai și vinde apă la suprapreț, profitând de renumele de om de știință.

3. Emoto și cunoașterea

După ce ați citit despre experimente probabil că unii o să spuneți: „Bine, dar ce contează experimentele, când uite ce imagine frumoase găsim în apa dintr-un izvor curat!”. În acest caz rolul meu se îngreunează, așa că o să încerc să clarific unde apar problemele. Cea mai imprtantă mi se pare faptul că Masaru Emoto este numit „om de știință” care a „demonstrat științific”.

Masaru Emoto NU este om de ştiinţă

Căutând articole şi păreri în limba română despre el am găsit aproape invariabil afirmaţia că a demonstrat diverse efecte miraculoase. Unele dintre texte (prezente pe diverse bloguri) păreau foarte asemănătoare, iar altele erau doar traduceri de pe saiturile lui, dar exprimate într-un stil personal. Mă întristează să văd că o grămadă de oameni preiau texte (uneori destul de lungi) și nu le verifică. Așa se răspândesc bârfele și așa se răspândesc și miturile. Iar după ce un mit devine atât de răspândit încât îl găsești peste tot, e greu să mai renunți la el.

În ce privește educația, conform propiului sait, Emoto a absolvit Universitatea Municipală din Yokohama, specializându-se în Relații Internaționale. Apoi și-a luat doctoratul în medicină alternativă de la Open International University, care bănuiesc că e cea din Calcutta, deși o căutare pe Google îmi returnează mai multe astfel de universități. Nu pare o universitate prea credibilă, iar faptul că o persoană are diplomă de doctor (Ph.D) nu înseamnă neapărat că a primit-o pe merit. În România avem câteva exemple neonorabile (universități neacreditate, lucrări plagiate etc.), iar acest fenomen nu este specific doar țării noastre (de exemplu, realizatorul unei emisiuni din Australia a obținut diplomă de medic pentru câinele său, în 7 zile). Iar o simplă diplomă care nu este urmată de cercetare ulterioară (și articole publicate) nu înseamnă prea multe. Masaru Emoto a publicat doar două studii și un eseu de fotografii, în schimb a scris multe cărți. Așa că l-am putea numi scriitor sau artist, dar nu om de știință. Iar despre partea cu „a demonstrat”, cred că e destul de clar din ce am scris mai sus despre experimentele sale că nu a demonstrat ceea ce predică, ba chiar am putea zice că a demonstrat că greșește.

Pentru comparație cred că ar fi util să îl dau ca exemplu pe Roy Baumeister. Pe saitul său are listate nu doar cărțile, ci și o mulțime de articole științifice. Și el este un om care a susținut ceva care inițial era greu de crezut: puterea voinței este influențată de cantitatea de glucoză din sânge.5 Ca să demonstreze asta a făcut experimente bine controlate, le-a publicat, a așteptat critici și le-a infirmat prin alte experimente. Iar dacă în viitor o să apară dovezi puternice că a greșit, o să renunțe la idee pentru că el nu vinde nimic (în afară de cărți). Emoto este opusul său.

De ce sunt importante experimentele?

Pentru că este foarte ușor să facem greșeli, iar un experiment riguros urmărește să reducă aceste greșeli. Pentru că nu înțelegem întâmplarea și statistica. Atunci când punem orez în două vase și după o vreme observăm că într-un vas orezul s-a stricat mai tare decât în celălalt, suntem tentați să credem că am descoperit un nou efect, uitând că de fapt sunt șanse destul de mari să se întâmple asta. Atunci când facem multe fotografii cu cristale de gheață, alegem doar câteva (bune) și le publicăm, cădem pradă confirmării prejudecăților noastre. Pentru a evita asta, trebuie să ne uităm la toate, să le analizăm și să aflăm dacă sunt așa cum ne așteptam.

În fine, dacă ideile lui Emoto ar funcționa, ar accepta provocarea de a câștiga 1.000.000$ demonstrându-le. Fundația James Randi oferă această sumă oricui poate arăta un efect paranormal, în condiții riguroase (stabilite de comun acord, astfel încât dacă într-adevăr există un efect să poată fi demonstrat, iar dacă nu există să nu pară că este). Aștept ca Emoto să câștige banii și, dacă n-are ce face cu ei, să-i doneze. Până atunci rămân doar mituri.

4. Concluzii

Am plecat de la reputația pe care o are Masaru Emoto, am citit că a făcut experimente și că a demonstrat diverse lucruri și am fost curios să aflu mai multe. Nu m-am mulțumit să citesc aceleași texte copiate dintr-o parte-n alta și am încercat să aflu în ce au constat experimentele sale. Citindu-le, am aflat că nu sunt nicidecum la nivelul la care m-aș fi așteptat din recomandările mult prea entuziaste. Am observat că experimentele lipsesc și că în realitate sunt doar două, dintre care unul este pilot (adică un fel de ciornă pentru a vedea dacă are rost să fie făcut unul mai serios), iar celălalt arată că nu există niciun efect semnificativ al gândurilor asupra cristalelor de apă. Și trebuie să ținem cont că e făcut de Emoto însuși.

Prin urmare, vă rog nu-l mai numiți pe Masaru Emoto om de știință și nu mai spuneți că a demonstrat una și alta. Mulțumesc.

Vezi și:

Informații interesante despre fazele apei;

Informații despre fotografierea artistică a cristalelor de apă;

Masaru Emoto’s Wonderful World of Water, articol de Harriet Hall;

Is Masaru Emoto for Real?

Surse:

1: Mesajele ascunse din apă, pe http://www.divin.ro;
2: Masaru Emoto, Healing with Water. The Journal of Alternative and Complementary Medicine. February 2004, 10(1): 19-21. doi:10.1089/107555304322848913;
3: Radin, Dean; Hayssen, Gail; Emoto, Masaru ; Kizu, Takashige (September 2006). “Double-Blind Test of the Effects of Distant Intention on Water Crystal Formation“. Explore: the Journal of Science and Healing 2 (5): 408–11.;
4: Radin, D. I., Lund, N., Emoto, M. & Kizu, T. (2008). Triple-blind replication of the effects of distant intention on water crystal formation. Journal of Scientific Exploration.;
5: Gailliot, M.T., Baumeister, R.F., DeWall, C.N.,  Maner, J.K., Plant, E.A., Tice, D.M., Brewer, L.E., & Schmeichel, B.J. (2007). Self-control relies on glucose as a limited energy source: Willpower is more than a metaphor. Journal of Personality and Social Psychology, 92, 325-336.;

27 februarie, 2013 at 23:34 20 comentarii

Superstiția și iluzia controlului I

Să vă povestesc o superstiție de-a mea.

Câteodată ascult muzică folosind Winamp și tot câteodată îmi place să ascult melodiile amestecate (adică pe Shuffle). În mod normal, asta ar însemna că Winamp-ul o să aleagă de fiecare dată următoarea melodie în mod întâmplător. Totuși, parcă unele melodii apar mai des decât altele. N-ar fi fain să apară mai des melodiile care îmi plac și mai rar sau deloc cele care nu îmi plac? N-ar fi fain să pot influența alegerile programului? Așa că după multă vreme în care am ascultat muzică în Winamp am început să manifest diverse comportamente. De exemplu, dacă ascultam o melodie și la sfârșit avea o parte de liniște mai lungă (sau, pur și simplu, o parte mai neinteresantă), treceam la următoarea melodie (foloseam tastele globale, astfel că nu trebuia să aduc Winamp-ul în prim plan; era destul să apăs trei taste). Dar vroiam să mai aud acea melodie în viitor, însă n-o mai auzeam (sau cel puțin nu așa de des pe cât aș fi vrut). În schimb, auzeam alte melodii pe care le mai ascultasem. Așa că m-am gândit că sigur trebuie să fie un algoritm mai complicat care să aleagă ce melodie urmează. Nu poate fi doar alegere la întâmplare. Cu siguranță algoritmul ține cont de ceea ce ascult, iar în modul shuffle acele melodii vor apărea mai des.

Winamp-logo

Așadar, cum pot să influențez subtil acest algoritm? Poate că dacă las melodia să cânte până la capăt, o să o aud mai des în viitor. Poate că Winamp-ul „crede” că dacă trec la următoarea înainte să se termine curenta, nu îmi place… curenta. Nu e logic? Adică, de ce să treci la următoarea dacă îți place cea pe care o auzi? Prin urmare, dacă dau next chiar și înainte cu 5 secunde de final, probabil melodia e marcată undeva printr-o bază de date cu atributul „n-o mai pune pe asta, că-i urâtă” și în viitor algoritmul o să o aleagă mai rar decât pe altele pe care le ascult până la capăt. Am făcut așa pentru o vreme și n-am mai sărit la următoarea chiar dacă la sfârșit erau câteva secunde de liniște. O singură problemă a fost: nu funcționa cum vroiam. Asta-i ciudat, nu? Dar am găsit soluția: sigur algoritmul folosit de Winamp este atât de complex încât ține cont și de alte lucruri. Am observat că făceam altceva: când nu îmi plăcea o parte dintr-o melodie săream peste partea care nu-mi plăcea (dădeam melodia cu câteva secunde în față), dar la sfârșit nu dădeam next, ca să nu ajungă pe lista neagră. Sigur algoritmul observă asta și dacă sar chiar și peste 5 secunde dintr-o melodie, o pune automat pe lista neagră. Așa că pentru o vreme am rezistat tentației și n-am mai sărit peste nicio parte din melodiile pe care vroiam să le aud mai des. Toate bune și frumoase până … până după un timp când am început să observ că parcă nu funcționează cum mă așteptam. Am început să mă gândesc cât de complicat au putut să facă algoritmul? Să țină oare cont și de alte lucruri? De exemplu, când îmi place mult o parte dintr-o melodie și sar înapoi câteva secunde să o ascult din nou… poate că algoritmul înregistrează orice salt ca semn că nu îmi place melodia și o pune automat pe lista neagră (o fi vreun bug). În momentul ăsta parcă aș fi descoperit Secretul: poate că Universul nu știe să citească „nu”-urile și le vede pe toate ca „da”.

Simțeam că melodiile nu sunt alese întâmplător și am ajuns să raționalizez asta încercând să găsesc un mod de control. Din cauză că superstiția mea este una strâns legată de tehnologie, probabil că n-o să o întâlnesc la multă lume, dar dacă înlocuiesc „algoritmul” cu o forță supranaturală și Winamp-ul cu natura parcă sună mai cunoscut. Eu am fost surprins când am observat că aveam tendințele pe care le-am descris mai sus pentru că mă așteptam să fiu mai atent la comportamentele superstițioase pentru că le observ repede pe ale altora. O să revin la sfârșit la algoritmul din Winamp.

Ce e cu superstiția asta?

Să începem cu celebrul experiment al lui B.F. Skinner.1 Aveți mai jos o descriere concisă:

Adică Skinner i-a învățat pe porumbei să dea cu ciocul într-un buton ca să primească mâncare. Apoi a schimbat un pic regulile, astfel că mâncarea venea la intervale aleatoare, indiferent de ceea ce făceau porumbeii. Acum porumbeii au început să repete diverse lucruri pe care se nimerea să le facă atunci când primeau mâncare, iar cum mâncarea venea aleator, comportamentul lor este asemănător superstiției.

Bine, dar ăștia-s porumbei! Oamenii s-ar prinde. Nu?

O cercetătoare japoneză s-a gândit să verifice asta, așa că a făcut un experiment2 în care a pus câte un participant într-o cabină unde erau trei mânere. Independent de ceea ce făcea participantul (dar fără ca el să știe asta), în fața lor apărea un numărător care le dădea câte un punct. După fiecare punct pâlpâia o lumină și se auzea un bâzâit. Punctele erau acordate după un interval variabil de 30 secunde în medie (cu o variație între 3 și 57 secunde) sau de 60 secunde în medie (cu o variație între 25 și 95 secunde). Înainte de experiment participanților li s-a spus că nu trebuie să facă nimic, dar dacă fac ceva s-ar putea să primească puncte și ar trebui să adune cât mai multe. Din moment ce participanții nu puteau prezice când o să fie acordate punctele (pentru că intervalul de livrare varia) și oamenii au o tendință naturală să tragă de mânere, unii dintre ei au făcut legătură între (A) tragerea mânerelor și (B) primirea punctelor. Și de aici începe să devină și mai interesant. Participantul 1, de exemplu, s-a întâmplat să primească un punct după ce a tras de mânere în ordinea stânga, mijloc, dreapta, dreapta, mijloc, stânga, așa că a repetat modelul încă de trei ori. Participantul nr. 5 a început trăgând ușor de fiecare mâner, iar punctele se acumulau indiferent de ceea ce făcea el. Dar apoi, din întâmplare, ținea mânerul din mijloc când a primit un punct, așa că de atunci încolo a executat ritualul superstițios de trei trageri scurte urmate de ținerea mânerului din mijloc. Bineînțeles, cu cât ținea mai mult de el, șansele să primească un punct creșteau. După 9 minute din cele 30 (cât dura experimentul), acest participant a devenit convins că a găsit metoda potrivită. Participanta 15 a găsit un ritual și mai ciudat: după 5 minute s-a întâmplat să atingă numărătorul de puncte și exact în acel moment s-a întâmplat să primească un punct. De atunci înainte a început să atingă tot ce putea prin jurul ei, iar cum punctele oricum veneau, și-a întărit încrederea în acest ritual. Pe la minutul 10 s-a întâmplat să primească un punct când a sărit, moment în care a schimbat ritualul de atingere cu ritualul de sărituri. Apoi a primit un punct când s-a întâmplat să atingă tavanul, motiv pentru care n-a rezistat cele 30 minute și a renunțat din cauza oboselii.

three levers

Trei mânere (nu cele din experiment) (sursa)

Un experiment asemănător, dar nu la fel de obositor a fost făcut în 1963 de doi colegi de-ai lui Skinner. Ei s-au gândit să verifice dacă și oamenii devin superstițioși ca porumbeii, așa că le-au zis participanților să apese un buton (dintre cele două pe care le aveau la dispoziție) de fiecare dată când se aprinde o lumină galbenă în fața lor, iar scopul era să acumuleze cât mai multe puncte. Când câștigau un punct, se aprindea și se stingea o lumină verde. Fără ca participanții să știe, doar butonul din dreapta dădea puncte, care erau acordate la un interval variabil (cu o medie de 30 secunde). Rezultatul a fost că oamenii sunt la fel de superstițioși ca porumbeii. Cei mai mulți și-au format câte o combinație între cele două butoane și au rămas cu ea până la sfârșit, deoarece dacă se întâmpla, să zicem, să apese pe butonul din stânga, apoi pe cel din dreapta și apoi să primească puncte, comportamentul era întărit.3

În experimentul de mai sus, cercetătorii au încercat să oprească formarea superstițiilor și au introdus un timp de „răcire”, astfel că dacă butonul din stânga era apăsat, cel din dreapta devenea inactiv pentru o perioadă de timp (adică degeaba îl apăsau, că nu primeau niciun punct). Într-adevăr, ritualurile superstițioase nu s-au mai format, dar la oameni a fost nevoie de un timp de „răcire” mai mare decât la porumbei. Oamenii țin minte mai mult timp. Oamenii sunt foarte buni la găsirea modelelor. Le găsesc chiar și unde nu sunt. Stuart Vyse i-a pus pe participanții la un studiu de-al său să joace un joc video în care tot ce aveau de făcut era să navigheze printr-un labirint și să găsească o ieșire.4 Unii dintre ei (primul grup) primeau puncte dacă găseau o ieșire din partea de jos a labirintului, iar alții (al doilea grup) primeau puncte la întâmplare. La sfârșit au fost întrebați cum cred că au fost distribuite punctele. Cei mai mulți din primul grup au găsit metoda de notare. Și cei din al doilea grup au găsit diverse metode de notare… doar că niciuna nu era corectă.

Toți avem tendința să căutăm modele pe care să le putem folosi pentru a controla lucrurile. Puși să adunăm puncte, căutăm regula după care sunt acordate și încercăm să o folosim. Asta e bine, de cele mai multe ori, doar că atunci când nu există nicio regulă, când ceea ce se întâmplă e doar întâmplător, găsim reguli care nu există și, mai mult de atât, devenim tot mai siguri că le-am găsit pe cele corecte. Eram sigur că am găsit cum să influențez algoritmul din Winamp! Aveam control asupra lui. Câți nu ne gândim că avem control asupra unor lucruri mult mai importante? Nu vrem să locuim la numărul 13 și nu facem lucruri importante într-o vineri, 13, facem trei pași înapoi dacă ne-a trecut o pisică neagră prin față, batem în lemn când am auzit ceva rău, apelăm la vrăji, rugăciuni și talismane norocoase. Totul ca să controlăm câte puncte o să primim, ca să ne controlăm norocul. Și ne dă o senzație plăcută iluzia controlului.

Iluzia controlului

Iluzia controlului apare când avem senzația că putem controla ceva ce nu putem. De exemplu, într-o serie de experimente din anii ’70, Ellen Langer i-a pus pe studenți de la Yale să joace un joc de cărți contra unui adversar. Jocul era simplu: fiecare trage o carte la întâmplare, iar cine a tras cartea mai mare câștigă. La fiecare rundă studenții puteau să pună pariu pe o sumă de la 0 la 25¢. Interesanți erau adversarii: unii dintre studenți au jucat contra unui adversar îmbrăcat frumos care emana încredere, iar alții au jucat contra unui adversar îmbrăcat neglijent în trening?. În ambele situații șansa de a câștiga era aceeași (pachetului de cărți nu-i pasă cu cine joci, nu?). Dar studenții se pare că n-au gândit la fel. Când au jucat contra celui îmbrăcat neglijent au fost mult mai încrezători și au făcut pariuri mai mari, adică s-au simțit în control, chiar dacă era clar că e un joc de noroc.

Un efect asemănător a fost găsit când studenților li s-a cerut să prezică rezultatul unei aruncări cu banul. Aruncarea era trucată: un „coleg” dădea cu banul, dar zicea rezultatele într-o anumită ordine, nu le zicea pe cele reale. Unor studenți li se spunea că au nimerit la primele încercări, altora că nu au nimerit. Succesul inițial a avut o foarte mare influență asupra încrederii studenților că pot prezice rezultatele. Cei care au ghicit la început câteva au devenit convinși că au talentul necesar să facă predicții corecte pentru mai mult de 50% dintre aruncări (cât e de așteptat din întâmplare). Și mai interesante au fost comentariile de după ale studenților: 40% dintre ei credeau că pot să-și îmbunătățească performanța prin antrenament și aveau impresia că sunt mai buni decât ceilalți, chiar dacă în realitate au ghicit la fel de rău.5

Oamenilor le place să exercite control asupra mediului din jurul lor. De aceea oameni care se urcă la volan după o sticlă de wiskey, tremură când avionul în care sunt are turbulențe minore. Senzația de control este însă foarte importantă pentru noi. Psihologul Bruno Bettelheim a observat, de exemplu, că supraviețuirea în lagărele de concentrare naziste „a depins de capacitatea de a aranja și păstra câteva zone de acțiune independentă, pentru a menține controlul asupra unor aspecte importante din viața fiecăruia, în ciuda unui mediu care părea copleșitor”. Alte studii au arătat că senzația de neajutorare și de lipsa de control corelează cu stresul. Într-un studiu șobolanii au fost deprivați de orice control asupra mediului lor și după scurt timp au încetat să mai încerce și au murit. Într-un alt studiu, niște studenți au dat o serie de teste. Chiar și puterea de a controla ordinea testelor le-a redus anxietatea. Ellen Langer, despre care am mai scris mai sus, a mai făcut un experiment cu persoane din căminele de bătrâni. Celor dintr-un grup li s-a spus că pot să decidă cum să-și aranjeze camera și să aleagă o plantă de care să aibă grijă. Cei din alt grup au avut camerele deja aranjate și plantele deja alese și îngrijite de altcineva. După câteva săptămâni cei din primul grup aveau scoruri mai mari la un test de bunăstare. După 18 luni, cei din primul grup aveau o rată a mortalității de doar 15% comparativ cu cei din grupul al doilea (30%).6 Iluzia controlului poate chiar să diminueze durerea percepută. Oamenii tolerează mai multă dacă li se spune că o pot opri oricând, decât dacă cred că nu o pot opri.7

Nevoia noastră de control ne aduce beneficii, însă ne poate și încurca atunci când avem de-a face cu procese întâmplătoare. Ne poate face să încurcăm norocul cu talentul sau acțiunile inutile cu controlul. Cere-le oamenilor să controleze niște lumini apăsând un buton (care nu face nimic) și vor crede că au reușit, deși luminile se aprind la întâmplare. Arată-le oamenilor un cerc de lumini care pâlpâie la întâmplare și spune-le că dacă se concentrează vor reuși să le facă să pâlpâie în direcția acelor de ceas și vor fi uimiți că au reușit. Pune simultan două grupuri de oameni să se concentreze să controleze ordinea în care se aprind luminile (un grup într-o direcție, celălalt în direcția opusă) și li se va părea tuturor că au reușit.6

Cum rămâne cu muzica?

Senzația că în Winamp sunt alese unele melodii mai des decât altele a fost foarte puternică, așa că am încercat să găsesc codul-sursă al programului. Din nefericire, n-am găsit, pentru că Winamp este software proprietar, însă am găsit alte informații. Nu pot să nu observ că de cele mai multe ori la fel se întâmplă și în cazul superstiției: e imposibil să găsești dovada supremă că un comportament este superstițios pentru că întotdeauna pot fi găsite raționalizări bazate pe „forțe supranaturale misterioase”.

Ziceam că am găsit, totuși, ceva. Nu sunt singurul care a ajuns să creadă că redarea aleatoare a melodiilor nu este aleatoare. Oameni pe forumuri ziceau că funcția shuffle din Winamp nu este bună. Dar cel mai interesant e că imediat după ce a fost lansat iPod-ul, foarte mulți utilizatori s-au plâns că melodiile nu sunt redate aleator cu adevărat. Un utilizator zicea:

Primul meu iPod îl iubea pe Steely Dan. La fel și eu. Dar nu așa de mult ca iPod-ul. În 2003, printre cele vreo 3000 melodii din librăria mea iTunes, aveam cam 50 de melodii de la Steely Dan. Dar de fiecare dată când ascultatm «aleator», parcă Steely Dan era ultra-prezent.8

Atât de puternică a fost reacția utilizatorilor încât Steve Jobs a declarat „O să o facem [redarea] mai puțin întâmplătoare, ca să pară mai întâmplătoare”.9 Așa că cei de la Apple au scris un algoritm mai complicat care să facă redarea aleatoare să pară mai aleatoare decât dacă ar fi fost în totalitate… aleatoare. Toate astea pentru că noi, oamenii, nu înțelegem întâmplarea. Ca lucrurile să pară întâmplătoare, trebuie să nu se repete prea des. Dacă dăm de patru ori cu banul și pică pe aceeași parte încercăm să găsim o „explicație” pe care n-am căuta-o dacă am obține, să zicem, BSSB (B=ban, S=stemă). La fel se întâmplă și cu melodiile: dacă auzim mai des o melodie, în timp ce pe alta n-o auzim niciodată, nu pare deloc o întâmplare. Dar este.

Din dorința mea de a mă convinge că algoritmul este aleator, mi-am scris propriul program care ia numele fișierelor dintr-un director (directorul meu cu muzică) și simulează redarea aleatoare folosind funcția Random() din C#. După ce a rulat un pic am observat câteva melodii care au fost „redate” de 6-7 ori, în timp ce multe altele doar 1 dată sau chiar deloc. Mai târziu, aveam melodii redate de 13-14 ori și încă mai existau melodii care n-au fost redate niciodată. După și mai multă vreme, aveam melodii redate de 70 ori, dar și melodii redate doar de 40 ori. Prin acest program nu am redat efectiv melodiile ci doar am vrut să aflu rezultatele funcției random. Așa că probabil algoritmul ăla super-complex din Winamp pe care mi-l imaginam eu este mult mai simplu.

 random_number

(Sursa: xkcd)

Referințe:
1: B.F. Skinner, ”’Superstition’ in the pigeon”, Journal of Experimental Psychology 38 (1948): 168-172;
2: Koichi Ono, “Superstitious Behavior in Humans,” Journal of the Experimental Analysis of Behavior 47 (1987): 261–71.;
3: Charles Catania and David Cutts, “Experimental Control of Superstitious Responding in Humans,” Journal of the Experimental Analysis of Behavior 6, no. 2 (1963): 203–8;
4: Michael Shermer, Why Darwin Matters: The Case Against Intelligent Design [2007], EPUB, Holt Paperbacks, pg. 52;
5: Langer, Ellen. 1975. The Illusion of Control. Journal of Personality and Social Psychology 32 (2), pp. 311-28.;
6: Leonard Mlodinow, The Drunkard’s Walk: How Randomness Rules Our Lives [2008], Pantheon Books, pg. 185-187;
7: T. V. Salomons, T. Johnstone, M.-M. Backonja, and R. J. Davidson, “Perceived controllability modulates the neural response to pain,” Journal of Neuroscience, 24 (2004), 7199–7203. In Hood, Bruce (2012-04-25). The Self Illusion: How the Social Brain Creates Identity (Kindle Locations 5042-5043). Oxford University Press. Kindle Edition.;
8: Articol pe Gagetopedia: Steely Dan and the perceived randomness of the iPod Shuffle;
9: Articol în DailyMail: And now for something completely random;
Info: Generatoarele software de numere aleatoare nu sunt cu adevărat aleatoare și sunt denumite pseudo-random pentru că se bazează pe diverși algoritmi. Funcția (de fapt clasa) Random() din C# folosește un algoritm de-al lui Donald Knuth (subtractive number generator). Mai multe despre algoritm aici (pg. 28) și aici, iar despre Random() aici.

2 februarie, 2013 at 17:57 5 comentarii

Mit sau Real? Psi: Efectul de catharsis

Poveste:

E mai bine să te „descarci” când ești nervos decât să ții în tine.

AngryWoman

Ce este?

Cuvântul „catharsis” vine din greacă, de pe vremea lui Aristotel și înseamnă „a curăța” sau „a purifica”. Însă efectul de catharsis a devenit popular odată cu Sigmund Freud care era de părere că furia reprimată se adună în mintea unui om la fel cum crește presiunea într-o oală de gătit și când este prea multă răbufnește și provoacă tot felul de probleme. Una dintre soluțiile la care s-a gândit Freud este eliberarea treptată a furiei într-un mod controlat astfel încât să nu se adune niciodată „prea multă”. El doar s-a gândit la asta, n-a făcut niciun experiment prin care să teseze dacă are dreptate sau nu. Și nu este singurul care crede că e mai bine să te descarci. Un sondaj făcut în 1983 asupra studenților la psihologie din primul an a arătat că 66% dintre studenți credeau acest lucru.1

Uitându-ne în cultura populară găsim destule filme în care apare ideea efectului de catharsis. De exemplu, în Cu nașu’ la psihiatru (1999) un gangster (jucat de Robert De Niro) este sfătuit de psihiatrul său să dea cu pumnul într-o pernă de fiecare dată când e nervos; în Network (1976), un prezentator de știri își îndeamnă telespectatorii să își elibereze frustrările strigând pe geam; iar în Al naibii tratament! (2003) personajul jucat de Adam Sandler, sfătuit de un doctor ajunge să arunce cu bile după copii și cu crose de golf. Iar Hulk este o metaforă pentru efectul de catharsis: când liniștitul Bruce Banner adună suficientă mânie se transformă într-un monstru pe care nimeni nu-l poate controla.2

hulk 2Hulk

Nu doar în filme, ci și în cărți de dezvoltare personală (self-help) găsim ideea că e mai bine să ne descărcăm când suntem nervoși. Un autor, John Lee, ne spune să dăm cu pumnii într-o pernă sau într-o geantă și să înjurăm și să strigăm dacă suntem nervoși. Iar dacă suntem nervoși pe o persoană anume, să ne imaginăm fața acelei persoane pe pernă. Alți autori, dr. George Bach și Herb Goldberg, propun o metodă numită Vezuviu (după vulcanul din Italia), în care „indivizii pot să se descarce de frustrări, resentimente, răni emoționale, ostilități și furie printr-o explozie de strigăte”. De asemenea, există produse care să ajute astfel de manifestări. Un astfel de produs este „Puiul de sufocat” (Choke the Chicken) pe care cei care îl cumpără pot să îl strângă de gât ca să se elibereze de furie. Pentru cei care nu au nimic cu puii, există și o jucărie numită „Choking Strangler Boss” (un fel de „Strangulează-ți șeful”) care începe să ceară utilizatorului să stea peste program și alte lucruri enervante, iar când este strâns de gât îi sar ochii din orbite, devine moale și spune că angajatul merită o mărire de salariu.2 Există chiar şi o terapie care face uz din plin de efectul de catharsis. Se numește terapie primală (primal scream therapy) și a fost propusă de Arthur Janov prin anii ’70.

Pe lângă toate astea, pare o metodă logică de a scăpa de furie și cred că foarte multă lume crede că este eficientă. Chiar și eu am crezut mai demult. Până la urmă, mânia aia trebuie să se ducă undeva, nu? Și decât să o ținem în noi, mai bine să o dăm afară.

Haideți să vedem, însă, dacă a fost testată ipoteza aceasta și care au fost rezultatele.

E un mit sau e real ?

Să începem cu un experiment făcut în anii ’90 de un psiholog pe nume Bushman pentru că nu știa dacă furia chiar se eliberează prin manifestarea ei.3 La experimentul său au participat 180 de studenți împărțiți în trei grupuri. Un grup a citit un articol neutru, alt grup un articol care spunea că eliberarea furiei este eficientă, iar al treilea grup a citit un articol care spunea că eliberarea furiei este inutilă. Apoi studenții au fost puși să scrie eseuri pro sau contra unui subiect sensibil și li s-a spus că eseurile lor vor fi corectate de studenți (dar n-a fost așa). După ce studenții și-au primit eseurile înapoi, jumătate aveau pe ele scris „Superb”, iar jumătate „Ăsta-i unul dintre cele mai proaste eseuri pe care le-am citit!”. Apoi Bushman le-a cerut să aleagă o activitate pe care să o facă în continuare, printre care să se uite la o comedie, să joace un joc, să citească o poveste sau să dea cu pumnii într-un sac. Rezultatele: a fost mult mai probabil ca aceia care au citit că efectul de catharsis funcționează și apoi s-au enervat, să aleagă să lovească un sac, decât cei din celelalte grupuri. Așadar, credința în efectul de catharsis ne face să îl și practicăm dacă avem ocazia.

Asta nu e surprinzător, însă Bushman s-a gândit să schimbe un pic experimentul și să îi lase pe studenți să se răzbune. Mai exact, a vrut să vadă dacă furia scade dacă studenții se „descarcă”. Experimentul modificat a fost la fel până la un punct (când au primit eseurile corectate), moment în care studenții care au primit eseurile cu „Ăsta-i unul dintre cele mai proaste eseuri pe care le-am citit!” au fost împărțiți în două grupuri. Participanților din ambele grupuri li s-a spus că va trebui să concureze cu persoana care le-a corectat eseul. Cei din primul grup au dat cu pumnii într-un sac înainte, iar cei din al doilea au stat și au așteptat. Pe urmă a început competiția: apasă un buton cât de repede poți; dacă pierzi o să suporți un zgomot oribil; când câștigi, adversarul tău o să audă acel zgomot. Studenții au fost lăsați să aleagă volumul zgomotului pe care îl va auzi adversarul lor (volum între 0 și 10, unde 10 = 105 dB). Ce credeți că au descoperit? În medie, cei care înainte au dat cu pumnii în saci (să se descarce) au ales un volum de 8,5. Cei care au așteptat liniștiți în loc să dea cu pumnii au ales în medie un volum de 2,47.  Ce înseamnă asta? Înseamnă că aceia care s-au „descărcat” au rămas nervoși după ce s-au „descărcat”, iar celor care au stat liniștiți le-a cam trecut dorința de răzbunare. În studii ulterioare au fost găsite aceleași rezultate (când zgomotul a fost înlocuit cu sos iute, cei care s-au „descărcat” i-au pus pe adversarii lor să mănânce mai mult sos iute, iar când cele două grupuri au fost puse să completeze cuvinte precum ch__e, cei care s-au „descărcat” au ales mult mai des cuvinte precum choke (sufocă) decât chase (urmărește)).

Într-un studiu, oamenii care au bătut cuie după ce i-a insultat cineva, au fost mult mai critici față de acea persoană decât cei care nu au bătut.4 Iar alt studiu a arătat că oamenii care au jucat un sport agresiv (cum ar fi fotbalul american) –care ar trebui să promoveze efectul de catharsis– nu s-au „descărcat”, ci au devenit și mai agresivi.5 Chiar și jucând jocuri video cu violență în ele efectul a fost asemănător: jucătorii nu s-au „descărcat”, ci și-au mărit agresivitatea.6

Într-un alt experiment participanții au fost puși să aleagă ce muzică să asculte în timp ce o să joace un joc în care trebuiau să împuște niște oameni (Soldier of Fortune). Muzica era din trei categorii: neutră, „nervoasă” și energică (dar nu nervoasă). Rezultatele au fost că participanții au ales de cele mai multe ori muzica agresivă și chiar au jucat mai bine ascultând astfel de muzică.8 Asta sugerează că muzica le-a menținut starea de agresivitate sau chiar le-a crescut-o, dar în niciun caz nu i-a ajutat să se descarce. Ipoteza că „descărcarea” cathartică scade furia a fost infirmată de multe studii.7 Așadar, dacă vreți să fiți mai buni la shooter-e vă ajută să fiți nervoși, însă în cele mai multe situații e mai bine să lăsați mânia de-o parte.

De ce pare că funcționează?

Păi, în primul rând, toți ne simțim mai bine după ce ne descărcăm, chiar dacă agresivitatea nu dispare. Când ne descărcăm rămânem nervoși și e mai probabil să ne manifestăm ca niște oameni nervoși ceea ce ne poate aduce și mai multă furie și procesul se repetă. Efectul este asemănător unui drog. Descărcându-ne ne simțim foarte bine (pe moment), păstrăm starea de nervozitate (mascată temporar) și avem impresia că efectul de catharsis funcționează.9 În plus, nu rămânem prea des nervoși pentru foarte multă vreme. Furia și nervozitatea trec de la sine după un timp, iar dacă în acest timp ne-am descărcat putem avea impresia că asta e cauza pentru care nu mai suntem nervoși. Presupunem că dacă un lucru vine după altul, primul este cauza celui de-al doilea (eroare numită post hoc, ergo propter hoc), deși nu este întotdeauna așa.

În al doilea rând, suntem influențați de cei din jur și, văzând că multă lume crede presupunem că este o noțiune ce ține de bunul simț. Iar dacă oamenii din jur nu sunt suficienți, mai vedem și prin filme cum personaje psihiatri recomandă să ne descărcăm și mai aflăm și că psihologi cunoscuți susțin asta (vezi Freud).

Iar în al treilea rând, metafora pe care o folosim este greșită. Lumea vorbește despre furie ca despre o oală în care fierbe apa și din cauza aburului crește presiunea, iar cândva o să răbufnească. Gândindu-ne așa, are foarte mult sens „să lăsăm să iasă” furia afară, pentru că dacă n-o lăsăm să iasă unde o să se ducă? O să se adune atât de multă încât n-o să mai încapă. Așa s-a gândit Freud, așa ne gândim și noi. Însă am văzut că atunci când verificăm prin experimente, rezultatele sunt opuse. Așa că probabil metafora nu este cea mai potrivită, furia nu este ca presiunea dintr-o oală. În schimb ar trebui să privim un pic mai jos – spre foc. Furia funcționează mai mult ca un foc: dacă îi dăm material de ars, arde și chiar cresc flăcările; dacă nu îl întreținem, se stinge de la sine după o vreme. Folosind această metaforă are mai mult sens să nu ne manifestăm agresiv. În special nu în mod intenționat. Manifestările cathartice doar pun lemne pe foc.

fire, coal

Ce-ar fi mai bine să facem?

Dacă nu avem un meci de Call of Duty sau de box ar fi mai bine să nu fim nervoși. Bushman (cel cu experimentele) sugerează să ne amânăm răspunsul, să încercăm să ne relaxăm sau, pentru că uneori e greu să facem asta, să găsim activități care ne distrag atenția de la lucruri agresive. Chiar și distragerea atenției e uneori grea, dar cel mai important e să nu facem în mod intenționat lucruri care ne mențin nervoși.

Studiile sugerează că furia poate fi de ajutor dacă o exprimăm într-un mod constructiv încercând să ajungem la sursa ei.10 De exemplu, dacă m-a enervat prietena că tot întârzie, n-o să rezolv problema începând să urlu la ea, ba chiar o să înrăutățesc situația. Cel mai bine ar fi ca în mod calm dar cu încredere să îmi exprim nemulțumirea („Îmi dau seama că probabil nu faci asta intenționat, dar când întârzii devin supărat.”).

Concluzii

Am văzut că în cultura populară este înfiptă adânc ideea că trebuie să ne descărcăm când suntem nervoși. Am văzut că această idee provine doar din presupuneri, iar când ne uităm la experimentele făcute, lucrurile par să stea exact invers. Pe scurt, ce înseamnă aceste experimente: luăm oameni la întâmplare, îi enervăm, îi punem întâmplător în două grupuri, pe unii îi punem să se „descarce”, iar pe ceilalți să stea liniștiți. La sfârșit observăm că cei care s-au descărcat sunt încă nervoși (poate chiar mai nervoși decât înainte să se descarce), iar celor care au stat liniștiți le-a cam trecut supărarea. Observând aceste lucruri nu putem ajunge decât la concluzia că metafora oalei sub presiune este greșită și că mult mai potrivită ar fi metafora focului: cu cât ne enervăm mai mult sau ne comportăm agresiv, cu atât devenim mai nervoși și mai agresivi, pentru că „punem paie pe foc”. În concluzie, efectul de catharsis este…

Mit sau Real?

Mit

Note:
1: Brown, L. T. (1983). Some more misconceptions about psychology among introductory psychology students. Teaching of Psychology, 10, 207–210;
2: Scott O. Lilienfeld, Steven Jay Lynn, John Ruscio, Barry L. Beyerstein, 50 Great Myths of Popular Psychology: Shatering Widespread Misconceptions about Human Behavior [2010], Wiley-Blackwell, Myth #30: It’s Better to Express Anger to Others than to Hold It in;
3: Bushman, B. J., Stack, A. D., & Baumeister, R. F. (1999). Catharsis,  aggression, and persuasive influence: Self-fulfilling or self-defeating prophecies?, Journal of Personality and Social Psychology 76(3), 367–376.;
4: în Scott O. Lilienfeld: Hornberger, R. H. (1959). The differential reduction of aggressive responses as a function of interpolated activities. American Psychologist, 14, 354.;
5: în Scott O. Lilienfeld: Patterson, A. H. (1974). Hostility catharsis: A naturalistic quasi experiment. Personality and Social Psychology Bulletin, 1, 195 197.;
6: în Scott O. Lilienfeld: Anderson, C. A., & Bushman, B. J. (2002). Media violence and the American Public revisited. American Psychologist, 57, 448–450.; Anderson, C. A., Gentile, D. A., & Buckley, K. E. (2007). Violent video game effects on children and adolescents. New York: Oxford University Press.;
7: Lohr, J. M., Olatunji, B. O., Baumeister, R. F., & Bushman, B. J. (2006). The psychology of anger venting and empirically supported alternatives that do no harm. Scientific Review of Mental Health Practice, 4, 54 65.;
8: Maya Tamir, Christopher Mitchell, and James J. Gross, “Hedonic and Instrumental Motives in Anger Regulation,” Psychological Science 19 (2008): 324–328;
9: Bushman, B. J. (2002). Does venting anger feed or extinguish the flame? Catharsis, rumination, distraction, anger, and aggressive responding. Personality and Social Psychology Bulletin, 28, 724–731;
10: Littrell, J. (1998). Is the re-experience of painful emotion therapeutic? Clinical Psychology Review, 18, 71–102.;
Extra: Daniel David, Steven Jay Lynn, Albert Ellis, Rational and Irrational Beliefs: Research, Theory and Clinical Practice [2010], Oxford University Press, Cap. 15: The Five Great Myths of Popular Psychology: Implications for Psychotherapy, The Myth of Catharsis, disponibilă aici;

11 ianuarie, 2013 at 22:33 5 comentarii

Mit sau Real? Psi: Testul „Desenează-o-persoană”

Poveste:

Din felul în care desenezi o persoană, un psiholog poate să afle multe lucruri despre tine.

Exemplu de persoane desenate

Ce este?

Unul dintre testele folosite de unii psihologi pentru a afla caracteristici ale personalității cuiva sau dacă are vreo problemă psihologică este așa-numitul test „desenează-o-persoană” (sau testul Omulețului, desenul omului, testul Machover etc.; în engleză: Draw-a-person Test), care a ajuns și în cultura populară (ex.: în emisiuni TV). Cea mai răspândită utilizare este ca test proiectiv.

În ce constă?

Se prezintă subiectului o foaie de hârtie, un creion și o gumă de șters și i se cere să deseneze o persoană. Între timp, examinatorul notează diverse indicii (ordinea de desenare a părților, comentarii etc.), apoi îi cere subiectului să mai deseneze o persoană, de sex opus pe o altă foaie de hârtie. Apoi, examinatorul interpretează desenele pentru a afla caracteristici de personalitate, stări emoționale, prezența unor tulburări (psihopatologie), inteligența ș.a. despre cel care a desenat.

Cum se interpretează?1

Pentru interpretare, trebuie analizate mai multe lucruri:

a). Imaginea de ansamblu

Examinatorul își formează o imagine de ansamblu încercând să răspundă la întrebări despre desen precum: este mare sau mic? Schematic sau complex? Armonios sau nearmonios? Ce exprimă postura? Este vesel sau trist? Este tânăr sau bătrân? Conține elemente bizare? Ce diferențe există între cele două persoane desenate? Ce elemente au fost scoase în evidență și ce elemente omise? Câteva exemple:

  • Poziția sau atitudinea persoanei desenate: siluetele  în mișcare sugerează o fire dinamică, energică; siluetele înclinate sugerează nesiguranță; siluetele în profil sugerează tendințe evazive, prudență;
  • Diferențe mari între silueta masculină și cea feminină: dacă silueta de același sex este desenată mare, detaliat, iar cea de sex opus este schematică și mică, sugerează o atitudine narcisistă;
  • Accentuarea sau îngroșarea unor elemente: sugerează importanța acestora; de exemplu, accentuarea buzelor, sânilor sau părului sugerează dorințe erotice intense sau exhibiționism sexual;
  • Tratarea superficială a unor elemente: sugerează conflicte;
  • Elemente bizare (copite, cap triunghiular, organe interne): sugerează anormalitate;

b). Analiza formală

Constă în analiza trăsăturilor și a spațiului grafic. De exemplu, liniile zimțate sau ascuțite la extremități reprezintă agresivitate, liniile întrerupte reprezintă nesiguranță, iar cele abia schițate lipsă de energie. Un desen mic în partea de jos a foii reprezintă inhibare și neadaptare; în partea de sus a foii sugerează ancorare solidă în realitate sau nevoie de putere ori expansiune. Un desen făcut în partea stângă sugerează retragere în trecut, atitudine pasivă, teamă, orientare spre interior. Unul făcut în partea dreaptă sugerează orientare spre viitor sau spre exterior. Un desen mare sugerează megalomanie sau centrarea pe sine.

c). Analiza de conținut

Constă, în mare parte, în analiza părților corpului persoanei desenate. Pe scurt, elementele analizate sunt:

  • Capul: este principalul element de expresivitate emoțională, prin urmare are un rol foarte important în recunoașterea atitudinii și dispoziției celui care a desenat. Câteva interpretări: cap mare comparativ cu restul corpului înseamnă o supravalorizare a funcțiilor cerebrale; cap mic = complex de inteligență sau inabilitatea de a-și controla impulsurile; gură deschisă = atitudine pasivă, așteaptă să primească; gură strâmbă = depresie sau dezamăgire; dinți ascuțiți = agresivitate; ochi fără pupile = blocaj emoțional, depresie; ochi foarte mici = închidere față de lume; ochi foarte mari = paranoia; păr mare/abundent = preocupări sexuale sau agresivitate; barbă la bărbați = masculinitate; urechi mari = suspiciune, teamă de bârfe; nas mare = virilitate, dominanță; nas turtit = prezența unei traume;
  • Gâtul: prezența unei strangulări (guler, cravată) sugerează inhibiții afective sau control în exprimarea emoțiilor;
  • Trunchiul: masiv = dorință de putere, masculinitate; subțire = fragilitate, sentimente de inferioritate; sâni la femei = maturitate, sexualitate; talie scoasă în evidență = inhibare sau reprimare a impulsurilor sexuale;
  • Membrele: lipsa mâinilor = sentimente de neadaptare sau neîndemânare; gheare la mâini = agresivitate; mâinile desenate la spate = dorința de a ascunde ceva; picioare lungi și groase = independență; picioare subțiri = lipsă de autonomie; coapse exagerate = tendința de exprimare erotică; siluete stând pe vârfuri = ambiție;
  • Accesoriile: rochii decoltate sau transparente = impuls sexual; șapcă = dorința de prestigiu; bijuterii sau tatuaje prea multe = narcisism, dorința de a ieși în evidență;

Dacă doriți să aflați mai multe detalii, puteți citi articolul Testul desenul omului, de unde am preluat și unele elemente de mai sus.

Versiuni

Există mai multe versiuni ale acestui test. Pe lângă varianta prezentată mai sus există și testul „Casă-Copac-Persoană” (House-Tree-Person Test), „Desenarea kinetică a familiei” (Kinetic Family Drawing) (desenarea unei familii „făcând ceva”) sau DAP: SPED (Draw-A-Person: Screening Procedure of Emotional Disturbance).

Exemplu de desen Casă-Copac-Persoană

Citind despre aceste teste și în special despre felul în care se interpretează, am un sentiment că trebuie să funcționeze, pentru că sună bine, are sens. Unii oameni se opresc aici și nu mai verifică dacă acest tip de test funcționează. Însă, ar fi greșit să ne oprim aici. Multe lucruri sună bine, dar nu toate funcționează. Hai să vedem ce spun dovezile.

E un mit sau e real ?

Căutând mai adânc, lucrurile par să stea altfel. O să încep cu un studiu simplu (să vedem ce rezultate a avut) și apoi o să prezint rezultatele unei meta-analize. O meta-analiză e o analiză a mai multor studii pe același subiect, comparând rezultatele lor. Astfel beneficiem de rezultatele unui număr mare de studii sintetizate într-unul singur.

În 1967, doi psihologi, soții Chapman, s-au gândit să verifice cât de bine funcționează testele ce presupun desenarea unei persoane, pentru că erau la modă în acea vreme (și mai sunt și acum). Multe dintre elementele acestui tip de test par să se potrivească destul de bine cu stereotipurile pe care le au oamenii și e posibil să fie doar atât: niște stereotipuri. Pentru a testa această idee, cei doi psihologi le-au dat studenților dintr-un grup desene făcute de niște pacienți din instituții psihiatrice, împreună cu scurte descrieri ale simptomelor (ex.: „Este suspicios” sau „Îi este teamă că nu este destul de bărbat”). După ce s-au uitat pe desene, participanții au fost întrebați dacă au descoperit modele. În mod interesant, ei au găsit aceleași tipuri de modele pe care profesioniștii le-au folosit ani de zile. Au descoperit, de exemplu, că paranoicii desenează ochi atipic de mari, cei ce se tem că nu sunt destul de bărbați desenează persoane cu umerii foarte mari sau că organele sexuale mici în desene sunt indicatori ai impotenței.2

Să fie japonezii? mai paranoici decât restul?!

Stai un pic! Niște amatori au re-descoperit modelele pe care profesioniștii le foloseau de mai multă vreme? Asta înseamnă că modelele acelea trebuie să fie reale. E o confirmare că profesioniștii știu ce fac. Deci testul „desenează-o-persoană” funcționează?! Așa pare, dar cel mai surprinzător lucru doar acum urmează: perechile desen-descriere au fost făcute… la întâmplare! Participanții au văzut invizibilul, au descoperit niște modele false. Desenele paranoicilor nu aveau descrieri de tip „este suspicios”. Participanții au văzut ochi mari acolo unde s-au așteptat să vadă și i-au ignorat unde nu se așteptau să vadă. Asta a fost valabil pentru toate modelele pe care le-au „descoperit”. Acest experiment a discreditat testul desenării unei persoane.

Dacă încă nu sunteți convinși, citiți în continuare o sinteză a meta-analizei făcute de Scott O. Lilienfeld și alții.3 Toate studiile la care fac referire mai jos sunt documentate în meta-analiza lui Lilienfeld, așa că puteți verifica în lucrarea originală (am pus un link la referința 3).

În termeni mari, există două abordări ale testului desenării unei persoane. Una este abordarea individuală, propusă de Karen Machover și pune accent pe elemente izolate (ex.: ochi mari). Conform lui Machover, multe semne sunt asociate cu trăsături de personalitate și trăsături psihopatologice. De exemplu, cum am văzut și mai sus, ochii mari sunt asociați cu paranoia, cravata lungă cu agresivitatea sexuală, lipsa trăsăturilor faciale cu depresia, umbrele îngroșate cu impulsurile agresive și ștersăturile dese cu anxietatea. Tot Machover a zis și că persoana desenată întruchipează caracteristicile psihologice centrale ale celui ce a desenat. Cea de-a doua abordare este cea globală, propusă de Elizabeth Koppitz prin anii ’60, care a dezvoltat un sistem de 30 de indicatori pentru desenele făcute de copii. Acești indicatori sunt apoi însumați pentru a obține un scor de neadaptare.

Consistența/Certitudinea

Consistența statistică între evaluatorii testului desenării unei persoane variază în diverse studii. O consistență mare se obține dacă cei ce evaluează obțin aceleași rezultate. O consistență slabă se obține când… fiecare e cu părerea lui. Așadar, e important să existe o consistență mare la evaluarea desenelor. Unele studii au găsit consistențe de peste 0,80, altele consistențe variind între 0,45 și 0,96 (pentru „umbre = agresivitate”) sau între -0,13 și 0,60 (pentru expresii faciale). Și consistența la testare-retestare variază. Unele studii au găsit consistențe între 0,74 și 0,90, altele între 0,81 și 0,99. Rezultatele în ceea ce privește consistența au fost în general acceptabile. Consistența medie internă a unei versiuni a testului a fost 0,86 pentru scorul total. Ce înseamnă numerele astea? O consistență între 0,80 și 0,90 este considerată bună, una peste 0,90 este excelentă (1,00 este valoarea maximă). În concluzie, consistența statistică a testului „desenază-o-persoană” este foarte bună. Totuși, consistența nu spune nimic dacă nu există validitate.

Validitatea

O problemă în evaluarea validității testului este că multe dintre ipoteze sunt greu de falsificat. Ce înseamnă asta? Păi, de exemplu, puși în fața descoperirilor negative, susținători ai acestui test vin cu explicații cum ar fi că persoanele patologice, în contrast cu cele normale, pot să deseneze figuri care sunt ori prea mari ori prea mici, au linii ori prea groase, ori prea subțiri, adaugă ori prea multe ori prea puține detalii sau că îngroșarea liniilor și ștersăturile dese pot să însemne fie prezența anxietății, fie prezența eforturilor reușite împotriva anxietății (adică lipsa ei) etc. Alte explicații insistă că uneori desenul nu e modul prin care oamenii aleg să-și exprime problemele (și de aceea, când testele nu funcționează nu e nicio problemă), dar nu dau nicio explicație de ce se întâmplă asta și, mai ales, când. Prin urmare, validitatea testului este foarte scăzută din cauză că aproape price descriere este considerată „bună”. Acesta este și unul dintre motivele principale pentru care consistența este mare. Dar, cum ziceam, consistența fără validitate nu înseamnă nimic. Majoritatea covârșitoare a studiilor au găsit o validitate neglijabilă sau zero în cazul testului „desenează-o-persoană”.

Într-o evaluare a literaturii publicate din 1967 până în 1982 s-a descoperit că există susținere moderată doar pentru 2 din cei 30 de factori: trunchiurile rotunde (în opoziție cu cele pătrate) indică trăsături feminine de personalitate, iar desenele colorate sunt un semn de anxietate. În schimb, nu s-a găsit nicio legătură între urechile mari și paranoia, desenarea organelor interne și schizofrenie, accesorii cum ar fi cuțite sau pistoale și delincvență, scoaterea în evidență a părului și impulsuri sexuale ș.a. De asemenea, nu s-a găsit nicio corelație semnificativă între mărimea, înălțimea sau greutatea desenatorului și cele ale figurii desenate.

Într-un studiu făcut de Joiner, Schmidt și Barnett, rezultatele legate de mărime, nivel al detaliilor și grosimea liniilor au fost negative. Deși consistența evaluatorilor a fost mare (între 0,91 și 0,95) (adică toți au ajuns la aceleași rezultate, nu s-au contrazis), niciunele dintre rezultate nu s-au potrivit cu felul în care erau în realitate persoanele care au desenat (au fost evaluate semne ale depresiei și ale anxietății la pacienți patologici). De exemplu, mărimea figurii se crede că este invers asociată cu depresia (adică figură mică = depresie mare), dar studiile au arătat că între ceea ce evaluatorii au dedus din desene și cum erau, de fapt, cei care le-au desenat corelația este nesemnificativă). La fel, și nivelul de detaliu ar trebui să coreleze invers cu anxietatea (adică anxietate mare = detalii puține), dar și în acest caz legătura a fost nesemnificativă. Alt studiu, făcut de Dudley et al. a găsit că persoanele deprimate, de fapt, e mai puțin probabil să deseneze fețe din profil (contrar a ceea ce se crede), iar Cvetkovic a găsit că schizofrenicii e mai puțin probabil să deseneze capete fără corp (din nou, contrar credințelor).

Ca răspuns la descoperirile ce sugerau că testul desenării unei persoane este invalid, susținătorii lui au zis că, de fapt, în practică nu se pune accent pe semne individuale. Afirmația asta e doar o scuză, pentru că în 1995 doi psihologi, Smith și Dumont, au făcut un experiment în care au participat 36 de psihologi clinicieni ce foloseau testul desenării unei persoane (dar și alte tehnici proiective) și au înregistrat comentariile acestora în timp ce interpretau desenele. Din 22 de clinicieni, 20 au tras concluziile bazându-se pe semne specifice. De exemplu, comentariile unui clinician: „Ochii săi sunt bizari și supra-accentuați. Cred că are probleme cu bărbații, cu o suspiciune paranoică”.

Totuși, există indicii că o abordare globală poate obține validitate modestă în detectarea psihopatologiei (a se reține: modestă). De exemplu calitatea slabă a desenului poate indica o problemă. Într-un studiu de Tharinger și Stark au fost evaluați 52 de copii care aveau ori tulburare emoțională, ori tulburare de anxietate, ori nimic. O analiză a semnelor individuale n-a dat niciun rezultat semnificativ, dar o analiză globală a reușit distingerea copiilor normali de cei cu o tulburare. Însă analiza globală nu s-a bazat pe tehnicile proiective din testul desenării unei persoane, ci pe indicatori generali ai psihopatologiei (ex.: lipsa bunăstării emoționale sau inumanitatea figurii desenate). În schimb, studii făcute de Naglieri și Pfeiffer, în care au încercat să diferențieze între 54 de copii și adolescenți cu tulburare de comportament și 54 fără, au descoperit că scorul celui de-al doilea grup a fost mai mare decât al primului, adică cei din al doilea grup au fost identificați greșit ca având tulburare de comportament.

Inteligența și talentul artisitc

O parte din validitatea (și așa mică) a testului „desenează-o-persoană” este dată de evaluarea talentului artistic sau a inteligenței. În ce privește inteligența, s-a găsit o corelație medie între IQ și scorul la testul desenului. În acest caz „medie” nu e suficient de bună. În ce privește talentul artistic, e de așteptat să aibă un efect, având în vedere că oamenii sunt puși să deseneze. Din cauză că nu este luat în calcul, apar erori de interpretare. De exemplu, unele părți ale corpului sunt mai greu de desenat decât altele, în special pentru copii, ceea ce face ca desenele lor să fie interpretate ca semn al neadaptării. Pe scurt, cei care nu au talent artistic riscă să fie diagnosticați ca patologici. Analize făcute de mai mulți psihologi sugerează că abilitatea astistică este determinantul cel mai important al variației figurilor. Într-un studiu făcut de Cressen în 1975, evaluările psihologilor au fost influențate de talentul artistic. Psihologii din experiment au trebuit să identifice schizofrenicii dintr-un grup de oameni (unii cu schizofrenie, alții fără) și nu s-au descurcat mai bine decât dacă ar fi ales la întâmplare, iar cei care au fost „identificați” ca schizofrenici au fost predominant cei netalentați la desen. A, și pentru a fi siguri, în realitate nu este nicio legătură între talentul artistic și schizofrenie.

În final, nici experiența evaluatorului nu îmbunătățește calitatea diagnosticului.

Concluzii

Am văzut, în mare, în ce constă testul „desenează-o-persoană”, am văzut cum sunt interpretate desenele și am văzut că este într-un mod foarte intuitiv. Chiar și pe mine ca sceptic m-a atras acest test când am citit despre tehnicile folosite pentru că sunt interesante (în general tehnicile proiective sunt interesante). Totuși, chiar dacă sună bine, nu putem să presupunem că funcționează. Și testele trebuie testate. Am văzut diverse studii și concluzia este clară: testul „desenează-o-persoană” este un dezastru. Toate utilizările proiective ale sale sunt inutile. Tot ce poate să spună acest test este cât de mult talent are la desen persoana evaluată și, într-un mod limitat, nivelul de dezvoltare cognitivă a unui copil (dacă desenează o persoană formată din cap și membre e mai puțin dezvoltat decât un copil care desenează și corpul).

Testul „desenează-o-persoană” nu vă poate spune ce trăsături are cineva sau dacă este bolnav!

Mit sau Real?

Note:

1: Monica Licu, „Desenul persoanei – Testul Machover – și rolul lui în procesul educațional”; și Testul desenul omului (Consultanță Psihologică);
2: L. J. Chapman and J. P. Chapman (1967). ‘Genesis of popular but erroneous psychodiagnostic observations’. Journal of Abnormal Psychology, 72, pg. 193–204; (Abstract)
3: Scott O. Lilienfeld, James M. Wood, Howard N. Garb, „The Scientific Status of Projective Techniques”, Psychological Science in the Public Interest, Nov. 2000, vol. 1, no. 2; Secțiunea Human Figure Drawing Methods; (Abstract)

 

3 noiembrie, 2012 at 20:31 Scrie un comentariu

Conspiracy Road Trip

Pe BBC Three a fost transmis un documentar numit Conspiracy Road Trip. Al treilea episod este despre niște oameni care cred în conspirații legate de extratereștri. Prezentatorul încearcă să le arate că acele conspirații în care cred nu sunt adevărate. Episodul despre OZN-uri îl puteți urmări aici:

Bineînțeles că nu și-a schimbat nimeni părerile. Dar mi s-au părut interesante următoarele aspecte:

  • Expunerea la idei extreme: participanții au fost duși să discute cu un fost angajat al CIA care zicea că Luna a fost construită în interiorul lui Jupiter și alte lucruri incredibile. Acest lucru i-a pus pe gânduri. Cred că e un element cheie în convingerea unui conspiraționist. Reacția unuia dintre participanți este relevantă: zicea că fostul angajat CIA nu are nicio dovadă să-i susțină afirmațiile. Schimbarea unei opinii nu se realizează instantaneu, ci în mod gradual. Deși participantul a zis la sfârșit că nu și-a schimbat părerea, cred că și-a pus mai multe întrebări și astfel poate fi un început spre calea scepticismului. Mai e un motiv pentru care am scos în evidență punctul ăsta. Pe vremea când eu credeam în conspirații și urmăream documentare ce promovau tot felul de idei, am dat peste câteva care erau prost realizate. Unul era despre apocalipsa din 2012, idee față de care eram un pic sceptic, motiv pentru care pentru mine a fost o „idee exagerată” și mi-am pus întrebări. Ăsta a fost începutul, de unde am ajuns mai târziu să fiu sceptic în legătură cu toate teoriile conspirației (și nu numai).
  • Prezentarea multor variante: participanții au fost duși pe la diverși oameni care și-au expus ideile diferite pe subiecte asemănătoare (conspirațiile legate de extratereștri). De la cele mai ciudate, la cele mai plauzibile. Printre cei invitați a fost și Annie Jacobsen, ce a scris o carte numită Area 51, carte mai credibilă decât altele pe același subiect, dar tot speculativă din cauza subiectului abordat. Expunerea la diverse „teorii” ne forțează să facem comparații și să analizăm dovezile pentru a ne forma o părere. Același lucru s-a întâmplat și cu participanții din documentar, care au fost puși față în față cu un fost angajat din Zona 51 care le-a zis că n-a văzut extratereștri, dar a văzut avioane militare secrete. Deși această expunere singură n-a schimbat nicio părere, a contribuit la slăbirea încrederii în „teoria” preferată.
  • O minte deschisă: destul de des cei ce cred în conspirații (și alte lucruri) le reproșează scepticilor că nu sunt destul de deschiși la minte și ăsta e motivul pentru care nu cred ideea X și teoria Y. Realitatea e că, în general, mințile oamenilor sunt parțial închise și parțial deschise (închise la idei contradictorii și deschise la idei ce confirmă). Una dintre participante demonstrează exact acest lucru: conspiraționiștii nu sunt mai deschiși la minte decât scepticii; sunt doar mai deschiși la ideile care le plac. Participanta avea o părere foarte proastă despre Michael Shermer și nici nu vroia să-l audă, deși nici nu știa ce o să spună. Din fericire, și-a îmbunătățit părerea despre el după ce l-a ascultat. Aș merge un pic mai departe și aș specula că reacția ei negativă inițială a fost cauzată de teamă pentru că ea credea că Michael susține că experiența ei nu este reală (ea zicea că a fost răpită de extratereștri, dacă îmi amintesc bine). Când a văzut că nu este atacată, a fost în stare să devină un pic mai rațională.
  • Detectorul de minciuni: ideea de a testa participanții cu detectorul de minciuni mi s-a părut inițial greșită complet din două motive. Primul ar fi că „detectorul de minciuni” de fapt nu detectează minciuni, ci schimbări fiziologice în trup (conductivitatea pielii, pulsul cardiac etc.). Al doilea ar fi că, și dacă testul ar fi funcționat, nu am fi aflat nimic ce nu știam deja. Participanții credeau în mod sincer în conspirațiile în care au zis că cred, iar experiențele ieșite din comun au fost, pentru ei, foarte realiste, convingându-i că sunt „reale”. De aceea m-am bucurat când am văzut că testul nu mai are loc. Tind să cred că ăsta era și scopul inițial (de a nu testa pe nimeni); astfel documentarul a devenit mai frumos.

Documentarul mai are încă două episoade pe care nu am apucat să le văd încă (dar plănuiesc să le văd cât mai curând), pe care le recomand de pe-acum. Unul este despre creaționism, iar celălalt despre atacurile din 11 septembrie 2001.

18 octombrie, 2012 at 23:33 Scrie un comentariu

The Science of Attraction

Dacă tot e ziua îndrăgostiților o să o folosesc ca pretext pentru a scrie despre atracție. Nu despre atracția gravitațională; despre atracția interpersonală (de la „fizică” la „romantică”). Pe tema asta s-au scris o mulțime de cărți de auto-educare/dezvoltare personală (self-help) care promit minuni. De la The Secret (care ne spune că trebuie doar să ne dorim și vom obține) până la cărți de tip The Layguide: How to Seduce Women More Beautiful Than You Ever Dreamed Possible No Matter How You Look Like or How Much You Make (care prezintă metode detaliate despre… vă dați seama din titlu), toate promit soluții magice pentru a găsi ori „iubirea perfectă” ori pentru a agăța fete, iar metodele propuse variază în eficiență de la complet nefuncționale la parțial funcționale. Ce reușesc aproape toate să facă este să crească încrederea cititorilor și astfel să-i determine să încerce să obțină ce vor, ceea ce este mai bine decât să nu încerce. Dar nu e nicio magie.

Totuși, atracția a fost studiată și s-a descoperit că unele lucruri funcționează mai bine decât altele, dar este doar un efect statistic. Atâta timp cât țineți cont de asta și nu vă așteptați la minuni, rezultatele studiilor următoare (și a altora asemănătoare) pot fi utile. Enjoy!

  1. Ceva roșu: într-o serie de 7 experimente s-a demonstrat că femeile îi percep pe bărbați ca fiind mai atrăgători dacă sunt pe un fundal roșu sau poartă o haină de culoare roșie;
  2. Toți bărbații buni sunt „luați”: într-un experiment participantele au fost întrebate dacă ar dori să înceapă o relație cu un bărbat. Unora li s-a spus că bărbatul este singur, altora că are o iubită. Doar 59% dintre femei au dorit o relație dacă au crezut că e singur, în timp ce 90% și-au dorit o relație dacă au crezut că nu e singur. Simplul fapt că era dorit de o altă femeie i-a crescut atractivitatea. Așa că, prin definiție, toți bărbații buni sunt „luați” pentru că asta îi face „buni”. Studiul a verificat și situația inversă și s-a observat că în cazul bărbaților efectul nu funcționează: atractivitatea unei femei nu variază dacă e într-o relație sau e singură; (a)
    Într-un alt studiu s-a observat că femeile preferă bărbații pe care i-au văzut în poze în care alte femei le zâmbeau (dacă acele femei au fost descrise pozitiv); (b)
    Într-un alt studiu s-a observat că femeile îi consideră mai atrăgători pe bărbații care apar în poze alături de alte femei (comparativ cu aceeași bărbați care apar singuri); iar bărbații le-au considerat mai puțin atrăgătoare pe femeile care apăreau în poze alături de alți bărbați (comparativ cu cele care apăreau singure); (c)
    Așadar, știți ce poze să vă puneți pe Facebook ;)
  3. Inteligența e sexy: într-un experiment, 204 femei participante au trebuit să aleagă ce bărbați preferă după ce au urmărit mai multe videoclipuri cu aceștia făcând diferite activități. S-a observat că femeile au preferat bărbații mai inteligenți (fără să știe asta în mod conștient);
  4. Umorul este atrăgător: s-a observat că femeile apreciază mai mult replicile amuzante decât complimentele;
  5. Foamea contează: într-un studiu s-a observat că bărbații flămânzi preferă femeile mai grase. Cercetătorii britanici i-au întrebat pe studenții care intrau sau ieșeau dintr-o cantină studențească să aprecieze atractivitatea unor fete din poze. Cei care intrau (deci erau flămânzi) au dat note mai mari fetelor mai grase, comparativ cu cei care ieșeau (erau sătui);
  6. Vorbiți despre ce NU vă place: cei care povestesc despre lucruri cu care ambii nu sunt de acord se apropie mai mult decât cei care vorbesc despre subiecte cu care ambii sunt de acord. Bineînțeles, dacă discută în contradictoriu nu există multe șanse de a se apropia;
  7. Zâmbește și înclină capul: zâmbetele false de obicei nu produc același efect ca și cele reale. Totuși, ca să pară real, un zâmbet trebuie să dureze mai mult și să fie asociat de o înclinare a capului ori în față ori într-o parte;
  8. Iubire sau atracție fizică?: într-un experiment, mai multe cupluri au fost filmate în timp ce discutau fie despre dragoste (romantică), fie despre atracție fizică. Înregistrările au fost apoi analizate pentru a descoperi elementele non-verbale specifice. S-a observat că în cazul discuțiilor despre dragoste, partenerii aveau corpurile înclinate unul spre altul, zâmbeau și dădeau din cap în semn de aprobare. În cazul celor care discutau despre atracție fizică s-a observat mai mult tendința de a își mușca sau linge buzele;
  9. Împărtășește ceva personal: pentru că produce o senzație de apropiere și intimitate mai repede decât discuțiile despre alte subiecte;
  10. Sperieturile sunt bune: în mai multe experimente s-a observat că persoanele într-o stare de stimulare ridicată îi văd pe ceilalți mai atrăgători decât într-o stare normală. Într-un parc de distracții au fost abordați potențiali participanți și au fost puși să aprecieze atractivitatea unor persoane înainte sau după ce au fost într-un montagne russe. Înainte au fost note mai mici, iar după au fost note mai mari (participanții care au dat note n-au fost aceeași și înainte și după, e un rezultat statistic). Așadar, la prima întâlnire, mergeți la un film horror în locul unuia romantic;
  11. Găsește-ți un prieten mai urât: Dan Ariely a făcut un experiment ingenios. A folosit fotografii ale unor studenți pe care le-a modificat astfel încât să producă o variantă mai urâtă a lor (i-a făcut un pic asimetrici). Apoi a prezentat participanților câte trei fotografii: cea originală, cea „urâtă” și una cu un alt student. Efectul observat a fost următorul: studenții care erau prezentați alături de o variantă mai urâtă a lor au fost apreciați ca fiind mai atrăgători. Simpla existență a unei variante mai urâte îi făcea (pe cei originali, nemodificați) mai atrăgători. Și nu doar atât, dar îi făcea preferabili celorlalți. Cu alte cuvinte, dacă ai un prieten care seamănă cu tine (sau un frate), dar care e puțin mai urât decât tine, ia-l cu tine când mergi în cluburi/baruri pentru că o să fi văzut ca fiind mai atrăgător decât ești, comparativ cu alții care nu au lângă ei „o variantă mai urâtă” a lor. Surprinzător. Despre experimente asemănătoare, dar din domeniul economic vorbește Dan Ariely în prezentarea sa de la TED (în special la 12:40);
  12. Sincronizați-vă!: s-a observat că mișcările sincronizate duc la apariția sentimentelor de apropiere și de compasiune între oameni. Simpla bătaie a ritmului în mod sincron poate apropia doi oameni. Acest lucru se poate aplica și când vine vorba de atracția fizică sau romantică. Dansați sincronizați!
  13. Atingeri, atingeri: atingerea duce la producerea de oxitocină care are ca efect calmarea și creșterea armoniei sociale, precum și un sentiment de apropiere. Primatele nu se îngrijesc (groom) doar pentru a păstra igiena, ci pentru a îmbunătăți relațiile sociale. În cazul oamenilor (dar și al primatelor), zonele care produc mai multă oxitocină la atingere sunt gâtul și spatele. De aceea oamenii care merg la masaj au tendința de a avea încredere în masori;
  14. Pupilele: se dilată dacă persoana vede ceva interesant sau ceva ce îi place. Pupile nedilatate înseamnă de obicei lipsă de interes, plictiseală, frică, tristețe etc. Dacă pupilele a două persoane sunt „sincronizate” ca grad de dilatare înseamnă că au empatie mare una față de alta. Pupilele se mai dilată și când facem calcule (de exemplu 73×84), dar asta nu-i o problemă. Cel mai important pentru a observa reacțiile emoționale ale cuiva e să îi urmărim pupilele.

Dacă vreți să aflați mai multe, vă recomand:

Science of Attraction 

Science of Attraction: The Halo Effect

Richard Wiseman: http://richardwiseman.files.wordpress.com/2011/09/love.pdf (o variantă foarte scurtă a capitolului 5 „Attraction” din cartea 59 Seconds: Think a Little, Change a Lot);

Psychology Today, despre atingeri: http://www.psychologytoday.com/blog/the-attraction-doctor/201202/how-flirt-and-seduce-touch-part-1

Referințe:
[1]: Andrew J. Elliot et al., “Red, Rank and Romance in Women Viewing Men“, Journal of Experimental Psychology, Vol. 139(3), Aug. 2010, 399-407;
[2]: (a): J. Parker, M. Burkley, “Who’s chasing whom? The impact of gender and relationship status on mate poaching“, Journal of Experimental Social Psychology, Vol. 45, July 2009, pg. 1016; și Kevin Eva, Timothy Wood, “Are all the taken men good? An indirect examination of mate-choice copying in humans“, Canadian Medical Association Journal, Dec. 2006, vol. 175, no. 12;
(b): Simon Chu, “I like who you like, but only if I like you: Female character affects mate-choice copying“, Personality and Individual Differences, vol. 52, Apr. 2012, p. 691;
(c): David M. Buss, Sarah E. Hill, “The Mere Presence of Opposite-Sex Others on Judgements of Sexual and Romantic Desirability: Opposite Effects for Men and Women“, Personality and Social Psychology Bulletin, Mar. 2008, vol. 34, no. 5, p. 635;
[3]: Mark Prokosch et al., “Intelligence and mate choice: intelligent men are always appealing“, Evolution and Human Behavior, vol. 30, Jan. 2009, p. 11;
[4]: Matthew Cooper et al., “Chat-up lines as male displays: Effects of context, sex and personality“, Personality and Individual Differences, vol. 43, Oct. 2007, p. 1075;
[5]: V. Swami, M. Tovée, “Does hunger influence judgements of female physical attractiveness?“, British Journal of Psychology (2006), 97, 353-363;
[6]: Bosson, J. K., Johnson, A. B., Niederhoffer, K., & Swann, W. B., Jr. (2006). “Interpersonal chemistry through negativity: Bonding by sharing negative attitudes about others“. Personal Relationships, 13, 135–150;
[7]: Krumhuber, E., Manstead, A. S. R., & Kappas, A. (2007). “Temporal aspects of facial displays in person and expression perception: The effects of smile dynamics, head-tilt, and gender“. Journal of Nonverbal Behavior, 31, 39–56.;
[8]: Gonzaga, G. C., Turner, R. A., Keltner, D., Campos, B. C., & Altemus, M. (2006). “Romantic love and sexual desire in close bonds“. Emotion, 6, 163–179.;
[9]:Aron, A., Melinat, E., Aron, E. N., Vallone, R., & Bator, R. (1997). “The experimental generation of interpersonal closeness: A procedure and some preliminary findings“. Personality and Social Psychology Bulletin, 23, 363-377;
[10]: Meston, C. M., & Frohlich, P. F. (2003) “Love at first fright: Partner salience moderates roller coaster-induced excitation transfer“. Archives of Sexual Behavior, 32, 537-544;
[11]: Constantine Sedikides, Dan Ariely, and Nils Olsen, “Contextual and Procedural Determinants of Partner Selection: On Asymmetric Dominance and Prominence,” Social Cognition (1999);
[12]: David DeSteno, Piercarlo Valdesolo, “Synchrony and the Social Tuning of Compasion“, Emotion (2011), vol. 11, p. 262;
[13]: John T. Cacioppo & William Patrick, Loneliness, Human Nature and the Need for Social Connection [2009], W.W.Norton & Company, pg. 157-160;
Kerstin Uvnäs-Mober, “Oxytocin may mediate the benefits of positive social interaction and emotions” (1998), Psychoneuroendocrinology, vol. 23, p. 819-835;
[14]: http://en.wikipedia.org/wiki/Pupil#Psychological_effects ;
http://www.journalofvision.org/content/4/8/103.short

14 februarie, 2012 at 00:04 Scrie un comentariu

Older Posts


Articole recente

Categorii


Follow

Get every new post delivered to your Inbox.

Join 26 other followers

%d bloggers like this: