Visitor Counter

ponedjeljak, 24. veljače 2020.

Povezanost korištenja riječi "utjecaj" i svjesnosti razlike između "utjecaja" i "povezanosti

Uvod
Iako je iz naslova sve jasno, dopustite da pobliže objasnim.  Nažalost, u ovom postu neće biti puno slika (tužan smajlić) ali je bitno za sve dalje što slijedi. I pritom sam savršeno svjestan da nisam još pričao o korelaciji (sinonim za povezanost) ali budem.

Jedno od prvih spominjanja ove (učestale) zabune dogodio se u 30-im godinama 20. stoljeća. Direktor je htio povećati učinkovitost svojih radnika (jer naravno, uvijek može bolje) u tvornici tako da im pojača svjetlo, smanji buku, preraspodjeli kutije po skladištu itd... U tu svrhu naručio je istraživače da ispitaju taj problem. Da smo mi ti istraživač, kako bismo pristupili problemu? Ajmo probat sumirati ono što znamo dosad iz ovih blogova.

1) Što sve moramo izmjeriti?
2) Na kojim skalama mjerimo navedeno?

1) Kao prvo, moramo izmjeriti učinkovitost. Ona nam je bitna, nju želimo ispitati, o njoj želimo znati sve što možemo (npr. kako se mijenja s promjenom neke druge varijable, kako se povećava a kako snižava), iako nismo još o tome govorili ona nam je zavisna varijabla. Također, moramo izmjeriti ostale stvari koje utječu na učinkovitost. Za sad ćemo se zadržati na mjerenju buke. Nju mjerimo u decibelima. Mala napomena, mi nećemo zapravo mjeriti buku već ju mijenjati (manipuliramo njome). Naravno da moramo izmjeriti količinu buke koju ćemo varirati ali to nam je poznat podatak (i prije eksperimenta znamo kolika će biti jer mi njome upravljamo) te je nazivamo nezavisna varijabla.

2) Na kojim skalama se mjere navedene stvari? Pa zavisi (vidjet ćete da je to najdraža uzrečica svih znanstvenika). Ajmo od nezavisne varijable krenuti. Nisam fizičar ni tome slično pa sam zagooglao decibel i saznao da se mjeri na intervalnoj skali zato što može ići i u minus (čim nešto može biti minus znači da nije omjerna skala). Čisto da dobijemo dojam o rasponu nekih vrijednost, buka koja izaziva običan razgovor iznosi oko 60 dB a sirena hitne pomoći zavija oko 120 dB a npr. Maria Sharapova prilikom udarca u tenisu uzvikne glasnoćom od 120 dB. Recimo da smo izmjerili da je trenutna buka u skladištu u kojem provodimo testiranje 80 dB i smatramo da njenim sniženjem možemo povećati učinkovitost. Kako nemamo 30 skladišta (kad bismo imali tada bismo u jednoj testirali efekt buke od 79 dB na učinkovitost, u sljedećem od 78 dB na učinkovitost itd.) nego eventualno 2 ili 3 onda ćemo usporediti učinkovitost kod visoke buke (80 dB) i niske buke (50 dB). Ovisno o tome kako ćemo kodirati (prilikom unosa u Excel ili SPSS) buku ćemo izraziti na ordinalnoj skali (ako je navedemo kao visoku-nisku) odnosno na intervalnoj (ako je navedemo kao 50 i 80 dB).
Učinkovitost isto ovisi o nama kako ćemo je definirati. Ako je definiramo kao broj kutija koje naprave tokom dana onda govorimo o omjernoj skali a ako je definiramo kao radnikovu samoprocjenu svoje učinkovitosti tada je intervalna (uvijek ću napomenuti da je to zapravo ordinalna ali da se mi pravimo da je intervalna).

Zaplet
I? Što se dogodilo u pravom istraživanju? Sjetimo se, istraživači su uspoređivali njihovu trenutnu učinkovitost (sve kako je, zapravo nisu ni došli u tvornicu jer su već imali podatke) i učinkovitost kad su im prilagodili okolinu kako bi smanjili buku. Opazili su ono što se danas naziva Hawthorne efekt. Dok su istraživači bili u prostoriji i namještali skladište, bilježili podatke itd. - učinkovitost je bila visoka. Čim su oni napustili tvornicu (jer su namjestili sve za buku kako treba) učinkovitost se vratila na početnu razinu. Istraživači nisu to odmah prmijetili. Prvi zaključak je bio - manje buke, veća učinkovitost. Dapače, rekli su da jačina buke utječe na učinkovitost radnika. Prije nego objasnim zašto ne utječe nego (ako i to) može eventualno biti povezana dopustite da vas pitam da se sjetite nečega što utječe na nešto (bilo čega). Jeste? Niste? Super. Evo vam slike da vam pokažem da sam stvarno mislio na bilo šta.
Ovo je namjerno iskarikiran primjer.

Važna napomena! 
Nije savršen jer zapravo između okreta tog gumba i eventualne glasnoće radia događa se jako puno stvari (koje za ovaj primjer držim konstantnima poput struja, upaljen auto, ispravan radio itd...) koje utječu na to hoće li pomak gumba izazvati promjenu u glasnoći ali poruka koju želim prenijeti je da je utjecaj onda kada je promjena u zavisnoj varijabli (glasnoća radia ili učinkovitost radnika) izazvana (samo, jedino i isključivo) našom manipulacijom nezavisne varijable (dugmeta na radiu ili svjetline radnog prostora). Za više o ovom svemu preporučam Shadish, Cook i Campbellovu knjigu Experimental and Quasi Experimental Designs for Generalized Causal Inference iz 2002. Tek kad sam napisao ovaj primjer sam vidio da i oni navode primjer da je zapaljena šibica uzrokovala požar. Je ali požar je mogao biti izazvan na razne druge načine, isto tako šibica je morala dovoljno dugo goriti, lišće je moralo biti dovoljno suho da uhvati vatru i moralo je biti dovoljno kisika da vatra opstane. Zamislite koliko je stvari u tako jednostavnom slučaju se moralo posložiti da bi ta šibica utjecala na pojavu požara!

Nazad na buku i učinkovitost. Naivan istraživač bi rekao: "Direktore, stavite svima slušalice na uši da ne čuju ništa i imat ćete maksimalno učinkovite radnike." Manje naivan istraživač bi rekao: "Direktore, zaposlite dva glumca u bijelim kutama da se šetaju po skladištu i bilježe nešto i tako ćete imati maksimalno učinkovite radnike." Najmanje naivan istraživač bi rekao: "Direktore, pogrješili smo u nacrtu, nismo kontrolirali činjenicu da bi se ljudi mogli drukčije ponašati u situaciji kada misle da ih se testira, dopustite da ispravimo grešku na način da postavimo uređaje koji se neće vidjeti kako bismo izmjerili učinkovitost radnika bez da ih stavljamo u testnu situaciju".

Ubrzo završavam jer mi se čini da bi ovo moglo do vijeka trajati. Tri uvjeta moraju biti zadovoljena prema John Stuart Millu a navode ga Shadish, Cook i Campbell (2002), joše jednom napomena - stvarno super knjiga, kako bismo mogli ustvrditi da jedna stvar utječe na drugu:
1) kovarijacije
2) redoslijed u vremenu
3) eliminacija alternativnih plauzibilnih objašnjenja.
Ja ću ovo svojim riječima prepričati u nadi da će uspjeti skicirati zašto je to važno. Za cijelu sliku obratite se Shadishu i kolegama.

Kovarijacija (smatrajte ovo točanjem noge u more korelacije)
Prvi i temeljni preduvjet je da su dvije stvari povezane. Dakle, iako je mantra u znanosti da "Correlation does not imply causation", kažu da "Korelacija ne implicira postojanje uzročne veze, ali sugestivno mrda obrvama, kima glavom u tom smjeru i oblikuje usnama "pogledaj tamo"." Dakle, ako je glasnoća radija jednaka bez obzira koji žmigavac ja upalio - vrlo je vjerojatno da žmigavac ne utječe na glasnoću radia. Ako uočimo da podjednak broj starih i mladih ljudi jednako jako želi kupiti novi iPhone - tada ne možemo reći da dob utječe na želju za kupnjom mobitela. Dovoljno za sad.

Redoslijed u vremenu
Upravo ono što ime kaže, kako bismo ustvrdili da prihod utječe na inteligenciju morali bismo (nakon što smo pokazali da npr. bogatiji ljudi imaju višu inteligenciju) moći ustvrditi da ljudi prvo postanu bogati pa tek onda inteligentni (djeluje li vam ovo malo iskarikirano? I nije baš, često se upravo ovakvi primjeri navode uz glagol utjecaj. Netko može sasvim opravdano tvrditi da je zapravo inteligencija uzrok a prihod posljedica...). Zamislimo da netko ustvrdi da znojenje uzrokuje vježbanje. Što biste mu odgovorili? Da je to nemoguće, jer prvo vježbaš pa se znojiš! Kad god netko kaže da A utječe na B, promislite bi li imalo smisla reći da B utječe na A. Ako vam se samo učini da ima smisla, već je dovoljno da nećete reći da A utječe na B nego eventualno da su povezani.

Eliminacija alternativnih plauzibilnih objašnjenja
Ono što razlikuje eksperiment od ostalih metoda je ovo. I kovarijaciju, pa donekle i redoslijed u vremenu (npr. spol nužno prethodi tome hoće li netko postati majka ili otac) možemo ispitati upitnicima i kojekakvim stvarima. Međutim, ono što eksperiment čini posebnim je eliminacija alternativnih plauzibilnih objašnjenja- Recimo da moji roditelji imaju neki šugavi mobitel (neki Alcatel iz 2004.) i da ja imam šugavi mobitel (Alcatel ali iz 2014.) i recimo da od kolege roditelji imaju iPhone 12 i da on ima iPhone 12 i većina ljudi u našem uzorku pokazuje ovakav obrazac. Naivan istraživač bi zaključio: "Preferencije u odabiru mobitela vaših roditelja utječe na marku mobitela koji ćete vi posjedovati!". Ovakav sličan nalaz biste lako mogli negdje pročitati. I kad bismo proveli upitnik u kojem bi ispitivali koji mobitel ima dijete a koji mobitel ima roditelj - što drugo možemo zaključiti. No, kako postajemo sve manje i manje naivni (a samim tim sve više i više kritični) mogli bismo se zapitati da nije možda da socioekonomski status roditelja utječe na to koliko novca mogu izdvojiti za telefon (i svoj i svog djeteta)? Ili možda roditelji više cijene iskustva nego materijalne stvari pa radije novac ulažu u putovanja i znanje a manje u mobitel te su takvo nešto usadili svom djetetu koje također više važnosti pridaje nematerijalnom? Ova dva potonja razloga su alternativna plauzibilna objašnjenja veze dviju varijabli (cijene mobitela roditelja i cijene mobitela djeteta). Primjer alternativnog neplauzibilnog objašnjenja bi bio da djeca imaju cjenovno slične mobitele kao i njihovi roditelji jer Djed Božićnjak dijeli jednu te istu marku mobitela i djetetu i roditeljima za Božić. Ovo nije plauzibilno objašnjenje odnosno ono nije vjerojatno (jer nije moguće da su roditelji i djeca bili jednako dobri tokom godine da baš iste mobitele dobiju).

Rasplet
Umjesto zaključka. Što smo danas naučili? Da je užasno (užasno, užasno) teško dokazati da nešto utječe na nešto drugo. S druge strane prilično je lako pokazati da su dvije stvari povezane. A to je potreban ali nedovoljan uvjet za uspostavljanje uzročno-posljedičnih odnosa. Jedan primjer s faksa za kraj. U 2011 izašlo je (jedno od prvih) retrospektivno istraživanje o povezanosti (ne o uzrok-posljedica) korištenja mobitela i kvalitete spermija kod muškaraca. Nalaz je bio (uz autorovu napomenu da je potrebno provesti dodatna preciznija i stroža ispitivanja) da korištenje mobitela negativno utječe (da, napisali su affects odnosno utječe) na kvalitetu spermija. Zastanimo na trenutak i procijenimo njihov zaključak prema kriterijima kauzalnosti. Ok, oni su ustvrdili da postoji povezanost, ispitanici koji su koristili mobitel su imali manje kvalitetne spermije. Vremenski redoslijed, je li moguće da ljudi koji imaju manje kvalitetne spermije u većoj mjeri koriste mobitel? Pa ne djeluje apsolutno nemoguće mada djeluje malo manje plauzibilno nego bih volio (ne znam kako bih objasnio takav nalaz, niti intuitivno). Treće, i najvažnije, eliminacija alternativnih plauzibilnih objašnjenja. Jedno alternativno objašnjenje je da postoje neki zajednički geni koji utječu na kvalitetu spermija i količinu korištenja mobitela (isto mi se ne čini baš vjerojatno ali ne čini se ni apsolutno nemoguće). Ono što je jedan profesor moj predložio je da objašnjenje možda leži u evolucijskoj psihologiji. Npr. muškarci nakon duljeg vremena što nisu vidjeli svoju dragu imaju povećan broj spermija (Buss u svojoj knjizi Evolutionary psychology - the new science of the mind iz 2014 [ne znam koje izdanje po redu, mislim treće] navodi nalaze Bakera i Bellisa iz 1995). Da budemo precizniji, muškarac koji je u promatrano vrijeme proveo 100% vremena s partnericom u prosjeku je "izbacio" oko 390 milijuna spermija dok je muškarac koji je proveo 5% vremena s partnericom u promatranom razdoblju "izbacio" 710 milijuna spermija u ejakulatu (skoro dvostruko, a mjereno je na omjernoj skali pa smijemo to reći). Znajući sve to možemo predložiti da je alternativno plauzibilno objašnjenje to da postojanjem mobitela smanjujemo dojam udaljenosti od svojih partnerica što posljedično dovodi do smanjenja broja spermija. Dakle tada bi to utjecalo na manji broj spermija a ne zračenje mobitela.

Kao i uvijek, nadam se da smo upamtili da je najsigurnije reći da su dvije stvari povezane (ako jesu zaista povezane) a zaključke o uzročno-posljedičnom odnosu tih varijabli donositi uz maksimalan oprez.

Do sljedećeg puta, kad god to bilo!
Matia

Nema komentara:

Objavi komentar