W dzisiejszych czasach w Waszyngtonie często słyszy się terminy „dobra nauka”, „dowody” i „dane”. Jednym z chwytliwych zwrotów w kręgach zajmujących się tworzeniem polityki jest „oparta na dowodach”, stosowana do wielu treści, w tym edukacji, polityki, praktyki, medycyny, a nawet architektury. Można by pomyśleć, że to nas wszystkich ucieszy – przynajmniej tych, którzy opowiadają się za tym, by decyzje dotyczące polityki, interwencji społecznych i przyszłych kierunków opierały się na danych. Ale, jak na ironię, nowy nacisk na to i owo oparte na dowodach został jednocześnie przyjęty z zadowoleniem i powitany z podniesionym poziomem niepokoju i czerwonymi flagami obaw.
Dlaczego tak się dzieje?
Jednym z powodów jest to, że czasami definicja „dobrej” nauki, która ma informować o polityce, wydaje się zabarwiona podtekstem politycznym. Tak więc, na przykład, niektórzy naukowcy skarżyli się, że chociaż Kongres i administracja regularnie wzywają do opierania się na najlepszej nauce, to jednak manipulują tą nauką – wybierają naukę, która im się podoba, przedstawiają ją w sposób, którego żaden naukowiec by nie zrozumiał, lub ustawiają poprzeczkę tak wysoko, że żadne badanie naukowe nie jest w stanie jej sprostać. Prawdopodobnie najlepszym przykładem są zmiany klimatyczne, ewolucja i kwestie środowiskowe – chociaż solidna nauka (jedna z definicji „dobrej nauki”) osiągnęła konsensus w sprawie danych i implikacji politycznych, istnienie kilku osób, które twierdzą inaczej, daje początek polityce, która wydaje się mówić, że fakty są nadal wątpliwe.
Pozwólcie mi teraz zwrócić się do nauk behawioralnych i społecznych. Chociaż istnieją z pewnością polityczne podteksty do niektórych kwestii, którymi zajmują się nauki behawioralne i społeczne (świadkiem jest niedawny pakiet zapytań do nauki o zachowaniach seksualnych lub nierówności w zdrowiu), istnieją inne obawy związane z ruchem „opartym na dowodach” poza areną polityczną. Kwestie te wahają się od obaw o sposoby, w jakie dowody są definiowane, do obaw, że eksperymentalne projekty są niewłaściwie reifikowane jako metodologia, która automatycznie daje „najlepsze” dowody.
Część niepokoju z obecnym ruchem opartym na dowodach może wynikać ze zrozumiałego przesiedlenia, gdy zmiany w finansowaniu i krajobrazie polityki stają się bardziej jasne (jednym z dobrych przykładów jest nowe portfolio badawcze Instytutu Nauk o Edukacji). Ale wiele z tych niepokojów wydaje się opierać na bardziej fundamentalnych kwestiach, które dotyczą tego, jak rozumiemy badania, świat i naukę.
Pozwólcie, że poruszę tylko kilka z tych podstawowych kwestii.
W niektórych dyskusjach na temat tego, co to znaczy być „opartym na dowodach”, losowy przydział i kontrola eksperymentalna (a.k.a. random controlled trials) są utrzymywane jako złoty standard. To podnosi czerwoną flagę dla wielu, którzy prowadzą badania, które nie są tego rodzaju. Naukowcy, którzy prowadzą badania jakościowe, quasi-eksperymentalne lub historyczne, ze zrozumiałych względów są zaniepokojeni sugestią, że tylko eksperymenty kwalifikują się jako prawdziwa nauka. Jednym z powszechnych argumentów przeciwko reifikacji eksperymentów jest to, że wiele dowodów, które uznajemy za niepodważalne, nie jest eksperymentalnych – dowody z takich dyscyplin jak epidemiologia czy astronomia, na przykład. A wiele rozsądnej polityki opiera się na danych korelacyjnych, a nie eksperymentalnych, takich jak dane dotyczące związku między używaniem tytoniu a rakiem. Chociaż nauka, do której odnoszą się te argumenty przeciwko reifikacji kontroli losowej, jest solidna, uważam, że argumenty te mimo wszystko mijają się z celem. W moim rozumieniu zawsze było tak, że kiedy projekt eksperymentalny (w tym losowy przydział) jest uznawany za złoty standard, to nie dotyczy to całej nauki, ale badań interwencyjnych – kiedy celem, w najprostszym przypadku, jest „utrzymanie wszystkiego na stałym poziomie” z wyjątkiem jednej zmiennej, aby umożliwić jasne wnioskowanie przyczynowe. W przypadku wielu pytań z zakresu nauk behawioralno-społecznych, zmienna może być dużo bardziej złożona – program, interwencja społeczna, itd. To, że ten złoty standard może pozwolić na jasne wnioskowanie przyczynowe (i jest jedynym standardem dla jednoznacznego wnioskowania przyczynowego) nie oznacza, że inne metody nie mogą również dostarczyć ważnej wiedzy, zwłaszcza systematyczny opis, kategoryzacja lub korelacja.
Innym obszarem niepokoju jest to, że nawet jeśli ktoś chciałby zastosować taki standard, projekty eksperymentalne mogą być nieodpowiednie lub niemożliwe w wielu złożonych, wielowymiarowych kontekstach, w których potrzebne są odpowiedzi, ponieważ takie metody byłyby niemożliwe, niepraktyczne lub nieetyczne do spełnienia. W wielu środowiskach, na przykład, losowy przydział osób do programów, klas, sąsiedztw, rodzin lub leczenia jest często niemożliwy, a losowy przydział programów do grup takich jak szkoły, zespoły lub miejsca leczenia może być niewykonalny. Czy jest to powód do niepokoju? Jest to oczywiście przykład klasycznej różnicy między skutecznością a efektywnością – między stwierdzeniem, czy coś działa w laboratorium lub w dobrze kontrolowanych warunkach, a tym, czy działa w praktyce, w nieporządnym, codziennym świecie. W opiece zdrowotnej, jednej z dziedzin, w których kwestie bazy dowodowej zostały najdokładniej przedyskutowane, wnioski są takie, że oba są konieczne, i że trzeba być sumiennym w dopasowywaniu wniosków do projektu. A w medycynie, podobnie jak w psychologii, zastosowanie wiedzy w praktyce musi być zawsze tańcem najlepszych dostępnych informacji i osądu ekspertów.
Jeśli wyjdziemy poza psychologię, istnieją szersze obawy – standardowe metody siostrzanych dyscyplin nauk społecznych nie są zazwyczaj eksperymentalne. Weźmy na przykład antropologię, ekonomię czy badania ankietowe. Dane zebrane przez ekonomistów, antropologów czy socjologów często wpływają na decyzje polityczne. Jednak dane te rzadko mają charakter eksperymentalny. Lekcja płynąca ze spojrzenia na różne dyscypliny, pytania i konteksty jest taka, że różne projekty mogą być odpowiednie dla różnych pytań, zachowań lub sytuacji. Oczywiście ważne jest, abyśmy dążyli do stosowania najbardziej rygorystycznego projektu, jaki jest odpowiedni i możliwy do zastosowania w danym przypadku, oraz abyśmy przekazywali decydentom znaczenie tego rygoru.
Ponieważ kwestie oparte na dowodach są tak gorące i tak ważne dla wszystkich psychologów, od badaczy po praktyków, szczególnie cieszy fakt, że Narodowa Akademia Nauk rozpoczyna inicjatywę mającą na celu pomoc w zdefiniowaniu standardów dowodowych w naukach behawioralnych i społecznych, pomoc w pytaniu, jak dopasować dowody do pytania i kontekstu, oraz pomoc w poprawie przełożenia badań na politykę. Inicjatywa ta rozpocznie się w tym miesiącu od „Workshop on Policy Making: How Behavioral and Cognitive Scientists can Contribute…” i będzie kontynuowana pytaniami, które dotyczą podstaw dowodowych nauk behawioralnych i społecznych oraz stopnia, w jakim dyskusje o dowodach w innych dyscyplinach (np, medycyna, fizyka i tak dalej) dostarczają pouczających modeli.
Jasne jest, że dyskusje na temat definicji dowodów, rozróżnienia między rodzajami dowodów (w tym danych naukowych, opinii ekspertów, obserwacji i teorii) oraz konsensusu co do tego, kiedy czego używać, będą nas zajmować przez jakiś czas. Psychologia musi być aktywnym uczestnikiem tej dyskusji. Musi wnieść swój unikalny wgląd jako dyscyplina, która zbudowała swoją podstawową naukę na solidnych metodach eksperymentalnych, która nieustannie zmaga się z przejściem od podstawowej nauki laboratoryjnej do nauki stosowanej, która próbuje przełożyć naukę na zastosowanie i praktykę, i która promuje znaczenie podstawowej bazy naukowej, która jest istotna dla zastosowania.