Politica datelor deschise
NEW YORK – Ideea de date deschise a ajuns în mainstream. Totuși, în ciuda beneficiilor multiple ale publicării de date gratuite, mai sunt multe de făcut până să ajungă o practică răspândită.
În ultimii cinci ani, mari finanțatori publici și privați ai programelor de cercetare - inclusiv Fundația Bill & Melinda Gates, Wellcome Trust, National Institutes of Health (NIH) și NASA - au instituit politici de “data-sharing” iar administrațiile naționale, statale și municipale din Statele Unite au promovat portalurile de date deschise. Publicațiile academice au adoptat și ele politica datelor deschise iar unele publicații științifice au luat măsuri care încurajează sau chiar pretind utilizarea în comun a datelor.
Dar practica utilizării în comun a datelor a stagnat. În raportul Figshare din 2017 se arată că 60% din cei 2.300 de cercetători intervievați au declarat că își fac publice datele “frecvent sau uneori” și doar 20-30% au declarat “frecvent.” Un alt studiu recent efectuat pe 1200 de cercetători a descoperit că “mai puțin de 15% dintre aceștia își pun datele într-un data repository (arhivă electronică specializată).” Accesul la date nu este regula în domeniul meu de activitate - științele sociale.
În mod clar, abordarea preponderentă de promovare a datelor deschise - dacă le ordoni, vor publica datele - nu funcționează. Pentru a produce schimbarea, cercetătorii înșiși trebuie să îmbrățișeze principiul datelor deschise.
Iar pentru asta este nevoie de informare corectă și de stimulente. Pe scurt, avem nevoie mai mult de recompense decât de sancțiuni.
În realitate, cerința de a publica datele este o sancțiune. La fel și replicarea, un alt argument în favoarea publicării datelor. Bineînțeles, replicarea studiilor este crucială iar știința suferă acum o criză a replicării. Dar, într-un sondaj din 2016 făcut pe un eșantion de 4600 de cercetători, doar 31% dintre cei care și-au publicat datele au declarat că au fost motivați de “transparență și reutilizare.”
Principalele motive pentru care cercetătorii ezită să-și facă publice datele, conform aceluiași studiu, țin de proprietatea intelectuală, confidențialitate, teama de interpretare sau utilizare greșită sau furtul de idei. Din cauza modelului “publici sau dispari” care definește cariera academică și a mediului competitiv de finanțare a cercetărilor, indivizii profită mai mult când “dețin” datele pe care se bazează cercetarea lor decât atunci când le pun la dispoziție și altora.
E momentul să schimbăm discuția despre “data sharing” de la ce pot pierde cercetătorii la ce pot ei să câștige. Vestea bună este că publicațiile de date unde își pot publica cercetătorii seturile de date sunt deja în expansiune. Numărul de citări în trei dintre cele mai mari publicații cu acces deschis (Data in Brief, Biodiversity Data Journal, și Scientific Data) au crescut de la 3 în 2012 la 1.028 în 2016.
Alt stimulent este că prin data sharing se maximizează randamentul investiției pentru cercetător și pentru finanțator. În acest moment, registrele de studii și
portalurile de date disparate fac dificilă găsirea unor proiecte similare de către cercetătorul individual care colectează date pentru a fi publicat în jurnale cu impact mare. Acest lucru crește riscul ca timpul cercetătorului și banii finanțatorului să se piardă pe proiecte care se suprapun cu ale altui cercetător.
În mod similar, pentru o evaluare randomizată în Zambia la care am lucrat, eu și colegii mei am colectat date despre aproximativ 2.500 de adolescenți și tineri. Pentru a respecta condițiile puse de finanțatorul proiectului, noi publicăm rezultatele obținute din utilizarea a 10% din date în reviste științifice cu evaluare inter-pares. Însă nu avem fondurile necesare pentru a analiza și restul informațiilor din setul de date (o problemă des întâlnită de cercetători). Dacă accesul la datele noastre neutilizate ar fi deschis, am putea atrage noi colaboratori și am am putea genera analize mai solide.
Folosirea datelor deschise existente oferă posibilitatea cercetătorilor să formuleze întrebări inovative și obiective de cercetare care sunt mult mai probabil să conducă la descoperiri cruciale. Dincolo de accelerarea progresului, colaborarea bazată pe data sharing amplifică abilitatea cercetătorilor de a obține finanțarea necesară pentru că finanțatorii sunt atrași de munca inovativă, interdisciplinară.
Totuși, pentru a beneficia de data sharing, finanțatorii trebuie să-și schimbe și ei mentalitatea și să investească mai mult în colectarea și managementul de calitate a datelor în timpul implementării proiectelor precum și să susțină finanțarea arhivării și analizei continue a seturilor de date. Cercetătorilor trebuie să li se ofere
timpul și resursele necesare pentru a scoate tot ce este posibil din datele pe care le colectează.
Un alt efect pozitiv obținut prin data sharing este susținerea cercetătorilor în viitor, când aceștia vor putea folosi datele colectate deja în alt scop. La începutul carierei mele la NIH (National Institutes of Health) am avut norocul să am acces la multiple seturi de date interne ale cercetătorilor de la NIH și Johns Hopkins University și am petrecut doi ani făcând analize secundare asupra acestor date. Pe baza unor lucrări anterioare am reușit să public o serie de studii care mi-au impulsionat cariera în cercetare.
Pe lângă stimulentele pentru cercetători și finanțatori, este nevoie de o schimbare fundamentală în cultura științifică pentru a accelera progresul științific, iar în prezent există mai multe inițiative promițătoare în acest sens.
De exemplu, Center for Open Science promovează deschiderea, integritatea și reproductibilitatea cercetării științifice. The Berkeley Initiative for Transparency in the Social Sciences furnizează date deschise și formare în domeniul transparenței cercetării pentru a consolida integritatea cercetării și utilizarea dovezilor științifice în elaborarea politicilor. Cochrane-REWARD prize încearcă să maximizeze utilizarea fondurilor de cercetare din care se risipesc anual aproximativ 170 de miliarde de dolari.
Aceste inițiative sunt eficiente însă este nevoie de mai mult pentru a face ca cercetătorii să devină forța motrice a fenomenului data sharing. Girl Innovation, Research, and Learning Center, centrul global de cercetare a
adolescenților pe care îl conduc în cadrul organizației Population Council, construiește cel mai mare Adolescent Data Hub din lume, un portal global unic unde cercetătorii și organizațiile pot publica și accesa date cantitative de calitate despre peste un milion de indivizi.
Credem că datele deschise pot accelera transparența cercetării și soluțiile inovative cu impact semnificativ asupra vieților celei mai numeroase generații de adolescenți - 1,2 miliarde de persoane. Și mai credem că, pe măsură ce practica datelor deschise se răspândește, beneficiile colaborării pe care aceasta o permite se vor extinde tot mai mult.
(Un articol apărut în The Project Syndicate sub semnătura lui Thoai Ngo)
- Etichete:
- date deschise