Kutatási adatok kezelése

A tudományos kutatás számára egyre fontosabb kérdéssé válik a kutatási adatok (tudományos adatok) kezelése. A kutatási adatok kezelésén értjük a tudományos adatok adatközpontokban való elhelyezését, fellelhetőségük, elérésük és újrahasznosíthatóságuk biztosítását, az adatok megosztásának lehetőségét.

A tudományos adatok nagyrészt a hagyományos akadémiai szféra (egyetemek, kutatóintézetek) kutatásaiból származnak. Az adatok részben önállóan, gyűjteményekben elhelyezve találhatók meg, részben pedig közvetetten pl. a publikációkhoz csatolva érhetők el. Mivel a kutatási adatok egyre terjedelmesebbek és összetettebbek, ezért ma már csak ritkán szerepelnek a publikációk részeként.

A kutatás kiterjedtsége és sokfélesége miatt a tudományos adatok kezelésének egyik legnagyobb kihívása az adatok szabad elérhetőségének biztosítása — akár utólagosan is. A nyílt hozzáférés fontos és szükséges az adatmanipuláció vagy adathamisítás elkerülése végett, illetve a kutatási eredmények hitelesítése és a kutatás reprodukálása miatt is.

Az adatközpontokban vagy adatbankokban rendszerezetten elhelyezett adatokhoz való nyílt hozzáférés olyan többletérték, amely mindenképp kifizetődő és teljesen új utakat nyit meg a kutatásban. (Kiemelkedő példát nyújtanak a GenBank és Protein Structure Data Bank adatbankok.)

A Berlin Declaration (magyar változat) egyaránt vonatkozik a kutatási adatokra és a publikációkra is.
Az adatokat rendszerezve és hálózatba foglalva adatcentrumokban vagy adatbankokban tárolják Az adatokhoz való nyílt hozzáférés olyan többletérték, amely mindenképp kifizetődő és teljesen új utakat nyit meg a kutatásban.Kiemelkedő példát nyújtanak a GenBank és Protein Structure Database adatbázisok.

Az adatokhoz való nyílt hozzáférés előnyei

  • Hitelesség:
    • az adatok, mint kutatási eredmények kritikai ellenőrzésen esnek át.
  • Gazdaságosság:
    • elkerülhető bizonyos kutatási munkák többszöri elvégzése;
    • az adatmegosztás révén meggyorsítható a kutatási folyamat;
    • a közösen épített és használt adatgyűjtemények költséghatékonyabbak.
  • Tudományosság:
    • a nyílt hozzáférés elősegíti az adatok újrahasznosítását. Így megvalósulhat (pl. további projektekben) az adatok és a belőlük korábban levont következtetések újabb, vagy átfogóbb tudományos kiértékelése;
    • különböző forrásokból származó adatok összegzése újabb tudományos felismerésekhez, eredményekhez vezethet;
    • az adatok összegyűjtésével és rendezésével létrejövő információs többletértékkel magas tudományos értékű adattermékek (pl. adattárházak, mutatórendszerek, adatvizualizációk) állíthatók elő.

Adatokhoz való nyílt hozzáférés elősegítése tudományos szervezeteken keresztül

Egyes szakterületekre (mint pl. az asztrofizika, energiafizika és a molekuláris biológia) jellemző, hogy az adatok keletkezésük után nagyon rövid idő elteltével hozzáférhetővé válnak. Az adatforrásokat, vagy a publikációkhoz tartozó adatokat egy központi adatbázisban vagy a publikációhoz csatolva bocsátják rendelkezésre.
Nemzetközi példák:
A Committee on Data for Science (CODATA), amely az International Council for Science (ICSU) alszervezete, illetve a minőségmenedzsment és a tudományos adatok cseréjének nemzetközi szervezete, a 2002-ben megjelent Principles for Dissemination of Scientific Data elveiben az adatok nyílt hozzáférését támogatja. Az OECD, a Committee for Scientific and Technological Policy (CSTP) támogatja a jogi és gazdasági érdekek figyelembevételével a kutatási eredmények nyílt hozzáférését a Declaration on Access to Research Data from Public Funding című nyilatkozatában. A National Institutes of Health (NIH) az 500.000 dollárt meghaladó támogatások odaítélését az adatmegosztás kötelezettségéhez köti.

Adatok megjelenítésének követelményei

A kutatási adatok hosszú távú elérésének biztosítása érdekében az alábbi minimum követelményeknek megfelelően kell az adatokat tárolni:

  • Hosszú távon elérhető azonosítók alkalmazása (Persistent Identifiers). A kedvelt azonosító a DOI.
  • Az adatok, illetve adatgyűjtemények leírása (metaadat-meghatározás). A metaadatok a tudományos publikációk illetve a tudományos adatokról szóló leíró adatok. A publikációt/adatokat kísérve, de azoktól függetlenül tárolva jelennek meg.
  • A forrásadatok és licencfeltételek rögzítése szintén szükséges az adatfájlokban és a publikációk/tudományos adatok metaadat-rekordjaiban is.