Adatrepozitóriumok

A tudományos kutatás során keletkezett kutatási adatok tárolásának módjáról, helyéről és formájáról nem csak a kutató dönthet. Ha az Ön kutatási területén belül léteznek adatkezelési szabványok vagy normák, akkor ezeket figyelembe véve kell a megfelelő adatrepozitóriumot kiválasztani. Sok esetben a kutatást finanszírozó intézet vagy projekt előírja, hogy az általa finanszírozott projektben létrehozott adatokat hol és hogyan kell tárolni.

Ha a kutató maga döntheti el, hogy hogyan kívánja feltárni, megőrizni és megosztani kutatási adatait, akkor a választás egyszerű lehet, ha már van egy jól működő adatrepozitórium az Ön intézményében.

Általánosságban elmondható, hogy a preferenciák figyelembe vételével a következő lehetőségei vannak egy kutatónak:

  • a kutatását finanszírozó intézmény előírása vagy ajánlása szerinti külső adatarchívum vagy adattár használata;
  • saját intézményi kutatási adatrepozitórium vagy a kutatócsoportja által létrehozott adatkezelési eszköztár (közös szerver, felhő szolgáltatás, stb.) használata;
  • költségmentes adat repozitórium használata, például a Zenodo-é,
    • A Zenodo az OpenAIRE és a CERN által létrehozott nyílt hozzáférésű repozitórium. A Zenodo lehetővé teszi a kutatók számára, hogy bármelyik témakörben 50 GB-ig terjedő fájlokat töltsenek fel. A Zenodoba mind a publikációk, mind pedig a kutatási adatok is feltölthetők, és a rendszer támogatja az egyes kutatási adatok és a hozzájuk kötődő publikációk kapcsolatának tárolását és megjelenítését, 2017 májusa óta pedig a verziókövetést is.
  • egyéb adatrepozitórium használata. A megfelelő adatrepozitórium kiválasztásában segítséget nyújtanak olyan adatrepozitóriumi keresők, mint pl. a re3data.org, az OAD lista, a PLOS lista, a Scientific Data által javasolt adattárak listája, illetve az Open Science Framework kutatói közösségi platform.
    • A re3data.org a kutatási adatrepozitóriumok globális nyilvántartója. Olyan általános és témaspecifikus adatrepozitóriumokat is tartalmaz, melyek megbízhatóan hosszú távon elérést kínálnak a kutatóknak, a finanszírozó szervezeteknek, a kiadóknak és a tudományos intézményeknek kutatási adataik tárolására.
    • Tematikusan rendezett adatrepozitórium lista az OAD, melyet a Simmons Főiskolai Könyvtár és Informatikai Iskola hosztol és felügyel egy független szerkesztőség segítségével.
    • A PLOS által létrehozott repozitóriumi lista, a saját tudományos közösségükben megbízható és elismert adatrepozitóriumokról.
    • A Scientific Data által javasolt adattárak listáján szereplő repozitóriumokat tudományos alapon értékelték annak tekintetében, hogy megfelelnek-e az adatokhoz való hozzáférés, a megőrzés és a stabilitás követelményeinek (FAIRsharing).

 

Az adatrepozitórium kiválasztásának szempontjai:

  • Ellátja-e a repozitórium a feltöltött tételeket állandó és egyedi azonosítóval (pl DOI)? Ez alapvető fontosságú a hosszútávú eléréshez, és annak biztosítására, hogy a különböző kutatási projektekből származó kutatási eredmények hozzácsatolhatók legyenek a megfelelő kutatókhoz és a támogatásokhoz.
  • Ellátja-e a repozitórium a feltöltött tételeket megfelelő mennyiségű és minőségű metaadattal, amelyek biztosítják a kutatási adatok visszakereshetőségét, megjelenítik a megfelelő publikációkhoz való kapcsolatát, és biztosítják az idézés lehetőségét, és a kutatási adatok újrahasznosítását?
  • Segít-e a repozitórium nyomon követni az adatok felhasználásának módját a hozzáférési és letöltési statisztikák megadásával?
  • „Megbízható adatrepozitórium”-nak minősül-e?
  • Megfelel-e a konkrét adatigényeknek? (Mik a feltölthető formátumok, van-e biztonsági mentés és helyreállítás, stb.) Ezen információkat meg kell, hogy találjuk az adatrepozitórium oldalán.
  • Egyértelmű és a jogi szabályozásnak megfelelő feltételeket kínál-e a kutatók számára adataik elhelyezéséhez?
  • Ad-e iránymutatást, segítséget a feltöltött adatok hivatkozására?
  • Fizetős szolgáltatást nyújt, vagy ingyenesen elérhető?
  • Általános vagy témaspecifikus adatrepozitóriumban szeretnénk elhelyezni kutatási adatainkat?
    • Előbbire jó példa a már ismertetett Zenodo,
    • Utóbbira a UCI Machine Learning Repository. Ez utóbbi a mesterséges intelligencia gépi tanulás témakörére specializálódott adatrepozitórium. Elsősorban a gépi intelligencia alkalmazása révén született, vagy az algoritmusok által feldolgozott adatset-ek találhatók itt. Az informatikus kutatói közösség számára primer adatforrásként is használható repozitórium népszerűségét mi sem bizonyítja jobban, mint az itt fellelhető adatok több, mint 1000 hivatkozása. Metaadatok tekintetében az egyes repozitóriumi tételek oldalán nagyon részletes specifikációt is találunk, a tételekhez kötődő publikációkat is láthatjuk, amelyek az adatokat elsődleges forrásként használják, és külön az idéző publikációkat is.

Nyílt hozzáférésű adatrepozitóriumok

Az adatok nyílt hozzáférésének támogatása a széleskörű kutatás miatt megfelelő infrastruktúrát kíván meg. A nyíltan hozzáférhető kutatási adatok és adathalmazok kezelésének, hozzáférhetőségének és újra felhasználhatóságának kérdését, a metaadatokkal és DOI azonosítóval való ellátását egyre több adatrepozitórium biztosítja. A megfelelő adatközpontok kiépítéséért a támogató intézmények, egyetemek és nyilvános kutatási intézetek felelősek, illetve illetékesek. Az ő felelősségi körükbe tartozik a megfelelő adatok és információk kiválasztására, hozzáférésére és használatára vonatkozó irányelvek (Policies) megfogalmazása.