Tanulságok az ELKH-HRDA adatrepozitórium pilot projektek végrehajtása alapján

Tanulságok az ELKH-HRDA adatrepozitórium pilot projektek végrehajtása alapján NWS2022 - Holl A. - Adatrepozitórium pilot projektek
Tanulságok az ELKH-HRDA adatrepozitórium pilot projektek végrehajtása alapján
Holl András
MTA Könyvtár és Információs Központ
NETWORKSHOP, 2021 április
NWS2022 - Holl A. - Adatrepozitórium pilot projektek
Az Eötvös Loránd Kutatási Hálózat
Titkársága a kutatási adatok kezelésére való felkészülés támogatására egy éves projektet indított. A projekt szakmai támogatását a Research Data Alliance magyar tagozatának segítségével biztosította, és a lebonyolítását, és a költségvetés
kezelését az MTA Könyvtár és Információs Központ végezte 2021- ben.
NWS2022 - Holl A. - Adatrepozitórium pilot projektek
- Kutatási adatkezelési pilot projektek az ELKH kutatóközpontjai, intézetei és kutatócsoportjai számára
- 7 támogatott pályázat
- Sokcsatornás, nagy téri felbontású in vivo elektrofiziológiai adatok archiválása
TTK Kognitív Idegtudományi és Pszichológiai Intézet Integratív Idegtudományi Kutatócsoport
- A Társadalomtudományi Kutatóközpontban (illetve annak jogelődjében) végzett kutatások veszélyben lévő kutatási adatainak megóvása TK Kutatási Dokumentációs Központ
- Régészeti rajzgyűjtemény kutatási adatainak feltárása és FAIR közreadása
BTK Régészeti Intézet
- Kis dózisoknál megfigyelhető hiperszenzitivitással és indukált sugárrezisztenciával kapcsolatos adatok gyűjtése és közzététele
EK Energia- és Környezetbiztonsági Intézet Környezetfiz. Labor Sugárbiofizikai Kcs.
- Fúziós kísérleti adatok tárolása és metaadatolása a FAIR elveknek megfelelően
EK Fúziós Plazmafizika Laboratórium
- Az OpenBioMaps biológiai adatbázis
keretrendszer publikus adatrepozitórium "láb" fejlesztésére
ELKH-DE Viselkedésökológiai Kutatócsoport
Funkcionális anyagok adatainak archiválása
Wigner FK Részecske- és Magfizikai Intézet Nukleáris Anyagtudományi Osztály
Példa nélkül álló kedvezményezés
Ami már követelmény: adatkezelési tervek benyújtása
Kismértékű hazai kitettség a FAIR adatkezelést illetően
A pilot projektek látványosan demonstrálták a kutatási adatok és kezelésük diverzitását. Nemhogy tudományterületek és -ágak között, de többnyire ugyanazon témában is alapvetően eltérő adattípusok fordulnak elő, melyek kezelése eltérő megközelítést kíván.
- Az Energiatudományi Kutatóközpont
Fúziós Plazmafizikai Laboratóriuma által megvalósított projektben a videodiagnosztikai és a nyalábemissziós spektroszkópiai mérésekben keletkező adatok mennyisége és feldolgozása is különböző. E projekt esetében a tárhely szükséglet nagyságrendekkel haladta meg más projektekét - a tárolás és az adatmozgatás aspektus különbözteti meg a többitől. A nemzetközi szervezetek szabványosítási törekvéseibe való
bekapcsolódás lehetősége is megjelent itt. Ugyancsak e projekt részeként valósult meg publikált cikkek kiegészítése mérési adatokkal.
- A Régészeti Intézet projektje
archív rajzdokumentáció digitalizálását, leírásának fejlesztését és adatrepozitóriumba helyezését célozta. Ennél a projektnél erőteljesen megjelent a történeti aspektus (nem a kutatott korszakokat, hanem a kutatás történetét tekintve): a hagyományos rajztár sok évtizedet felölelő, ugyanakkor nem avuló anyagainak digitális elérhetőségét és kereshetőségét kellett megalapozni, egyúttal lehetőséget adva a leíró adatok modern szempontok szerint történő gazdagítására, javítására. Ez a pályázat példázta a más hazai adatbázis (az Archeodatabase) szabványos, hierarchikus szószedeteihez való alkalmazkodást.
- Az EK másik, dozimetriai projektje a szakirodalomból gyűjtött adatok feldolgozását célozta. Ebben az esetben tehát rögtön megvalósult a korábbi, más kutatócsoportok által mért adatok újrafelhasználhatóvá tétele és újrafelhasználása: az összegyűjtött és közreadott adatok a modell javításán és ellenőrzésén túl további kutatások számára is hozzáférhetővé váltak.
- Ismét másik oldalát mutatta meg a kutatási adatkezelésnek a TK KDK projektje. Ez esetben egy már régóta működő kutatási adatrepozitórium volt a pályázó, a megvalósított feladat pedig hanganyagok archiválása volt. Kiemelendő a hanganyagok kezelésének szoftveres megoldása, és a társadalomtudományok terén fontos adatvédelem, anonimizálás.
- A TTK projektje esetében is fontos tényező volt a nemzetközi adatleírási szabványokhoz való alkalmazkodás. Ennél a projektnél merült fel a publikációhoz társuló adatnyilvánossági követelmény is - a megvalósítás idején szembesültek a szerzők egy benyújtott közleményük bírálója kérésével, hogy az adatokat és az elemzéshez használt kódot is tegyék elérhetővé.
- A Wigner FK kutatási programja keretében három (megjelent vagy elbírálás alatt lévő) közleményhez is elhelyeztek adatokat a Concorda- ban. A beszámolóban megjegyezték, hogy az adatrepozitóriumok használata a projektekben résztvevő, esetenként különböző intézményekből érkező kutatók közötti kommunikációban is fontos eszköz lehet: az adatok már a kísérletek során repozitóriumba kerülhetnek, és az arra jogosultaknak hozzáférhetőek lehetnek.
Újabb facettáját csillantotta meg a kutatási adatkezelésnek az MTA-DE Viselkedésökológiai Kutatócsoport projektje. Az OpenBioMaps egy kutatási célú adatbázis- infrastruktúra, melyhez adatrepozitálást elősegítő szoftveres megoldásokat fejlesztettek. Igen fontos a kutatáshoz használt eszközök (beleértve a szoftvereket és adatbázisokat) FAIR archiválást támogató funkciókkal való bővítése. Megfelelő infrastruktúra nélkül a kutatók nem lesznek képesek a FAIR adatkezelés követelményei miatt megnövelt költség- és munkaigényeknek megfelelni.
nagy adatmennyiségek
kis projektek
archív anyagok
publikációkhoz kapcsolódó adatok
hazai szabványos szótárak
hazai kereszthivatkozások
nemzetközi szabványosítási folyamat média digitalizálás technológia adatbázisrendszerek kapcsolódása korábbi adatok javítása
egyedi azonosítók használata
Új lehetőségek felismerése anonimizálás, személyes adatok
Tanulságok
A HRDA tagjai/vezetősége köréből kikerült bíráló bizottság Igen jó véleményt alakított ki a pilot eredményeiről. Lényeges eredmény volt, hogy olyan kutatókat és kutatócsoportokat is kapcsolatba lehetett hozni az adatarchiválás és a FAIR témakörrel, akik ezzel korábban nem találkoztak. Az ELKH épülő adatrepozitóriuma - a Concorda - számára is lényeges volt a valós kutatói igényekkel való
szembesülés, a korai kapcsolatépítés.
A projektbeszámolók alapján kiderül, hogy a pilot eredeti célkitűzésein túl is elért eredményeket:
"...értékes információkhoz jutottunk mind az eredmények reprodukálhatóságát illetően, … mind pedig a tanulmány eredményeinek megbízhatóságát tekintve..."
"...egy másik [a pályázatban nem résztvevő] kutatócsoport … is megismerkedhetett a magyar adatrepozitóriummal [Concorda] ..."
"Hadd jegyezzük meg, hogy a kutatási adatok repozitóriumban való elhelyezése a kutatási projektek végrehajtása során, még az eredmények közlése előtt is egy nagyon hasznos eszköz lehet a kutatók kezében.
Lehetőségeket nyújt, hogy az egyes adatcsomagokhoz - privát URL-en keresztül - a közreműködő kollégák hozzáférjenek, ami nagymértékben megkönnyítheti a kutatók munkáját, főleg nagyobb adatmennyiségek esetén."
[Idézetek a projektbeszámolókból]
Felismerések
tárolóhelyigény
archiválási kényszer nemzetközi publikálás esetén
munkaigényes
meg kell teremteni az (OpenBioMaps pl.)
szaktudásra, támogatásra van szükség (adatgazdászok)
Projektzáró, folytatás
A projektek 2021 decemberében lezárultak, a zárókonferencia 2022 január 18.-án volt.
[ https://openaccess.mtak.hu/event/kutatasiadat-archivalasi-
pilot-projektek-az-eotvos-lorand-kutatasi-halozathoz-tartozo- kutatokozpontokban-intezetekben-es-csoportokban/ ]
A pilot sikerét leginkább az tanúsítja, hogy az ELKH Titkársága folytatásként másfél éves futamidejű Adatrepozitórium Projektet (ARP) indított. magyar