Integrácia, katalogizácia, FAIRifikácia a celková správa biobankových a klinických dát
Authors | |
---|---|
Year of publication | 2023 |
Citation | |
Description | Jednou z techník, ktorá je na odporučenie interdisciplinárneho tímu odborníkov tzv. Molecular Tumour Board (MTB) na Masarykovom onkologickom ústave často využívaná, je sekvenácia somatickej DNA u vybraných pacientov. Napriek tomu, že táto technika generuje obrovské množstvo dát s potenciálom ich sekundárneho využitia vo výskume, samotné zdieľanie dát pre výskumné účely je mimoriadne zložité. Dôvodom je často ich nedostatočný popis, správa a chýbajúca platforma pre prezentáciu ich existencie. Súvisiacim problémom sú vysoké kapacitné nároky na ukladanie veľkého objemu dát a ich zabezpečenie. Nielen že sú tieto dáta vystavené nebezpečenstvu úplnej straty z dôvodu degradácie nosičov, na ktorých sú veľa krát neodborne skladované, ale ich spätné dohľadanie a prepojenie s inými dátami rovnakého pacienta je komplikované a niekedy až nereálne kvôli nesystematicky používaným identifikátorom a označeniam. Cieľom tejto práce bolo vytvoriť návrh správy citlivých nemocničných dát a položiť základy integračného centra, ktoré zaistí súlad dát s tzv. FAIR princípmi. Tieto princípy zabezpečujú, že dáta sú nájditeľné (findability), prístupné (accessibility), interoperabilné (interoperability) a v konečnom dôsledku znovu-využiteľné (reusability). Výstupom práce je návrh správy dát (tzv. data pipeline), v rámci ktorého bol vytvorený metadátový katalóg slúžiaci ako jednotná platforma pre vystavenie metadát a navrhnuté cloudové prostredie pre ukladanie citlivých dát pomocou služby SensitiveCloud. Úlohou pripravovaného posteru je informovať o novo vzniknutej data pipeline, ktorá môže slúžiť ako inšpirácia pre biobanky, ktoré chcú okrem biologických vzoriek svojim žiadateľom ponúkať aj pridružené dáta (sekvenačné, rádiologické atď.), ktoré majú potenciál obohatiť výskum a priniesť zaujímavé poznatky do sveta medicíny. |