Какво са „отворени“ данни?
Това са данни, които всеки може свободно да достъпва, използва, модифицира и споделя за всякакви цели. Това означава, че данните трябва да са достъпни за изтегляне в машинно-четим формат (например CSV). Всеки трябва да може да използва, преизползва и разпространява данните с посочване на автора. Комерсиалната употреба също е допустима според тази дефиниция.
Защо отворените данни са важни?
Репродуцируемост: Позволява на други изследователи да проверят и възпроизведат публикуваните резултати.
Публично финансиране: Публично финансираните изследвания трябва да бъдат публично достъпни.
Спестяване на ресурси: Данните могат да се използват от други изследователи, което спестява време и средства.
Лична изгода: Повишава видимостта на изследователя, като данните могат да бъдат цитирани от други.
Принципите FAIR
FAIR (Findable, Accessible, Interoperable, Reusable) принципите са насочени към подобряване на намираемостта, достъпността, оперативната съвместимост и повторната употреба на данните. Те са разработени през 2016 г. и са особено важни за автоматизираната обработка на данни.
Как да направим данните отворени?
Формат: Изберете общ и машинно-четим формат.
Репозитории: Използвайте надеждни хранилища за данни.
Метаданни: Осигурете богати и машинно-четими метаданни.
Постоянен идентификатор: Присвоете уникален и постоянен идентификатор на данните (например DOI).
Лиценз: Изберете подходящ лиценз, който уточнява как данните могат да бъдат използвани и споделяни.
Отворените данни са важен аспект от съвременната наука, който улеснява сътрудничеството и прозрачността. За повече информация и ресурси, посетете официалния портал за европейски данни и тяхната обучителна програма.
За повече информация: ТУК
Използвани източници:
- https://opendatahandbook.org/guide/en/what-is-open-data/
- Gabelica, M., Bojčić, R., & Puljak, L. (2022). Many researchers were not compliant with their published data sharing statement: A mixed-methods study. Journal of Clinical Epidemiology, 150, 33–41. https://doi.org/10.1016/j.jclinepi.2022.05.019
- Stodden, V., Seiler, J., & Ma, Z. (2018). An empirical analysis of journal policy effectiveness for computational reproducibility. Proceedings of the National Academy of Sciences, 115(11), 2584–2589. https://doi.org/10.1073/pnas.1708290115
- Wilkinson, M. D., Dumontier, M., Aalbersberg, Ij. J., Appleton, G., Axton, M., Baak, A., Blomberg, N., Boiten, J.-W., da Silva Santos, L. B., Bourne, P. E., Bouwman, J., Brookes, A. J., Clark, T., Crosas, M., Dillo, I., Dumon, O., Edmunds, S., Evelo, C. T., Finkers, R., … Mons, B. (2016). The FAIR Guiding Principles for scientific data management and stewardship. Scientific Data, 3(1), 160018. https://doi.org/10.1038/sdata.2016.18
- https://www.go-fair.org/fair-principles/
- https://www.openaire.eu/how-to-make-your-data-fair
The Open Science Snacks by Science4All Initiative are licensed under CC-BY 4.0.