Gestión de Datos
El Grupo de Trabajo de "Depósito y Gestión de datos en Acceso Abierto" de FECYT (2012) hace referencia a la definición de la Universidad Australiana de Melbourne en su política institucional de gestión de datos:
"Los datos de la investigación son hechos, observaciones o experiencias en que se basa el argumento, la teoría o la prueba. Los datos pueden ser numéricos, descriptivos o visuales. Los datos pueden ser en estado bruto o analizado, pueden ser experimentales u observacionales. Los datos incluyen: cuadernos de laboratorio, cuadernos de campo, datos de investigación primaria (incluidos los datos en papel o en soporte informático), cuestionarios, cintas de audio, videos, desarrollo de modelos, fotografías, películas, y las comprobaciones y las respuestas de la prueba. Las colecciones datos para la investigación pueden incluir diapositivas; diseños y muestras. En la información sobre la procedencia de los datos también se podría incluir: el cómo, cuándo, donde se recogió y con que (por ejemplo, instrumentos). El código de software utilizado para generar, comentar o analizar los datos también pueden ser considerados datos".
El 15 de marzo de 2016 fue publicado en la revista Scientific Data de Nature el artículo: “Principios FAIR para el manejo y administración de datos científicos”. Los Principios FAIR ofrecen un conjunto de cualidades precisas y medibles que una publicación de datos debería seguir para que los datos sean Encontrables, Accesibles, Interoperables y Reutilizables (del inglés FAIR – Findable, Accessible, Interoperable, and Reusable):
FAIR resources graphic by the by ARDC
FINDABLE (Encontrables): Los datos y metadatos pueden ser encontrados por la comunidad después de su publicación, mediante herramientas de búsqueda.
F1. Asignarles un identificador único y persistente a los datos y los metadatos
F2. Describir los datos con metadatos de manera prolija
F3. Registrar/Indexar los datos y los metadatos en un recurso de búsqueda
F4. En los metadatos se debe especificar el identificador de los datos que se describen.
ACCESSIBLE (Accesibles): Los datos y metadatos están accesibles y por ello pueden ser descargados por otros investigadores utilizando sus identificadores.
A1 Los datos y los metadatos pueden ser recuperados por sus identificadores mediante protocolos estandarizados de comunicación
A1.1 Los protocolos tienen que ser abiertos, gratuitos e implementados universalmente
A1.2 El protocolo debe de permitir procedimientos para la autentificación y la autorización (por si fuera necesario).
A2 Los metadatos deben de estar accesibles, incluso cuando los datos ya no estuvieran disponibles.
INTEROPERABLE (Interoperables): Tanto los datos como los metadatos deben de estar descritos siguiendo las reglas de la comunidad, utilizando estándares abiertos, para permitir su intercambio y su reutilización.
I1. Los datos y los metadatos deben de usar un lenguaje formal, accesible, compartible y ampliamente aplicable para representar el conocimiento
I2. Los datos y los metadatos usan vocabularios que sigan los principios FAIR
I3. Los datos y los metadatos incluyen referencias cualificadas a otros datos o metadatos
REUSABLE (Reutilizables): Los datos y los metadatos pueden ser reutilizados por otros investigadores, al quedar clara su procedencia y las condiciones de reutilización.
R1. Los datos y los metadatos contienen una multitud de atributos precisos y relevantes
R1.1. Los datos y los metadatos se publican con una licencia clara y accesible sobre su uso y reutilización
R1.2. Los datos y los metadatos se asocian con información sobre su procedencia
R1.3. Los datos y los metadatos siguen los estándares relevantes que usa la comunidad del dominio concreto.
A nivel europeo:
Horizonte Europa. El próximo programa de investigación e innovación de la UE (2021-2027)
Exploitation & Open science in Horizon Europe. Stakeholder workshop: Novelties in Horizon Europe MGA
El RGPD requiere que los responsables tengan en cuenta los aspectos de privacidad y tratamiento de los datos personales desde el comienzo de un estudio, y requiere que haya una completa transparencia. Importante, ya que afecta a la gestión de los datos desde el comienzo de la compilación de los datos.
La reutilización de datos personales está permitida en el RPGD para temas de investigación, pero solo cuando el responsable disponga de medidas técnicas de seguridad y privacidad, que garanticen la protección los datos. Estas medidas pueden ser la seudonimización, la anonimización, la encriptación, el control restringido o limitado de acceso.
Finalmente, los datos de la investigación pueden estar protegidos por la ley; pueden estar regulados por contrato; o pueden estar sujetos a normas comunitarias como las de buenas prácticas académicas. OpenAIRE (2020) Guides for Researchers. How do I know if my research data is protected?
A nivel nacional:
En su artículo 37, “Difusión en acceso abierto”, recoge los siguientes aspectos a tener en cuenta respecto a la difusión en abierto de los resultados de la investigación financiada con fondos públicos:
Artículo 37. Difusión en acceso abierto:
1. Los agentes públicos del Sistema Español de Ciencia, Tecnología e Innovación impulsarán el desarrollo de repositorios, propios o compartidos, de acceso abierto a las publicaciones de su personal de investigación, y establecerán sistemas que permitan conectarlos con iniciativas similares de ámbito nacional e internacional.
2. El personal de investigación cuya actividad investigadora esté financiada mayoritariamente con fondos de los Presupuestos Generales del Estado hará pública una versión digital de la versión final de los contenidos que le hayan sido aceptados para publicación en publicaciones de investigación seriadas o periódicas, tan pronto como resulte posible, pero no más tarde de doce meses después de la fecha oficial de publicación.
3. La versión electrónica se hará pública en repositorios de acceso abierto reconocidos en el campo de conocimiento en el que se ha desarrollado la investigación, o en repositorios institucionales de acceso abierto.
4. La versión electrónica pública podrá ser empleada por las Administraciones Públicas en sus procesos de evaluación.
5. El Ministerio de Ciencia e Innovación facilitará el acceso centralizado a los repositorios, y su conexión con iniciativas similares nacionales e internacionales.
6. Lo anterior se entiende sin perjuicio de los acuerdos en virtud de los cuales se haya podido atribuir o transferir a terceros los derechos sobre las publicaciones, y no ser de aplicación cuando los derechos sobre los resultados de la actividad de investigación, desarrollo e innovación sean susceptibles de protección.
El objetivo de esta Ley Orgánica es adaptar el Derecho interno español al Reglamento General de Protección de Datos.
El Plan Estatal es el principal instrumento de la Administración General del Estado para el desarrollo y consecución de los objetivos de la Estrategia Española de Ciencia y Tecnología y de Innovación (EECTI).
La EECTI 2021-2027, en vigor, se estructura en dos planes estatales, el Plan Estatal 2021-2023, que es el que se está ejecutando en este momento, y el Plan Estatal 2024-2027. Los planes incluyen las ayudas estatales destinadas a la I+D+I que se realizan desde la AGE. Una parte considerable de estas ayudas se ejecutan a través de convocatorias en régimen de concurrencia competitiva.
Reutilización de los datos de investigación
- Licencias de uso asociadas a las iniciativas de datos abiertos en España
- License Selector: este recurso ayuda a elegir qué licencia de uso se ajusta mejor a cada tipo de set de datos o de software.
- Sherpa Juliet: ofrece información actualizada sobre las políticas de los financiadores y sus requisitos de acceso abierto, publicación y archivo de datos.
- Apartado web de Biblioteca: Creative Commons
Recursos para la descripción de los datos:
- Metadatos (Según sea su contexto o disciplina)
- Control de versiones
- Formatos
- Anonimización y seudonimización
Herramientas para la creación de Programas de Gestión de Datos:
- El DMP Online: desarrollado por el Digital Curation Center (DCC) y Curation Center de la Universidad de California (UC3) para crear, revisar y compartir planes de gestión de datos que cumplan con los requisitos institucionales y de los financiadores.
- PGDonline: adaptación al castellano de DMP Online desarrollado por el Consorcio Madroño.
- Argos: plataforma abierta y colaborativa desarrollada de forma conjunta entre OpenAIRE y EUDAT para facilitar las actividades de Gestión de Datos de Investigación (GDI) relacionadas con la implementación de planes de gestión de datos.
- El Data Stewardship Wizard (DWS): herramienta para crear planes de gestión de datos desarrollado dentro del proyecto ELIXIR ( European Data Infrastructure for the Life Sciences).
Webs y Repositorios de datos:
- Iniciativa Aporta: iniciativa de datos abiertos del Gobierno de España.
- Portal de datos abiertos de la UE
- Re3data: registro global de repositorios de datos de investigación
- eCienciaDatos: desarrollado por el Consorcio Madroño es el primer repositorio de datos de las universidades españolas.
- Scientific Data: revista de acceso abierto revisada del grupo Nature que ofrece revisiones por pares para descripciones de conjuntos de datos científicamente valiosos e investigaciones que promueven el intercambio y la reutilización de datos científicos.
- Zenodo: repositorio en el que se permite a los investigadores publicar sus dataset de forma gratuita.
- Nube Europea: entorno donde alojar y gestionar datos de investigación para apoyar la ciencia en Europa.