Plano de Gestão de Dados
Enquadramento
Gestão e Abertura de Dados
“Tão aberto quanto possível, tão fechado quanto necessário”
A Universidade Lusófona alinha-se com as Políticas relativas à gestão e partilha dos dados de investigação emanadas pela Comissão Europeia e recomendações da Fundação para Ciência e Tecnologia. Estas políticas incluem requisitos relativos à gestão e proteção de dados, nomeadamente através da elaboração de planos de gestão de dados, e definem a partilha de dados como a opção padrão. No âmbito da política e requisitos estabelecidos no Horizonte 2020 e Horizonte Europa este princípio relativo aos dados de investigação foi formulado como “Tão aberto quanto possível, tão fechado quanto necessário”.
FAQs
Um Plano de Gestão de Dados (PGD) (Data Management Plan, DMP), é um documento formal que define o ciclo de vida dos dados gerados ou recolhidos em contexto de investigação. Abrange diversos aspectos, desde a criação ou recolha até ao processamento dos dados durante e após um projeto de investigação. Identifica de que forma os dados serão criados e documentados, quem terá acesso a eles, como podem ser (re)utilizados e onde serão armazenados e/ou preservados.
Os PGDs são documentos dinâmicos que se adaptam e evoluem à medida que a investigação progride. São cruciais para uma gestão eficiente dos dados de investigação, pois proporcionam uma compreensão abrangente dos dados e das circunstâncias em que foram gerados. Esta abordagem sobre a gestão dos dados possibilita a sua reutilização e replicação, contribuindo assim para um sistema científico mais robusto.
Um PGD compreende diversos elementos essenciais para assegurar uma abordagem eficiente e ética na gestão de dados ao longo do ciclo de vida de um projeto de investigação. Alguns dos componentes fundamentais incluem:
- Que dados serão criados ou recolhidos?
Identificação clara dos tipos de dados que serão criados ou recolhidos durante o projeto.
- Como é que os dados vão ser criados ou gerados?
Descrição detalhada da forma como os dados serão criados, gerados ou recolhidos.
- Que métodos e normas serão adotados no tratamento de dados?
Definição de métodos e normas utilizadas no tratamento dos dados, incluindo processos de limpeza, transformação e análise.
- Que métodos e normas serão adotados para a manipulação de dados ao longo de todo o processo?
Definição dos procedimentos relativos à manipulação dos dados, ou seja, todos os procedimentos relativos a depósito em repositório, transferência, ou reutilização segura e eficiente dos dados ao longo de todo o projeto de investigação
- Que documentação ou metadados vai ser integrada nos dados?
Especificação da documentação ou metadados que serão integrados aos dados para facilitar a compreensão e reutilização futura.
- Como lidar com as questões éticas?
Indicação das estratégias utilizadas para lidar com questões éticas relacionadas com a recolha, (re)utilização e divulgação dos dados.
- Como lidar com questões de direito de autor e propriedade intelectual?
Informação detalhada acerca das questões de direitos de autor e propriedade intelectual associadas aos dados (https://grupolusofona.sharepoint.com/sites/Click/administracao/Ordens%20de%20Servio/Forms/OS.aspx?FilterField1=Ano&FilterValue1=2023&FilterType1=Text&FilterDisplay1=2023&FilterField2=Entidade&FilterValue2=COFAC&FilterType2=Choice&FilterDisplay2=COFAC&id=%2Fsites%2FClick%2Fadministracao%2FOrdens%20de%20Servio%2FOS%5FCOFAC%5F2023%5F079%2Epdf&viewid=b48e1dbb%2D1b10%2D4f7c%2D8ba4%2D6f9891caf54d&q=Propriedade%20intelectual&parent=%2Fsites%2FClick%2Fadministracao%2FOrdens%20de%20Servio&parentview=7).
- Como é que os dados serão armazenados e criadas cópias de segurança durante o projeto?
Delineamento dos formatos de arquivo e procedimentos adotados para assegurar a segurança do armazenamento dos dados e a criação de cópias de segurança durante o projeto.
- Quais os níveis de acesso e segurança dos dados?
Identificação dos níveis de acesso aos dados (ex. restritos à Instituição, acesso completamente aberto, etc) e medidas de segurança implementadas.
- Como é que os dados vão ser mantidos e preservados após o término do projeto?
Delineamento de plano detalhado para a preservação de dados, incluindo formatos de arquivo e estratégias de armazenamento.
- Qual o plano de preservação de dados a longo prazo?
Definição de plano detalhado para a preservação de dados a longo prazo, incluindo identificação dos processos de curadoria.
- Que dados serão disponibilizados em Acesso Aberto?
Determinação de quais os dados que serão disponibilizados em Acesso Aberto e de que forma.
- Como serão partilhados os dados?
Estratégias para o compartilhamento dos dados, incluindo plataformas e formatos.
- Existem orientações sobre restrições ou acesso aberto aos dados?
Identificação de restrições ou acesso aberto aos dados, quando aplicável.
- Quem é responsável pela gestão dos dados?
Designação clara da pessoa ou equipa responsável pela gestão contínua dos dados (DPO).
- Que recursos são necessários para a implementação do PGD?
Estimativa dos recursos humanos, financeiros e tecnológicos necessários para a implementação do PGD
A criação de um PGD, o tratamento subsequente, bem como a sua partilha e disponibilização, são requisitos essenciais no contexto do Acesso Aberto. As diretrizes estabelecidas pela União Europeia (UE), por meio do European Research Council (ERC), e por projetos financiados pelo Horizonte 2020, consideram esse critério como desejável, proporcionando ferramentas específicas para sua implementação. O estímulo à divulgação de dados de pesquisa no âmbito do Horizonte 2020 é efetuado por meio do Open Research Data (ORD), alinhado aos princípios FAIR, que preconizam que os dados devem ser localizáveis (findable), acessíveis (accessible), interoperáveis (interoperable) e reutilizáveis (reusable).
Dados FAIR referem-se àqueles que são geridos em conformidade com os princípios FAIR – Findable, Accessible, Interoperable e Reusable. Esses princípios visam orientar a gestão dos dados de pesquisa, facilitando a sua localização, acesso, interoperabilidade e reutilização. Cada letra do acrônimo FAIR representa um conjunto de 15 princípios.
FINDABLE (LOCALIZÁVEIS) |
ACCESSIBLE (ACESSÍVEIS) |
INTEROPERABLE (INTEROPERÁVEIS) |
REUSABLE (REUTILIZÁVEIS) |
A atribuição de um identificador único persistente aos (meta)dados |
Os (meta)dados são recuperáveis através do seu identificador, mediante um protocolo de comunicações normalizado. |
Os (meta)dados usam uma linguagem formal, acessível, partilhada e de ampla aplicabilidade para a representação do conhecimento. |
Os (meta)dados têm uma pluralidade de atributos precisos e relevantes. |
A descrição dos dados com metadados pormenorizados |
O protocolo de comunicações é aberto, gratuito e universalmente implementável. |
Os (meta)dados usam vocabulários que seguem os princípios FAIR. |
Os (meta)dados são disponibilizados com uma licença clara e acessível de uso dos dados. |
O registo ou a indexação dos (meta)dados num recurso pesquisável |
O protocolo de comunicações permite um procedimento de autenticação e autorização, quando necessário. |
Os (meta)dados incluem referências qualificadas a outros (meta)dados. |
Os (meta)dados são associados à sua proveniência. |
A inclusão do identificador nos metadados |
Os metadados permanecem acessíveis, mesmo se os dados já não estiverem disponíveis. |
Os (meta)dados cumprem normas relevantes da comunidade disciplinar. |
Os princípios FAIR funcionam como diretrizes, não como normas. Eles delineiam qualidades ou comportamentos essenciais para otimizar a reutilização dos dados, destacando a importância de elementos como descrição e citação.
Os requisitos comuns incluem a elaboração de um PGD e a disponibilização dos dados de investigação em acesso aberto, sempre que possível. Essa exigência abrange os dados necessários para validar os resultados em publicações científicas, assim como outros dados decorrentes do projeto conforme especificado no PGD.
Comissão Europeia – Estratégia Europeia para os Dados:
A Comissão Europeia preconiza o acesso aos dados que validam publicações científicas, assim como a disponibilização de todos os outros dados associados ao projeto, com o intuito de maximizar o acesso e a reutilização dos dados gerados por projetos de investigação. No entanto, os projetos poderão não compartilhar dados, seja na fase de proposta ou durante a execução, mediante justificação no PDG do projeto. Isso pode ocorrer nos seguintes cenários:
- Se o projeto não gera ou recolhe dados;
- Em casos de conflito com a proteção dos resultados, especialmente se há expectativa de exploração comercial ou industrial;
- Quando a disponibilização aberta dos dados compromete o alcance do objetivo principal do projeto;
- Em situações de conflito com obrigações de confidencialidade;
- Em situações de desacordo com obrigações nacionais de segurança;
- Em violação das regras de proteção de dados pessoais.
Quando se deve elaborar um PGD varia conforme o contexto do projeto:
No âmbito de um projeto financiado:
- Primeira versão: Durante o processo de candidatura a financiamento ou nos primeiros 6 meses do projeto, conforme requisito do financiador.
- Atualizações: Sempre que mudanças significativas justifiquem ou novos conjuntos de dados sejam adicionados. A meio ou nos estágios finais do projeto.
- Natureza Evolutiva: O PGD não é estático; evolui, ganhando mais precisão e substância ao longo do projeto, já que nem todos os dados ou usos potenciais poderão estar claros desde o início.
No âmbito das unidades de investigação:
- Primeira versão: Aquando da proposta de financiamento, alinhando com o regulamento institucional para a gestão de dados em investigação.
- Suporte à elaboração de PGD e sua Manutenção: A UID deve apoiar o investigador na elaboração e gestão do PGD, providenciar condições para o desenvolvimento dos PGD dos projetos a ela associados.
- Natureza Evolutiva e Curadoria: O PGD não é estático; evolui, ganhando mais precisão e substância ao longo dos projetos, já que nem todos os dados ou usos potenciais estão claros desde o início. A instituição deve assumir a responsabilidade da gestão da preservação e curadoria dos dados mesmo após o término do projeto segundo o estipulado em cada PDG.
São sugeridas para apoiar a elaboração e gestão de PGDs as seguintes ferramentas:
- ARGOS: O ARGOS é uma ferramenta que oferece suporte a processos automatizados para a criação, gestão, partilha e vinculação de PGDs com os resultados de investigação correspondentes. Além de se integrar com entidades financiadoras e projetos de investigação, o ARGOS permite a utilização de modelos pré-definidos na criação de um PGD. Também oferece a flexibilidade de criar novos modelos parametrizados de acordo com as especificações da instituição, projeto, entidade financiadora, entre outros. Para mais informações, consulte aqui.
- DMPonline: A ferramenta DMPonline integra uma ampla variedade de financiadores de projetos, tornando mais fácil para os investigadores organizar o processo de recolha de dados. Permite a edição, atualização e partilha das diferentes versões do projeto entre investigadores. Além disso, possibilita a exportação em diversos formatos (pdf, docx, csv, html, etc.) em cada fase do projeto. Para mais informações, consulte aqui.
Estas plataformas permitem a inserção de DMPs segundo os modelos estabelecidos pelas entidades financiadoras (p.e. FCT, Horizon Europe ect).
No entanto, dadas as exigências específicas para PGDs podem variar entre financiadores e organizações, é sempre bom consultar as diretrizes específicas do financiador.
A preservação de dados de investigação é fundamental para garantir a integridade e acessibilidade a longo prazo. São recomendados os seguintes repositórios:
- Repositório Institucional:
O Repositório Científico Lusófona (https://recil.ensinolusofona.pt/) é um serviço digital que congrega os trabalhos científicos produzidos no Grupo Lusófona, disponibilizando de forma pública e universal a produção científica do Grupo.
- Repositórios Temáticos: Alguns repositórios se concentram em tipos específicos de dados, como dados geoespaciais, dados genéticos, entre outros. Esses repositórios podem oferecer uma infraestrutura mais adequada para determinados tipos de dados, tornando-os também mais acessíveis por pares (ex. BioData.pt - dados biológicos; APIS - dados informação social)
- Centros de Dados Especializados: Alguns centros de dados especializados oferecem serviços de preservação de dados para a comunidade científica. (ex. Zenodo; POLEN)
É importante considerar a política de preservação de dados, a acessibilidade a longo prazo, a segurança, os requisitos de metadados e as necessidades específicas da sua investigação e comunidade, na escolha do melhor repositório.
As agências de financiamentos reconhecem fundamentos válidos para a não divulgação dos dados de investigação, como quando o projeto não gera dados, quando os dados estão sujeitos a exploração comercial, por razões de confidencialidade, privacidade, segurança nacional, ou se a partilha de dados comprometer o objetivo central do projeto. Essa é a razão pela qual a Comissão Europeia adotou o princípio "As open as possible, as closed as necessary" - "Tão abertos quanto possível, tão fechados quanto necessário".
Sim, as agências de financiamento solicitam a divulgação dos conjuntos de dados que sustentam as publicações, mas não há obrigação de compartilhar os conjuntos restantes. Além disso, é possível que, inicialmente, a disponibilização de alguns conjuntos de dados seja planeada, mas essa decisão pode ser modificada posteriormente, especialmente se esses dados se encaixarem nas exceções previstas, como a possibilidade de exploração comercial. Em tais situações, a decisão deve ser justificada no PGDs.
Existem vários cursos de formação livre que poderão ajudar a compreender melhor a necessidade e como se faz um plano de gestão de dados:
- Skills4 EOSC - FAIR-by-Design Methodology
- NAU/FCCN - O Essencial da Gestão de Dados de Investigação
- RDNL - Essentials 4 Data Support
O cumprimento dessas diretrizes tem impacto positivo na avaliação do projeto, desde a fase de proposta.