Skip to main content

Data Management Plan

‎Framework

Data Management and Openness

"As open as possible, as closed as necessary"

Lusófona University aligns itself with the Policies on the Management and Sharing of Research Data issued by the European Commission and the recommendations of the Foundation for Science and Technology. These policies include requirements regarding data management and protection, namely through the preparation of data management plans, and define data sharing as the default option. Within the framework of the policy and requirements established in Horizon 2020 and Horizon Europe, this principle regarding research data has been formulated as ‘As open as possible, as closed as necessary’.

FAQs

1. O que é um Plano de Gestão de Dados?

Um Plano de Gestão de Dados (PGD) (Data Management Plan, DMP), é um documento formal que define o ciclo de vida dos dados gerados ou recolhidos em contexto de investigação. Abrange diversos aspectos, desde a criação ou recolha até ao processamento dos dados durante e após um projeto de investigação. Identifica de que forma os dados serão criados e documentados, quem terá acesso a eles, como podem ser (re)utilizados e onde serão armazenados e/ou preservados.

Os PGDs são documentos dinâmicos que se adaptam e evoluem à medida que a investigação progride. São cruciais para uma gestão eficiente dos dados de investigação, pois proporcionam uma compreensão abrangente dos dados e das circunstâncias em que foram gerados. Esta abordagem sobre a gestão dos dados possibilita a sua reutilização e replicação, contribuindo assim para um sistema científico mais robusto.

2. O que compõe um Plano de Gestão de Dados?

Um PGD compreende diversos elementos essenciais para assegurar uma abordagem eficiente e ética na gestão de dados ao longo do ciclo de vida de um projeto de investigação. Alguns dos componentes fundamentais incluem:

  • Que dados serão criados ou recolhidos? 

Identificação clara dos tipos de dados que serão criados ou recolhidos durante o projeto.

  • Como é que os dados vão ser criados ou gerados?

Descrição detalhada da forma como os dados serão criados, gerados ou recolhidos.

  • Que  métodos e normas serão adotados no tratamento de dados?

Definição de métodos e normas utilizadas no tratamento dos dados, incluindo processos de limpeza, transformação e análise.

  • Que métodos e normas serão adotados para a manipulação de dados ao longo de todo o processo?

Definição dos procedimentos relativos à manipulação dos dados, ou seja, todos os procedimentos relativos a depósito em repositório, transferência, ou reutilização segura e eficiente dos dados ao longo de todo o projeto de investigação

  • Que documentação ou metadados vai ser integrada nos dados? 

Especificação da documentação ou metadados que serão integrados aos dados para facilitar a compreensão e reutilização futura.

  • Como lidar com as questões éticas? 

Indicação das estratégias utilizadas para lidar com questões éticas relacionadas com a recolha, (re)utilização e divulgação dos dados.

  • Como lidar com questões de direito de autor e propriedade intelectual? 

Informação detalhada acerca das questões de direitos de autor e propriedade intelectual associadas aos dados (https://grupolusofona.sharepoint.com/sites/Click/administracao/Ordens%20de%20Servio/Forms/OS.aspx?FilterField1=Ano&FilterValue1=2023&FilterType1=Text&FilterDisplay1=2023&FilterField2=Entidade&FilterValue2=COFAC&FilterType2=Choice&FilterDisplay2=COFAC&id=%2Fsites%2FClick%2Fadministracao%2FOrdens%20de%20Servio%2FOS%5FCOFAC%5F2023%5F079%2Epdf&viewid=b48e1dbb%2D1b10%2D4f7c%2D8ba4%2D6f9891caf54d&q=Propriedade%20intelectual&parent=%2Fsites%2FClick%2Fadministracao%2FOrdens%20de%20Servio&parentview=7).

  • Como é que os dados serão armazenados e criadas cópias de segurança durante o projeto?

Delineamento dos formatos de arquivo e procedimentos adotados para assegurar a segurança do armazenamento dos dados e a criação de cópias de segurança durante o projeto.

  • Quais os níveis de acesso e segurança dos dados?

Identificação dos níveis de acesso aos dados (ex. restritos à Instituição, acesso completamente aberto, etc)  e medidas de segurança implementadas.

  • Como é que os dados vão ser mantidos e preservados após o término do projeto? 

Delineamento de plano detalhado para a preservação de dados, incluindo formatos de arquivo e estratégias de armazenamento.

  • Qual o plano de preservação de dados a longo prazo?

Definição de plano detalhado para a preservação de dados a longo prazo, incluindo identificação dos processos de curadoria.

  • Que dados serão disponibilizados em Acesso Aberto?

Determinação de quais os dados que serão disponibilizados em Acesso Aberto e de que forma.

  • Como serão partilhados os dados? 

Estratégias para o compartilhamento dos dados, incluindo plataformas e formatos.

  • Existem orientações sobre restrições ou acesso aberto aos dados? 

Identificação de restrições ou acesso aberto aos dados, quando aplicável.

  • Quem é responsável pela gestão dos dados?

Designação clara da pessoa ou equipa responsável pela gestão contínua dos dados (DPO).

  • Que recursos são necessários para a implementação do PGD? 

Estimativa dos recursos humanos, financeiros e tecnológicos necessários para a implementação do PGD

3. Porquê fazer um Plano de Gestão de Dados?

A criação de um PGD, o tratamento subsequente, bem como a sua partilha e disponibilização, são requisitos essenciais no contexto do Acesso Aberto. As diretrizes estabelecidas pela União Europeia (UE), por meio do European Research Council (ERC), e por projetos financiados pelo Horizonte 2020, consideram esse critério como desejável, proporcionando ferramentas específicas para sua implementação. O estímulo à divulgação de dados de pesquisa no âmbito do Horizonte 2020 é efetuado por meio do Open Research Data (ORD), alinhado aos princípios FAIR, que preconizam que os dados devem ser localizáveis (findable), acessíveis (accessible), interoperáveis (interoperable) e reutilizáveis (reusable).

Dados FAIR referem-se àqueles que são geridos em conformidade com os princípios FAIR – Findable, Accessible, Interoperable e Reusable. Esses princípios visam orientar a gestão dos dados de pesquisa, facilitando a sua localização, acesso, interoperabilidade e reutilização. Cada letra do acrônimo FAIR representa um conjunto de 15 princípios.

 

FINDABLE (LOCALIZÁVEIS)

ACCESSIBLE (ACESSÍVEIS)

INTEROPERABLE (INTEROPERÁVEIS)

REUSABLE (REUTILIZÁVEIS)

A atribuição de um identificador único persistente aos (meta)dados

Os (meta)dados são recuperáveis através do seu identificador, mediante um protocolo de comunicações normalizado.

Os (meta)dados usam uma linguagem formal, acessível, partilhada e de ampla aplicabilidade para a representação do conhecimento.

Os (meta)dados têm uma pluralidade de atributos precisos e relevantes.

A descrição dos dados com metadados pormenorizados

O protocolo de comunicações é aberto, gratuito e universalmente implementável.

Os (meta)dados usam vocabulários que seguem os princípios FAIR.

Os (meta)dados são disponibilizados com uma licença clara e acessível de uso dos dados.

O registo ou a indexação dos (meta)dados num recurso pesquisável

O protocolo de comunicações permite um procedimento de autenticação e autorização, quando necessário.

Os (meta)dados incluem referências qualificadas a outros (meta)dados.

Os (meta)dados são associados à sua proveniência.

A inclusão do identificador nos metadados

Os metadados permanecem acessíveis, mesmo se os dados já não estiverem disponíveis.

 

Os (meta)dados cumprem normas relevantes da comunidade disciplinar.

Os princípios FAIR funcionam como diretrizes, não como normas. Eles delineiam qualidades ou comportamentos essenciais para otimizar a reutilização dos dados, destacando a importância de elementos como descrição e citação.

4. Requisitos das Agências de Financiamento

Os requisitos comuns incluem a elaboração de um PGD e a disponibilização dos dados de investigação em acesso aberto, sempre que possível. Essa exigência abrange os dados necessários para validar os resultados em publicações científicas, assim como outros dados decorrentes do projeto conforme especificado no PGD.

Comissão Europeia – Estratégia Europeia para os Dados:

A Comissão Europeia preconiza o acesso aos dados que validam publicações científicas, assim como a disponibilização de todos os outros dados associados ao projeto, com o intuito de maximizar o acesso e a reutilização dos dados gerados por projetos de investigação. No entanto, os projetos poderão não compartilhar dados, seja na fase de proposta ou durante a execução, mediante justificação no PDG do projeto. Isso pode ocorrer nos seguintes cenários:

  • Se o projeto não gera ou recolhe dados;
  • Em casos de conflito com a proteção dos resultados, especialmente se há expectativa de exploração comercial ou industrial;
  • Quando a disponibilização aberta dos dados compromete o alcance do objetivo principal do projeto;
  • Em situações de conflito com obrigações de confidencialidade;
  • Em situações de desacordo com obrigações nacionais de segurança;
  • Em violação das regras de proteção de dados pessoais.

FCT – Política sobre a disponibilização de dados e outros resultados de investigação científica financiada pela FCT.

5. Quando devem ser elaborados os Planos de Gestão de Dados?

Quando se deve elaborar um PGD varia conforme o contexto do projeto:

No âmbito de um projeto financiado:

  • Primeira versão: Durante o processo de candidatura a financiamento ou nos  primeiros 6 meses do projeto, conforme requisito do financiador.
  • Atualizações: Sempre que mudanças significativas justifiquem ou novos conjuntos de dados sejam adicionados. A meio ou nos estágios finais do projeto.
  • Natureza Evolutiva: O PGD não é estático; evolui, ganhando mais precisão e substância ao longo do projeto, já que nem todos os dados ou usos potenciais poderão estar claros desde o início.

No âmbito das unidades de investigação:

  • Primeira versão: Aquando da proposta de financiamento, alinhando com o regulamento institucional para a gestão de dados em investigação. 
  • Suporte à elaboração de PGD e sua Manutenção: A UID deve apoiar o investigador na elaboração e gestão do PGD, providenciar condições para o desenvolvimento dos PGD dos projetos a ela associados.
  • Natureza Evolutiva e Curadoria: O PGD não é estático; evolui, ganhando mais precisão e substância ao longo dos projetos, já que nem todos os dados ou usos potenciais estão claros desde o início. A instituição deve assumir a responsabilidade da gestão da preservação e curadoria dos dados mesmo após o término do projeto segundo o estipulado em cada PDG.
6. Plano de Gestão de Dados – Ferramentas Recomendadas

São sugeridas para apoiar a elaboração e gestão de PGDs as seguintes ferramentas:

  1. ARGOS: O ARGOS é uma ferramenta que oferece suporte a processos automatizados para a criação, gestão, partilha e vinculação de PGDs com os resultados de investigação correspondentes. Além de se integrar com entidades financiadoras e projetos de investigação, o ARGOS permite a utilização de modelos pré-definidos na criação de um PGD. Também oferece a flexibilidade de criar novos modelos parametrizados de acordo com as especificações da instituição, projeto, entidade financiadora, entre outros. Para mais informações, consulte aqui.
  2. DMPonline: A ferramenta DMPonline integra uma ampla variedade de financiadores de projetos, tornando mais fácil para os investigadores organizar o processo de recolha de dados. Permite a edição, atualização e partilha das diferentes versões do projeto entre investigadores. Além disso, possibilita a exportação em diversos formatos (pdf, docx, csv, html, etc.) em cada fase do projeto. Para mais informações, consulte aqui.

 

Estas plataformas permitem a inserção de DMPs segundo os modelos estabelecidos pelas entidades financiadoras (p.e. FCT, Horizon Europe ect).

No entanto, dadas as exigências específicas para PGDs podem variar entre financiadores e organizações, é sempre bom consultar as diretrizes específicas do financiador.

7. Onde preservar os meus dados?

A preservação de dados de investigação é fundamental para garantir a integridade e acessibilidade a longo prazo. São recomendados os seguintes repositórios:

  • Repositório Institucional: 

O Repositório Científico Lusófona (https://recil.ensinolusofona.pt/) é um serviço digital que congrega os trabalhos científicos produzidos no Grupo Lusófona, disponibilizando de forma pública e universal a produção científica do Grupo.

 

  • Repositórios Temáticos: Alguns repositórios se concentram em tipos específicos de dados, como dados geoespaciais, dados genéticos, entre outros. Esses repositórios podem oferecer uma infraestrutura mais adequada para determinados tipos de dados, tornando-os também mais acessíveis por pares (ex. BioData.pt - dados biológicos; APIS - dados informação social)
  • Centros de Dados Especializados: Alguns centros de dados especializados oferecem serviços de preservação de dados para a comunidade científica. (ex.  Zenodo; POLEN)

É importante considerar a política de preservação de dados, a acessibilidade a longo prazo, a segurança, os requisitos de metadados e as necessidades específicas da sua investigação e comunidade, na escolha do melhor repositório.

8. E se não for possível compartilhar os meus dados?

As agências de financiamentos reconhecem fundamentos válidos para a não divulgação dos dados de investigação, como quando o projeto não gera dados, quando os dados estão sujeitos a exploração comercial, por razões de confidencialidade, privacidade, segurança nacional, ou se a partilha de dados comprometer o objetivo central do projeto. Essa é a razão pela qual a Comissão Europeia adotou o princípio "As open as possible, as closed as necessary" - "Tão abertos quanto possível, tão fechados quanto necessário".

9. É possível disponibilizar apenas alguns conjuntos de dados do projeto?

Sim, as agências de financiamento solicitam a divulgação dos conjuntos de dados que sustentam as publicações, mas não há obrigação de compartilhar os conjuntos restantes. Além disso, é possível que, inicialmente, a disponibilização de alguns conjuntos de dados seja planeada, mas essa decisão pode ser modificada posteriormente, especialmente se esses dados se encaixarem nas exceções previstas, como a possibilidade de exploração comercial. Em tais situações, a decisão deve ser justificada no PGDs.

10. Como posso saber mais sobre PGDs?

Existem vários cursos de formação livre que poderão ajudar a compreender melhor a necessidade e como se faz um plano de gestão de dados:

11. Por que devo seguir essas diretrizes?

O cumprimento dessas diretrizes tem impacto positivo na avaliação do projeto, desde a fase de proposta.

11. Why should I follow these guidelines?

The fulfilment of these guidelines has a positive impact on the evaluation of the project, right from the proposal stage.

10. How can I find out more about PGDs?

There are several free training courses that can help you better understand the need for and how to make a data management plan:

9. Is it possible to make only certain sets of project data available?

Yes, funding agencies request the release of the data sets that support publications, but there is no obligation to share the remaining sets. In addition, it is possible that initially the availability of some datasets is planned, but this decision can be modified later, especially if these data fit into the exceptions foreseen, such as the possibility of commercial exploitation. In such situations, the decision must be justified in the DMP.

8. What if I can't share my data?

Funding agencies recognise valid grounds for not disclosing research data, such as when the project does not generate data, when the data is subject to commercial exploitation, for reasons of confidentiality, privacy, national security, or if the sharing of data compromises the central objective of the project. This is why the European Commission has adopted the principle "As open as possible, as closed as necessary".

7. Where can I store my data?

The preservation of research data is essential to guarantee its integrity and long-term accessibility. The following repositories are recommended:

Institutional Repository:

The Lusófona Scientific Repository (https://recil.ensinolusofona.pt/) is a digital service that brings together the scientific work produced at the Lusófona Group, making the Group's scientific output publicly and universally available.

Thematic Repositories:

Some repositories focus on specific types of data, such as geospatial data, genetic data, among others. These repositories can offer a more suitable infrastructure for certain types of data, also making them more accessible to peers (e.g. BioData.pt - biological data; APIS - social information data).

Specialised Data Centres:

Some specialised data centres offer data preservation services to the scientific community (e.g. Zenodo; POLEN).

 


It is important to consider data preservation policy, long-term accessibility, security, metadata requirements and the specific needs of your research and community when choosing the best repository.

6. Data Management Plan - Recommended Tools

The following tools are suggested to support the creation and management of DMPs:

  • ARGOS: ARGOS is a tool that supports automated processes for creating, managing, sharing and linking PGDs with the corresponding research results. As well as integrating with funding bodies and research projects, ARGOS allows predefined templates to be used when creating a PGD. It also offers the flexibility to create new models parameterised according to the specifications of the institution, project, funding body, etc. 
  • DMPonline: The DMPonline tool integrates a wide variety of project funders, making it easier for researchers to organise the data collection process. It allows the different versions of the project to be edited, updated and shared between researchers. It also makes it possible to export data in various formats (pdf, docx, csv, html, etc.) at each stage of the project. 

These platforms allow DMPs to be inserted according to the models established by the funding organisations (e.g. FCT, Horizon Europe ect).

However, as the specific requirements for DMPs can vary between funders and organisations, it is always a good idea to consult the funder's specific guidelines.

4. Requirements of Funding Agencies

Common requirements include drawing up a DMP and making research data available in open access wherever possible. This requirement covers the data needed to validate the results in scientific publications, as well as other data arising from the project as specified in the DMP.

European Commission - European Data Strategy:

The European Commission advocates access to data validating scientific publications, as well as making available all other data associated with the project, in order to maximise access to and re-use of data generated by research projects. However, projects may not share data, either at the proposal stage or during execution, subject to justification in the project's PDG. This can happen in the following scenarios:

  • If the project does not generate or collect data;
  • In cases of conflict with the protection of results, especially if commercial or industrial exploitation is expected;
  • When making data openly available jeopardises the achievement of the project's main objective;
  • In situations of conflict with confidentiality obligations;
  • In situations of non-compliance with national security obligations;
  • In violation of personal data protection rules.


FCT - Policy on making data and other results of scientific research funded by FCT available.

3. Why make a Data Management Plan?

The creation of a DMP, its subsequent processing, as well as its sharing and availability, are essential requirements in the context of Open Access. The guidelines established by the European Union (EU), through the European Research Council (ERC), and by projects funded by Horizon 2020, consider this criterion to be desirable, providing specific tools for its implementation. Encouraging the dissemination of research data under Horizon 2020 is done through Open Research Data (ORD), in line with the FAIR principles, which advocate that data should be findable, accessible, interoperable and reusable.

FAIR data refers to data that is managed in accordance with the FAIR principles - Findable, Accessible, Interoperable and Reusable. These principles aim to guide the management of research data, facilitating its location, access, interoperability and reuse. Each letter of the FAIR acronym represents a set of 15 principles.

  • FINDABLE

Assigning a persistent unique identifier to (meta)data

Describing the data with detailed metadata

Registering or indexing the (meta)data in a searchable resource

Including the identifier in the metadata

  • ACCESSIBLE

The (meta)data can be retrieved via its identifier, using a standardised communications protocol.

The communications protocol is open, free and universally implementable

The communications protocol allows for an authentication and authorisation procedure when necessary.

Metadata remains accessible even if the data is no longer available.

  • INTEROPERABLE

(Meta)data uses a formal, accessible, shared and widely applicable language to represent knowledge.

(Meta)data uses vocabularies that follow the FAIR principles.

(Meta)data includes qualified references to other (meta)data.

  • REUSABLE

(Meta)data has a plurality of precise and relevant attributes.

The (meta)data is made available with a clear and accessible licence to use the data.

The (meta)data is linked to its provenance.

The (meta)data complies with relevant standards of the disciplinary community.

 

The FAIR principles act as guidelines, not standards. They outline essential qualities or behaviours to optimise data reuse, highlighting the importance of elements such as description and citation.

2. What makes up a Data Management Plan?

A DMP comprises several essential elements to ensure an efficient and ethical approach to data management throughout the lifecycle of a research project. Some of the key components include:

What data will be created or collected?
Clear identification of the types of data that will be created or collected during the project.

How will the data be created or generated?
A detailed description of how the data will be created, generated or collected.

What methods and standards will be used to process the data?
Definition of the methods and standards used to process the data, including cleaning, transformation and analysis processes.

What methods and standards will be adopted for handling data throughout the process?
Definition of the procedures relating to data handling, i.e. all procedures relating to deposit in a repository, transfer, or safe and efficient reuse of the data throughout the research project.

What documentation or metadata will be integrated into the data?
Specification of the documentation or metadata that will be integrated into the data to facilitate understanding and future reuse.

How will ethical issues be dealt with?
Indication of the strategies used to deal with ethical issues related to the collection, (re)use and dissemination of the data.

How to deal with copyright and intellectual property issues?
Detailed information about the copyright and intellectual property issues associated with the data (https://grupolusofona.sharepoint.com/sites/Click/administracao/Ordens%20de%20Servio/Forms/OS.aspx?FilterField1=Ano&FilterValue1=2023&FilterType1=Text&FilterDisplay1=2023&FilterField2=Entidade&FilterValue2=COFAC&FilterType2=Choice&FilterDisplay2=COFAC&id=%2Fsites%2FClick%2Fadministracao%2FOrdens%20de%20Servio%2FOS%5FCOFAC%5F2023%5F079%2Epdf&viewid=b48e1dbb%2D1b10%2D4f7c%2D8ba4%2D6f9891caf54d&q=Propriedade%20intelectual&parent=%2Fsites%2FClick%2Fadministracao%2FOrdens%20de%20Servio&parentview=7).

How will the data be stored and backed up during the project?
Outline of the file formats and procedures adopted to ensure secure data storage and backup during the project.

What are the levels of data access and security?
Identification of data access levels (e.g. restricted to the Institution, completely open access, etc.) and security measures implemented.

How will the data be maintained and preserved after the end of the project?
Outline a detailed plan for data preservation, including file formats and storage strategies.

What is the long-term data preservation plan?
Definition of a detailed plan for long-term data preservation, including identification of curation processes.

What data will be made available in Open Access?
Determination of which data will be made Open Access and in what form.

How will the data be shared?
Strategies for sharing the data, including platforms and formats.

Are there guidelines on restrictions or open access to the data?
Identification of restrictions or open access to data, where applicable.

Who is responsible for data management?
Clear designation of the person or team responsible for ongoing data management (DPO).

What resources are needed to implement the DMP?
Estimate of the human, financial and technological resources needed to implement the DMP.

1. What is a Data Management Plan?

A Data Management Plan (DMP) is a formal document that defines the life cycle of the data generated or collected in a research context. It covers various aspects, from the creation or collection to the processing of data during and after a research project. It identifies how the data will be created and documented, who will have access to it, how it can be (re)used and where it will be stored and/or preserved.

DMPs are dynamic documents that adapt and evolve as the research progresses. They are crucial for efficient research data management, as they provide a comprehensive understanding of the data and the circumstances in which it was generated. This approach to data management makes it possible to reuse and replicate data, thus contributing to a more robust scientific system.