“Tão aberto quanto possível, tão fechado quanto necessário”
A Universidade Lusófona alinha-se com as Políticas relativas à gestão e partilha dos dados de investigação emanadas pela Comissão Europeia e recomendações da Fundação para Ciência e Tecnologia. Estas políticas incluem requisitos relativos à gestão e proteção de dados, nomeadamente através da elaboração de planos de gestão de dados, e definem a partilha de dados como a opção padrão. No âmbito da política e requisitos estabelecidos no Horizonte 2020 e Horizonte Europa este princípio relativo aos dados de investigação foi formulado como “Tão aberto quanto possível, tão fechado quanto necessário”.
Um Plano de Gestão de Dados (PGD) (Data Management Plan, DMP), é um documento formal que define o ciclo de vida dos dados gerados ou recolhidos em contexto de investigação. Abrange diversos aspectos, desde a criação ou recolha até ao processamento dos dados durante e após um projeto de investigação. Identifica de que forma os dados serão criados e documentados, quem terá acesso a eles, como podem ser (re)utilizados e onde serão armazenados e/ou preservados.
Os PGDs são documentos dinâmicos que se adaptam e evoluem à medida que a investigação progride. São cruciais para uma gestão eficiente dos dados de investigação, pois proporcionam uma compreensão abrangente dos dados e das circunstâncias em que foram gerados. Esta abordagem sobre a gestão dos dados possibilita a sua reutilização e replicação, contribuindo assim para um sistema científico mais robusto.
Um PGD compreende diversos elementos essenciais para assegurar uma abordagem eficiente e ética na gestão de dados ao longo do ciclo de vida de um projeto de investigação. Alguns dos componentes fundamentais incluem:
Identificação clara dos tipos de dados que serão criados ou recolhidos durante o projeto.
Descrição detalhada da forma como os dados serão criados, gerados ou recolhidos.
Definição de métodos e normas utilizadas no tratamento dos dados, incluindo processos de limpeza, transformação e análise.
Definição dos procedimentos relativos à manipulação dos dados, ou seja, todos os procedimentos relativos a depósito em repositório, transferência, ou reutilização segura e eficiente dos dados ao longo de todo o projeto de investigação
Especificação da documentação ou metadados que serão integrados aos dados para facilitar a compreensão e reutilização futura.
Indicação das estratégias utilizadas para lidar com questões éticas relacionadas com a recolha, (re)utilização e divulgação dos dados.
Informação detalhada acerca das questões de direitos de autor e propriedade intelectual associadas aos dados (https://grupolusofona.sharepoint.com/sites/Click/administracao/Ordens%20de%20Servio/Forms/OS.aspx?FilterField1=Ano&FilterValue1=2023&FilterType1=Text&FilterDisplay1=2023&FilterField2=Entidade&FilterValue2=COFAC&FilterType2=Choice&FilterDisplay2=COFAC&id=%2Fsites%2FClick%2Fadministracao%2FOrdens%20de%20Servio%2FOS%5FCOFAC%5F2023%5F079%2Epdf&viewid=b48e1dbb%2D1b10%2D4f7c%2D8ba4%2D6f9891caf54d&q=Propriedade%20intelectual&parent=%2Fsites%2FClick%2Fadministracao%2FOrdens%20de%20Servio&parentview=7).
Delineamento dos formatos de arquivo e procedimentos adotados para assegurar a segurança do armazenamento dos dados e a criação de cópias de segurança durante o projeto.
Identificação dos níveis de acesso aos dados (ex. restritos à Instituição, acesso completamente aberto, etc) e medidas de segurança implementadas.
Delineamento de plano detalhado para a preservação de dados, incluindo formatos de arquivo e estratégias de armazenamento.
Definição de plano detalhado para a preservação de dados a longo prazo, incluindo identificação dos processos de curadoria.
Determinação de quais os dados que serão disponibilizados em Acesso Aberto e de que forma.
Estratégias para o compartilhamento dos dados, incluindo plataformas e formatos.
Identificação de restrições ou acesso aberto aos dados, quando aplicável.
Designação clara da pessoa ou equipa responsável pela gestão contínua dos dados (DPO).
Estimativa dos recursos humanos, financeiros e tecnológicos necessários para a implementação do PGD
A criação de um PGD, o tratamento subsequente, bem como a sua partilha e disponibilização, são requisitos essenciais no contexto do Acesso Aberto. As diretrizes estabelecidas pela União Europeia (UE), por meio do European Research Council (ERC), e por projetos financiados pelo Horizonte 2020, consideram esse critério como desejável, proporcionando ferramentas específicas para sua implementação. O estímulo à divulgação de dados de pesquisa no âmbito do Horizonte 2020 é efetuado por meio do Open Research Data (ORD), alinhado aos princípios FAIR, que preconizam que os dados devem ser localizáveis (findable), acessíveis (accessible), interoperáveis (interoperable) e reutilizáveis (reusable).
Dados FAIR referem-se àqueles que são geridos em conformidade com os princípios FAIR – Findable, Accessible, Interoperable e Reusable. Esses princípios visam orientar a gestão dos dados de pesquisa, facilitando a sua localização, acesso, interoperabilidade e reutilização. Cada letra do acrônimo FAIR representa um conjunto de 15 princípios.
FINDABLE (LOCALIZÁVEIS) |
ACCESSIBLE (ACESSÍVEIS) |
INTEROPERABLE (INTEROPERÁVEIS) |
REUSABLE (REUTILIZÁVEIS) |
A atribuição de um identificador único persistente aos (meta)dados |
Os (meta)dados são recuperáveis através do seu identificador, mediante um protocolo de comunicações normalizado. |
Os (meta)dados usam uma linguagem formal, acessível, partilhada e de ampla aplicabilidade para a representação do conhecimento. |
Os (meta)dados têm uma pluralidade de atributos precisos e relevantes. |
A descrição dos dados com metadados pormenorizados |
O protocolo de comunicações é aberto, gratuito e universalmente implementável. |
Os (meta)dados usam vocabulários que seguem os princípios FAIR. |
Os (meta)dados são disponibilizados com uma licença clara e acessível de uso dos dados. |
O registo ou a indexação dos (meta)dados num recurso pesquisável |
O protocolo de comunicações permite um procedimento de autenticação e autorização, quando necessário. |
Os (meta)dados incluem referências qualificadas a outros (meta)dados. |
Os (meta)dados são associados à sua proveniência. |
A inclusão do identificador nos metadados |
Os metadados permanecem acessíveis, mesmo se os dados já não estiverem disponíveis. |
Os (meta)dados cumprem normas relevantes da comunidade disciplinar. |
Os princípios FAIR funcionam como diretrizes, não como normas. Eles delineiam qualidades ou comportamentos essenciais para otimizar a reutilização dos dados, destacando a importância de elementos como descrição e citação.
Os requisitos comuns incluem a elaboração de um PGD e a disponibilização dos dados de investigação em acesso aberto, sempre que possível. Essa exigência abrange os dados necessários para validar os resultados em publicações científicas, assim como outros dados decorrentes do projeto conforme especificado no PGD.
Comissão Europeia – Estratégia Europeia para os Dados:
A Comissão Europeia preconiza o acesso aos dados que validam publicações científicas, assim como a disponibilização de todos os outros dados associados ao projeto, com o intuito de maximizar o acesso e a reutilização dos dados gerados por projetos de investigação. No entanto, os projetos poderão não compartilhar dados, seja na fase de proposta ou durante a execução, mediante justificação no PDG do projeto. Isso pode ocorrer nos seguintes cenários:
Quando se deve elaborar um PGD varia conforme o contexto do projeto:
No âmbito de um projeto financiado:
No âmbito das unidades de investigação:
São sugeridas para apoiar a elaboração e gestão de PGDs as seguintes ferramentas:
Estas plataformas permitem a inserção de DMPs segundo os modelos estabelecidos pelas entidades financiadoras (p.e. FCT, Horizon Europe ect).
No entanto, dadas as exigências específicas para PGDs podem variar entre financiadores e organizações, é sempre bom consultar as diretrizes específicas do financiador.
A preservação de dados de investigação é fundamental para garantir a integridade e acessibilidade a longo prazo. São recomendados os seguintes repositórios:
O Repositório Científico Lusófona (https://recil.ensinolusofona.pt/) é um serviço digital que congrega os trabalhos científicos produzidos no Grupo Lusófona, disponibilizando de forma pública e universal a produção científica do Grupo.
É importante considerar a política de preservação de dados, a acessibilidade a longo prazo, a segurança, os requisitos de metadados e as necessidades específicas da sua investigação e comunidade, na escolha do melhor repositório.
As agências de financiamentos reconhecem fundamentos válidos para a não divulgação dos dados de investigação, como quando o projeto não gera dados, quando os dados estão sujeitos a exploração comercial, por razões de confidencialidade, privacidade, segurança nacional, ou se a partilha de dados comprometer o objetivo central do projeto. Essa é a razão pela qual a Comissão Europeia adotou o princípio "As open as possible, as closed as necessary" - "Tão abertos quanto possível, tão fechados quanto necessário".
Sim, as agências de financiamento solicitam a divulgação dos conjuntos de dados que sustentam as publicações, mas não há obrigação de compartilhar os conjuntos restantes. Além disso, é possível que, inicialmente, a disponibilização de alguns conjuntos de dados seja planeada, mas essa decisão pode ser modificada posteriormente, especialmente se esses dados se encaixarem nas exceções previstas, como a possibilidade de exploração comercial. Em tais situações, a decisão deve ser justificada no PGDs.
Existem vários cursos de formação livre que poderão ajudar a compreender melhor a necessidade e como se faz um plano de gestão de dados:
O cumprimento dessas diretrizes tem impacto positivo na avaliação do projeto, desde a fase de proposta.