Desafios para tornar dados de pesquisa mais FAIR: entre a promessa e a prática — Et al. #340

O crescimento exponencial da produção científica nas últimas décadas trouxe consigo não apenas avanços em diversas áreas do conhecimento, mas também uma preocupação cada vez mais evidente: como tornar os dados de pesquisa efetivamente utilizáveis, reprodutíveis e sustentáveis no longo prazo?

Nesse contexto, os princípios FAIR – sigla em inglês para Findable, Accessible, Interoperable, Reusable – têm se consolidado como referência internacional para a gestão e o compartilhamento de dados científicos.

Mais do que um slogan, esses princípios estabelecem parâmetros concretos para que os resultados de pesquisas sejam localizáveis em bases digitais, acessíveis mediante condições claras, interoperáveis em diferentes plataformas e reutilizáveis em novos contextos. Contudo, transformar tais diretrizes em prática cotidiana é um desafio que envolve aspectos técnicos, éticos, institucionais e financeiros.

Antes de aprofundar nos obstáculos, é essencial compreender a diferença entre dados FAIR e open data. Embora os conceitos dialoguem, não são sinônimos. Open data remete, em geral, à disponibilização de dados de forma aberta, gratuita e sem restrições de acesso, salvo exceções legais. Já o paradigma FAIR não exige necessariamente abertura irrestrita: um dado pode ser FAIR mesmo quando seu acesso é controlado, por exemplo, em casos de informações clínicas sensíveis.

O foco está menos na abertura em si e mais na qualidade da documentação, nos metadados associados, nos padrões técnicos empregados e nas condições de reutilização claramente descritas. Em suma, todo dado aberto deveria ser FAIR, mas nem todo dado FAIR precisa ser aberto. Essa distinção, muitas vezes negligenciada, é fundamental para equilibrar transparência científica com salvaguardas éticas.

Entre os principais entraves para a implementação dos princípios FAIR está a padronização de formatos e metadados. Pesquisadores de áreas distintas utilizam metodologias, softwares e convenções próprias, o que gera heterogeneidade. Arquivos em formatos proprietários dificultam a longevidade e a interoperabilidade dos dados.

Além disso, a ausência de taxonomias comuns ou ontologias consolidadas em determinados campos do conhecimento impede que informações sejam compreendidas por máquinas em escala global. Criar consensos em torno de padrões, sem sufocar a diversidade metodológica das ciências, exige diálogo interdisciplinar, investimento em infraestrutura tecnológica e tempo – um recurso cada vez mais escasso no cotidiano acadêmico.

Outro desafio sensível é a garantia de acessibilidade sem comprometer privacidade e ética. Em pesquisas com dados clínicos, sociais ou outros de natureza sensível, expor informações de forma descontrolada pode gerar riscos graves para indivíduos ou comunidades.

O princípio FAIR demanda acessibilidade “sob condições bem definidas”, o que inclui mecanismos de consentimento, anonimização, restrições de uso e governança de acesso. Ainda assim, a tensão entre transparência e proteção permanece. Instituições precisam investir em protocolos robustos de segurança da informação, além de oferecer orientação jurídica e ética para pesquisadores, a fim de que a prática FAIR não se converta em ameaça à integridade das pessoas envolvidas.

A questão da infraestrutura institucional é igualmente central. A ausência de repositórios confiáveis, com padrões de preservação digital e mecanismos de atribuição de identificadores persistentes (como DOI), dificulta a consolidação de práticas FAIR.

Muitas universidades e centros de pesquisa não dispõem de estruturas técnicas ou financeiras para manter repositórios que atendam aos requisitos internacionais. Além disso, a falta de programas de capacitação reduz a compreensão dos próprios pesquisadores sobre o que significa organizar, documentar e disponibilizar dados de modo FAIR. A dependência de plataformas comerciais, quando não acompanhada de políticas públicas sólidas, pode agravar desigualdades entre instituições de países centrais e periféricos.

Outro aspecto pouco discutido são os custos associados à adequação FAIR. Produzir ciência de qualidade já demanda esforços consideráveis; alinhar dados aos princípios FAIR exige etapas adicionais, como documentação detalhada, curadoria, verificação de padrões, conversão de formatos e submissão a repositórios.

Isso implica tempo que o pesquisador deixa de dedicar à escrita de artigos ou à coleta de novos dados, além de custos financeiros que nem sempre estão previstos em editais de fomento. O risco é que a adoção plena dos princípios FAIR se torne um privilégio de projetos bem financiados, enquanto outras iniciativas permanecem à margem.

Nesse cenário, iniciativas internacionais oferecem exemplos relevantes. O European Open Science Cloud (EOSC), por exemplo, busca criar uma infraestrutura paneuropeia que permita o compartilhamento e a reutilização de dados científicos em larga escala, respeitando padrões FAIR.

Já o movimento GO FAIR, descentralizado e global, propõe a criação de redes temáticas e comunidades de prática para facilitar a implementação dos princípios, adaptando-os às realidades locais.

Na América Latina, destaca-se o SciELO Data, que fornece repositório e serviços para gestão de dados alinhados aos princípios FAIR, fortalecendo a visibilidade da produção científica regional. Essas experiências demonstram que, embora os desafios sejam enormes, a construção de ecossistemas colaborativos é possível e necessária.

A partir desses exemplos, alguns aprendizados se destacam. Primeiro, que a adoção dos princípios FAIR não pode ser vista como responsabilidade exclusiva dos pesquisadores individuais. É preciso um compromisso coletivo, envolvendo agências de fomento, universidades, editoras científicas e governos.

Segundo, que a formação de competências em ciência de dados e gestão da informação deve ser incorporada à formação de novos cientistas, preparando-os para uma realidade em que publicar artigos já não basta: será preciso também publicar dados de modo confiável e útil.

Por fim, a experiência internacional mostra que a construção de infraestruturas comuns, abertas e sustentáveis, é condição indispensável para reduzir assimetrias globais e democratizar o acesso ao conhecimento.

Em síntese, os princípios FAIR representam um avanço crucial para tornar a ciência mais transparente, reprodutível e colaborativa. Contudo, sua implementação encontra barreiras técnicas, éticas, financeiras e institucionais que não podem ser ignoradas. A tentação de reduzir a discussão a um checklist burocrático deve ser evitada.

O verdadeiro desafio é criar condições estruturais para que dados de pesquisa sejam não apenas armazenados, mas efetivamente reutilizados em benefício do avanço científico e da sociedade. Para isso, será necessário um esforço coordenado, sustentado por políticas públicas, investimentos em infraestrutura, cooperação internacional e capacitação permanente. Apenas assim os dados científicos poderão cumprir seu potencial transformador, tornando-se verdadeiramente FAIR.

_____
(*) Fundada em 2000, a Zeppelini Publishers atua no segmento editorial técnico e científico, atendendo empresas e organizações e desenvolvendo estratégias para todas as áreas da produção de publicações impressas e online.

Foto: Pressfoto / Freepik