A publicação científica sempre esteve centrada na análise, hipótese e descoberta. Artigos científicos eram — e ainda são — a principal moeda de troca do conhecimento: um espaço para apresentar resultados originais, discutir implicações e contribuir para o avanço do saber.
No entanto, uma nova tendência editorial vem ganhando força e desafiando esse modelo tradicional: os periódicos de dados, ou data journals, que priorizam a publicação estruturada de conjuntos de dados, em vez de análises ou teorias.
A revolução dos dados não é apenas tecnológica; é epistemológica. Muda a forma como a ciência é construída, compartilhada e validada. Neste artigo, exploramos o crescimento desse novo modelo de publicação, suas potencialidades e os desafios éticos, técnicos e editoriais envolvidos — buscando compreender se o futuro da ciência, de fato, passará mais pelos dados do que pelas palavras.
A emergência dos data journals
Os periódicos de dados não são simples repositórios. Eles operam com rigor editorial, revisão por pares e exigência de documentação detalhada dos conjuntos de dados. Alguns dos mais influentes são Scientific Data, voltado para dados nas áreas de ciências da vida, ambientais e sociais, com ênfase na reutilização e transparência.
Além do GigaScience, especializado em datasets de grande escala, particularmente em biotecnologia e ciências biomédicas, há também o Earth System Science Data, focado em dados de sistemas terrestres e ambientais, muitos dos quais essenciais para estudos climáticos. E o Data in Brief, que permite a publicação de dados complementares de pesquisas em andamento ou finalizadas, com formato acessível e citação independente.
Esses periódicos preenchem uma lacuna antiga: o reconhecimento formal de um tipo de trabalho científico que até então era invisibilizado — o trabalho com os dados brutos. Coletar, limpar, padronizar, organizar, documentar, armazenar e tornar acessível um dataset são tarefas que demandam tempo, conhecimento técnico e responsabilidade, mas raramente recebiam crédito equivalente ao “paper”.
Como se vê, a ascensão dos periódicos de dados é sintomática de mudanças mais amplas na ciência contemporânea. Podemos destacar pelo menos cinco razões principais para esse movimento.
Reprodutibilidade e crise de confiança na ciência: Vivemos o que alguns chamam de “crise de replicação” — especialmente em áreas como psicologia, medicina e ciências sociais. Muitos estudos não conseguem ser reproduzidos por outros pesquisadores, o que levanta dúvidas sobre a solidez dos achados. Publicar os dados originais, com transparência, é uma resposta ética e metodológica a esse problema. Ao dar acesso aos dados completos e à metodologia de coleta, os data journals permitem que outros cientistas testem hipóteses alternativas, verifiquem erros e validem as análises. Isso fortalece a ciência como processo coletivo e não apenas como relato individual.
Reconhecimento acadêmico e métricas alternativas: A publicação de dados começa a ser valorizada como produção científica legítima. Muitos datasets recebem DOIs próprios e são citáveis. Em algumas áreas, a citação de datasets já impacta diretamente nos índices de produtividade e nas avaliações institucionais. Isso também contribui para uma diversificação do reconhecimento científico – técnicos, bioinformatas, engenheiros de dados e especialistas em curadoria passam a ocupar um espaço mais central na ecologia da ciência.
Economia de tempo e recursos: Ao disponibilizar datasets completos, economiza-se o esforço de duplicar coletas que já foram feitas. Isso é especialmente importante em áreas com custos elevados de coleta, como pesquisas em comunidades remotas, escavações arqueológicas, observações astronômicas ou sequenciamentos genéticos. No contexto de países em desenvolvimento, a publicação aberta de dados também democratiza o acesso à matéria-prima da ciência, permitindo que mais pesquisadores utilizem informações de qualidade mesmo com recursos limitados.
Ciência aberta como valor e prática
A abertura dos dados está no cerne do movimento pela Open Science. Agências como Unesco, União Europeia e National Science Foundation vêm exigindo que projetos financiados com recursos públicos tornem seus dados acessíveis. Os data journals surgem como mecanismos formais para isso, oferecendo curadoria e validação científica.
Estímulo à interdisciplinaridade e inovação: Datasets abertos podem gerar inovações inesperadas. Um banco de dados meteorológico pode ser utilizado por cientistas sociais para estudar o impacto do clima na migração. Dados de mobilidade urbana podem ser reinterpretados por urbanistas, sociólogos ou engenheiros. O compartilhamento estimula novas perguntas e conexões.
Exemplos de impacto
Durante a pandemia da Covid-19, a velocidade com que os dados genéticos do vírus SARS-CoV-2 foram publicados foi essencial para o desenvolvimento de vacinas e estratégias de contenção. Plataformas como GISAID, repositórios de pré-publicações e periódicos de dados permitiram que o conhecimento fosse compartilhado quase em tempo real — rompendo barreiras geográficas e burocráticas.
Outro exemplo vem da área da genômica. Projetos como o 1000 Genomes Project e o Human Cell Atlas publicaram imensos conjuntos de dados genéticos e transcriptômicos em periódicos de dados e repositórios abertos. Esses bancos de dados estão sendo usados por centenas de grupos de pesquisa ao redor do mundo, acelerando descobertas em doenças raras, terapias personalizadas e biotecnologia.
Desafios que ainda se impõem
Apesar dos avanços, publicar dados abertos em periódicos especializados envolve uma série de desafios:
Privacidade e ética: Dados sensíveis — especialmente os que envolvem seres humanos — exigem protocolos rigorosos de anonimização. Em muitos casos, mesmo dados supostamente anonimizados podem ser cruzados com outras fontes e levar à reidentificação de indivíduos. Isso é particularmente perigoso em estudos sobre saúde, violência, gênero ou dados geográficos detalhados.
Perenidade e infraestrutura: Quem garante que um dataset publicado hoje estará disponível daqui a 20 anos? A preservação digital depende de infraestrutura robusta, padrões técnicos e financiamento contínuo. Muitos periódicos ainda não têm garantias claras sobre a manutenção de seus arquivos no longo prazo.
Qualidade e revisão por pares: Revisar dados exige habilidades diferentes da revisão tradicional de artigos. É preciso avaliar estrutura, metadados, consistência, formato e usabilidade — o que nem sempre é trivial. Faltam ainda padrões universais para julgar a qualidade de um dataset.
Modelo de negócios: Alguns data journals adotam taxas de publicação elevadas (APCs), o que pode excluir pesquisadores de países em desenvolvimento. A ciência aberta, nesse sentido, corre o risco de reproduzir desigualdades se não houver políticas de apoio inclusivas.
Cultura e formação científica: Por fim, muitos pesquisadores ainda não foram treinados para pensar seus dados como produtos científicos. Falta formação em gestão de dados, curadoria digital, licenciamento, FAIR principles (Findable, Accessible, Interoperable, Reusable) e boas práticas de documentação.
Transformação
Os periódicos de dados não vão substituir os artigos científicos — mas vão transformá-los. Em vez de trabalhar com publicações isoladas e fechadas, caminhamos para um modelo modular e aberto, em que dados, códigos, análises e resultados coexistem de forma integrada.
O futuro da ciência está no diálogo entre esses elementos. Os datasets ganham protagonismo não por serem o “fim” da pesquisa, mas porque permitem novos começos — novas análises, hipóteses e colaborações. Nesse universo, uma coisa é certa: ignorar a centralidade dos dados na ciência contemporânea é ficar à margem da história do conhecimento.
_____
(*) Fundada em 2000, a Zeppelini Publishers atua no segmento editorial técnico e científico, atendendo empresas e organizações e desenvolvendo estratégias para todas as áreas da produção de publicações impressas e online.
Foto: EyeEm / Freepik