O estudo foi conduzido por uma equipe de pesquisadores brasileiros do Instituto Todos pela Saúde, da Universidade de São Paulo (USP), da Fundação de Medicina Tropical Dr. Heitor Vieira Dourado, da Fundação Oswaldo Cruz (Fiocruz), entre outras, em colaboração com pesquisadores internacionais. Os resultados foram publicados na revista PeerJ.
Métodos
Os pesquisadores desenvolveram a ferramenta Tucuxi-BLAST, que usa uma abordagem inspirada em código genético para codificar registros de identificação em sequências semelhantes a DNA. Em seguida, o algoritmo BLASTn, tradicionalmente usado em bioinformática para comparar sequências biológicas, é aplicado para alinhar essas sequências e identificar correspondências entre diferentes bases de dados. A técnica foi testada em grandes conjuntos de dados simulados com até 300 milhões de registros, além de várias bases administrativas reais de saúde, incluindo dados de doenças como meningite, HIV e tuberculose.
Achados principais
A ferramenta Tucuxi-BLAST superou métodos tradicionais de ligação de registros, sendo capaz de vincular grandes bases administrativas com maior rapidez e precisão. Por exemplo, enquanto métodos convencionais levaram mais de 5 dias para processar grandes conjuntos, a Tucuxi-BLAST realizou a tarefa em cerca de 23 horas. Além disso, a nova abordagem lidou melhor com erros comuns nos bancos de dados, como erros de digitação ou grafia, o que melhora a qualidade da ligação entre registros de diferentes sistemas. Essa estratégia inovadora transforma informações de identificação em um formato codificado e explorável com ferramentas bioinformáticas, ampliando o potencial de análises integradas em saúde pública.
Interpretação
Os achados indicam que novas estratégias de "record linkage" (ligação de registros) baseadas em métodos inspirados no código do DNA podem revolucionar a forma como grandes bases de dados administrativas são integradas no campo da saúde. Ao diminuir erros e reduzir o tempo de processamento necessário para vincular registros entre sistemas diferentes, essa abordagem pode fortalecer pesquisas epidemiológicas, vigilância de doenças e avaliações de serviços de saúde, onde a integração de múltiplos bancos é essencial para análises precisas. Ferramentas como a Tucuxi-BLAST representam um avanço tecnológico que pode acelerar estudos com grandes volumes de dados e, consequentemente, apoiar decisões de política em saúde pública com maior precisão e agilidade.