AggRaDa - Aggregation of Raw Data

O AggRaDa é um framework projetado para automatizar a agregação espaço-temporal de dados brutos heterogêneos provenientes de múltiplas fontes. Seu propósito é identificar, de forma automática, granularidades que maximizem a consistência e a representatividade dos dados, tornando-os mais úteis para análises e tomada de decisão. A arquitetura modular, baseada em microsserviços, integra funções de indexação e manipulação de dados espaciais e temporais, possibilitando a exploração eficiente de diferentes escalas e a avaliação quantitativa dos resultados.

Agregação Espaço-TemporalDados de Múltiplas FontesDados HeterogêneosQualidade dos DadosAutomação de Agregação de DadosAgregação de Dados Brutos

Project Contact

Talk with us for more information and requests about this project.

Ennio Politi Lopes

enniolopes@gmail.com

Project Overview

Introdução

A crescente disponibilidade de dados abertos cria oportunidades inéditas para pesquisa e inovação, mas também traz desafios relacionados à heterogeneidade e às diferentes escalas temporais e espaciais das bases de dados. Muitas vezes, esses dados são coletados por instituições distintas, com metodologias próprias, o que dificulta análises consistentes. O AggRaDa surge para enfrentar esse problema, propondo uma solução automatizada para integrar, harmonizar e agregar dados brutos multifonte. Seu diferencial está na capacidade de identificar a granularidade mais adequada para cada contexto, preservando a fidelidade da informação e otimizando a representatividade dos dados.

Objetivos

Automatizar a agregação espaço-temporal de dados brutos heterogêneos multifonte.
Implementar métricas de qualidade que avaliem a consistência, representatividade e fidelidade dos dados agregados.
Explorar diferentes granularidades espaciais e temporais, investigando seus impactos na qualidade das análises.
Fornecer uma arquitetura modular e escalável, baseada em microsserviços e interoperabilidade, para facilitar integração e expansão.
Validar o framework com estudos de caso utilizando dados reais de domínios variados (saúde, socioeconômicos, ambientais, urbanos).

Aplicações

Saúde pública: integração de dados epidemiológicos com cadastros socioeconômicos para análises em múltiplas escalas.
Gestão urbana: fusão de dados de mobilidade, infraestrutura e redes sociais para planejamento de cidades inteligentes.
Meio ambiente: análise de dados ambientais e climáticos em diferentes granularidades para monitoramento e políticas públicas.
Ciências sociais: estudo de correlações entre dados censitários, socioeconômicos e eventos em diferentes níveis espaço-temporais.

Limitações

Dependência da qualidade dos dados de origem: erros, lacunas e inconsistências podem impactar os resultados.
Nem sempre existe uma granularidade única e ótima; em alguns casos, o sistema pode gerar resultados menos representativos.
O desempenho pode variar de acordo com o volume de dados e a complexidade das consultas espaciais/temporais.
O framework não substitui a análise especializada: os resultados servem de suporte, mas a interpretação depende do domínio de aplicação.

Collaborators

Ennio Politi Lopes

Pesquisador principal

Alexandre Cláudio Botazzo Delbem

Orientador