Construção de Histograma Híbrido para Melhoria da Precisão da Seletividade de Consultas de Janela em Dados Espaciais
Resumo: O processamento de bancos de dados espaciais volumosos ainda é um desafio relevante na computação. Atualmente, existem diversas tecnologias capazes de capturar grandes volumes de dados espaciais de forma rápida e eficiente. No entanto, quando comparados o processamento e a captura de dados espaciais, se torna nítido que com o decorrer do tempo, a evolução do processamento não conseguiu acompanhar a evolução das tecnologias usadas para a captura de dados espaciais, de forma que essa diferença atrasa o procedimento por completo. Técnicas conhecidas como histogramas vêm sendo empregadas para reduzir o uso de recursos computacionais e acelerar o processamento de consultas espaciais, principalmente as multijunções. Esta pesquisa teve como objetivo criar um histograma híbrido a partir do aperfeiçoamento de dois histogramas conhecidos, sendo eles o Histograma de Euler e o Histograma MinSkew. Enquanto o Histograma de Euler foca na solução do problema conhecido como contagem múltipla, o Histograma MinSkew foca na melhoria da precisão da estimativa para datasets não uniformes. Observando que estes dois problemas contribuem na imprecisão das estimativas, a hipótese principal da pesquisa é de que um histograma híbrido, que implemente as duas técnicas, contribuiria na redução dos erros de estimativa e consequentemente, acelere o processamento das consultas. Um terceiro método foi projetado unindo as suas principais características. Seguiu-se com a implementação em código do método e com testes de validação. Construiu-se uma forma de visualização do histograma para validar visualmente sua estrutura no QGis (software utilizado para a visualização de bancos de dados espaciais). Em seguida foi realizada a implementação do algoritmo de busca, o qual permitiu a avaliação da precisão da seletividade, e foi realizado experimento comparativo de desempenho entre o novo método proposto e os dois baselines (Histograma MinSkew e Histograma de Euler). Analisando os resultados obtidos, foi observado que o histograma EulerSkew apresentou maior assertividade nos datasets do tipo polígono sendo superior ao histograma MinSkew.
Palavras-chave: Histogramas; Estimativa de Seletividade; Consulta de Janela.
Monografia completa. Copyright © 2022. Todos os direitos reservados.
Citação: João Marcelo Teodoro de Sousa. Construção de Histograma Híbrido para Melhoria da Precisão da Seletividade de Consultas de Janela em Dados Espaciais. Monografia. Bacharelado em Ciência da Computação. Universidade Federal de Jataí. Jataí, GO, Brasil. 2022. 51p.
Copiar citação no formato bibtex.