Avaliação do uso de Histogramas Espaciais para Particionamento de Dados em Sistemas Distribuídos
Resumo: O processamento de dados espaciais teve um aumento significativo desde a criação de equipamentos que auxiliam na obtenção de informações, como o GPS (Global Position System), smartphones, drones e satélites. Com esses dados espaciais, novas informações podem ser obtidas. Um exemplo de processamento de dados espaciais é a consulta espacial, que encontra em dois ou mais conjunto de dados informações correlacionadas. A consulta espacial pode ter sua execução complexa devido a quantidade de dados envolvidos. Os sistemas computacionais que realizam esses processamentos não têm evoluído na mesma proporção, de forma a não atender toda a demanda. Sendo assim, é muito adotado na literatura a execução paralela das consultas espaciais por sistemas distribuídos. O particionamento dos dados espaciais no sistema distribuído é um ponto que influencia diretamente na eficiência do processamento de uma consulta espacial. Uma técnica que vem sendo muito utilizada é o uso de histogramas multidimensionais para o particionamento dos dados no sistema distribuído. Esta pesquisa apresenta uma análise do particionamento de dados em um sistema distribuído utilizando diferentes tipos de histogramas espaciais. Os testes se baseiam na execução de diferentes consultas espaciais utilizando os histogramas de grade e o Minskew para o particionamento dos dados espaciais. As execuções foram realizados em um cluster físico com 16 máquinas de configurações idênticas sob as mesmas condições de uso. Os testes mostraram que apesar de todas as características de pré-processamento do histograma Minskew, o histograma de grade apresentou maior eficiência no particionamento dos dados no cluster.
Palavras-chave: Histogramas multidimensionais; Cluster; Dados espaciais; Processamento distribuído.
Monografia completa. Copyright © 2017. Todos os direitos reservados.
Citação: Leandro Cesar Pita. Avaliação do uso de Histogramas Espaciais para Particionamento de Dados em Sistemas Distribuídos. Monografia. Bacharelado em Ciências da Computação. Universidade Federal de Goiás, Regional Jataí. Jataí, GO, Brasil. 2017. 51p.
Copiar citação no formato bibtex.