Dionatas Pereira Silva *
Juliano Schimiguel**
UNIANCHIETA, Brasil
dionatas3@gmail.com
RESUMO
Utilizar big data para criar soluções inteligentes é um grande desafio e tem exigido mais interatividade entre as diversas áreas do conhecimento, processar grandes volumes de dados é uma parte desse desafio, com a diversidade de dados gerados de diferentes fontes, é fundamental o uso de tecnologias big data. O objetivo do artigo é descrever big data, as tecnologias que processam e armazenam essa gigantesca massa de dados, descrever data mining, ou mineração de dados e tratar dados históricos utilizando as bibliotecas da linguagem de programação Python: Pandas e matplotlib. A metodologia utilizada para elaboração do artigo foi um estudo bibliográfico sobre big data e data mining e também um caso de uso que comparou os dados históricos das bolsas concedidas na região do CIMBAJU (Consórcio Intermunicipal dos Municípios da Bacia do Juqueri) e do Brasil. A conclusão deste trabalho é a apresentação do universo big data e suas tecnologias, mostrando teoricamente o que é big data e também data mining além de uma descrição do ProUni e a comparação dos dados históricos que foram analisados.
Palavras-Chave: Big data, mineração de dados, Python, Pandas, matplotlib, ProUni, data mining, dados.
ABSTRACT
Using big data to create smart solutions is a major challenge and has demanded more interactivity among the various areas of knowledge, processing large volumes of data is a part of this challenge, with the diversity of data generated from different sources, is Fundamental use of big data technologies. The purpose of the article is to describe big data, the technologies that process and store this gigantic mass of data, describe data mining, and handle historical data using the libraries of the Python programming language: Pandas and Matplotlib. The methodology used to elaborate the article was a study on big data and data mining and also a case of use that compared the historical data of the fellows contemed in the region of Cimbaju (Intermunicipal consortium of Municipalities of the Juqueri basin) and of Brazil. The conclusion of this work is the presentation of the Big Data universe and its technologies, theoretically showing what is big data and also data mining in addition to a description of the ProUni and the comparison of the historical data that were analyzed.
Keywords: Big data, data mining, Python, Pandas, Matplotlib, ProUni, data
Para citar este artículo puede utilizar el siguiente formato:
Dionatas Pereira Silva y Juliano Schimiguel (2019): “Análise de base de dados histórica do Prouni, usando mineração de dados”, Revista Atlante: Cuadernos de Educación y Desarrollo (marzo 2019). En línea:
https://www.eumed.net/rev/atlante/2019/03/base-datos-historica.html
//hdl.handle.net/20.500.11763/atlante1903base-datos-historica