Mineração de Dados Aplicada na Base do Cadastro Único para Programas Sociais com Enfoque nos Perfis dos Usuários Cadastrados Utilizando o Algoritmo J48
Abstract
O KDD (Knowledge Discovery in Databases), ou processo de extração do conhecimento em banco de dados, compreende técnicas que possibilitam a verificação e extratação de padrões e informações vantajosas de uma grande base de dados, identificando semelhanças nos dados e apresentando regras e padrões como resultados. O Cadastro Único para Programas Sociais do Governo Federal (Cadastro Único) é utilizado como instrumento para identificar e caracterizar famílias de baixa renda, possibilitando que a gestão pública tome conhecimento da realidade socioeconômica da população. O artigo objetiva gerar conhecimento a partir do banco de dados do Cadastro Único, que contém dados relativos aos usuários que efetuaram o cadastro desde o início da implantação do mesmo até 31 de outubro do ano de 2018, no município de Cachoeiro de Itapemirim, ES. A base de dados utilizada foi obtida no site de Consulta, Seleção e Extração de Informações do Cadastro Único – CECAD. Para o alcance do objetivo proposto, a base selecionada passou pelo processo de KDD, além de serem empregadas técnicas de Mineração de Dados e utilização do software WEKA. A tarefa aplicada para minerar os dados foi a de Classificação, com o emprego da técnica de árvore de decisão a partir do algoritmo J48. Após minerar os dados, pôde-se observar a influência da renda familiar nos resultados, assim como a predominância de situações de vulnerabilidade social, como a identificação de famílias que não possuem água canalizada, a qual não tem acesso à coleta de lixo, da mesma forma que a constatação de ausência de escoamento sanitário. Almeja-se que as informações obtidas deste artigo possam ser empregadas para auxiliar a gestão municipal nas tomadas de decisão, no que se refere à definição de ações de implementação de políticas públicas, assim como na criação e pactuação de programas e benefícios sociais. Palavras-Chave. Cadastro Único; Mineração de Dados; Programas Sociais; KDD (Knowledge Discovery in Databases); Algoritmo J48.References
CARDOSO, O. N. P.; MACHADO, R. T. M. Gestão do conhecimento usando data mining: estudo de caso na Universidade Federal de Lavras. Revista de Administração Pública, Rio de Janeiro, 2008. Disponível em: <http://www.scielo.br/pdf/rap/v42n3/a04v42n3.pdf>. Acesso em: 24 nov. 2018.
CRETTON, N. N. Mineração de dados aplicada na base do ENADE com enfoque na criação de perfis dos estudantes que prestaram o exame utilizando o algoritmo j48. 2016. 127 f. Dissertação (Mestrado em Pesquisa Operacional e Inteligência Computacional) - Universidade Candido Mendes, Rio de Janeiro, 2016.
CRETTON, N. N.; GOMES, G. R.. Aplicação de técnicas de mineração de dados na base de dados do ENADE com enfoque nos cursos de medicina. Acta Biomedica Brasiliensia, 2016. Disponível em: <http://www.actabiomedica.com.br/index.php/acta/article/view/130/111>. Acesso em: 01 dez. 2018.
DUHAM, M. H. Data mining: introductory and advanced topics. New Jersey: Pearson Education: 2003.
FAYYAD, U..; PIATETSKY-SHAPIRO, G.; SMYTH, P.. Advances in knowledge discovery and data mining. California: AAAI Press, 1996.
FRANK, E.; WITTENM I. H. Data mining: practical machine learning tools and techniques. 2nd ed. San Francisco: Morgan Kaufmann Publishers, 2005.
MINISTÉRIO DO DESENVOLVIMENTO SOCIAL. Cadastro Único para Programas Sociais, 2015. Disponível em: <http://mds.gov.br/assuntos/cadastro-unico>. Acesso em: 30 nov. 2018.
SANTOS, M. F.; AZEVEDO, C. S. Data mining: descoberta de conhecimento em bases de dados. São Paulo: FCA, 2005.
SASSI, R. J. An hybrid architecture for clusters analysis: rough setstheory and self-organizing map artificial neural network. Pesquisa Operacional, Rio de Janeiro, 2012. Disponível em: <http://www.scielo.br/pdf/pope/v32n1/aop0512.pdf>. Acesso em: 24 nov. 2018.
SILVA, A. M. G. O desempenho escolar via uma abordagem de descoberta de conhecimento em bases de dados. 2007. 172 f. Dissertação
(Mestrado em Sistemas de Informação) - Universidade do Minho, Braga-Portugal,
Disponível em: <http://repositorium.sdum.uminho.pt/handle/1822/7966>.
Acesso em: 24 nov. 2018.
SILVA, M. P. dos S. Mineração de Dados - Conceitos, Aplicações e Experimentos com Weka. 2004. Disponível em: http://www.lbd.dcc.ufmg.br/colecoes/erirjes/2004/004.pdf>. Acesso em: 20 abril. 2018.
VIANNA, R. C. X. F. et al. Mineração de dados e características da mortalidade infantil. Cadernos de Saúde Pública, Rio de Janeiro, 2010. Disponível em: <http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0102-311X2010000300011>. Acesso em: 25 nov. 2018.
WORLD WITHOUT POVERTY (WWP). Breve histórico do cadastro unico. Disponível em: <https://wwp.org.br/wp-content/uploads/2016/12/breve_historico_do_cadastro_unico.pdf>. Acesso em: 01 dez. 2018.
Downloads
Published
Issue
Section
License
• O(s) autor(es) autoriza(m) a publicação do artigo na revista;
• O(s) autor(es) garante(m) que a contribuição é original e inédita e que não está em processo de avaliação em outra(s) revista(s);
• A revista não se responsabiliza pelas opiniões, ideias e conceitos emitidos nos textos, por serem de inteira responsabilidade de seu(s) autor(es);
• É reservado aos editores o direito de proceder ajustes textuais e de adequação do artigo às normas da publicação.
Autores mantêm os direitos autorais e concedem à revista o direito de primeira publicação, com o trabalho simultaneamente licenciado sob a Licença Creative Commons Attribution, que permite o compartilhamento do trabalho com reconhecimento da autoria e publicação inicial nesta revista.
Autores têm autorização para assumir contratos adicionais separadamente, para distribuição não exclusiva da versão do trabalho publicada nesta revista (ex.: publicar em repositório institucional ou como capítulo de livro), com reconhecimento de autoria e publicação inicial nesta revista.
Autores têm permissão e são estimulados a publicar e distribuir seu trabalho online (ex.: em repositórios institucionais ou na sua página pessoal) a qualquer ponto antes ou durante o processo editorial, já que isso pode gerar alterações produtivas, bem como aumentar o impacto e a citação do trabalho publicado (Veja O Efeito do Acesso Livre) em http://opcit.eprints.org/oacitation-biblio.html