Please use this identifier to cite or link to this item: https://ric.cps.sp.gov.br/handle/123456789/7052
Title: Limpeza de dados utilizando ferramentas power Bi e Tableau
Other Titles: Data cleansing using Power Bi and Tableau tools
Authors: FERREIRA, Guilherme Henrique
Advisor: PAIVA, Cláudio Eduardo
type of document: Monografia
Keywords: Análise de dados;Banco de dados;Análise de dados
Issue Date: 14-Dec-2020
Publisher: 109
Citation: Ferreira, Guilherme Henrique. Limpeza de dados utilizando ferramentas power Bi e Tableau. 2020.Trabalho de Graduação (Curso superior em Análise de Desenvolvimento de Sistema). Faculdade de Tecnologia " Dr. Thomaz Novelino”, Franca, 2020.
Abstract: A limpeza de dados é uma etapa essencial do processo de análise de dados e implica na execução de metodologias e práticas de modificação de bases de dados originais a fim de melhorar sua qualidade. Nos dias atuais, as atividades de estudo de dados coletados de diversas fontes vêm aumentando em empresas públicas e privadas que têm, cada vez mais, visto a importância de se avaliar e analisar dados coletados nas suas tomadas de decisões. Muitas vezes, os softwares utilizados nas empresas não foram preparados para fornecer dados para análises e geram dados com baixa qualidade, com anomalias e erros, o que pode exigir um processo de limpeza de dados mais intenso, com grandes modificações da massa de dados original. Uma razão para estudar ferramentas para limpeza de dados, ocorre do fato de que, quando os dados originais possuem vários tipos e formatos diferentes, muitas vezes também eles apresentam redundâncias e inconsistências, o que pode prejudicar sobremaneira a interpretação dos resultados das análises. Esse trabalho propõe estudar, por meio de testes práticos, algumas das principais ferramentas disponíveis no mercado e suas técnicas para limpeza de dados no processo de extração, transformação e carregamento de dados. Os testes permitiram comparar situações em que dada ferramenta se torna mais eficaz e ou apropriada em relação às outras e tiveram seus resultados documentados.
Cleaning data is part of the data analysis process. This is an essential step and implies the implementation of methodologies and practices for modifying original databases, in order to improve their quality for the creation of analyzes. Nowadays, the activities of studying data collected from different sources have been increasing in public and private companies, which have increasingly seen the importance of evaluating and analyzing data collected in their process making decision. Often, the software used in companies is not prepared to provide data for analysis and generates data with low quality, with a large number of anomalies and errors and which requires a more intense data cleaning process, making changes to the original data mass. One reason for studying tools for data cleaning is that, when the original data has several different types and formats, they often also have redundancies and inconsistencies, which can greatly impair the interpretation of the analysis results. This study proposes analyses of tools and techniques of working in data cleaning in the ETL process, analyzing which process becomes easier and more effective, thus we had the quality conclusion that all results obtaining more significant difference in the speed and quantity of processes required in each process, and showing that each study requires an analysis of the problem in order to run cleaning processes.
URI: http://ric.cps.sp.gov.br/handle/123456789/7052
Appears in Collections:Trabalhos de Conclusão de Curso

Files in This Item:
File Description SizeFormat 
FERREIRA - Limpeza de dados.pdf841.62 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.