Please use this identifier to cite or link to this item: https://ric.cps.sp.gov.br/handle/123456789/23958
Title: Data lake: suas funcionalidades e aplicações
Other Titles: Data lake: its functionalities and applications
Authors: PAES, Miriam Francieli
SILVA, Denis Henrique Pazini da
SOTTO, Eder Carlos Salazar
Advisor: ARAÚJO, Liriane Soares de
type of document: Artigo científico
Keywords: Análise de dados;Banco de dados
Issue Date: Jun-2024
Publisher: 182
Citation: PAES, Miriam Francieli; SILVA, Denis Henrique Pazini da; SOTTO, Eder Carlos Salazar. DATA LAKE: suas funcionalidades e aplicações. Orientadora: Liriane Soares de Araújo. 2024. 13 f. Trabalho de conclusão de curso (Curso superior de Gestão da Tecnologia da Informação) - Fatec Catanduva, Catanduva, SP, 2024
Abstract: Em uma era onde a voracidade por dados é insaciável, o conceito de Data Lake emerge como um reservatório robusto e inovador para a retenção e análise de informações. Inspirado por pesquisas pioneiras de autores como James Dixon em seu blog em 2010, fundador da Pentaho, e Thomas H. Davenport, renomado especialista em análise de dados, o Data Lake se destaca como uma abordagem disruptiva no cenário do gerenciamento de dados. Este artigo tem como objetivo explorar esse conceito, examinando a arquitetura flexível e expansível proposta por Dixon e as principais abordagens tradicionais ao preservar a integridade dos dados brutos independente de sua fonte ou formato, tudo em um único local, considerando a escassez de literatura ainda existente por ser um assunto novo. Ao abordar sobre o Lago de Dados (Data Lake), pretende-se abranger não apenas sua estrutura, mas também suas implicações que esse ambiente de armazenamento de dados brutos pode ter nas pesquisas científicas, mostrando ainda o que é o Data Lake, a fim de contribuir para a compreensão desse conceito. Além disso, apresenta-se dois cases de empresas em que o Data Lake foi utilizado a fim de demonstrar sua aplicabilidade. Espera-se contribuir para a literatura ao enfocar as características do Data Lake e seu impacto positivo nas empresas, que inclui eficiência, unificação de dados e aumento da lucratividade.
In an age where the voracity for data is insatiable, the concept of the Data Lake emerges as a robust and innovative reservoir for the retention and analysis of information. Inspired by pioneering research by authors such as James Dixon on his blog in 2010, founder of Pentaho, and Thomas H. Davenport, renowned data analytics expert, the Data Lake stands out as a disruptive approach in the data management landscape. This article aims to explore this concept, examining the flexible and scalable architecture proposed by Dixon and the main traditional approaches to preserving the integrity of raw data regardless of its source or format all in a single place, Considering the scarcity of literature that still exists because it is a new subject. When addressing the Data Lake, it is intended to cover not only its structure, but also its implications that this raw data storage environment can have on scientific research, also showing what the Data Lake is, in order to contribute to the understanding of this concept. In addition, two cases of companies in which the Data lake has been used are presented in order to demonstrate its applicabiblity. We hope to contribute to the literature by focusing on the characteristics of the Data Lake and its positive impact on companies, which includes efficiency, data unification and increased profitability.
URI: https://ric.cps.sp.gov.br/handle/123456789/23958
Appears in Collections:Trabalhos de Conclusão de Curso

Files in This Item:
File Description SizeFormat 
gestão_tecnologia_informação_2024_1_miriam_francieli_paes_data_lake.pdf
  Restricted Access
438 kBAdobe PDFView/Open Request a copy


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.