Webinar no próximo dia 17 de abril vai abordar como negócios podem lidar com volume cada vez maior de dados - Foto: Leonardo Marinho
Em um cenário em que empresas lidam com volumes crescentes de dados, um dos principais desafios é combater a fragmentação das informações. Como uma resposta a essa demanda, surge o conceito Data Lakehouse, uma solução que une as vantagens do Data Lake (capacidade de armazenar grandes volumes de dados em diferentes formatos) com a organização típica de um Data Warehouse, tornando a análise muito mais eficiente e escalável. Em muitos casos, além de otimizar processos produtivos, usar os dados em favor dos negócios pode ainda trazer redução de custos e evitar perdas.
De acordo com Marco Rezende, engenheiro de dados que atua como analista de sistemas na FPFtech, a principal função de um Data Lakehouse é justamente permitir que diferentes áreas da empresa contribuam com informações para um ambiente centralizado.
A partir disso, é possível criar visualizações, prever tendências, automatizar processos e personalizar a experiência dos clientes. A análise de dados históricos permite, por exemplo, antecipar o comportamento do consumidor e otimizar estoques, campanhas e investimentos.
Rezende demonstra que Supermercados podem cruzar dados de vendas para descobrir relações de consumo, como a compra recorrente de cerveja com carvão, e reorganizar os produtos nas gôndolas para aumentar o faturamento. Já empresas industriais usam sensores para prever falhas em equipamentos e realizar manutenções antes que máquinas fiquem paradas e prejudiquem a produção.
Em outro exemplo, uma multinacional combinou dados da produção com registros de assistência técnica para identificar falhas em lotes específicos de equipamentos. ‘’A análise preditiva permitiu mapear onde estavam esses produtos e prever as peças necessárias para reposição em cada unidade de atendimento, o que reduziu custos e melhorou o tempo de resposta ao cliente. Antes, o processo era limitado a amostras de 5 mil registros por vez. Com o uso do Data Lakehouse, a empresa passou a analisar até 10 milhões de registros simultaneamente, garantindo uma visão mais abrangente e ágil do desempenho das suas operações’’, explica Rezende.
Volume de dados indica investimento
Esse tipo de estrutura, no entanto, não é exclusivo de grandes corporações. Segundo Marco Rezende, o investimento nessa estrutura varia conforme o volume de dados e a maturidade digital de cada negócio. Para empresas menores, muitas vezes um Data Lake mais simples já é suficiente para gerar valor. Na avaliação do especialista, a prioridade é garantir que os dados existam, estejam organizados e sejam acessíveis.
‘’A implementação de uma estratégia baseada em dados geralmente começa pela coleta e organização das informações. Essa etapa é conduzida por engenheiros de dados, que preparam a infraestrutura para o consumo por analistas e cientistas de dados. Os analistas interpretam essas informações e respondem a perguntas de negócio com base no histórico. Já os cientistas aplicam técnicas mais avançadas, como predição e inteligência artificial, com foco em tomada de decisão e automação’’, pontua Rezende.
O uso de dados não estruturados também tem ganhado destaque nesse cenário. Imagens, vídeos e áudios podem ser usados para treinar modelos de inteligência artificial, que, em exemplos práticos, detectam furtos em tempo real, classificam padrões de comportamento ou segmentam consumidores com alta precisão. Com a flexibilidade do Data Lakehouse, esse tipo de dado pode ser armazenado e processado junto com os dados estruturados provenientes de bases de dados relacionais, ERPS, planilhas ou APIs ampliando significativamente o seu potencial de análise e tomadas de decisões.
‘’Empresas que crescem rapidamente tendem a optar por armazenar seus dados na nuvem, pela flexibilidade e escalabilidade que essa abordagem oferece. Já organizações que exigem mais controle e segurança costumam manter seus dados em data centers próprios, respeitando requisitos de conformidade e regulamentação’’, completa.
Webinar aponta caminhos na construção de Data Lakehouse
A FPFtech, que já desenvolveu três Data Lakes, defende que o conhecimento gerado por essas tecnologias precisa ser compartilhado. Por isso, no dia 17 de abril, realizará o webinar “Como Gerar Valor para a Empresa Construindo um Data Lakehouse”, transmitido ao vivo pelo LinkedIn. A proposta é mostrar como o conceito pode ser aplicado na prática para resolver problemas reais e gerar diferencial competitivo.
Com o avanço da digitalização e o crescimento do volume de dados, o uso de soluções como o Data Lakehouse tende a se tornar cada vez mais estratégico, portanto, o encontro virtual deve abordar seus benefícios e desafios, as estratégias para governança e escalabilidade de dados e como gerar insights estratégicos e reduzir custos operacionais.
Marco Rezende, que além de analista de sistemas na FPFtech é também professor de Big Data na Escola FPFtech, irá conduzir o seminário online. Rezende possui aproximadamente 3 anos de experiência com construção e manutenção de arquiteturas de Big Data, sendo especialista em arquitetura medalhão, Data Lakehouse e Apache Spark.