Data Lakes e os recursos para toda a organização

Nesta terça-feira, a SOFTSUL inaugurou seu CaféTech na cafeteria Love It. Na primeira edição, o tema foi Data Lake, uma estratégia de armazenamento de dados que pode servir a todos os segmentos da empresa, sendo fundamental para a arquitetura de Big Data. Quem apresentou este novo conceito foi Gilberto Lanzer, profissional com mais de 30 anos de experiência, muitos deles na área comercial de empresas como Oracle, EMC, IBM. Atualmente, Lanzer atua na GAVB como executivo de vendas focado em projetos de Analytics e Big Data.

Data Lake é um termo recente, criado pelo CTO (Chief Technical Officer) da Pentaho Corp, James Dixon, para descrever um componente importante no universo da análise de dados e do Big Data. A ideia é ter um único repositório dentro da empresa, para que todos os dados brutos estejam disponíveis a qualquer pessoa que precise fazer análise sobre eles.

Durante o encontro, o palestrante esclareceu as principais diferenças entre Big Data e Data Lake. Para isso, começou falando sobre Big Data, conceito que pode ser compreendido também pela diferenciação com Business Intelligence (BI). A análise de BI tem uma natureza mais descritiva, de transformação de dados em informações capazes de delinear realidades de negócio. A disciplina de Business Intelligence começou com o lançamento do MS Excel. Mas o trabalho do cientista de dados com o Big Data atinge maior volume de dados, maior variedade e velocidade. Assim, é possível focar numa análise mais preditiva, de maior complexidade, que agrega mais valor ao negócio. “Podemos dizer que o uso do Big Data funciona como um acelerador do negócio, facilitando o acesso e monitoramento de informações em tempo real”, pontuou Lanzer .

Já o Data Lake recebe os dados crús, ou seja, os dados são acessados e armazenados em sua forma original e de lá é possível, diretamente, buscar insights, e, também, gerar o tradicional Data Warehouse (DW) para tratar dados estruturados. A diferença em relação ao Data Warehouse é que, no Data Lake, os modelos de dados não são impostos de antemão, mas emergem à medida que os dados são trabalhados. “Hoje percebemos uma grande valorização do trabalho do estatístico, capaz de gerar insights mais precisos para a gestão do negócio”, comentou o palestrante. Algumas aplicações desta ciência de dados são: otimização do funil de vendas, segmentação de clientes, análise de comportamento, manutenção preditiva e detecção de fraude.

O CaféTech acontece sempre no formato de um café da manhã com especialistas em tecnologias portadoras de futuro. Eles tratarão de temas essenciais para a concepção de novos negócios digitais. A segunda edição já tem data marcada: 3 de abril. Mais informações em breve.

Realização: SOFTSUL

× Fale conosco