Contente
- Definição - O que significa Big Data Analytics de código aberto?
- Uma introdução ao Microsoft Azure e Microsoft Cloud | Neste guia, você aprenderá sobre o que é a computação em nuvem e como o Microsoft Azure pode ajudá-lo a migrar e administrar seus negócios a partir da nuvem.
- Techopedia explica Big Data Open Source Analytics
Definição - O que significa Big Data Analytics de código aberto?
A análise de big data de código aberto refere-se ao uso de software e ferramentas de código aberto para analisar grandes quantidades de dados, a fim de reunir informações relevantes e acionáveis que uma organização pode usar para promover seus objetivos de negócios. O maior player em análise de big data de código aberto é o Apaches Hadoop - é a biblioteca de software mais usada para processar enormes conjuntos de dados em um cluster de computadores usando um processo distribuído para paralelismo.
Uma introdução ao Microsoft Azure e Microsoft Cloud | Neste guia, você aprenderá sobre o que é a computação em nuvem e como o Microsoft Azure pode ajudá-lo a migrar e administrar seus negócios a partir da nuvem.
Techopedia explica Big Data Open Source Analytics
A análise de big data de código aberto utiliza software e ferramentas de código aberto para executar a análise de big data usando uma plataforma de software inteira ou várias ferramentas de código aberto para diferentes tarefas no processo de análise de dados. O Apache Hadoop é o sistema mais conhecido para análise de big data, mas outros componentes são necessários para que um sistema de análise real possa ser montado.
O Hadoop é a implementação de código aberto do algoritmo MapReduce, pioneiro no Google e no Yahoo, por isso é a base da maioria dos sistemas de análise atualmente. Muitas ferramentas de análise de big data fazem uso de código aberto, incluindo sistemas robustos de banco de dados, como o MongoDB de código aberto, um banco de dados NoSQL sofisticado e escalável, adequado para aplicativos de big data, entre outros.
Os serviços de análise de big data de código aberto abrangem:
- Sistema de coleta de dados
- Centro de controle para administrar e monitorar clusters
- Biblioteca de aprendizado de máquina e mineração de dados
- Serviço de coordenação de aplicativos
- Mecanismo de computação
- Estrutura de execução