Análise de big data de código aberto

Autor: Laura McKinney
Data De Criação: 1 Abril 2021
Data De Atualização: 14 Poderia 2024
Anonim
Análise de big data de código aberto - Tecnologia
Análise de big data de código aberto - Tecnologia

Contente

Definição - O que significa Big Data Analytics de código aberto?

A análise de big data de código aberto refere-se ao uso de software e ferramentas de código aberto para analisar grandes quantidades de dados, a fim de reunir informações relevantes e acionáveis ​​que uma organização pode usar para promover seus objetivos de negócios. O maior player em análise de big data de código aberto é o Apaches Hadoop - é a biblioteca de software mais usada para processar enormes conjuntos de dados em um cluster de computadores usando um processo distribuído para paralelismo.


Uma introdução ao Microsoft Azure e Microsoft Cloud | Neste guia, você aprenderá sobre o que é a computação em nuvem e como o Microsoft Azure pode ajudá-lo a migrar e administrar seus negócios a partir da nuvem.

Techopedia explica Big Data Open Source Analytics

A análise de big data de código aberto utiliza software e ferramentas de código aberto para executar a análise de big data usando uma plataforma de software inteira ou várias ferramentas de código aberto para diferentes tarefas no processo de análise de dados. O Apache Hadoop é o sistema mais conhecido para análise de big data, mas outros componentes são necessários para que um sistema de análise real possa ser montado.

O Hadoop é a implementação de código aberto do algoritmo MapReduce, pioneiro no Google e no Yahoo, por isso é a base da maioria dos sistemas de análise atualmente. Muitas ferramentas de análise de big data fazem uso de código aberto, incluindo sistemas robustos de banco de dados, como o MongoDB de código aberto, um banco de dados NoSQL sofisticado e escalável, adequado para aplicativos de big data, entre outros.


Os serviços de análise de big data de código aberto abrangem:

  • Sistema de coleta de dados
  • Centro de controle para administrar e monitorar clusters
  • Biblioteca de aprendizado de máquina e mineração de dados
  • Serviço de coordenação de aplicativos
  • Mecanismo de computação
  • Estrutura de execução