Qual é a diferença entre big data e Hadoop?

Autor: Judy Howell
Data De Criação: 5 Julho 2021
Data De Atualização: 23 Junho 2024
Anonim
Qual é a diferença entre big data e Hadoop? - Tecnologia
Qual é a diferença entre big data e Hadoop? - Tecnologia

Contente

Q:

Qual é a diferença entre big data e Hadoop?


UMA:

A diferença entre big data e o programa de software de código aberto Hadoop é distinta e fundamental. O primeiro é um ativo, geralmente complexo e ambíguo, enquanto o último é um programa que cumpre um conjunto de metas e objetivos para lidar com esse ativo.

Big data são simplesmente os grandes conjuntos de dados que as empresas e outras partes reúnem para atender a metas e operações específicas. O big data pode incluir muitos tipos diferentes de dados em muitos tipos diferentes de formatos. Por exemplo, as empresas podem trabalhar muito na coleta de milhares de dados em compras em formatos de moeda, em identificadores de clientes como nome ou número do Seguro Social ou em informações sobre produtos na forma de números de modelo, números de vendas ou números de estoque. Tudo isso, ou qualquer outra grande massa de informações, pode ser chamado de big data. Como regra, é bruto e não classificado até que seja submetido a vários tipos de ferramentas e manipuladores.


O Hadoop é uma das ferramentas projetadas para lidar com big data. O Hadoop e outros produtos de software trabalham para interpretar ou analisar os resultados de pesquisas de big data por meio de algoritmos e métodos proprietários específicos. O Hadoop é um programa de código aberto sob a licença Apache, mantido por uma comunidade global de usuários. Ele inclui vários componentes principais, incluindo um conjunto de funções do MapReduce e um sistema de arquivos distribuídos (HDFS) do Hadoop.

A idéia por trás do MapReduce é que o Hadoop pode primeiro mapear um grande conjunto de dados e, em seguida, executar uma redução nesse conteúdo para obter resultados específicos. Uma função de redução pode ser vista como um tipo de filtro para dados brutos. O sistema HDFS age para distribuir dados através de uma rede ou migrá-los conforme necessário.


Administradores de bancos de dados, desenvolvedores e outros podem usar os vários recursos do Hadoop para lidar com grandes volumes de dados de várias maneiras. Por exemplo, o Hadoop pode ser usado para buscar estratégias de dados como agrupar e direcionar dados não uniformes ou dados que não se encaixam perfeitamente em uma tabela tradicional ou respondem bem a consultas simples.