Sistema de arquivos distribuídos do Hadoop (HDFS)

Autor: Judy Howell
Data De Criação: 28 Julho 2021
Data De Atualização: 1 Julho 2024
Anonim
Sistema de arquivos distribuídos do Hadoop (HDFS) - Tecnologia
Sistema de arquivos distribuídos do Hadoop (HDFS) - Tecnologia

Contente

Definição - O que significa o HDado (Sistema de Arquivos Distribuídos) do Hadoop?

O Hadoop Distributed File System (HDFS) é um sistema de arquivos distribuído executado em hardware padrão ou de gama baixa. Desenvolvido pelo Apache Hadoop, o HDFS funciona como um sistema de arquivos distribuído padrão, mas fornece melhor taxa de transferência e acesso de dados através do algoritmo MapReduce, alta tolerância a falhas e suporte nativo a grandes conjuntos de dados.


Uma introdução ao Microsoft Azure e Microsoft Cloud | Neste guia, você aprenderá sobre o que é a computação em nuvem e como o Microsoft Azure pode ajudá-lo a migrar e administrar seus negócios a partir da nuvem.

Techopedia explica o sistema de arquivos distribuídos (HDFS) do Hadoop

O HDFS armazena uma grande quantidade de dados colocados em várias máquinas, geralmente em centenas e milhares de nós conectados simultaneamente, e fornece confiabilidade de dados replicando cada instância de dados como três cópias diferentes - duas em um grupo e uma no outro. Essas cópias podem ser substituídas em caso de falha.

A arquitetura HDFS consiste em clusters, cada um dos quais é acessado por meio de uma única ferramenta de software NameNode instalada em uma máquina separada para monitorar e gerenciar o sistema de arquivos desses clusters e o mecanismo de acesso do usuário. As outras máquinas instalam uma instância do DataNode para gerenciar o armazenamento em cluster.


Como o HDFS é gravado em Java, ele possui suporte nativo para API (Java Application Programming Interface) para integração e acessibilidade de aplicativos. Também pode ser acessado através de navegadores da Web padrão.