Sistema de arquivos do Google (GFS)

Autor: Robert Simon
Data De Criação: 15 Junho 2021
Data De Atualização: 1 Julho 2024
Anonim
Google File System
Vídeo: Google File System

Contente

Definição - O que significa o sistema de arquivos do Google (GFS)?

O sistema de arquivos do Google (GFS) é um sistema de arquivos distribuídos (DFS) escalável criado pelo Google Inc. e desenvolvido para acomodar os requisitos de processamento de dados em expansão do Google. O GFS fornece tolerância a falhas, confiabilidade, escalabilidade, disponibilidade e desempenho para grandes redes e nós conectados. O GFS é composto de vários sistemas de armazenamento criados a partir de componentes de hardware de baixo custo. Ele é otimizado para acomodar diferentes necessidades de armazenamento e uso de dados do Googles, como o mecanismo de pesquisa, que gera enormes quantidades de dados que devem ser armazenados.


O sistema de arquivos do Google aproveitou a força dos servidores disponíveis no mercado, minimizando as fraquezas do hardware.

O GFS também é conhecido como GoogleFS.

Uma introdução ao Microsoft Azure e Microsoft Cloud | Neste guia, você aprenderá sobre o que é a computação em nuvem e como o Microsoft Azure pode ajudá-lo a migrar e administrar seus negócios a partir da nuvem.

Techopedia explica o sistema de arquivos do Google (GFS)

O cluster do nó GFS é um único mestre com vários servidores de chunk que são acessados ​​continuamente por diferentes sistemas clientes. Servidores Chunk armazenam dados como arquivos Linux em discos locais. Os dados armazenados são divididos em grandes blocos (64 MB), que são replicados na rede no mínimo três vezes. O tamanho grande do pedaço reduz a sobrecarga da rede.


O GFS foi projetado para acomodar os grandes requisitos de cluster do Google sem sobrecarregar os aplicativos. Os arquivos são armazenados em diretórios hierárquicos identificados pelos nomes dos caminhos. Os metadados - como espaço para nome, dados de controle de acesso e informações de mapeamento - são controlados pelo mestre, que interage e monitora as atualizações de status de cada servidor de chunk por meio de batimentos cardíacos cronometrados.

Os recursos do GFS incluem:

  • Tolerância ao erro
  • Replicação de dados críticos
  • Recuperação de dados automática e eficiente
  • Alto rendimento agregado
  • Interação reduzida de cliente e mestre devido ao grande tamanho do servidor de blocos
  • Gerenciamento e bloqueio de namespace
  • Alta disponibilidade

Os maiores clusters de GFS têm mais de 1.000 nós com capacidade de armazenamento em disco de 300 TB. Isso pode ser acessado por centenas de clientes em uma base contínua.