Sistema de archivos de Google (GFS)

Autor: Robert Simon
Fecha De Creación: 15 Junio 2021
Fecha De Actualización: 1 Mes De Julio 2024
Anonim
Google File System
Video: Google File System

Contenido

Definición: ¿Qué significa el Sistema de archivos de Google (GFS)?

Google File System (GFS) es un sistema de archivos distribuido escalable (DFS) creado por Google Inc. y desarrollado para adaptarse a los requisitos de procesamiento de datos en expansión de Google. GFS proporciona tolerancia a fallas, confiabilidad, escalabilidad, disponibilidad y rendimiento a grandes redes y nodos conectados. GFS está compuesto por varios sistemas de almacenamiento creados a partir de componentes de hardware de bajo costo. Está optimizado para adaptarse a las diferentes necesidades de uso y almacenamiento de datos de Google, como su motor de búsqueda, que genera grandes cantidades de datos que deben almacenarse.


El Sistema de archivos de Google aprovechó la fortaleza de los servidores disponibles al tiempo que minimiza las debilidades del hardware.

GFS también se conoce como GoogleFS.

Una introducción a Microsoft Azure y la nube de Microsoft | A lo largo de esta guía, aprenderá de qué se trata la computación en la nube y cómo Microsoft Azure puede ayudarlo a migrar y administrar su negocio desde la nube.

Techopedia explica el Sistema de archivos de Google (GFS)

El clúster de nodos GFS es un maestro único con múltiples servidores de fragmentos a los que acceden continuamente diferentes sistemas de clientes. Los servidores Chunk almacenan datos como archivos Linux en discos locales. Los datos almacenados se dividen en fragmentos grandes (64 MB), que se replican en la red un mínimo de tres veces. El gran tamaño del fragmento reduce la sobrecarga de la red.


GFS está diseñado para adaptarse a los grandes requisitos de clúster de Google sin sobrecargar las aplicaciones. Los archivos se almacenan en directorios jerárquicos identificados por nombres de ruta. Los metadatos, como el espacio de nombres, los datos de control de acceso y la información de mapeo, son controlados por el maestro, que interactúa y monitorea las actualizaciones de estado de cada servidor fragmentado a través de latidos cronometrados.

Las características de GFS incluyen:

  • Tolerancia a fallos
  • Replicación de datos críticos
  • Recuperación de datos automática y eficiente.
  • Alto rendimiento agregado
  • Se redujo la interacción entre el cliente y el maestro debido al gran tamaño del servidor
  • Gestión de espacios de nombres y bloqueo
  • Alta disponibilidad

Los clústeres GFS más grandes tienen más de 1,000 nodos con capacidad de almacenamiento en disco de 300 TB. A esto pueden acceder cientos de clientes de forma continua.