SQL en Hadoop

Autor: Roger Morrison
Fecha De Creación: 19 Septiembre 2021
Fecha De Actualización: 21 Junio 2024
Anonim
What is Hadoop?: SQL Comparison
Video: What is Hadoop?: SQL Comparison

Contenido

Definición: ¿Qué significa SQL en Hadoop?

SQL on Hadoop es un tipo de herramienta de aplicación analítica: la implementación de SQL en la plataforma Hadoop, que combina consultas estándar de estilo SQL de datos estructurados con el marco de datos Hadoop. Hadoop es una plataforma relativamente nueva, como lo son los grandes datos en sí, y no muchos profesionales son expertos en ella, pero SQL en Hadoop simplifica el acceso al marco de Hadoop y facilita la implementación en los sistemas empresariales actuales.


Una introducción a Microsoft Azure y la nube de Microsoft | A lo largo de esta guía, aprenderá de qué se trata la computación en la nube y cómo Microsoft Azure puede ayudarlo a migrar y administrar su negocio desde la nube.

Techopedia explica SQL en Hadoop

SQL en Hadoop se refiere a varias implementaciones de SQL para la plataforma Hadoop. MapReduce, que es el mapeador de trabajos de clúster de Hadoops y el organizador de resultados, admite SQL como un caso de uso importante, así como otros métodos de procesamiento. Por lo tanto, tiene sentido crear herramientas poderosas para permitir SQL, que es uno de los lenguajes más utilizados para la consulta y manipulación de bases de datos. A medida que Hadoop gana popularidad para la arquitectura de datos empresariales, SQL es clave para la adopción adecuada tanto de datos estructurados libremente como de datos estructurados utilizados en Hadoop.


Los controladores clave de SQL en Hadoop incluyen:

  • Aprovechar las habilidades existentes de SQL presentes en la mayoría de las organizaciones
  • Reutilización de la carga de transformación de extracción (ETL), inteligencia empresarial (BI) e inversiones en infraestructura analítica en Hadoop

Algunas implementaciones de SQL en Hadoop incluyen:

  • Apache Spark SQL
  • Colmena Apache
  • Apache Tajo
  • Taladro Apache
  • HP Vertica en MapR
  • Controladores ODBC
  • Presto
  • Tiburón