Cerdo apache

Autor: Robert Simon
Fecha De Creación: 16 Junio 2021
Fecha De Actualización: 13 Mayo 2024
Anonim
Así TRABAJAN 🔪 el PUERCO 🐖 en El MERCADO DE CARNE 🥩 MÁS GRANDE - San Juan Pantitlán
Video: Así TRABAJAN 🔪 el PUERCO 🐖 en El MERCADO DE CARNE 🥩 MÁS GRANDE - San Juan Pantitlán

Contenido

Definición - ¿Qué significa Apache Pig?

Apache Pig es una plataforma que se utiliza para analizar grandes conjuntos de datos. Consiste en un lenguaje de alto nivel para expresar programas de análisis de datos, junto con la infraestructura para evaluar estos programas. Una de las características más significativas de Pig es que su estructura responde a una paralelización significativa.


Pig opera en la plataforma Hadoop, escribe datos y lee datos del Sistema de archivos distribuidos de Hadoop (HDFS) y realiza el procesamiento mediante uno o más trabajos de MapReduce. Apache Pig está disponible como código abierto.

Apache Pig también se conoce como lenguaje de programación Pig o Hadoop Pig.

Una introducción a Microsoft Azure y la nube de Microsoft | A lo largo de esta guía, aprenderá de qué se trata la computación en la nube y cómo Microsoft Azure puede ayudarlo a migrar y administrar su negocio desde la nube.

Techopedia explica Apache Pig

Apache Pig tiene dos partes: lenguaje latino Pig y motor Pig. El lenguaje Pig Latin es un lenguaje de script que permite a los usuarios ilustrar la forma en que el flujo de datos de una o más entradas debe leerse y procesarse, y la ubicación en la que debe almacenarse.

Algunas de las propiedades clave de Pig Latin son las siguientes:


  • Fácil de programar: las tareas complejas que consisten en varias transformaciones de datos interconectadas están claramente codificadas como secuencias de flujo de datos. Esto los hace simples de escribir, comprender y mantener.
  • Posibilidades de optimización: la forma en que se codifican las tareas permite al sistema optimizar la ejecución automática. Esto permite al usuario prestar atención a la semántica en lugar de la eficiencia.
  • Extensibilidad: los usuarios pueden crear sus propias funciones para llevar a cabo un procesamiento de propósito especial. El motor Pig es responsable de la ejecución del flujo de datos escrito en Pig Latin. Al igual que el diseño de un sistema estándar de gestión de bases de datos relacionales (RDBMS), Apache Pig consta de un analizador sintáctico, un optimizador y un verificador de tipos, además de operadores que realizan el procesamiento de datos. Pig no incluye transacciones, un catálogo de datos o la capacidad de manejar directamente el almacenamiento de datos o emplear el marco de ejecución.