Apache Kafka

Autor: Louise Ward
Fecha De Creación: 5 Febrero 2021
Fecha De Actualización: 28 Junio 2024
Anonim
Введение в Apache Kafka, первая тема открытого базового курса
Video: Введение в Apache Kafka, первая тема открытого базового курса

Contenido

Definición - ¿Qué significa Apache Kafka?

Apache Kafka es un sistema de publicación-suscripción de código abierto diseñado para proporcionar un manejo rápido, escalable y tolerante a fallas de los datos en tiempo real. A diferencia del software de mensajería empresarial tradicional, Kafka puede manejar todos los datos que fluyen a través de una empresa y hacerlo en tiempo casi real.


Kafka está escrito en Scala y fue desarrollado originalmente por LinkedIn. Desde entonces, varias compañías lo han usado para construir plataformas en tiempo real.

Una introducción a Microsoft Azure y la nube de Microsoft | A lo largo de esta guía, aprenderá de qué se trata la computación en la nube y cómo Microsoft Azure puede ayudarlo a migrar y administrar su negocio desde la nube.

Techopedia explica Apache Kafka

Kafka tiene muchas similitudes con los registros de transacciones, y mantiene feeds de s en temas. Los productores escriben datos en los temas y los consumidores leen esos temas, que se dividen y replican en varios nodos en un formato de sistema distribuido. Kafka es único en el sentido de que trata cada partición de tema como un registro, y cada una de las particiones tiene asignado un desplazamiento único. Conserva todos los correos electrónicos durante un cierto período de tiempo, y los consumidores son responsables de rastrear su ubicación en cada registro. Esto difiere de los sistemas anteriores, donde los corredores eran responsables de este seguimiento, que limitaba severamente la capacidad del sistema para escalar a medida que aumentaba el número de consumidores. Esta estructura permite a Kafka dar soporte a muchos consumidores y retener grandes cantidades de datos con una sobrecarga muy baja.


Kafka se puede usar:

  • Como corredor tradicional
  • Para el seguimiento de la actividad del sitio web
  • Para la agregación de registros
  • Para el procesamiento de grandes flujos de datos

Kafka se puede usar junto con Apache Storm, Apache HBase y Apache Spark para el análisis en tiempo real y la representación de datos de transmisión.