Kafka to rozproszony system przetwarzania strumieniowego, który został stworzony w celu rozwiązywania problemów związanych z przesyłaniem i przetwarzaniem dużej ilości danych w czasie rzeczywistym. Jest to typu platforma open-source, oparta na architekturze publish-subscribe. Umożliwia wysyłanie, przechowywanie oraz przetwarzanie strumieni danych w sposób niezawodny i skalowalny.
Główne założenia Kafki to zapewnienie wysokiej przepustowości i niezawodności w przesyłaniu danych. System działa w oparciu o koncepcję tematów (topics), a także partycji (partitions), gdzie dane są publikowane w tematach, a następnie dzielone na partycje, co pozwala na równoległe przetwarzanie oraz replikację danych w klastrze.
Sprawdź oferty pracy Kafka na serwisie the:protocol