About the role
The product: A sophisticated query engine
We are building a sophisticated OLAP/SQL query engine for advanced analytics, accessing data from many different data sources (RDBMS’s, Hive, Impala, Druid, Elasticsearch and others). The query engine is written in Scala and builds on Apache Calcite. We are planning to open-source it during the course of this year with the goal of making it an Apache project eventually.
The stack
Das gibt es bei uns zu tun:
Entwicklung von end- to end Big Data Lösungen entlang der Wertschöpfungskette der REWE Group unter Einsatz einschlägiger Technologien (Hadoop, Spark, etc.)Analyse und Verarbeitung großer Mengen strukturierter und unstrukturierter DatenEntwurf und Implementierung von Datenmodellen, Datenflüssen sowie APIs zur Ermöglichung einer performanten Nutzung großer DatenmengenKontinuierliche Sicherstellung und Verbesserung der DatenqualitätOperationalisierung von Data Science Modellen für den produktiven EinsatzPartizipation bei der Technologie AuswahlEigenverantwortliches Arbeiten in selbstorganisierten, agilen cross- funktionalen Teams mit viel Gestaltungsspielraum und enger Zusammenarbeit mit FachabteilungenIntensiver Wissensaustausch und vielfältige Weiterbildungsmöglichkeiten der persönlichen, methodischen und technischen ExzellenzDas solltest Du können: