Data Engineer (m/w/d)

Remote Full-time Live

Um zuverlässige KI-Automatisierung im großen Maßstab zu ermöglichen, suchen wir einen Data Engineer (m/w/d), der robuste Datenpipelines für den produktiven Einsatz, verteilte Datenverarbeitungssysteme und hochwertige Datenstrukturen für unsere KI-Plattform entwickelt. Du spielst eine zentrale Rolle dabei, sicherzustellen, dass KI-Systeme schnell, sicher und strukturiert auf die benötigten Daten zugreifen können.

Design und Aufbau skalierbarer Datenpipelines zur Aufnahme, Transformation und Bereitstellung strukturierter und unstrukturierter Daten
Entwicklung verteilter Datenverarbeitungs-Workflows zur Unterstützung von KI-Features wie Wissensabruf, Automatisierungsprozessen und Analytics
Aufbau und Betrieb von Daten-Ingestionssystemen zur Anbindung von Enterprise-APIs, Datenbanken, File Storage und Streaming-Quellen
Modellierung und Optimierung von Datensätzen für KI-Anwendungen, inklusive Embeddings-Pipelines und Vektorindexierung
Sicherstellung von Datenqualität, Konsistenz und Observability über alle Pipelines und Speicherlösungen hinweg
Optimierung von Abfrageperformance, Datenaktualität und Kosteneffizienz in großen Datensystemen
Enge Zusammenarbeit mit AI Engineers zur Umsetzung von Retrieval-Augmented Generation (RAG) und wissensbasierten KI-Features
Implementierung von Batch- und Echtzeitverarbeitung mittels Queues, Streaming-Systemen oder eventgetriebenen Architekturen
Design und Betrieb von Datenspeicherlösungen wie relationalen Datenbanken, Object Storage und Vektordatenbanken
Umsetzung von Data-Governance-Praktiken (z. B. Zugriffskontrolle, Datenherkunft/Lineage und Monitoring)
Zusammenarbeit mit DevOps bei containerisierten Deployments, Infrastrukturautomatisierung und Cloud-Datenservices
Zusammenarbeit mit unserem Data-Research-Team

Fundierte Erfahrung im Aufbau von Datenpipelines im produktiven Einsatz
Gutes Verständnis von verteilten Systemen und skalierbaren Datenarchitekturen
Erfahrung im Umgang mit großen Datenmengen und deren Performance-Optimierung
Vertrautheit mit modernen Daten-Tools und Workflow-Orchestrierung
Erfahrung in der Bereitstellung von Daten für AI/ML- oder Analytics-Anwendungen
Pragmatistische Arbeitsweise mit Fokus auf Zuverlässigkeit und Wartbarkeit
Fähigkeit zur Zusammenarbeit mit Backend-, AI- und Infrastruktur-Teams
Interesse an KI-getriebenen Datensystemen und neuen Entwicklungen im Bereich Dateninfrastruktur

Unser Tech Stack & Bereiche

SQL (mindestens 5 Jahre Erfahrung)
Praktische Erfahrung mit Python
PostgreSQL / analytische Datenbanken
Konzepte der verteilten Datenverarbeitung
Streaming- / Messaging-Systeme
Datenmodellierung & Pipeline-Orchestrierung
Vektordatenbanken & Embeddings-Pipelines
Cloud-Plattformen (Azure, GCP oder AWS)
Docker & CI/CD

Impact: Aufbau intelligenter produktiver Systeme, die den Einsatz von KI in Unternehmen neu definieren
Innovation: Arbeit mit modernsten Frameworks und Modell-Ökosystemen
Kultur: Kollaboratives, kreatives und eigenverantwortliches Team
Flexibilität: Remote-first und flexible Arbeitszeiten
Wachstum: Zugang zu KI-Ressourcen, Tools und Weiterbildungen
Beteiligung: Virtual Stock Option Plan (VSOP)

neuland.ai ist ein innovatives deutsches Unternehmen mit umfassender KI-Expertise und Digitaltransformation. Basierend auf unserer umfangreichen Erfahrung aus zahlreichen KI-Projekten haben wir den neuland.ai HUB entwickelt - die vertrauenswürdige KI-Plattform „Made in Germany“. Mit unseren eigenentwickelten und zum Patent angemeldeten Technologien ist der neuland.ai HUB mehr als eine Plattform: Er ist der sichere Raum für souveräne, kontextgenaue KI-Nutzung in Wirtschaft, Politik und Wissenschaft. Unser Commitment zu Diversität: neuland.ai lebt von unterschiedlichen Perspektiven. Wir bewerten dich nach deinen Fähigkeiten und deiner Leidenschaft – unabhängig von Herkunft, Geschlecht, Alter, Religion oder Identität. Um unser Team noch vielfältiger aufzustellen, werden Kandidat:innen aus unterrepräsentierten Gruppen bei gleicher Eignung bevorzugt eingestellt. Trau dich und bewirb dich, auch wenn du (noch) nicht 100 % der Anforderungen erfüllst! Apply To This Job

Apply

Data Engineer (m/w/d)

On the same wavelength

QA & Testing Automation Engineer — neuland.ai | Cologne / Remote (Germany)

DevOps / Platform Engineer (Kubernetes / AI Infrastructure)

RCM QA Specialist - Cash Posting

RCM QA Specialist - Adjustments / Refunds

RCM QA Specialist - Cash Posting

RCM QA Specialist - Adjustments / Refunds

Loss Control - Consultant

Inside Sales Supervisor

Case Manager

Case Manager

Steuerfachkraft (m/w/d) in Weißbach mindestens 52.000€ - 100% Remote möglich

Human Resources Representative

Lkw-Reifen Runderneuerungsberater:in (alle) im Raum München, Nürnberg

Job Title: Digital Media Operations Manager - Disney Data Entry Remote

Remote Medical Writer – Scientific Publications & Educational Content Specialist (San Francisco & Nationwide Home‑Based)

Experienced Customer Service Associate – arenaflex Locker+ Retail Location Support and Package Management Expert

Senior Software Engineer I

Care Manager, Registered Nurse- Remote

Netflix Remote (Data Entry Jobs) $21/H - [Entry level remote jobs]

Experienced Operations Manager – Global Customer Service and Quality Assurance