Senior Data Architect
Omilia · Poland · Remote mogelijk
Je gaat verder naar de originele vacature van de werkgever.
- Bedrijf
- Omilia
- Locatie
- Poland
- Dienstverband
- Voltijd
- Geplaatst op
- 15 april 2026
Over deze vacature
Accountabilities Own the Training Environment data architecture end-to-end: dataset design and schema for all ML training pipelines, including dialog corpora for LLM training, conversational steps for NLU models, annotated evaluation sets, and whole-call recordings for speech-to-speech model development. Define and govern data selection and sampling strategy: establish criteria that determine which production conversations have the highest training value, including diversity-optimized sampling, confidence-based filtering, edge-case prioritization, and deduplication strategies. Build and maintain the data catalog and dataset discovery infrastructure: enable ML engineers across LLM, NLU, Speech, and Agentic teams to find, understand, and use training data without friction. Define annotation …
Dit is een korte samenvatting. De volledige omschrijving staat op de pagina van de werkgever.
Ontvang vacatures zoals deze
Maak een gratis profiel aan en ontvang passende vacatures uit Poland en de hele EU.
Bekijk mijn matches