Freelance Agent Evaluation Engineer

Mindrift · Rome, Metropolitan City of Rome Capital, Italy · Remote mogelijk

Je gaat verder naar de originele vacature van de werkgever.

Bedrijf
Mindrift
Locatie
Rome, Metropolitan City of Rome Capital, Italy
Dienstverband
Deeltijd
Salaris
$40
Geplaatst op
23 juni 2026

Over deze vacature

Please submit your CV in English and indicate your level of English proficiency. Mindrift connects specialists with project-based AI opportunities for leading tech companies, focused on testing, evaluating, and improving AI systems. Participation is project-based, not permanent employment. What this opportunity involves We're building a dataset to evaluate AI coding agents - how well a model handles real-world developer tasks. You'll create challenging tasks and evaluation criteria within realistic simulated environments: Build realistic developer environments - a virtual company with codebase, infrastructure, and context (tickets, docs, conversations) that forms a believable development history Design tasks from intermediate states of these environments - craft the prompt, define what "so

Dit is een korte samenvatting. Wil je weten of je past? Check je cv voor deze functie — gratis, in 30 seconden.

Past jouw cv bij deze baan?

Plak je cv voor een directe match-score voor deze functie — plus een persoonlijke motivatiebrief met één klik.

  • Directe match-score voor deze functie
  • Persoonlijke motivatiebrief met één klik
  • Gratis — geen creditcard
Mijn cv checken — gratis
Freelance Agent Evaluation Engineer — Mindrift | NewLuxJob | NewLuxJob