Freelance Agent Evaluation Engineer

Mindrift · Rome, Metropolitan City of Rome Capital, Italy · Remote möglich

Sie werden zur Original-Anzeige des Arbeitgebers weitergeleitet.

Unternehmen
Mindrift
Standort
Rome, Metropolitan City of Rome Capital, Italy
Anstellungsart
Teilzeit
Gehalt
$40
Veröffentlicht am
23. Juni 2026

Über diese Stelle

Please submit your CV in English and indicate your level of English proficiency. Mindrift connects specialists with project-based AI opportunities for leading tech companies, focused on testing, evaluating, and improving AI systems. Participation is project-based, not permanent employment. What this opportunity involves We're building a dataset to evaluate AI coding agents - how well a model handles real-world developer tasks. You'll create challenging tasks and evaluation criteria within realistic simulated environments: Build realistic developer environments - a virtual company with codebase, infrastructure, and context (tickets, docs, conversations) that forms a believable development history Design tasks from intermediate states of these environments - craft the prompt, define what "so

Das ist eine Kurzfassung. Wissen Sie, ob Sie passen? Prüfen Sie Ihren Lebenslauf für diese Stelle — kostenlos, in 30 Sekunden.

Passt Ihr Lebenslauf zu diesem Job?

Fügen Sie Ihren Lebenslauf ein und erhalten Sie sofort einen Match-Score für diese Stelle — plus ein passendes Anschreiben mit einem Klick.

  • Sofortiger Match-Score für diese Stelle
  • Passendes Anschreiben mit einem Klick
  • Kostenlos — keine Kreditkarte
Meinen Lebenslauf prüfen — kostenlos
Freelance Agent Evaluation Engineer — Mindrift | NewLuxJob | NewLuxJob