Freelance Agent Evaluation Engineer

Mindrift · Warsaw, Masovian Voivodeship, Poland · Remote möglich

Sie werden zur Original-Anzeige des Arbeitgebers weitergeleitet.

Unternehmen
Mindrift
Standort
Warsaw, Masovian Voivodeship, Poland
Anstellungsart
Teilzeit
Veröffentlicht am
20. Mai 2026

Über diese Stelle

Please submit your CV in English and indicate your level of English proficiency. Mindrift connects specialists with project-based AI opportunities for leading tech companies, focused on testing, evaluating, and improving AI systems. Participation is project-based, not permanent employment. What this opportunity involves We're building a dataset to evaluate AI coding agents — how well a model handles real-world developer tasks. You'll create challenging tasks and evaluation criteria within realistic simulated environments: Build virtual companies following a high-level plan - codebase, infrastructure, and context (conversations, documentation, tickets) that form a realistic environment with development history Assemble and calibrate tasks from intermediate states of the virtual company: cra

Dies ist eine Kurzfassung. Die vollständige Beschreibung finden Sie auf der Seite des Arbeitgebers.

Passende Jobs wie diesen erhalten

Erstellen Sie ein kostenloses Profil und erhalten Sie passende Stellen aus Poland und der ganzen EU.

Meine Matches ansehen