Disponible · Remote
Évaluateur IA & Spécialiste Red-Team · QA Conversationnel
12 ans d'audit qualité, appliqués aux systèmes d'IA. Bilingue FR/EN.
Professionnel de l'assurance qualité avec plus de 12 ans d'expérience à évaluer des comportements d'agents, concevoir des rubriques et encadrer la performance — aujourd'hui appliqués aux systèmes d'IA. Expérimenté dans l'identification de modes d'échec, d'incohérences dans les sorties et de lacunes de politique dans des environnements complexes et à fort volume. Praticien des outils d'IA générative (Claude, Gemini, Google AI Studio, Claude Code), des concepts de red-teaming, du prompt engineering et de l'infrastructure LLM auto-hébergée. Bilingue FR/EN, rigoureux par nature, motivé à rendre les systèmes d'IA plus sûrs et fiables.
Application web Flask pour évaluer des conversations de chatbot IA contre une grille qualité structurée de 15 critères. Système de score pondéré sur 100, règle d'échec automatique pour la sécurité, export CSV et rapport HTML. Interface bilingue FR/EN.
Application full-stack de référence pour la gestion de campagnes de jeu de rôle sur table. Navigateur de 303+ aventures avec galerie de cartes, bestiaire complet, gestionnaire de PNJ et de rencontres. Déployé sous Docker avec domaine personnalisé.
Ouvert aux opportunités remote et contractuelles. Disponible immédiatement.