Description du poste
1. Conception & Développement de Solutions GenAI
- Développer des modèles et pipelines :
- Fine-tuning de LLM (Gemini, Mistral, Llama) avec PyTorch/TensorFlow.
- Implémentation de systèmes RAG (Retrieval-Augmented Generation) pour des applications métiers (recherche documentaire, chatbots, assistants).
- Optimisation des prompts et des chaînes de traitement (LangChain, LlamaIndex).
- Prototyper des PoC :
- Évaluation de l’applicabilité des modèles génératifs à des problèmes concrets (ex. : automatisation de processus, génération de code, analyse de données non structurées).
- Benchmarking des solutions cloud (Azure AI, GCP Vertex AI) et open-source.
2. Industrialisation & MLOps
- Automatiser et scalabiliser les pipelines GenAI :
- Déploiement de modèles en production avec MLOps (MLflow, Kubeflow, Azure ML/GCP Vertex AI).
- Containerisation (Docker, Kubernetes) et orchestration des workflows.
- Garantir la performance et la fiabilité :
- Optimisation des temps de réponse (latence, throughput) et de la consommation ressources.
- Mise en place de tests automatisés (unitaires, d’intégration, de non-régression).
- Monitoring et maintenance :
- Suivi des métriques de performance (précision, drift, coût).
- Logging et traçabilité des inférences (outils : Prometheus, Grafana, ELK).
3. Intégration Système & Collaboration
- Intégrer les solutions GenAI dans des environnements existants :
- API REST/GraphQL pour l’interfaçage avec les applications métiers.
- Collaboration avec les équipes backend, data, et devops pour une intégration fluide.
- Documenter et former :
- Rédaction de documentations techniques (architecture, APIs, guides d’utilisation).
- Formation des équipes métiers à l’utilisation des outils GenAI.
4. Veille & Innovation
- Suivre les avancées en IA Générative :
- Évaluation des nouveaux modèles (ex. : Gemini 1.5, Mistral 8x22B) et des techniques émergentes (agents autonomes, multi-modalité).