Your PDF didn't include an email, so self-service claim isn't available yet. Reach out and we'll claim it for you.
Paris, FR-IDF
Solution Architect · hybrid cloud & IA générative on-prem
Français · Anglais · Allemand
Updated May 20, 2026
Contact
About
Solution Architect depuis 9 ans, spécialisé depuis 2 ans dans le déploiement de LLM en mode hybride / on-premise pour les entreprises qui ne peuvent pas envoyer leurs données chez OpenAI ou Anthropic. Je connais vLLM, Ollama, llama.cpp et les contraintes GPU réelles (vRAM, throughput, coût). Mon créneau : aider une banque ou un assureur à avoir son ChatGPT interne sans que les données sortent du SI.
Skills
2021-03 – present
Principal Solution Architect
Vairon Tech
Paris, France
Accompagne 12 grands comptes (banque, assurance, santé) dans leur migration vers des architectures hybrides cloud + IA générative sécurisée. Déploiements de LLM on-premise (vLLM, Ollama) pour les cas où les données ne peuvent pas sortir du SI. Définition des architectures GPU et des coûts associés.
2016-09 – 2021-02
Cloud Solution Architect
Tessera Labs
Paris, France
Architecte cloud sur des projets de migration on-prem → AWS / Azure pour des grands comptes français. Premier projet d'inférence GPU on-prem en 2020 (vision computer).
Education
Diplôme d'ingénieur in Informatique
Centrale Paris · 2014
Project · 2024
on-prem-llm-sizing
Calculator open-source pour dimensionner un déploiement LLM on-prem : VRAM requise, throughput attendu, comparaison vLLM vs Ollama vs TGI selon le profil de charge.