Claim this profile

Your PDF didn't include an email, so self-service claim isn't available yet. Reach out and we'll claim it for you.

Paris, FR-IDF

Florian Chastel

Verified

Solution Architect · hybrid cloud & IA générative on-prem

Open to opportunities

Français · Anglais · Allemand

65/100

Updated May 20, 2026

Contact

Hidden

About

Solution Architect depuis 9 ans, spécialisé depuis 2 ans dans le déploiement de LLM en mode hybride / on-premise pour les entreprises qui ne peuvent pas envoyer leurs données chez OpenAI ou Anthropic. Je connais vLLM, Ollama, llama.cpp et les contraintes GPU réelles (vRAM, throughput, coût). Mon créneau : aider une banque ou un assureur à avoir son ChatGPT interne sans que les données sortent du SI.

Skills

AWSAzureGCPHybrid cloudOn-premvLLMOllamallama.cppLLM deploymentLlama 3MistralMixtralEnterprise AIComplianceGDPRConfidential computingKubernetesGPU scheduling

2021-03 – present

Principal Solution Architect

Vairon Tech

Paris, France

Accompagne 12 grands comptes (banque, assurance, santé) dans leur migration vers des architectures hybrides cloud + IA générative sécurisée. Déploiements de LLM on-premise (vLLM, Ollama) pour les cas où les données ne peuvent pas sortir du SI. Définition des architectures GPU et des coûts associés.

2016-09 – 2021-02

Cloud Solution Architect

Tessera Labs

Paris, France

Architecte cloud sur des projets de migration on-prem → AWS / Azure pour des grands comptes français. Premier projet d'inférence GPU on-prem en 2020 (vision computer).

Education

Diplôme d'ingénieur in Informatique
Centrale Paris · 2014

Project · 2024

on-prem-llm-sizing

PythonvLLMOllama

Calculator open-source pour dimensionner un déploiement LLM on-prem : VRAM requise, throughput attendu, comparaison vLLM vs Ollama vs TGI selon le profil de charge.