P
📊Analyse de donnéesAvanceAll AIs

Profilage de la latence d'inférence du modèle

Optimiser la vitesse d'inférence du modèle

Coller dans votre IA

Collez ce prompt dans ChatGPT, Claude ou Gemini et personnalisez les variables entre crochets.

Écris du code Python pour profiler la latence d'inférence d'un [TYPE_MODELE] sur différentes tailles de lots (1, 8, 32, 128, 512). Mesure : latence p50, p95, p99 et débit (prédictions/seconde). Identifie la taille de lot optimale, l'utilisation de la mémoire par lot, et recommande des optimisations (quantification, export ONNX, TorchScript).

Personnaliser ce prompt avec Léa

Réponds à 3 questions, Léa adapte le prompt à ta situation.

Cas d'usage

Optimiser la vitesse d'inférence du modèle

Formez-vous en profondeur

Découvrez le skill complet sur Prompt Guide pour maîtriser cette technique de A à Z.

Voir sur Prompt Guide

📬 Recevez de nouveaux prompts chaque semaine

Rejoignez notre newsletter et ne manquez aucun prompt.

Prompts similaires

Analyse des données marketing multicanal

Analyse complète des performances marketing multicanal avec calcul ROI, modèles d'attribution et optimisation budgétaire.

0229

Choisir la bonne visualisation pour ses données

Guide le choix du type de graphique optimal selon les données, l'audience et le message à communiquer.

0206
📊Analyse de donnéesIntermediaireAll AIs

Analyse des métriques web analytics

Analyse complète des métriques web analytics pour comprendre les comportements visiteurs et identifier les axes d'optimisation.

0203

Créer son premier tableau de bord dans Excel

Guide pas à pas pour créer son premier tableau de bord Excel professionnel sans connaissances avancées requises.

0283