📊Analyse de donnéesAvanceAll AIs

Profilage de la latence d'inférence du modèle

Optimiser la vitesse d'inférence du modèle

Coller dans votre IA

Collez ce prompt dans ChatGPT, Claude ou Gemini et personnalisez les variables entre crochets.

Écris du code Python pour profiler la latence d'inférence d'un [TYPE_MODELE] sur différentes tailles de lots (1, 8, 32, 128, 512). Mesure : latence p50, p95, p99 et débit (prédictions/seconde). Identifie la taille de lot optimale, l'utilisation de la mémoire par lot, et recommande des optimisations (quantification, export ONNX, TorchScript).

Personnaliser ce prompt avec Léa

Réponds à 3 questions, Léa adapte le prompt à ta situation.

Cas d'usage

Optimiser la vitesse d'inférence du modèle

Améliorez ce prompt

Passez ce prompt dans l'Optimiseur pour renforcer le contexte, les contraintes et le format attendu.

Améliore ce prompt avec l'Optimiseur

Commentaires

Sois le premier à commenter ce prompt.

Termes du glossaire

Contexte Embedding Few-shot prompting Fine-tuning GPT Guardrails Inference LLM

📬 Recevez de nouveaux prompts chaque semaine

Rejoignez notre newsletter et ne manquez aucun prompt.

Pour aller plus loin

Améliore ce prompt avec l'Optimiseur

Analyse le prompt, renforce le contexte et obtiens une version plus précise.

Prompt Engineering

Les principes transverses pour écrire des prompts plus fiables.

Prompts similaires

📊Analyse de donnéesAvanceAll AIs

Créer un système de recommandation

Créer des systèmes de recommandation

0103

📊Analyse de donnéesDebutantAll AIs

Créer un rapport EDA automatisé

Générer automatiquement des rapports EDA

098

📊Analyse de donnéesIntermediaireAll AIs

Analyse de puissance statistique

Planifier une expérience statistique

0121

📊Analyse de donnéesAvanceAll AIs

Créer une proposition de stratégie de données

Proposer des initiatives en matière de données de manière stratégique

0116