P
📊Analyse de donnéesIntermediateAll AIs

Correlation analysis between variables

Analyze correlations between dataset variables with business interpretation and heatmap visualization.

Paste in your AI

Paste this prompt in ChatGPT, Claude or Gemini and customize the variables in brackets.

J'ai un dataset contenant [NOMBRE_VARIABLES] variables : [LISTE_VARIABLES]. Le dataset comporte [NOMBRE_OBSERVATIONS] observations sur la période [PERIODE]. L'objectif est de comprendre les relations entre ces variables pour [OBJECTIF_METIER].

Réalise une analyse de corrélation complète :
1. Calcule la matrice de corrélation (Pearson pour variables continues, Spearman si distribution non-normale, Kendall pour variables ordinales)
2. Identifie les paires de variables avec corrélation forte (|r| > 0.7) et modérée (|r| > 0.4)
3. Distingue corrélation et causalité pour les relations identifiées
4. Détecte la multicolinéarité problématique pour de futures analyses de régression
5. Représente graphiquement la matrice de corrélation (heatmap) avec le code approprié
6. Propose des hypothèses métier pour expliquer les corrélations les plus significatives
7. Identifie des variables potentiellement redondantes pouvant être supprimées

Contexte business : [CONTEXTE_BUSINESS]
Outil préféré : [OUTIL] (Python pandas/seaborn, R, Excel)

Fournis une interprétation en langage accessible pour des non-statisticiens.

Why this prompt works

The prompt is effective because it asks for both technical calculation and accessible business interpretation, bridging the gap between statistical analysis and managerial decision-making. It avoids the correlation/causation trap.

Use Cases

Customer satisfaction factor analysisSales driver identificationChurn determinant study

Expected Output

Commented correlation matrix, identification of significant relationships, visualization code and business interpretations.

Learn more

Check the full skill on Prompt Guide to master this technique from A to Z.

View on Prompt Guide