P

Semantic Search : Définition et Exemples

La recherche sémantique est une technique de recherche d'information qui comprend le sens et l'intention derrière une requête, plutôt que de se limiter à la correspondance exacte de mots-clés.

Définition complète

La recherche sémantique (semantic search) désigne une approche avancée de la recherche d'information qui va au-delà de la simple correspondance de mots-clés. Au lieu de chercher des occurrences exactes de termes dans un corpus de documents, elle analyse le sens profond de la requête et des contenus pour établir des correspondances basées sur la signification réelle.

Cette technologie repose sur des modèles de langage et des techniques d'embeddings vectoriels. Chaque texte — qu'il s'agisse d'une requête utilisateur ou d'un document indexé — est transformé en un vecteur numérique dans un espace multidimensionnel. Les textes ayant un sens proche se retrouvent proches dans cet espace, ce qui permet de trouver des résultats pertinents même si les mots employés diffèrent de ceux de la requête.

Dans le contexte de l'IA générative et du prompt engineering, la recherche sémantique joue un rôle central dans les architectures RAG (Retrieval-Augmented Generation). Elle permet de retrouver les passages les plus pertinents d'une base de connaissances pour les injecter dans le contexte d'un LLM, améliorant ainsi la précision et la fiabilité des réponses générées.

Contrairement à la recherche lexicale traditionnelle (comme TF-IDF ou BM25), la recherche sémantique comprend que « voiture électrique » et « véhicule à batterie » parlent du même sujet. Cette capacité de compréhension contextuelle en fait un outil indispensable pour les applications modernes d'IA, les moteurs de recherche intelligents et les systèmes de recommandation.

Étymologie

Le terme combine « semantic » (du grec semantikos, « qui a un sens »), relatif à l'étude du sens en linguistique, et « search » (recherche en anglais). L'expression est apparue dans les années 2000 avec les travaux sur le web sémantique de Tim Berners-Lee, avant d'être popularisée dans le domaine du NLP et de l'IA avec l'essor des modèles de langage neuronaux.

Exemples concrets

Recherche dans une base de documentation technique

Tu as accès à une base de connaissances via recherche sémantique. Quand l'utilisateur pose une question, reformule-la en une requête de recherche optimisée qui capture l'intention réelle, puis utilise les résultats pour répondre avec précision.

Amélioration d'un chatbot de support client

Avant de répondre, effectue une recherche sémantique dans notre FAQ avec la question du client. Si un article pertinent est trouvé (score de similarité > 0.8), base ta réponse dessus. Sinon, indique que tu transmets la demande à un agent humain.

Analyse de retours utilisateurs pour identifier des tendances

Regroupe ces avis clients par thème en utilisant la similarité sémantique. Identifie les clusters principaux de plaintes et suggestions, même si les clients utilisent des formulations très différentes pour exprimer le même problème.

Usage pratique

En prompt engineering, la recherche sémantique s'utilise principalement pour alimenter un LLM avec du contexte pertinent extrait d'une base de connaissances (pattern RAG). Pour l'exploiter efficacement, formulez vos requêtes de recherche comme des phrases complètes décrivant l'information recherchée plutôt que comme des mots-clés isolés. Pensez également à découper vos documents sources en chunks de taille appropriée (300-500 tokens) pour maximiser la précision des résultats retournés.

Concepts liés

EmbeddingsRAG (Retrieval-Augmented Generation)Base de données vectorielleSimilarité cosinus

FAQ

Quelle est la différence entre la recherche sémantique et la recherche par mots-clés ?
La recherche par mots-clés cherche des correspondances exactes de termes dans les documents, tandis que la recherche sémantique comprend le sens de la requête. Par exemple, si vous cherchez « comment réduire ma facture d'énergie », une recherche par mots-clés ne trouvera que les documents contenant ces termes exacts. La recherche sémantique trouvera aussi des articles parlant d'« économies sur la consommation électrique » ou de « baisse des dépenses en chauffage », car le sens est similaire.
Quels outils utiliser pour mettre en place une recherche sémantique ?
Les solutions les plus courantes incluent des bases de données vectorielles comme Pinecone, Weaviate, Qdrant ou pgvector (extension PostgreSQL), combinées à des modèles d'embeddings comme ceux d'OpenAI (text-embedding-3), de Cohere ou des modèles open source comme Sentence-Transformers. Des frameworks comme LangChain ou LlamaIndex simplifient l'intégration de ces composants dans une application RAG.
La recherche sémantique remplace-t-elle complètement la recherche par mots-clés ?
Non, les deux approches sont complémentaires. La recherche sémantique excelle pour comprendre l'intention et trouver des résultats conceptuellement proches, mais peut parfois manquer des correspondances exactes importantes (noms propres, codes produits, identifiants). Les systèmes les plus performants utilisent une approche hybride combinant recherche sémantique et recherche lexicale (BM25), ce qui est souvent appelé « hybrid search ».

Voir aussi

Recevez de nouveaux prompts chaque semaine

Rejoignez notre newsletter.

Semantic Search : Définition et Exemples | Prompt Guide