Lexique des LLM : comprendre enfin l’IA générative (sans faire semblant)
Introduction
L’IA est partout. Dans les timelines, dans les réunions, dans les slides de direction.
Sauf qu’entre LLM, RAG, embeddings, agents, multimodal et compagnie… on finit vite par hocher la tête en mode « oui oui je vois », alors que pas vraiment.
Ce lexique est là pour ça :
- poser des définitions claires sur les mots qu’on entend tout le temps,
- comprendre comment tout s’emboîte (LLM, IA générative, RAG, etc.),
- sans te noyer dans du jargon de chercheur ou de paper académique.
Tu peux le lire d’une traite pour avoir la vue d’ensemble, ou venir piocher un terme quand quelqu’un balance un acronyme en réunion et que tu n’as pas envie d’avouer que tu as décroché.
Objectif : que tu puisses suivre (et mener) une conversation sur l’IA moderne sans avoir l’impression de parler une langue étrangère.
1. Les bases
🤖 IA (intelligence artificielle)
L’IA, c’est le grand domaine qui cherche à faire faire à des machines des tâches qu’on associe à l’intelligence humaine : comprendre, raisonner, décider, prédire.
Les LLM et l’IA générative n’en sont qu’une partie. Très visible aujourd’hui, mais loin de représenter toute l’IA.
📚 Machine learning
Le machine learning, c’est une manière de faire de l’IA où on ne code pas toutes les règles à la main.
On montre des exemples à un modèle et on le laisse apprendre les régularités tout seul : prédire des ventes, reconnaître une image, classer des textes, etc.
🧠 Modèle
Un modèle, c’est le « cerveau mathématique ».
Ça peut désigner :
- un type d’algorithme,
- ou une version entraînée sur des données précises.
2. Aller plus loin : le deep learning
🧱 Deep learning
Le deep learning est une sous-catégorie du machine learning basée sur de grands réseaux de neurones avec de nombreuses couches.
Plus il y a de couches, plus le modèle peut apprendre des relations complexes. Les LLM font partie de cette famille.
⚙️ Paramètres
Les paramètres sont les valeurs internes du modèle.
Pendant l’entraînement, le modèle ajuste ces paramètres pour produire de meilleures prédictions.
Quand on parle d’un modèle à « 7 milliards de paramètres », on parle du nombre de ces réglages internes.
3. Les LLM
🧠 LLM (Large Language Model)
Un LLM est un très gros modèle de deep learning spécialisé dans le langage naturel.
Il peut réaliser de nombreuses tâches : résumé, traduction, génération de texte, analyse, écriture de code… simplement en changeant l’instruction.
🗣 Langage naturel
Le langage naturel, c’est le langage humain : le texte que nous écrivons et parlons tous les jours.
Les LLM permettent d’interagir directement avec les machines dans ce langage, sans interface technique complexe.
📚 NLP / TAL
NLP (Natural Language Processing) ou TAL (Traitement Automatique du Langage) désigne le domaine qui s’intéresse au traitement du texte par des algorithmes.
Les LLM sont aujourd’hui les outils dominants de ce domaine, mais pas les seuls.
🤖 GPT
GPT est une famille de modèles développée par OpenAI.
Tous les GPT sont des LLM, mais tous les LLM ne sont pas des GPT (Mistral, Llama, Claude, etc.).
4. Bien parler à un LLM
🧩 Token
Les LLM découpent le texte en tokens : morceaux de mots, mots entiers ou signes de ponctuation.
Les limites de contexte et la facturation sont généralement basées sur le nombre de tokens.
💬 Prompt
Un prompt est la consigne donnée au modèle.
Un bon prompt précise :
- le rôle du modèle,
- la tâche attendue,
- le format de sortie souhaité.
🎯 Prompt engineering
Le prompt engineering consiste à formuler et tester des prompts pour obtenir des réponses plus fiables et plus utiles.
C’est souvent empirique : on teste, on ajuste, on garde ce qui fonctionne.
📏 Fenêtre de contexte
La fenêtre de contexte correspond à la quantité maximale de texte qu’un modèle peut prendre en compte en une fois.
Pour travailler avec de longs documents, on utilise souvent des techniques comme le RAG.
5. IA générative
🎨 IA générative
L’IA générative regroupe les modèles capables de créer du contenu : texte, images, audio, vidéo, code.
Les LLM sont la branche « texte » de cette famille.
🧱 Modèles de fondation
Un modèle de fondation est un modèle généraliste entraîné à grande échelle, réutilisable pour de nombreux cas d’usage.
Les LLM sont des modèles de fondation pour le langage.
🧮 Transformers
Les transformers sont une architecture de réseaux de neurones particulièrement adaptée aux séquences longues.
Ils sont à la base de la majorité des LLM modernes.
🖼️ Multimodalité
Un modèle multimodal peut traiter plusieurs types de données à la fois : texte, image, audio, etc.
6. Techniques avancées
📏 Embeddings
Les embeddings sont des représentations numériques du contenu (texte, image…).
Ils permettent de comparer des éléments par similarité de sens.
🔍 Recherche sémantique
La recherche sémantique utilise les embeddings pour retrouver des contenus proches en sens, même si les mots sont différents.
📚 RAG (Retrieval-Augmented Generation)
Le RAG combine une recherche dans une base documentaire et un LLM.
Le modèle génère une réponse en s’appuyant sur des documents pertinents retrouvés au préalable.
😵 Hallucinations
Une hallucination correspond à une réponse inventée par le modèle, mais présentée avec assurance.
Le RAG et les contrôles métier permettent de réduire ce phénomène.
🛠 Agents
Un agent est un système qui combine un LLM avec des outils externes (APIs, bases de données, services).
Il peut enchaîner des actions pour atteindre un objectif.
🚀 MLOps / LLMOps
Le MLOps et le LLMOps regroupent les pratiques permettant de déployer, surveiller et maintenir des modèles en production.
7. Les humains dans la boucle
👨💻 Développeur augmenté
Un développeur augmenté utilise l’IA comme un outil pour accélérer certaines tâches, sans être remplacé par elle.
🎛 Vibe coding
Le vibe coding consiste à coder presque exclusivement via des instructions en langage naturel.
Très efficace pour prototyper, moins pour des projets industriels.
🧩 Développement LLM
Le développement LLM est un nouveau métier à la croisée de l’ingénierie logicielle, de l’IA générative et de l’infrastructure.
Conclusion
Si tu es arrivé jusque-là, tu as déjà l’essentiel : le vocabulaire pour comprendre ce qui se cache derrière les buzzwords.
Les LLM ne sont qu’une brique parmi d’autres, mais une brique puissante qui transforme la façon dont on crée des produits et dont on travaille.
Ce lexique n’est pas exhaustif, le domaine évolue trop vite pour ça. Mais avec ces bases, tu peux poser les bonnes questions, comprendre les enjeux réels et éviter de confondre magie et marketing.
Garde-le comme une référence, et quand un nouveau terme apparaît, demande-toi simplement : « ça rentre où, là-dedans ? »



Un commentaire
Mc
Un blog prometteur !