Lexique des LLM : comprendre enfin l’IA générative (sans faire semblant)

Introduction

L’IA est partout. Dans les timelines, dans les réunions, dans les slides de direction.
Sauf qu’entre LLM, RAG, embeddings, agents, multimodal et compagnie… on finit vite par hocher la tête en mode « oui oui je vois », alors que pas vraiment.

Ce lexique est là pour ça :

poser des définitions claires sur les mots qu’on entend tout le temps,
comprendre comment tout s’emboîte (LLM, IA générative, RAG, etc.),
sans te noyer dans du jargon de chercheur ou de paper académique.

Tu peux le lire d’une traite pour avoir la vue d’ensemble, ou venir piocher un terme quand quelqu’un balance un acronyme en réunion et que tu n’as pas envie d’avouer que tu as décroché.

Objectif : que tu puisses suivre (et mener) une conversation sur l’IA moderne sans avoir l’impression de parler une langue étrangère.

1. Les bases

🤖 IA (intelligence artificielle)

L’IA, c’est le grand domaine qui cherche à faire faire à des machines des tâches qu’on associe à l’intelligence humaine : comprendre, raisonner, décider, prédire.

Les LLM et l’IA générative n’en sont qu’une partie. Très visible aujourd’hui, mais loin de représenter toute l’IA.

📚 Machine learning

Le machine learning, c’est une manière de faire de l’IA où on ne code pas toutes les règles à la main.

On montre des exemples à un modèle et on le laisse apprendre les régularités tout seul : prédire des ventes, reconnaître une image, classer des textes, etc.

🧠 Modèle

Un modèle, c’est le « cerveau mathématique ».

Ça peut désigner :

un type d’algorithme,
ou une version entraînée sur des données précises.

2. Aller plus loin : le deep learning

🧱 Deep learning

Le deep learning est une sous-catégorie du machine learning basée sur de grands réseaux de neurones avec de nombreuses couches.

Plus il y a de couches, plus le modèle peut apprendre des relations complexes. Les LLM font partie de cette famille.

⚙️ Paramètres

Les paramètres sont les valeurs internes du modèle.

Pendant l’entraînement, le modèle ajuste ces paramètres pour produire de meilleures prédictions.

Quand on parle d’un modèle à « 7 milliards de paramètres », on parle du nombre de ces réglages internes.

3. Les LLM

🧠 LLM (Large Language Model)

Un LLM est un très gros modèle de deep learning spécialisé dans le langage naturel.

Il peut réaliser de nombreuses tâches : résumé, traduction, génération de texte, analyse, écriture de code… simplement en changeant l’instruction.

🗣 Langage naturel

Le langage naturel, c’est le langage humain : le texte que nous écrivons et parlons tous les jours.

Les LLM permettent d’interagir directement avec les machines dans ce langage, sans interface technique complexe.

📚 NLP / TAL

NLP (Natural Language Processing) ou TAL (Traitement Automatique du Langage) désigne le domaine qui s’intéresse au traitement du texte par des algorithmes.

Les LLM sont aujourd’hui les outils dominants de ce domaine, mais pas les seuls.

🤖 GPT

GPT est une famille de modèles développée par OpenAI.

Tous les GPT sont des LLM, mais tous les LLM ne sont pas des GPT (Mistral, Llama, Claude, etc.).

4. Bien parler à un LLM

🧩 Token

Les LLM découpent le texte en tokens : morceaux de mots, mots entiers ou signes de ponctuation.

Les limites de contexte et la facturation sont généralement basées sur le nombre de tokens.

💬 Prompt

Un prompt est la consigne donnée au modèle.

Un bon prompt précise :

le rôle du modèle,
la tâche attendue,
le format de sortie souhaité.

🎯 Prompt engineering

Le prompt engineering consiste à formuler et tester des prompts pour obtenir des réponses plus fiables et plus utiles.

C’est souvent empirique : on teste, on ajuste, on garde ce qui fonctionne.

📏 Fenêtre de contexte

La fenêtre de contexte correspond à la quantité maximale de texte qu’un modèle peut prendre en compte en une fois.

Pour travailler avec de longs documents, on utilise souvent des techniques comme le RAG.

5. IA générative

🎨 IA générative

L’IA générative regroupe les modèles capables de créer du contenu : texte, images, audio, vidéo, code.

Les LLM sont la branche « texte » de cette famille.

🧱 Modèles de fondation

Un modèle de fondation est un modèle généraliste entraîné à grande échelle, réutilisable pour de nombreux cas d’usage.

Les LLM sont des modèles de fondation pour le langage.

🧮 Transformers

Les transformers sont une architecture de réseaux de neurones particulièrement adaptée aux séquences longues.

Ils sont à la base de la majorité des LLM modernes.

🖼️ Multimodalité

Un modèle multimodal peut traiter plusieurs types de données à la fois : texte, image, audio, etc.

6. Techniques avancées

📏 Embeddings

Les embeddings sont des représentations numériques du contenu (texte, image…).

Ils permettent de comparer des éléments par similarité de sens.

🔍 Recherche sémantique

La recherche sémantique utilise les embeddings pour retrouver des contenus proches en sens, même si les mots sont différents.

📚 RAG (Retrieval-Augmented Generation)

Le RAG combine une recherche dans une base documentaire et un LLM.

Le modèle génère une réponse en s’appuyant sur des documents pertinents retrouvés au préalable.

😵 Hallucinations

Une hallucination correspond à une réponse inventée par le modèle, mais présentée avec assurance.

Le RAG et les contrôles métier permettent de réduire ce phénomène.

🛠 Agents

Un agent est un système qui combine un LLM avec des outils externes (APIs, bases de données, services).

Il peut enchaîner des actions pour atteindre un objectif.

🚀 MLOps / LLMOps

Le MLOps et le LLMOps regroupent les pratiques permettant de déployer, surveiller et maintenir des modèles en production.

7. Les humains dans la boucle

👨‍💻 Développeur augmenté

Un développeur augmenté utilise l’IA comme un outil pour accélérer certaines tâches, sans être remplacé par elle.

🎛 Vibe coding

Le vibe coding consiste à coder presque exclusivement via des instructions en langage naturel.

Très efficace pour prototyper, moins pour des projets industriels.

🧩 Développement LLM

Le développement LLM est un nouveau métier à la croisée de l’ingénierie logicielle, de l’IA générative et de l’infrastructure.

Conclusion

Si tu es arrivé jusque-là, tu as déjà l’essentiel : le vocabulaire pour comprendre ce qui se cache derrière les buzzwords.

Les LLM ne sont qu’une brique parmi d’autres, mais une brique puissante qui transforme la façon dont on crée des produits et dont on travaille.

Ce lexique n’est pas exhaustif, le domaine évolue trop vite pour ça. Mais avec ces bases, tu peux poser les bonnes questions, comprendre les enjeux réels et éviter de confondre magie et marketing.

Garde-le comme une référence, et quand un nouveau terme apparaît, demande-toi simplement : « ça rentre où, là-dedans ? »

Lexique des LLM : comprendre enfin l’IA générative (sans faire semblant)

Introduction

1. Les bases

🤖 IA (intelligence artificielle)

📚 Machine learning

🧠 Modèle

2. Aller plus loin : le deep learning

🧱 Deep learning

⚙️ Paramètres

3. Les LLM

🧠 LLM (Large Language Model)

🗣 Langage naturel

📚 NLP / TAL

🤖 GPT

4. Bien parler à un LLM

🧩 Token

💬 Prompt

🎯 Prompt engineering

📏 Fenêtre de contexte

5. IA générative

🎨 IA générative

🧱 Modèles de fondation

🧮 Transformers

🖼️ Multimodalité

6. Techniques avancées

📏 Embeddings

🔍 Recherche sémantique

📚 RAG (Retrieval-Augmented Generation)

😵 Hallucinations

🛠 Agents

🚀 MLOps / LLMOps

7. Les humains dans la boucle

👨‍💻 Développeur augmenté

🎛 Vibe coding

🧩 Développement LLM

Conclusion

Un commentaire

Mc

Répondre à Mc Annuler la réponse

Introduction

1. Les bases

🤖 IA (intelligence artificielle)

📚 Machine learning

🧠 Modèle

2. Aller plus loin : le deep learning

🧱 Deep learning

⚙️ Paramètres

3. Les LLM

🧠 LLM (Large Language Model)

🗣 Langage naturel

📚 NLP / TAL

🤖 GPT

4. Bien parler à un LLM

🧩 Token

💬 Prompt

🎯 Prompt engineering

📏 Fenêtre de contexte

5. IA générative

🎨 IA générative

🧱 Modèles de fondation

🧮 Transformers

🖼️ Multimodalité

6. Techniques avancées

📏 Embeddings

🔍 Recherche sémantique

📚 RAG (Retrieval-Augmented Generation)

😵 Hallucinations

🛠 Agents

🚀 MLOps / LLMOps

7. Les humains dans la boucle

👨‍💻 Développeur augmenté

🎛 Vibe coding

🧩 Développement LLM

Conclusion

Vous pourriez aussi aimer

Dynamic Pricing & IA : Votre batterie de téléphone influence-t-elle les prix ?

Décrypter le langage du RSSI : Le guide ultime pour vendre la sécurité (GRC, NIS 2, DORA, KPI)

Le paradoxe de l’Open Source : Plus de contrôle, mais une maintenance au défi de la pénurie d’experts

Un commentaire

Mc

Répondre à Mc Annuler la réponse