Module 1 — Comprendre les LLM/SLM

Naissance et anatomie d'un LLM

Comprendre ce qu'est un Large Language Model — construction, fonctionnement, différences avec un moteur de recherche. Poser le vocabulaire de base.

AI for Everyone (Ng)ClaudeNotebookLM

Durée

Objectif du jour

Comprendre ce qu'est un Large Language Model : comment il est construit, ce qu'il fait réellement, et pourquoi il est fondamentalement différent d'un moteur de recherche ou d'un programme classique. Poser le vocabulaire de base utilisé tout au long du programme.

Notions requises en entrée

Aucun prérequis technique — c'est le point de départ absolu du programme
Avoir une expérience utilisateur avec au moins un LLM (Claude, ChatGPT, Mistral) suffit

Déroulé de la session

Visionnage

45 min

AI for Everyone (Andrew Ng, Coursera) — semaine 1 complète. Regarder sans prendre de notes dans un premier temps. Identifier mentalement les trois concepts les plus flous.

Analogie fondatrice

25 min

Un LLM est un compresseur de langage humain : il a lu des centaines de milliards de mots et a appris à prédire quel mot vient après un autre, dans n'importe quel contexte. Rédiger cette analogie en cinq phrases maximum.

« Explique-moi en une analogie concrète et sans jargon ce qu'est un LLM, comme si tu parlais à un dirigeant de PME de 50 personnes sans formation technique. »

Vocabulaire

30 min

Construire un glossaire personnel de 12 termes fondamentaux avec définition en langage simple et exemple concret PME : LLM, SLM, token, contexte, paramètres, poids, inférence, prompt, completion, température, hallucination, benchmark.

Consolidation

20 min

Avec NotebookLM : importer le glossaire produit. Générer cinq questions de niveau débutant. Répondre sans relire.

Notions acquises en sortie

Distinction claire LLM vs programme classique : un LLM génère du texte probable, il n'exécute pas des règles explicites
Définition opérationnelle du token : unité de traitement (~¾ d'un mot en français)
Fenêtre de contexte : la mémoire de travail du modèle — ce qu'il « voit » à chaque inférence
Hallucination : le modèle génère du texte statistiquement plausible mais factuellement faux
Glossaire personnel de 12 termes avec exemples PME — ressource réutilisable en formation

Auto-évaluation

Explique la différence entre un LLM et un moteur de recherche en deux phrases à un non-technicien.

Pourquoi un LLM hallucine-t-il ? Quelle est la cause fondamentale de ce phénomène ?

Qu'est-ce qu'un token ? Combien en contient approximativement la phrase : « Notre chiffre d'affaires a augmenté de 12 % ce trimestre » ?

Qu'est-ce que la température d'un LLM et quel effet concret a-t-elle sur les réponses générées ?

Livrable du jour

📄

Glossaire personnel de 12 termes LLM

Définition + exemple PME pour chaque terme. Analogie fondatrice en cinq phrases. Ces deux documents seront intégrés au support de formation M1.

Ressources externes

AI for Everyone — Andrew Ng (Coursera) NotebookLM Claude

Architecture Transformer — l'intuition sans les maths

Comprendre le mécanisme d'attention au cœur de tous les LLM — non pas pour le coder, mais pour expliquer à un client PME pourquoi un LLM comprend le contexte.

ClaudeNotebookLM

1h45

Durée

Objectif du jour

Comprendre le mécanisme d'attention qui est au cœur de tous les LLM modernes — non pas pour le coder, mais pour expliquer à un client PME pourquoi un LLM comprend le contexte, pourquoi il a des limites, et comment cette architecture conditionne le choix entre LLM et SLM.

Notions requises en entrée

Définition opérationnelle du LLM et notion de token (S1-J1)
Notion de fenêtre de contexte (S1-J1)

Déroulé de la session

Intuition attention

30 min

Le mécanisme d'attention : quand un LLM lit « La banque a refusé le prêt à cause de son bilan déficitaire », il doit résoudre « son » (la banque ou le client ?). L'attention permet de peser chaque mot par rapport à tous les autres. C'est ce qui distingue les Transformers des architectures RNN qui lisaient linéairement.

« Explique-moi le mécanisme d'attention dans les Transformers avec une analogie concrète, sans formule mathématique. Puis explique pourquoi c'est ce mécanisme qui rend les LLM capables de comprendre le contexte à longue distance dans un texte. »

Encodeur vs décodeur

25 min

Deux grandes familles : modèles encodeurs (BERT) qui « comprennent » — utilisés pour la classification et la recherche sémantique — et modèles décodeurs (GPT, Llama, Mistral) qui « génèrent ». La quasi-totalité des LLM conversationnels sont des décodeurs.

Implications pratiques

30 min

Pour une PME : la fenêtre de contexte est une limite physique, plus le modèle a de paramètres plus il est capable mais plus il est lent, la quantization permet de faire tourner de grands modèles sur du hardware modeste.

« Explique-moi la quantization d'un LLM avec une analogie accessible. Quels sont les avantages et les inconvénients pour un déploiement on-premise sur un MacBook M2 ? »

Fiche de synthèse

20 min

Créer dans NotebookLM une note « Architecture LLM — synthèse » avec : schéma textuel encodeur/décodeur, implications pratiques pour le choix de modèle, définition de la quantization.

Notions acquises en sortie

Mécanisme d'attention : capacité du modèle à peser chaque token par rapport au contexte global
Distinction encodeur (comprendre / classer) vs décodeur (générer) — impact direct sur les cas d'usage RAG vs génération
Fenêtre de contexte : limite physique de la mémoire de travail du modèle, mesurable en tokens
Quantization : compression des poids pour réduire les besoins en RAM — condition du déploiement M2

Auto-évaluation

Pourquoi les modèles de type décodeur (Llama, Mistral) sont-ils privilégiés pour les assistants conversationnels ?

Un document de 80 pages doit être analysé par un LLM avec une fenêtre de 8 000 tokens. Quel problème se pose et quelle approche permet de le contourner ?

Qu'est-ce que la quantization Q4 et pourquoi permet-elle de faire tourner Mistral 7B sur un MacBook M2 avec 16 Go de RAM ?

Livrable du jour

📓

Note de synthèse « Architecture LLM » dans NotebookLM

Fiche « Implications pratiques pour le choix de modèle » (une page).

Ressources externes

NotebookLM Claude

Panorama des modèles — LLM, SLM, open weights, propriétaires

Construire la carte de référence des modèles disponibles en 2026, organisée selon deux axes : taille/performance et ouverture/souveraineté.

PerplexityClaude

Durée

Objectif du jour

Construire la carte de référence des modèles disponibles en 2026, organisée selon deux axes : taille/performance d'un côté, ouverture/souveraineté de l'autre. Document de référence utilisé dans toutes les formations pour aider une PME à choisir son modèle.

Notions requises en entrée

Définition LLM, notion de paramètres, quantization (S1-J1 et S1-J2)
Distinction encodeur / décodeur (S1-J2)

Déroulé de la session

Taxonomie

20 min

Quatre catégories : (1) LLM propriétaires cloud — Claude, GPT-4o, Gemini. (2) LLM open weights hébergés — Mistral Large via API. (3) SLM open weights on-prem — Mistral 7B, Phi-4, Llama 3.2 3B. (4) Modèles d'embedding — nomic-embed-text.

Recherche comparative

40 min

Avec Perplexity : tableau comparatif de 8 modèles clés (paramètres, fenêtre de contexte, licence, hébergement, benchmark MMLU, cas d'usage PME).

« Compare ces huit modèles LLM/SLM : Claude Sonnet 4.6, Mistral Large, GPT-4o, Mistral 7B, Phi-4, Llama 3.2 3B, Llama 4 Scout, nomic-embed-text. Critères : paramètres, fenêtre de contexte, licence, on-prem possible, MMLU, cas d'usage PME. »

Axe souveraineté

30 min

Positionner chaque modèle sur un axe souveraineté : 🔴 rouge (données vers serveurs US), 🟠 orange (hébergeur européen), 🟢 vert (modèle tourne localement). Ajouter les certifications SecNumCloud.

Carte de référence

30 min

Avec Claude : mise en forme en carte de référence pédagogique avec code couleur et recommandations par profil PME.

« À partir de ce tableau comparatif, crée une carte de référence pédagogique pour dirigeants de PME avec code couleur souveraineté et recommandations par profil (petite / moyenne / réglementée). »

Notions acquises en sortie

Taxonomie des modèles en quatre catégories : propriétaire cloud, open weights hébergé, SLM on-prem, modèles d'embedding
Tableau comparatif de 8 modèles clés avec critères opérationnels
Axe souveraineté appliqué aux modèles : rouge / orange / vert selon la destination des données
Carte de référence PME prête à l'emploi — premier livrable commercial du programme

Auto-évaluation

Quelle est la différence entre un modèle open weights et un modèle véritablement open source ?

Pourquoi Mistral Large via API Mistral est-il classé « orange » plutôt que « vert » ?

Pour une PME de 15 personnes sans compétence IT, sans données sensibles, quel modèle recommanderais-tu et pourquoi ?

Pour un cabinet d'avocats de 8 personnes traitant des dossiers confidentiels, quel modèle recommanderais-tu ?

Livrable du jour

🗺️

Carte de référence des modèles LLM/SLM

Tableau + axe souveraineté + recommandations PME. Premier livrable commercial du programme.

Ressources externes

Perplexity Claude Mistral AI Ollama Phi-4 (HuggingFace)

Limites fondamentales des LLM

Maîtriser les cinq limites fondamentales — pour enseigner une posture professionnelle : utiliser les LLM là où ils excellent, les contourner là où ils échouent.

ClaudeMistral

1h30

Durée

Objectif du jour

Maîtriser les cinq limites fondamentales des LLM — pas pour décourager leur adoption, mais pour enseigner une posture professionnelle : utiliser les LLM là où ils excellent, les contourner ou les compléter là où ils échouent.

Notions requises en entrée

Mécanisme de génération par prédiction de tokens (S1-J1)
Notion d'hallucination (S1-J1)
Fenêtre de contexte (S1-J2)

Les cinq limites

1. Hallucination

Le modèle invente avec confiance — texte statistiquement plausible, factuellement faux. Signal : réponses très précises sur des sujets obscurs. Contournement : RAG, vérification systématique des sources.

2. Date de coupure

Le modèle ignore tout ce qui s'est passé après son entraînement. Signal : réponses sur l'actualité récente. Contournement : RAG avec données récentes, recherche web.

3. Absence de mémoire

Chaque conversation repart de zéro sans mécanisme externe. Contournement : mémoire de conversation, RAG, bases de données vectorielles.

4. Calcul limité

Les LLM font des erreurs de calcul. Ne jamais faire confiance aux chiffres sans vérification. Contournement : code interpreter, calculatrice externe.

5. Sensibilité au prompt

La même question mal formulée donne un résultat médiocre. Contournement : prompt engineering structuré (S2-J1).

Expérimentation

« Je veux te poser des questions pour tester tes limites dans un objectif pédagogique. Sois totalement transparent sur tes incertitudes. Q1 : quel est le taux d'inflation en France en mars 2026 ? Q2 : calcule 847 × 293 + racine carrée de 15 129. Q3 : cite trois décisions CNIL de 2025 concernant l'IA. »

Notions acquises en sortie

Cinq limites fondamentales avec mécanisme, signal d'alerte et contournement
Expérience directe de chaque limite par l'expérimentation
Posture professionnelle : utiliser les LLM comme outil d'accélération, pas comme oracle infaillible

Auto-évaluation

Un client PME te dit : « J'ai demandé à ChatGPT les chiffres du marché et il m'a donné des données très précises. » Quelle réaction adoptes-tu ?

Explique pourquoi un LLM ne peut pas se souvenir d'une conversation précédente sans mécanisme externe.

Quels sont les deux types de tâches pour lesquelles tu déconseilles d'utiliser un LLM seul ?

Livrable du jour

📋

Fiche « Cinq limites fondamentales des LLM »

Mécanisme + signal d'alerte + contournement pour chaque limite. Support prêt à être intégré dans une formation client.

Ressources externes

Claude Mistral Le Chat

SLM — petits modèles, grands usages on-prem

Comprendre les Small Language Models et réaliser la première installation d'Ollama sur MacBook M2 — le fondement technique de tout le programme.

Ollama (1ère install)Perplexity

Durée

Objectif du jour

Comprendre ce que sont les Small Language Models, pourquoi ils sont stratégiquement importants pour la souveraineté des PME, et réaliser la première installation d'Ollama sur le MacBook M2 — le fondement technique de tout le programme.

Notions requises en entrée

Taxonomie des modèles (S1-J3) — catégorie SLM on-prem
Notion de quantization (S1-J2)
MacBook Air M2 disponible avec au moins 16 Go de RAM

Déroulé de la session

SLM vs LLM

20 min

Ce qui distingue un SLM d'un LLM : taille (1B à 14B paramètres vs 70B+), empreinte mémoire (4–8 Go vs 40–80 Go), vitesse d'inférence sur Neural Engine M2. Modèles clés pour le M2 : Phi-4 (14B, MIT), Mistral 7B (7B, Apache 2.0), Llama 3.2 3B (très rapide).

Installation Ollama

30 min

Pas à pas sur MacBook M2 :

# 1. Télécharger ollama.ai (paquet macOS)
ollama --version
ollama pull mistral    # ~4,1 Go
ollama run mistral     # Premier test

Observer les tokens/seconde affichés. Documenter le résultat.

Benchmark rapide

35 min

Comparer Mistral 7B local vs Claude (chat web) sur trois questions identiques : culture générale, raisonnement logique, question métier PME. Évaluer qualité (1–5), vitesse et noter : Mistral local n'a envoyé aucune donnée à l'extérieur.

Cartographie SLM

35 min

Avec Perplexity : rechercher les benchmarks actuels des principaux SLM déployables sur M2 (MMLU, performances, RAM nécessaire en Q4).

Notions acquises en sortie

Distinction SLM vs LLM : taille, vitesse, spécialisation possible, empreinte hardware
Ollama installé et fonctionnel sur le MacBook M2 avec Mistral 7B opérationnel
Expérience concrète de l'inférence locale : tokens/seconde mesurés, zéro donnée envoyée
Carte de référence des modèles mise à jour avec la section SLM on-prem

Auto-évaluation

Quel est le principal avantage d'un SLM par rapport à un LLM pour une PME traitant des données confidentielles ?

Sur ton M2, quel modèle choisirais-tu pour un pré-filtre d'anonymisation (besoin de vitesse) vs un assistant RAG documentaire (besoin de qualité) ?

Cite deux cas où un SLM local surpasserait Claude — et deux cas où ce serait l'inverse.

Livrable du jour

📊

Rapport de benchmark SLM local

Modèle installé, tokens/sec mesurés, comparaison avec LLM cloud sur trois questions. Carte de référence mise à jour. Démonstration live réutilisable en rendez-vous commercial.

Ressources externes

Ollama — site officiel Perplexity Phi-4 (HuggingFace) Mistral 7B (HuggingFace)

Prompt engineering — maîtriser l'interface avec le LLM

Maîtriser les cinq techniques de prompt engineering qui font la différence entre un LLM médiocre et performant sur une tâche donnée.

ClaudeMistral local (Ollama)

Durée

Objectif du jour

Maîtriser les techniques de prompt engineering qui font la différence entre un LLM médiocre et performant sur une tâche donnée. Ce n'est pas une compétence technique — c'est une compétence de communication structurée que toute PME peut apprendre.

Notions requises en entrée

Limites des LLM — sensibilité au prompt (S1-J4)
Ollama + Mistral local fonctionnels (S1-J5)
Notions de token et de fenêtre de contexte (S1-J1 et S1-J2)

Les cinq techniques fondamentales

1. Rôle + contexte

7 min

« Tu es un assistant commercial pour une PME française de distribution B2B… » — donner un rôle précis améliore drastiquement la pertinence.

2. Instructions explicites

7 min

Format de sortie précisé : « Réponds en trois paragraphes. Commence par… » — la structure de la réponse doit être prescrite.

3. Few-shot (exemples)

7 min

Fournir deux ou trois exemples du résultat attendu avant de demander — particulièrement utile pour les tâches de classification ou de mise en forme.

4. Chain-of-thought

7 min

« Réfléchis étape par étape avant de répondre » — améliore le raisonnement sur les problèmes complexes.

5. Contraintes négatives

7 min

« Ne donne pas de conseils juridiques. Ne dépasse pas 200 mots. » — délimiter ce que le LLM ne doit pas faire.

Expérimentation comparative

Pour le même besoin PME (rédiger un email de relance client), tester : prompt brut / prompt structuré (rôle + contexte + format) / prompt avec few-shot.

« [Sur Mistral local] Tu es un assistant commercial pour une PME française de distribution B2B. Ton client « Entreprise Martin » a une facture de 4 500 € en retard de 30 jours. Rédige un email de relance professionnel et ferme, sans être agressif, en trois paragraphes maximum. Commence par reconnaître la relation commerciale. »

Notions acquises en sortie

Cinq techniques de prompt engineering maîtrisées : rôle/contexte, instructions explicites, few-shot, chain-of-thought, contraintes négatives
Expérience directe de la différence de qualité entre un prompt brut et un prompt structuré
Capacité à évaluer si un SLM local est suffisant ou si un LLM cloud est nécessaire
Bibliothèque de prompts PME initiale dans NotebookLM

Livrable du jour

📚

Bibliothèque de cinq prompts PME documentés

Contexte + technique + niveau de modèle requis. Rapport comparatif Claude vs Mistral local sur le même prompt.

Ressources externes

Claude Ollama Guide Prompt Engineering Anthropic

RAG — principe et intuition avant la pratique

Comprendre en profondeur le Retrieval-Augmented Generation avant de le coder en M3. Le RAG est la technologie clé qui permet à un LLM de répondre sur les documents internes d'une PME.

ClaudeNotebookLM

1h45

Durée

Objectif du jour

Comprendre en profondeur le principe du RAG (Retrieval-Augmented Generation) avant de le coder en M3. Le RAG est la technologie clé qui permet à un LLM de répondre sur les documents internes d'une PME sans les envoyer entièrement dans le prompt.

Notions requises en entrée

Limite de coupure temporelle et absence de mémoire des LLM (S1-J4)
Notion de fenêtre de contexte (S1-J2)
Distinction encodeur (embedding) vs décodeur (génération) (S1-J2)

Pipeline RAG — 5 étapes (analogie bibliothèque)

1. Indexation

Découper les documents en chunks et les convertir en vecteurs (embeddings) — comme indexer les livres d'une bibliothèque.

2. Stockage

Sauvegarder ces vecteurs dans une base vectorielle (FAISS, Chroma) — comme le catalogue de la bibliothèque.

3. Requête

Convertir la question de l'utilisateur en vecteur — comme formuler une recherche.

4. Recherche sémantique

Trouver les chunks les plus proches sémantiquement — comme le bibliothécaire qui trouve les livres pertinents.

5. Génération

Injecter les chunks dans le prompt et demander au LLM de répondre — le LLM ne voit que les passages pertinents.

« Explique-moi le pipeline RAG avec une analogie concrète qui parle à un chef de PME. Insiste sur pourquoi c'est plus sécurisé qu'envoyer tous les documents au LLM et pourquoi c'est plus précis. »

Cinq cas d'usage RAG pour PME françaises

Cas d'usage	Type de documents	Sensibilité RGPD	Verdict
Assistant contrats clients	PDF contrats	Moyenne (données client)	On-prem recommandé
Chatbot documentation produit	Fiches produits, manuels	Faible	Cloud acceptable
Synthèse réunions internes	Comptes-rendus	Élevée (stratégie)	On-prem obligatoire
Recherche procédures internes	Process internes	Moyenne	On-prem recommandé
Analyse devis fournisseurs	Devis, factures	Élevée (données financières)	On-prem recommandé

Notions acquises en sortie

Pipeline RAG en cinq étapes : indexation, stockage vectoriel, requête, recherche sémantique, génération
Distinction embedding (modèle qui vectorise) vs LLM (modèle qui génère)
Cinq cas d'usage RAG PME documentés avec analyse souveraineté

Livrable du jour

📋

Fiche « Cinq cas d'usage RAG pour PME françaises »

Type de documents, sensibilité RGPD, verdict on-prem / cloud. Cette fiche sera enrichie en M3 avec les détails d'implémentation.

Ressources externes

Claude NotebookLM FAISS (GitHub)

Agents LLM — comprendre avant d'utiliser

Comprendre ce qu'est un agent LLM, comment il se distingue d'un simple LLM conversationnel, et pourquoi la souveraineté est encore plus critique pour les agents.

ClaudePerplexity

Durée

Objectif du jour

Comprendre ce qu'est un agent LLM, comment il se distingue d'un simple LLM conversationnel, et pourquoi la question de souveraineté est encore plus critique pour les agents — car un agent agit, pas seulement génère du texte.

Notions requises en entrée

Fonctionnement d'un LLM (S1-J1 à S1-J4)
Notion de prompt engineering (S2-J1)
Principe du RAG (S2-J2)

Déroulé de la session

LLM vs Agent

25 min

Un LLM répond. Un agent agit. La boucle : Percevoir → Raisonner → Agir → Observer → Boucler. Un agent dispose d'outils (tools) qu'il peut appeler de façon autonome : moteur de recherche, base de données, API, fichiers, email.

« Explique-moi la différence entre un LLM conversationnel et un agent LLM avec une analogie concrète. Pourquoi le tool calling est-il central ? Et pourquoi les erreurs d'un agent peuvent avoir des conséquences plus graves ? »

MCP — la plomberie universelle

30 min

Le Model Context Protocol (Anthropic, 2024) : standard ouvert qui définit comment un agent LLM se connecte à n'importe quel outil. Avant MCP : chaque intégration était spécifique. Avec MCP : un agent compatible peut se connecter à Google Drive, Slack, un ERP avec la même interface.

Panorama des agents

35 min

Cartographier les agents disponibles selon l'axe souveraineté : Cowork, Claude Computer Use, Opera Neon + MCP Connector, LangGraph + Ollama, n8n + LLM local.

« Compare ces agents en 2026 : Cowork, Claude Computer Use, Opera Neon + MCP Connector, LangGraph + Ollama, n8n + LLM local. Pour chaque : LLM pilote, données vues, actions possibles, risques souveraineté. »

Grille souveraineté agents

30 min

Construire la grille : 6 agents × 5 critères (LLM pilote, données vues, actions possibles, verdict 🔴/🟠/🟢, cas PME acceptable). Ajouter une colonne « risque PME » : pire scénario si l'agent envoie des données sensibles.

Notions acquises en sortie

Architecture d'un agent : boucle percevoir-raisonner-agir-observer, tool calling
MCP : protocole standard de connexion agents-outils, importance pour la souveraineté
Grille de souveraineté des cinq principaux agents du marché
Principe clé : un agent agit — ses erreurs peuvent être irréversibles

Livrable du jour

📊

Grille de souveraineté des agents

5 agents × 5 critères. Fiche « LLM vs Agent — différences et risques PME ».

Ressources externes

Model Context Protocol LangGraph n8n Perplexity

Consolidation M1 — NotebookLM et flashcards

Centraliser tous les livrables et notions du Module 1 dans NotebookLM. Produire les flashcards de révision et un premier QCM de positionnement CAIP.

NotebookLM

1h30

Durée

Objectif du jour

Centraliser et structurer dans NotebookLM tous les livrables et notions du Module 1. Produire les flashcards de révision et un premier QCM de positionnement CAIP.

Déroulé de la session

Import des livrables

20 min

Importer dans NotebookLM : glossaire LLM, fiche architecture, carte de référence des modèles, fiche cinq limites, rapport benchmark SLM, bibliothèque de prompts, fiche RAG cas d'usage, grille souveraineté agents.

Note de synthèse M1

30 min

Créer une note « Module 1 — Synthèse complète » en 6 sections.

« À partir de tous les documents importés, génère une synthèse structurée du Module 1 en six sections. Chaque section concise (5–8 lignes) orientée vers un usage pédagogique pour dirigeants de PME. »

Flashcards M1

25 min

Générer 20 flashcards couvrant l'ensemble du Module 1. Les passer une première fois. Identifier les cinq plus difficiles.

« Génère 20 flashcards sur le Module 1 (LLM, SLM, architecture, limites, prompt engineering, RAG, agents). Format : Question | Réponse concise. Questions de type CAIP : choix de scénario, justification de décision. »

QCM de positionnement

15 min

Générer 8 QCM type examen CAIP. Score sur 8 — référence de départ pour mesurer la progression.

Notions acquises en sortie

Notebook M1 complet dans NotebookLM — base documentaire du cours M1
20 flashcards M1 avec identification des cinq plus difficiles
Score QCM M1 de référence (sur 8) — premier marqueur de progression CAIP

Livrable du jour

📓

Note de synthèse M1 dans NotebookLM

Plan de cours réutilisable. 20 flashcards. Score QCM noté.

Ressources externes

NotebookLM CAIP — CertNexus

Bilan M1 — interrogation croisée et préparation M2

Consolider et valider les acquis du Module 1 par une interrogation croisée multi-modèles. Identifier les zones de confort et les zones d'effort.

Mistral local (Ollama)Claude

1h45

Durée

Objectif du jour

Consolider et valider les acquis du Module 1 par une interrogation croisée multi-modèles. Identifier précisément les zones de confort et les zones d'effort. Produire la synthèse personnelle de fin de module.

Déroulé de la session

Interrogation Mistral local

35 min

Sur Mistral local via Ollama (terminal) — session d'interrogation sur le M1 sans notes. L'exercice est aussi une démonstration : utiliser un SLM local pour se former — exactement ce qu'on enseignera aux clients PME.

« Je prépare une certification sur les LLM et la souveraineté. Fais-moi passer une interrogation de 30 minutes sur : architecture LLM/SLM, différences open weights vs propriétaires, limites des LLM, RAG, agents et MCP. Pose une question à la fois et évalue ma réponse avant de continuer. »

Points de difficulté

20 min

Identifier les trois notions sur lesquelles Mistral local a pointé des lacunes. Les approfondir avec Claude en demandant des exemples ou des explications différentes.

Synthèse personnelle M1

30 min

Rédiger la synthèse en répondant à 4 questions : (1) Les cinq notions que je maîtrise suffisamment pour les enseigner. (2) Les deux notions à consolider. (3) Le concept qui m'a le plus surpris. (4) Le livrable M1 le plus utile commercialement.

Anticipation M2

20 min

Lire la description du Module 2 (décision de souveraineté). Identifier les trois questions que tu te poses déjà. Les noter dans NotebookLM.

Notions acquises en sortie

Identification précise des acquis solides vs zones d'effort à l'issue du Module 1
Expérience de l'auto-formation avec un SLM local — argument démonstratif pour les clients PME
Synthèse personnelle M1 — document de référence pour la révision finale CAIP

Auto-évaluation

Si un prospect PME te demande « pourquoi ne pas juste utiliser ChatGPT pour tout ? », que lui répondrais-tu en deux minutes ?

Cite les cinq livrables produits pendant M1 et leur usage commercial potentiel.

Livrable du jour

✍️

Synthèse personnelle de fin de M1

Quatre questions, une à deux pages. Trois questions d'anticipation M2 dans NotebookLM.

Ressources externes

Ollama Claude NotebookLM

← Module précédent Module 2 — La décision de souveraineté →

M1 — Comprendre les LLM / SLM

Naissance et anatomie d'un LLM

Architecture Transformer — l'intuition sans les maths

Panorama des modèles — LLM, SLM, open weights, propriétaires

Limites fondamentales des LLM

SLM — petits modèles, grands usages on-prem

Prompt engineering — maîtriser l'interface avec le LLM

RAG — principe et intuition avant la pratique

Agents LLM — comprendre avant d'utiliser

Consolidation M1 — NotebookLM et flashcards

Bilan M1 — interrogation croisée et préparation M2