Aucun code

M1 — Comprendre les LLM / SLM

Construire la culture LLM / SLM nécessaire pour conseiller une PME : architecture, modèles, limites, prompt engineering, RAG et agents. Tous les livrables sont directement réutilisables en formation client.

2
Semaines
10
Sessions
S1–S2
Semaines 1 et 2
CAIP D1
Certification préparée

Naissance et anatomie d'un LLM

Comprendre ce qu'est un Large Language Model — construction, fonctionnement, différences avec un moteur de recherche. Poser le vocabulaire de base.

AI for Everyone (Ng)ClaudeNotebookLM
2h
Durée
Objectif du jour

Comprendre ce qu'est un Large Language Model : comment il est construit, ce qu'il fait réellement, et pourquoi il est fondamentalement différent d'un moteur de recherche ou d'un programme classique. Poser le vocabulaire de base utilisé tout au long du programme.

Notions requises en entrée
  • Aucun prérequis technique — c'est le point de départ absolu du programme
  • Avoir une expérience utilisateur avec au moins un LLM (Claude, ChatGPT, Mistral) suffit
Déroulé de la session
Visionnage
45 min
AI for Everyone (Andrew Ng, Coursera) — semaine 1 complète. Regarder sans prendre de notes dans un premier temps. Identifier mentalement les trois concepts les plus flous.
Analogie fondatrice
25 min
Un LLM est un compresseur de langage humain : il a lu des centaines de milliards de mots et a appris à prédire quel mot vient après un autre, dans n'importe quel contexte. Rédiger cette analogie en cinq phrases maximum.
« Explique-moi en une analogie concrète et sans jargon ce qu'est un LLM, comme si tu parlais à un dirigeant de PME de 50 personnes sans formation technique. »
Vocabulaire
30 min
Construire un glossaire personnel de 12 termes fondamentaux avec définition en langage simple et exemple concret PME : LLM, SLM, token, contexte, paramètres, poids, inférence, prompt, completion, température, hallucination, benchmark.
Consolidation
20 min
Avec NotebookLM : importer le glossaire produit. Générer cinq questions de niveau débutant. Répondre sans relire.
Notions acquises en sortie
  • Distinction claire LLM vs programme classique : un LLM génère du texte probable, il n'exécute pas des règles explicites
  • Définition opérationnelle du token : unité de traitement (~¾ d'un mot en français)
  • Fenêtre de contexte : la mémoire de travail du modèle — ce qu'il « voit » à chaque inférence
  • Hallucination : le modèle génère du texte statistiquement plausible mais factuellement faux
  • Glossaire personnel de 12 termes avec exemples PME — ressource réutilisable en formation
Auto-évaluation
Q1
Explique la différence entre un LLM et un moteur de recherche en deux phrases à un non-technicien.
Q2
Pourquoi un LLM hallucine-t-il ? Quelle est la cause fondamentale de ce phénomène ?
Q3
Qu'est-ce qu'un token ? Combien en contient approximativement la phrase : « Notre chiffre d'affaires a augmenté de 12 % ce trimestre » ?
Q4
Qu'est-ce que la température d'un LLM et quel effet concret a-t-elle sur les réponses générées ?
Livrable du jour
📄
Glossaire personnel de 12 termes LLM

Définition + exemple PME pour chaque terme. Analogie fondatrice en cinq phrases. Ces deux documents seront intégrés au support de formation M1.

Architecture Transformer — l'intuition sans les maths

Comprendre le mécanisme d'attention au cœur de tous les LLM — non pas pour le coder, mais pour expliquer à un client PME pourquoi un LLM comprend le contexte.

ClaudeNotebookLM
1h45
Durée
Objectif du jour

Comprendre le mécanisme d'attention qui est au cœur de tous les LLM modernes — non pas pour le coder, mais pour expliquer à un client PME pourquoi un LLM comprend le contexte, pourquoi il a des limites, et comment cette architecture conditionne le choix entre LLM et SLM.

Notions requises en entrée
  • Définition opérationnelle du LLM et notion de token (S1-J1)
  • Notion de fenêtre de contexte (S1-J1)
Déroulé de la session
Intuition attention
30 min
Le mécanisme d'attention : quand un LLM lit « La banque a refusé le prêt à cause de son bilan déficitaire », il doit résoudre « son » (la banque ou le client ?). L'attention permet de peser chaque mot par rapport à tous les autres. C'est ce qui distingue les Transformers des architectures RNN qui lisaient linéairement.
« Explique-moi le mécanisme d'attention dans les Transformers avec une analogie concrète, sans formule mathématique. Puis explique pourquoi c'est ce mécanisme qui rend les LLM capables de comprendre le contexte à longue distance dans un texte. »
Encodeur vs décodeur
25 min
Deux grandes familles : modèles encodeurs (BERT) qui « comprennent » — utilisés pour la classification et la recherche sémantique — et modèles décodeurs (GPT, Llama, Mistral) qui « génèrent ». La quasi-totalité des LLM conversationnels sont des décodeurs.
Implications pratiques
30 min
Pour une PME : la fenêtre de contexte est une limite physique, plus le modèle a de paramètres plus il est capable mais plus il est lent, la quantization permet de faire tourner de grands modèles sur du hardware modeste.
« Explique-moi la quantization d'un LLM avec une analogie accessible. Quels sont les avantages et les inconvénients pour un déploiement on-premise sur un MacBook M2 ? »
Fiche de synthèse
20 min
Créer dans NotebookLM une note « Architecture LLM — synthèse » avec : schéma textuel encodeur/décodeur, implications pratiques pour le choix de modèle, définition de la quantization.
Notions acquises en sortie
  • Mécanisme d'attention : capacité du modèle à peser chaque token par rapport au contexte global
  • Distinction encodeur (comprendre / classer) vs décodeur (générer) — impact direct sur les cas d'usage RAG vs génération
  • Fenêtre de contexte : limite physique de la mémoire de travail du modèle, mesurable en tokens
  • Quantization : compression des poids pour réduire les besoins en RAM — condition du déploiement M2
Auto-évaluation
Q1
Pourquoi les modèles de type décodeur (Llama, Mistral) sont-ils privilégiés pour les assistants conversationnels ?
Q2
Un document de 80 pages doit être analysé par un LLM avec une fenêtre de 8 000 tokens. Quel problème se pose et quelle approche permet de le contourner ?
Q3
Qu'est-ce que la quantization Q4 et pourquoi permet-elle de faire tourner Mistral 7B sur un MacBook M2 avec 16 Go de RAM ?
Livrable du jour
📓
Note de synthèse « Architecture LLM » dans NotebookLM

Fiche « Implications pratiques pour le choix de modèle » (une page).

Ressources externes

Panorama des modèles — LLM, SLM, open weights, propriétaires

Construire la carte de référence des modèles disponibles en 2026, organisée selon deux axes : taille/performance et ouverture/souveraineté.

PerplexityClaude
2h
Durée
Objectif du jour

Construire la carte de référence des modèles disponibles en 2026, organisée selon deux axes : taille/performance d'un côté, ouverture/souveraineté de l'autre. Document de référence utilisé dans toutes les formations pour aider une PME à choisir son modèle.

Notions requises en entrée
  • Définition LLM, notion de paramètres, quantization (S1-J1 et S1-J2)
  • Distinction encodeur / décodeur (S1-J2)
Déroulé de la session
Taxonomie
20 min
Quatre catégories : (1) LLM propriétaires cloud — Claude, GPT-4o, Gemini. (2) LLM open weights hébergés — Mistral Large via API. (3) SLM open weights on-prem — Mistral 7B, Phi-4, Llama 3.2 3B. (4) Modèles d'embedding — nomic-embed-text.
Recherche comparative
40 min
Avec Perplexity : tableau comparatif de 8 modèles clés (paramètres, fenêtre de contexte, licence, hébergement, benchmark MMLU, cas d'usage PME).
« Compare ces huit modèles LLM/SLM : Claude Sonnet 4.6, Mistral Large, GPT-4o, Mistral 7B, Phi-4, Llama 3.2 3B, Llama 4 Scout, nomic-embed-text. Critères : paramètres, fenêtre de contexte, licence, on-prem possible, MMLU, cas d'usage PME. »
Axe souveraineté
30 min
Positionner chaque modèle sur un axe souveraineté : 🔴 rouge (données vers serveurs US), 🟠 orange (hébergeur européen), 🟢 vert (modèle tourne localement). Ajouter les certifications SecNumCloud.
Carte de référence
30 min
Avec Claude : mise en forme en carte de référence pédagogique avec code couleur et recommandations par profil PME.
« À partir de ce tableau comparatif, crée une carte de référence pédagogique pour dirigeants de PME avec code couleur souveraineté et recommandations par profil (petite / moyenne / réglementée). »
Notions acquises en sortie
  • Taxonomie des modèles en quatre catégories : propriétaire cloud, open weights hébergé, SLM on-prem, modèles d'embedding
  • Tableau comparatif de 8 modèles clés avec critères opérationnels
  • Axe souveraineté appliqué aux modèles : rouge / orange / vert selon la destination des données
  • Carte de référence PME prête à l'emploi — premier livrable commercial du programme
Auto-évaluation
Q1
Quelle est la différence entre un modèle open weights et un modèle véritablement open source ?
Q2
Pourquoi Mistral Large via API Mistral est-il classé « orange » plutôt que « vert » ?
Q3
Pour une PME de 15 personnes sans compétence IT, sans données sensibles, quel modèle recommanderais-tu et pourquoi ?
Q4
Pour un cabinet d'avocats de 8 personnes traitant des dossiers confidentiels, quel modèle recommanderais-tu ?
Livrable du jour
🗺️
Carte de référence des modèles LLM/SLM

Tableau + axe souveraineté + recommandations PME. Premier livrable commercial du programme.

Limites fondamentales des LLM

Maîtriser les cinq limites fondamentales — pour enseigner une posture professionnelle : utiliser les LLM là où ils excellent, les contourner là où ils échouent.

ClaudeMistral
1h30
Durée
Objectif du jour

Maîtriser les cinq limites fondamentales des LLM — pas pour décourager leur adoption, mais pour enseigner une posture professionnelle : utiliser les LLM là où ils excellent, les contourner ou les compléter là où ils échouent.

Notions requises en entrée
  • Mécanisme de génération par prédiction de tokens (S1-J1)
  • Notion d'hallucination (S1-J1)
  • Fenêtre de contexte (S1-J2)
Les cinq limites
1. Hallucination
Le modèle invente avec confiance — texte statistiquement plausible, factuellement faux. Signal : réponses très précises sur des sujets obscurs. Contournement : RAG, vérification systématique des sources.
2. Date de coupure
Le modèle ignore tout ce qui s'est passé après son entraînement. Signal : réponses sur l'actualité récente. Contournement : RAG avec données récentes, recherche web.
3. Absence de mémoire
Chaque conversation repart de zéro sans mécanisme externe. Contournement : mémoire de conversation, RAG, bases de données vectorielles.
4. Calcul limité
Les LLM font des erreurs de calcul. Ne jamais faire confiance aux chiffres sans vérification. Contournement : code interpreter, calculatrice externe.
5. Sensibilité au prompt
La même question mal formulée donne un résultat médiocre. Contournement : prompt engineering structuré (S2-J1).
Expérimentation
« Je veux te poser des questions pour tester tes limites dans un objectif pédagogique. Sois totalement transparent sur tes incertitudes. Q1 : quel est le taux d'inflation en France en mars 2026 ? Q2 : calcule 847 × 293 + racine carrée de 15 129. Q3 : cite trois décisions CNIL de 2025 concernant l'IA. »
Notions acquises en sortie
  • Cinq limites fondamentales avec mécanisme, signal d'alerte et contournement
  • Expérience directe de chaque limite par l'expérimentation
  • Posture professionnelle : utiliser les LLM comme outil d'accélération, pas comme oracle infaillible
Auto-évaluation
Q1
Un client PME te dit : « J'ai demandé à ChatGPT les chiffres du marché et il m'a donné des données très précises. » Quelle réaction adoptes-tu ?
Q2
Explique pourquoi un LLM ne peut pas se souvenir d'une conversation précédente sans mécanisme externe.
Q3
Quels sont les deux types de tâches pour lesquelles tu déconseilles d'utiliser un LLM seul ?
Livrable du jour
📋
Fiche « Cinq limites fondamentales des LLM »

Mécanisme + signal d'alerte + contournement pour chaque limite. Support prêt à être intégré dans une formation client.

Ressources externes

SLM — petits modèles, grands usages on-prem

Comprendre les Small Language Models et réaliser la première installation d'Ollama sur MacBook M2 — le fondement technique de tout le programme.

Ollama (1ère install)Perplexity
2h
Durée
Objectif du jour

Comprendre ce que sont les Small Language Models, pourquoi ils sont stratégiquement importants pour la souveraineté des PME, et réaliser la première installation d'Ollama sur le MacBook M2 — le fondement technique de tout le programme.

Notions requises en entrée
  • Taxonomie des modèles (S1-J3) — catégorie SLM on-prem
  • Notion de quantization (S1-J2)
  • MacBook Air M2 disponible avec au moins 16 Go de RAM
Déroulé de la session
SLM vs LLM
20 min
Ce qui distingue un SLM d'un LLM : taille (1B à 14B paramètres vs 70B+), empreinte mémoire (4–8 Go vs 40–80 Go), vitesse d'inférence sur Neural Engine M2. Modèles clés pour le M2 : Phi-4 (14B, MIT), Mistral 7B (7B, Apache 2.0), Llama 3.2 3B (très rapide).
Installation Ollama
30 min
Pas à pas sur MacBook M2 :
# 1. Télécharger ollama.ai (paquet macOS) ollama --version ollama pull mistral # ~4,1 Go ollama run mistral # Premier test
Observer les tokens/seconde affichés. Documenter le résultat.
Benchmark rapide
35 min
Comparer Mistral 7B local vs Claude (chat web) sur trois questions identiques : culture générale, raisonnement logique, question métier PME. Évaluer qualité (1–5), vitesse et noter : Mistral local n'a envoyé aucune donnée à l'extérieur.
Cartographie SLM
35 min
Avec Perplexity : rechercher les benchmarks actuels des principaux SLM déployables sur M2 (MMLU, performances, RAM nécessaire en Q4).
Notions acquises en sortie
  • Distinction SLM vs LLM : taille, vitesse, spécialisation possible, empreinte hardware
  • Ollama installé et fonctionnel sur le MacBook M2 avec Mistral 7B opérationnel
  • Expérience concrète de l'inférence locale : tokens/seconde mesurés, zéro donnée envoyée
  • Carte de référence des modèles mise à jour avec la section SLM on-prem
Auto-évaluation
Q1
Quel est le principal avantage d'un SLM par rapport à un LLM pour une PME traitant des données confidentielles ?
Q2
Sur ton M2, quel modèle choisirais-tu pour un pré-filtre d'anonymisation (besoin de vitesse) vs un assistant RAG documentaire (besoin de qualité) ?
Q3
Cite deux cas où un SLM local surpasserait Claude — et deux cas où ce serait l'inverse.
Livrable du jour
📊
Rapport de benchmark SLM local

Modèle installé, tokens/sec mesurés, comparaison avec LLM cloud sur trois questions. Carte de référence mise à jour. Démonstration live réutilisable en rendez-vous commercial.

Prompt engineering — maîtriser l'interface avec le LLM

Maîtriser les cinq techniques de prompt engineering qui font la différence entre un LLM médiocre et performant sur une tâche donnée.

ClaudeMistral local (Ollama)
2h
Durée
Objectif du jour

Maîtriser les techniques de prompt engineering qui font la différence entre un LLM médiocre et performant sur une tâche donnée. Ce n'est pas une compétence technique — c'est une compétence de communication structurée que toute PME peut apprendre.

Notions requises en entrée
  • Limites des LLM — sensibilité au prompt (S1-J4)
  • Ollama + Mistral local fonctionnels (S1-J5)
  • Notions de token et de fenêtre de contexte (S1-J1 et S1-J2)
Les cinq techniques fondamentales
1. Rôle + contexte
7 min
« Tu es un assistant commercial pour une PME française de distribution B2B… » — donner un rôle précis améliore drastiquement la pertinence.
2. Instructions explicites
7 min
Format de sortie précisé : « Réponds en trois paragraphes. Commence par… » — la structure de la réponse doit être prescrite.
3. Few-shot (exemples)
7 min
Fournir deux ou trois exemples du résultat attendu avant de demander — particulièrement utile pour les tâches de classification ou de mise en forme.
4. Chain-of-thought
7 min
« Réfléchis étape par étape avant de répondre » — améliore le raisonnement sur les problèmes complexes.
5. Contraintes négatives
7 min
« Ne donne pas de conseils juridiques. Ne dépasse pas 200 mots. » — délimiter ce que le LLM ne doit pas faire.
Expérimentation comparative

Pour le même besoin PME (rédiger un email de relance client), tester : prompt brut / prompt structuré (rôle + contexte + format) / prompt avec few-shot.

« [Sur Mistral local] Tu es un assistant commercial pour une PME française de distribution B2B. Ton client « Entreprise Martin » a une facture de 4 500 € en retard de 30 jours. Rédige un email de relance professionnel et ferme, sans être agressif, en trois paragraphes maximum. Commence par reconnaître la relation commerciale. »
Notions acquises en sortie
  • Cinq techniques de prompt engineering maîtrisées : rôle/contexte, instructions explicites, few-shot, chain-of-thought, contraintes négatives
  • Expérience directe de la différence de qualité entre un prompt brut et un prompt structuré
  • Capacité à évaluer si un SLM local est suffisant ou si un LLM cloud est nécessaire
  • Bibliothèque de prompts PME initiale dans NotebookLM
Livrable du jour
📚
Bibliothèque de cinq prompts PME documentés

Contexte + technique + niveau de modèle requis. Rapport comparatif Claude vs Mistral local sur le même prompt.

RAG — principe et intuition avant la pratique

Comprendre en profondeur le Retrieval-Augmented Generation avant de le coder en M3. Le RAG est la technologie clé qui permet à un LLM de répondre sur les documents internes d'une PME.

ClaudeNotebookLM
1h45
Durée
Objectif du jour

Comprendre en profondeur le principe du RAG (Retrieval-Augmented Generation) avant de le coder en M3. Le RAG est la technologie clé qui permet à un LLM de répondre sur les documents internes d'une PME sans les envoyer entièrement dans le prompt.

Notions requises en entrée
  • Limite de coupure temporelle et absence de mémoire des LLM (S1-J4)
  • Notion de fenêtre de contexte (S1-J2)
  • Distinction encodeur (embedding) vs décodeur (génération) (S1-J2)
Pipeline RAG — 5 étapes (analogie bibliothèque)
1. Indexation
Découper les documents en chunks et les convertir en vecteurs (embeddings) — comme indexer les livres d'une bibliothèque.
2. Stockage
Sauvegarder ces vecteurs dans une base vectorielle (FAISS, Chroma) — comme le catalogue de la bibliothèque.
3. Requête
Convertir la question de l'utilisateur en vecteur — comme formuler une recherche.
4. Recherche sémantique
Trouver les chunks les plus proches sémantiquement — comme le bibliothécaire qui trouve les livres pertinents.
5. Génération
Injecter les chunks dans le prompt et demander au LLM de répondre — le LLM ne voit que les passages pertinents.
« Explique-moi le pipeline RAG avec une analogie concrète qui parle à un chef de PME. Insiste sur pourquoi c'est plus sécurisé qu'envoyer tous les documents au LLM et pourquoi c'est plus précis. »
Cinq cas d'usage RAG pour PME françaises
Cas d'usageType de documentsSensibilité RGPDVerdict
Assistant contrats clientsPDF contratsMoyenne (données client)On-prem recommandé
Chatbot documentation produitFiches produits, manuelsFaibleCloud acceptable
Synthèse réunions internesComptes-rendusÉlevée (stratégie)On-prem obligatoire
Recherche procédures internesProcess internesMoyenneOn-prem recommandé
Analyse devis fournisseursDevis, facturesÉlevée (données financières)On-prem recommandé
Notions acquises en sortie
  • Pipeline RAG en cinq étapes : indexation, stockage vectoriel, requête, recherche sémantique, génération
  • Distinction embedding (modèle qui vectorise) vs LLM (modèle qui génère)
  • Cinq cas d'usage RAG PME documentés avec analyse souveraineté
Livrable du jour
📋
Fiche « Cinq cas d'usage RAG pour PME françaises »

Type de documents, sensibilité RGPD, verdict on-prem / cloud. Cette fiche sera enrichie en M3 avec les détails d'implémentation.

Ressources externes

Agents LLM — comprendre avant d'utiliser

Comprendre ce qu'est un agent LLM, comment il se distingue d'un simple LLM conversationnel, et pourquoi la souveraineté est encore plus critique pour les agents.

ClaudePerplexity
2h
Durée
Objectif du jour

Comprendre ce qu'est un agent LLM, comment il se distingue d'un simple LLM conversationnel, et pourquoi la question de souveraineté est encore plus critique pour les agents — car un agent agit, pas seulement génère du texte.

Notions requises en entrée
  • Fonctionnement d'un LLM (S1-J1 à S1-J4)
  • Notion de prompt engineering (S2-J1)
  • Principe du RAG (S2-J2)
Déroulé de la session
LLM vs Agent
25 min
Un LLM répond. Un agent agit. La boucle : Percevoir → Raisonner → Agir → Observer → Boucler. Un agent dispose d'outils (tools) qu'il peut appeler de façon autonome : moteur de recherche, base de données, API, fichiers, email.
« Explique-moi la différence entre un LLM conversationnel et un agent LLM avec une analogie concrète. Pourquoi le tool calling est-il central ? Et pourquoi les erreurs d'un agent peuvent avoir des conséquences plus graves ? »
MCP — la plomberie universelle
30 min
Le Model Context Protocol (Anthropic, 2024) : standard ouvert qui définit comment un agent LLM se connecte à n'importe quel outil. Avant MCP : chaque intégration était spécifique. Avec MCP : un agent compatible peut se connecter à Google Drive, Slack, un ERP avec la même interface.
Panorama des agents
35 min
Cartographier les agents disponibles selon l'axe souveraineté : Cowork, Claude Computer Use, Opera Neon + MCP Connector, LangGraph + Ollama, n8n + LLM local.
« Compare ces agents en 2026 : Cowork, Claude Computer Use, Opera Neon + MCP Connector, LangGraph + Ollama, n8n + LLM local. Pour chaque : LLM pilote, données vues, actions possibles, risques souveraineté. »
Grille souveraineté agents
30 min
Construire la grille : 6 agents × 5 critères (LLM pilote, données vues, actions possibles, verdict 🔴/🟠/🟢, cas PME acceptable). Ajouter une colonne « risque PME » : pire scénario si l'agent envoie des données sensibles.
Notions acquises en sortie
  • Architecture d'un agent : boucle percevoir-raisonner-agir-observer, tool calling
  • MCP : protocole standard de connexion agents-outils, importance pour la souveraineté
  • Grille de souveraineté des cinq principaux agents du marché
  • Principe clé : un agent agit — ses erreurs peuvent être irréversibles
Livrable du jour
📊
Grille de souveraineté des agents

5 agents × 5 critères. Fiche « LLM vs Agent — différences et risques PME ».

Consolidation M1 — NotebookLM et flashcards

Centraliser tous les livrables et notions du Module 1 dans NotebookLM. Produire les flashcards de révision et un premier QCM de positionnement CAIP.

NotebookLM
1h30
Durée
Objectif du jour

Centraliser et structurer dans NotebookLM tous les livrables et notions du Module 1. Produire les flashcards de révision et un premier QCM de positionnement CAIP.

Déroulé de la session
Import des livrables
20 min
Importer dans NotebookLM : glossaire LLM, fiche architecture, carte de référence des modèles, fiche cinq limites, rapport benchmark SLM, bibliothèque de prompts, fiche RAG cas d'usage, grille souveraineté agents.
Note de synthèse M1
30 min
Créer une note « Module 1 — Synthèse complète » en 6 sections.
« À partir de tous les documents importés, génère une synthèse structurée du Module 1 en six sections. Chaque section concise (5–8 lignes) orientée vers un usage pédagogique pour dirigeants de PME. »
Flashcards M1
25 min
Générer 20 flashcards couvrant l'ensemble du Module 1. Les passer une première fois. Identifier les cinq plus difficiles.
« Génère 20 flashcards sur le Module 1 (LLM, SLM, architecture, limites, prompt engineering, RAG, agents). Format : Question | Réponse concise. Questions de type CAIP : choix de scénario, justification de décision. »
QCM de positionnement
15 min
Générer 8 QCM type examen CAIP. Score sur 8 — référence de départ pour mesurer la progression.
Notions acquises en sortie
  • Notebook M1 complet dans NotebookLM — base documentaire du cours M1
  • 20 flashcards M1 avec identification des cinq plus difficiles
  • Score QCM M1 de référence (sur 8) — premier marqueur de progression CAIP
Livrable du jour
📓
Note de synthèse M1 dans NotebookLM

Plan de cours réutilisable. 20 flashcards. Score QCM noté.

Ressources externes

Bilan M1 — interrogation croisée et préparation M2

Consolider et valider les acquis du Module 1 par une interrogation croisée multi-modèles. Identifier les zones de confort et les zones d'effort.

Mistral local (Ollama)Claude
1h45
Durée
Objectif du jour

Consolider et valider les acquis du Module 1 par une interrogation croisée multi-modèles. Identifier précisément les zones de confort et les zones d'effort. Produire la synthèse personnelle de fin de module.

Déroulé de la session
Interrogation Mistral local
35 min
Sur Mistral local via Ollama (terminal) — session d'interrogation sur le M1 sans notes. L'exercice est aussi une démonstration : utiliser un SLM local pour se former — exactement ce qu'on enseignera aux clients PME.
« Je prépare une certification sur les LLM et la souveraineté. Fais-moi passer une interrogation de 30 minutes sur : architecture LLM/SLM, différences open weights vs propriétaires, limites des LLM, RAG, agents et MCP. Pose une question à la fois et évalue ma réponse avant de continuer. »
Points de difficulté
20 min
Identifier les trois notions sur lesquelles Mistral local a pointé des lacunes. Les approfondir avec Claude en demandant des exemples ou des explications différentes.
Synthèse personnelle M1
30 min
Rédiger la synthèse en répondant à 4 questions : (1) Les cinq notions que je maîtrise suffisamment pour les enseigner. (2) Les deux notions à consolider. (3) Le concept qui m'a le plus surpris. (4) Le livrable M1 le plus utile commercialement.
Anticipation M2
20 min
Lire la description du Module 2 (décision de souveraineté). Identifier les trois questions que tu te poses déjà. Les noter dans NotebookLM.
Notions acquises en sortie
  • Identification précise des acquis solides vs zones d'effort à l'issue du Module 1
  • Expérience de l'auto-formation avec un SLM local — argument démonstratif pour les clients PME
  • Synthèse personnelle M1 — document de référence pour la révision finale CAIP
Auto-évaluation
Q1
Si un prospect PME te demande « pourquoi ne pas juste utiliser ChatGPT pour tout ? », que lui répondrais-tu en deux minutes ?
Q2
Cite les cinq livrables produits pendant M1 et leur usage commercial potentiel.
Livrable du jour
✍️
Synthèse personnelle de fin de M1

Quatre questions, une à deux pages. Trois questions d'anticipation M2 dans NotebookLM.

Ressources externes
← Module précédent Module 2 — La décision de souveraineté →