Premier module avec du code Python. Construire un pipeline RAG complet 100 % local — Ollama, Mistral 7B, Phi-4, FAISS, LangChain, Streamlit — et produire une démonstration commerciale prête à l'emploi.
Mettre en place l'environnement Python complet et écrire les trois premiers scripts d'adaptation : lire_pdf, appel_ollama, assemblage.
Mettre en place l'environnement Python complet pour le programme et écrire les trois premiers scripts d'adaptation — lire un fichier, appeler Ollama, sauvegarder un résultat. Le niveau visé est celui de l'adaptateur : comprendre un script existant, modifier ses paramètres, l'assembler avec un autre.
lire_pdf.py, appel_ollama.py, assemblage.py — testés sur un PDF réel. Rapport de test : modèle utilisé, temps de réponse mesuré, limite observée sur un long document.
Implémenter les deux premières étapes du pipeline RAG : découpage en chunks et vectorisation par embeddings.
Comprendre et implémenter les deux premières étapes du pipeline RAG : le découpage en chunks et la vectorisation par embeddings. Ce sont les étapes les moins intuitives mais les plus importantes pour la qualité des réponses.
ollama pull nomic-embed-text.Rapport de test : nombre de chunks produits sur un document réel, valeurs de similarité mesurées entre phrases proches et éloignées.
Implémenter les troisième et quatrième étapes du pipeline RAG : stocker les embeddings dans FAISS et effectuer une recherche sémantique.
Implémenter les troisième et quatrième étapes du pipeline RAG : stocker les embeddings dans une base vectorielle FAISS et effectuer une recherche sémantique. À la fin de cette session, le composant de recherche du RAG est fonctionnel.
Index FAISS créé sur un dossier de PDFs réels. Test de recherche sémantique documenté avec cinq questions et les chunks trouvés.
Assembler le premier pipeline RAG complet et fonctionnel : lire des documents, indexer, rechercher, générer une réponse avec Mistral local.
Assembler le premier pipeline RAG complet et fonctionnel : lire des documents, indexer, rechercher, générer une réponse avec Mistral local. C'est le livrable technique central du Module 3 — la démonstration live en rendez-vous commercial.
Dossier démo avec 3 à 5 documents PME fictifs et cinq questions démonstratives. Rapport de test (10 questions, qualité des réponses, paramètres retenus).
Ajouter une interface web minimaliste au RAG local avec Streamlit — transformer le script terminal en une application accessible à tous.
Ajouter une interface web minimaliste au RAG local avec Streamlit — transformer le script en terminal en une application utilisable par n'importe quel employé de PME sans passer par le terminal.
pip3 install streamlit.streamlit run rag_streamlit.py. Tester avec les questions de la démo. Vérifier que les sources s'affichent correctement.L'ensemble des scripts S5 (rag_local.py + rag_streamlit.py + documents_demo/) constitue le livrable démontrable n°2 du programme.
Installer Phi-4 (14B paramètres, MIT license) et effectuer une comparaison systématique avec Mistral 7B sur les tâches PME.
Installer Phi-4 (14B paramètres, MIT license) sur le MacBook M2 et effectuer une comparaison systématique avec Mistral 7B sur les tâches PME. Comprendre quand utiliser quel modèle — notamment Phi-4 comme pré-filtre d'anonymisation contextuelle en M4.
MODELE_LLM = 'phi4'. Tester sur les cinq questions de la démo. Comparer la qualité des réponses avec Mistral 7B.Tableau comparatif Phi-4 vs Mistral 7B (six tâches, scores, verdict).
Ajouter la mémoire de conversation au RAG — permettre des échanges multi-tours où chaque nouvelle question tient compte des réponses précédentes.
Ajouter la mémoire de conversation au RAG — permettre des échanges multi-tours où chaque nouvelle question tient compte des réponses précédentes. C'est ce qui transforme un outil de recherche en un véritable assistant.
Log d'une conversation de cinq échanges démontrant la cohérence apportée par la mémoire.
Ajouter les métadonnées de source (nom du fichier, numéro de page) aux chunks pour que chaque réponse soit vérifiable.
Ajouter les métadonnées de source (nom du fichier, numéro de page) aux chunks pour que chaque réponse du RAG soit vérifiable. Un élément de confiance essentiel en contexte PME.
Test documenté sur cinq questions avec vérification manuelle des sources citées.
Identifier les risques de sécurité spécifiques à un déploiement RAG local et les mesures de protection correspondantes.
Identifier les risques de sécurité spécifiques à un déploiement RAG local et les mesures de protection correspondantes. Ce module nourrit directement la section vecteurs d'attaque de la formation client.
Démo d'empoisonnement documentée. Fiche « Quatre risques RAG local et protections » pour la formation client Module 5.
Consolider tous les acquis techniques des semaines 5 et 6 dans NotebookLM, identifier les fragilités et préparer le plan de la semaine 7.
Consolider tous les acquis techniques des semaines 5 et 6 dans NotebookLM, identifier les fragilités et préparer le plan de la semaine 7.
15 flashcards. Inventaire des sept scripts avec statuts. Plan S7.
Comprendre l'architecture LangGraph et implémenter un agent minimal avec deux outils : recherche RAG et réponse directe — entièrement on-prem.
Comprendre l'architecture LangGraph et implémenter un agent minimal avec deux outils : recherche RAG et réponse directe. L'agent tourne entièrement on-prem — zéro donnée vers l'extérieur. C'est la base du M3b.
Log de cinq tests avec décisions de routage documentées.
Spécialiser le RAG local pour le secteur juridique et générer des documents fictifs avec PII qui serviront de base de test pour M4.
Spécialiser le RAG local pour un cas d'usage PME réel — le secteur juridique (contrats, actes) — et générer des documents fictifs avec PII qui serviront de base de test pour M4 (Presidio).
Paramètres + trois documents fictifs avec PII (réutilisés en M4 pour tester Presidio). Fiche de déploiement cabinet d'avocats.
Préparer, répéter et documenter la démonstration commerciale complète du Module 3. La démo doit tenir en huit minutes.
Préparer, répéter et documenter la démonstration commerciale complète du Module 3. La démo doit tenir en huit minutes et convaincre un dirigeant PME sans compétence technique.
Script verbal (huit minutes). Fiche technique prospect. Bilan M3 complet. Le Module 3 est entièrement finalisé — démonstration commerciale opérationnelle.