Faites-vous aider pour choisir entre Copilot et Cowork

Depuis que l’on sait que Copilot Cowork va passer à la facturation à l’usage, vous avez sans doute commencé à prendre un nouveau réflexe, tel un futur ancien fumeur : avant de lancer une tâche, vous vous demandez si elle mérite vraiment de consommer des Copilot Credits, ou si un simple Copilot Chat aurait fait le job gratuitement. Le souci, c’est qu’on se pose la question dans le vide, sans savoir ce que la tâche va réellement coûter, ni si l’outil le plus cher apporte quelque chose de plus. Si ça vous parle, cet article est fait pour vous.

Je vous montre comment j’ai construit un petit agent Copilot, baptisé CoworkChooser, dont le seul boulot est de répondre à cette question avant que vous ne dépensiez le moindre crédit : Cowork, ou Copilot ? Et accessoirement, de vous rendre le bon prompt, déjà optimisé. On part de zéro, on le configure ensemble, et je vous montre ce que ça donne sur mes vraies tâches, captures à l’appui, pièges compris.

Pour rappel, le changement de modèle qui rend tout ça nécessaire, je l’ai détaillé dans mon article précédent sur la bascule de Cowork en PAYG. Je m’appuie dessus tout du long, donc si vous l’avez loupé, c’est le bon moment : Copilot Cowork passe en PAYG.

Pour vous guider plus facilement dans cet article, voici des liens rapides :

1. Le problème : depuis la GA, chaque tâche est un arbitrage

Pour rappel, jusqu’ici Microsoft 365 Copilot, c’était un tarif fixe et prévisible. Depuis la disponibilité générale de Cowork le 16 juin 2026, ce n’est plus le cas : la licence reste obligatoire, mais elle ne suffit plus. L’usage de Cowork se facture en plus, à la tâche, en Copilot Credits, à 0,01 $ le crédit en pay-as-you-go.

Microsoft classe les tâches en trois profils. Concrètement, ça donne quoi ? Une tâche légère tourne autour de 100 à 300 crédits (1 à 3 $), une tâche moyenne de 400 à 700 crédits (4 à 7 $), et une tâche lourde dépasse les 700 crédits, soit plus de 7 $ pièce :

D’où la question qu’on se pose désormais en boucle : pour ce que je veux faire, est-ce que j’ai vraiment besoin de Cowork, ou est-ce que Copilot Chat (déjà inclus dans ma licence, donc à zéro crédit) suffit ? C’est précisément ce trou que l’agent vient combler.

2. L’idée : un portier gratuit devant une ressource chère

L’idée tient en une phrase : on place un agent gratuit en amont d’une fonctionnalité facturée à l’usage. Un portier qui ne coûte rien et qui vous évite de déclencher du Cowork à plusieurs dollars la tâche quand un simple Copilot Chat aurait suffi.

Et c’est là que c’est malin : un agent déclaratif classique tourne sur le moteur de Copilot Chat, couvert par la licence. Il ne consomme donc pas de crédits. CoworkChooser est littéralement un conseiller gratuit qui vous dit s’il faut payer ou pas. Le rapport bénéfice sur coût est imbattable : zéro investissement pour piloter une dépense variable.

À retenir : l’agent lui-même ne facture rien si l’utilisateur dispose d’une licence Copilot. Tout son intérêt est de réduire la consommation de crédits Cowork, pas d’en créer. C’est un argument qui fait gagner du temps face à un valideur interne. Mais l’agent peut aussi fonctionner en PAYG, ce qui occasionne une petite consommation de crédit.

3. Ce que fait CoworkChooser concrètement

Vous lui donnez votre demande en langage naturel, et il déroule toujours la même mécanique :

  • Si la demande est floue, il pose une à trois questions de clarification avant toute estimation. Pas de chiffrage à l’aveugle.
  • Il rend un tableau comparatif Copilot Chat contre Cowork, avec une fourchette de coût en crédits et en dollars.
  • Il affiche en clair où exécuter la tâche (Copilot Chat, Copilot dans Word ou Excel, ou Cowork).
  • Il rend un verdict, évalue la valeur ajoutée de Cowork, et recommande le bon modèle.
  • Il vous donne le prompt reformulé, prêt à coller. Et si Copilot suffit, il propose même de générer le résultat directement.

Le tout dans la langue de votre demande. Vous écrivez en français, il répond en français :

4. La config pas-à-pas dans Copilot Studio

On passe à la pratique. Avant de commencer, vérifiez les pré-requis : une licence Microsoft 365 Copilot, un accès à Copilot Studio, et le rôle qui vous autorise à publier un agent pour l’organisation.

Étape 0 : ouvrez Copilot Studio et lancez Create, puis New agent pour Microsoft 365 Copilot.

Étape 1 : renseignez le nom (CoworkChooser) :

Étape 2 : renseignez la description, elle sert à l’utilisateur final, restez clair sur le rôle de tri :

A triage assistant that compares, in a table, the cost and the value of your request depending on whether it runs through Copilot Cowork (billed in credits) or Copilot Chat. It asks questions to fully understand the need, recommends the right model/mode, provides the optimized prompt, and can generate the result directly when Copilot Chat is enough.

Étape 3 : collez le bloc d’instructions dans le champ Instructions. C’est le cerveau de l’agent :

ROLE
You are CoworkChooser, a triage assistant that sits in front of Microsoft 365 Copilot. Your goal: stop the user from spending Copilot Credits unnecessarily. You analyze the request, compare Copilot Chat and Cowork in a table, and return an optimized prompt. You never run Cowork yourself (you cannot). However, when the verdict is "Copilot Chat is enough" and the user confirms, you carry out the task yourself directly in the conversation: you run on the Copilot Chat engine. Reply ENTIRELY in the language of the user's request - the table, the verdict, the recommendations and any generated content all in that language (English by default; if the user writes in French, answer fully in French).

WORKFLOW - FOLLOW IT
1. CLARIFY FIRST. If the request is ambiguous or you lack the info to decide (number of sources, expected deliverables, scope, output format), ask 1 to 3 short, targeted questions BEFORE any estimate. Never estimate a cost until the request is clear.
2. CLASSIFY the task by profile (see grid).
3. PRODUCE THE TABLE comparing Copilot Chat vs Cowork.
4. GIVE WHERE TO RUN IT, THE VERDICT, the value, and the recommended setting.
5. PROVIDE THE PROMPT: either the optimized Cowork prompt or the ready-to-run Copilot query, depending on the verdict.
6. CHAIN. After the table, verdict and prompt:
   - If COPILOT is enough: end with "Want me to generate it now?". If the user says yes / go ahead, immediately run the reformulated prompt and produce the result in the conversation (structured content ready to paste into Word).
   - If COWORK is recommended: do not run it. Remind the user the task must be launched in Cowork, and provide the optimized Cowork prompt ready to copy.

CLASSIFICATION GRID
- Copilot Chat IS ENOUGH when: a single-turn answer, writing/summarizing/translating content already provided, a one-off question, a single source or limited context, a single simple deliverable.
- Cowork IS NEEDED when at least 2 of these signals are present: aggregating several sources (emails + files + meetings), autonomous multi-step end-to-end execution, multiple deliverables, long-running orchestration, actions across several tools.
- Cowork IS OUT OF SCOPE (recommend Copilot or warn the user) if the task requires: a local file (Cowork only touches OneDrive/SharePoint), deleting files, an encrypted file, an attachment over 200 MB, or an external system not connected (Salesforce, ServiceNow, Entra...) without a plugin/export first.

COWORK NATIVE CAPABILITIES (never mark these out of scope)
Recurring scheduled prompts (e.g. "every Friday at 5pm" - built into Cowork via the Scheduled tab; NEVER tell the user to use Power Automate for scheduling), sending emails, posting in Teams, creating/editing Word/Excel/PowerPoint/PDF, and organizing or moving OneDrive/SharePoint files. The ONLY hard limits are those in the OUT OF SCOPE line above.

COPILOT CHAT FILE-CREATION REALITY (do not over-claim)
Copilot Chat can create a basic Word/Excel/PowerPoint/PDF via its code/Analyst tool. NEVER say it "cannot create files." Its output is crude: skeleton structure, shallow or placeholder content, weak on full translation, and not reliably saved to a chosen OneDrive folder. So: for a quick or basic single file, Copilot Chat may be enough (Feasible = Yes). For a polished, content-complete, multi-file, or reliably-saved deliverable, recommend Cowork on QUALITY and COMPLETENESS grounds, not on a false impossibility. Set Copilot Chat feasibility to "Partial" with the real limitation, never "No" just because a file is involved.

TASK PROFILES AND COST (Opus 4.8 reference, PayGo $0.01/credit)
- Light (few sources, light reasoning, 1 deliverable or fewer): 100 to 300 credits (~$1 to $3).
- Medium (multiple sources, structured reasoning, 2+ deliverables): 400 to 700 credits (~$4 to $7).
- Heavy (broad aggregation, deep analysis, many deliverables): over 700 credits (~over $7).
- Copilot Chat is covered by the license: 0 credits.

ESTIMATION RULES
- Always give a RANGE + a profile, never a single hard number.
- State that the estimate is DIRECTIONAL, based on Opus 4.8; the real cost depends on configuration, the chosen model, and complexity.
- Define Cowork's VALUE as what it does that Copilot cannot (end-to-end automation, multiple deliverables, polished/content-complete output, manual time saved). Rate it: low / medium / high. If the value is low but the cost is real, recommend Copilot.

MODEL / MODE RECOMMENDATION
Always add a setting recommendation matched to the verdict.
- If COPILOT is enough: fast mode by default. Suggest deeper reasoning (Think Deeper / Researcher or Analyst agents) only if the analysis is complex or multi-source. That mode is included in the license: no credits, the trade-off is depth vs speed.
- If COWORK is recommended: the model is the number-one controllable cost lever.
  - Auto = good default (Cowork picks, leans cheaper).
  - Sonnet 4.6 = to save on routine work.
  - Opus 4.8 = for high-stakes reasoning (small premium over Sonnet).
  - Sonnet + Opus Advisor = for an important deliverable with a built-in review pass.
  - Avoid GPT 5.5 by default: about 2 to 3 times the cost for often-equivalent output; reserve it for verbose writing or citations.
  Adjust the estimated cost to the recommended model (Sonnet instead of the top tier can cut the bill by 2 or 3 times).

RESPONSE FORMAT (once the request is clear)
Start with the table, exactly in this Markdown structure:

| Option | Feasible? | Estimated cost | What you get |
|---|---|---|---|
| Copilot Chat | Yes / Partial / No | 0 credits (included in the license) | [concrete result] |
| Copilot Cowork | Yes | [profile] - [range] credits (~[$]) | [finished end-to-end deliverable] |

Then, below the table:
Where to run it: name the single concrete Copilot entry point to open, in bold, so it is scannable at a glance - one of: Copilot Chat, Copilot in Word, Copilot in Excel, Copilot in PowerPoint, Copilot in Outlook, the Researcher agent, the Analyst agent, or Copilot Cowork.
Verdict: Copilot Chat is enough / Cowork recommended - in one sentence, with the reason.
Cowork value: low / medium / high - short justification.
Recommended setting: [recommended mode or model + a short reason: cost or depth].

Then the prompt, depending on the verdict:
- If COWORK is recommended: heading "Optimized Cowork prompt" + the prompt in a code block.
- If COPILOT is enough: heading "Ready-to-run Copilot query" + the query in a code block, followed by "Want me to generate it now?".

REWRITING BEST PRACTICES
Structure every prompt around: (1) a single clear objective, (2) context and sources to use, (3) the expected output format, (4) constraints (length, tone, audience), (5) the success criterion. Remove vagueness; split it up if several intents are mixed.

REUSE (optional, one line)
For a prompt the user will likely run again, suggest saving it to the Copilot Prompt Gallery ("Your Prompts"). Do not output deep links - they are unreliable.

COST-SAVING TIP (optional, one line)
If relevant: narrow the scope, split a heavy task, or pick a cheaper model.

TONE
Direct, concrete, no jargon. You are a budget-discipline copilot, not a salesperson. If the user insists on Cowork where Copilot is enough, respect their choice but flag the avoidable extra cost.

Étape 4 : ajoutez la connaissance via Knowledge. Rattachez le catalogue de cas d’usage (un document de référence stocké dans SharePoint ou OneDrive). N’ajoutez aucune autre source, aucun connecteur :

Étape 5 : renseignez les Conversation starters, les quelques amorces que l’utilisateur verra en ouvrant l’agent :

Étape 6 : activez Work IQ :

Étape 7 : publiez via Publish et demandez la disponibilité pour l’organisation. L’agent remonte ensuite pour validation côté admin, selon le processus en place chez vous :

5. Cas n°1 : la tâche qui mérite Cowork

Premier test sur une vraie tâche de mon tenant. Je demande à l’agent :

chaque lundi à 8h, compile mes notifications de sécurité PIM de la semaine, repère les activations Global Administrator anormales, et envoie-moi un récap par mail.

Là, l’agent ne tergiverse pas : verdict Cowork. Et il a raison, la demande cumule plusieurs signaux forts. Une récurrence hebdomadaire automatique, une agrégation de plusieurs e-mails, un raisonnement de détection d’anomalie, et un envoi de mail. C’est exactement ce que Copilot Chat seul ne sait pas faire en mode autonome. Le profil est moyen, et l’agent me recommande Sonnet 4.6 plutôt qu’Opus pour diviser la facture par deux à trois :

Un prompt complet est même proposé par l’agent pour le rendre encore plus efficace :

Et là, magie : quand on colle le prompt dans Cowork, il propose directement de créer la tâche planifiée, chaque lundi, sans bricolage. La récurrence est native :

Dans Copilot Chat, en revanche, ce même prompt ne donne pas satisfaction : il ne sait pas planifier, et vous renvoie vers Power Automate :

6. Cas n°2 : la tâche où Copilot suffit

Le test miroir, maintenant. Je demande une seule source (un mail), un seul livrable (un résumé), aucune action :

résume-moi le dernier mail de suivi de chantier, les 3 points clés, les blocages, et ce qui attend une décision de ma part.

Le verdict tombe : Copilot Chat suffit, zéro crédit. L’agent note que la valeur de Cowork est faible ici, et que payer des crédits n’apporterait rien. Il me donne la requête prête à coller et propose de la générer sur place :

Le clou du test : par curiosité, j’ai lancé la même demande dans Copilot Chat :

Et dans Cowork :

Résultat quasi identique. Le résumé Cowork n’apporte rien de plus que le résumé Copilot, sauf qu’il aurait coûté une centaine de crédits. L’agent avait raison de me garder sur Copilot.

C’est tout l’intérêt : il vous évite de payer pour un résultat que vous auriez eu gratuitement :

7. Le vrai levier de coût : le choix du modèle

Voici le point que peu de gens regardent, alors que c’est le premier levier de coût que vous contrôlez directement. Sur Cowork, le modèle retenu fait varier la facture du simple au triple, à qualité souvent équivalente. J’ai lancé une même tâche multi-livrables sur trois modèles, et l’écart est saisissant.

ModèleIdéal pourCrédits (même tâche)Coût PayGo
AutoLa majorité du travail, Cowork choisit et penche vers le moins cherVariableRecommandé par défaut
Claude Sonnet 4.6Tâches courantes, rédaction, réponses rapides314~3,14 $
Claude Opus 4.8Raisonnement à fort enjeu, analyse multi-étapes401~4,01 $
GPT 5.5Rédaction verbeuse, citations1087~10,87 $

Le constat est net : GPT 5.5 a coûté près de trois fois Sonnet pour un résultat équivalent, alors qu’Opus n’est qu’à 0,80 $ de plus que Sonnet. La règle que l’agent applique : Auto ou Sonnet par défaut, Opus uniquement pour le raisonnement à fort enjeu, et GPT 5.5 seulement en cas de besoin précis :

Attention : ces chiffres sont des estimations directionnelles, sur la base du modèle Opus 4.8. Le coût réel dépend de votre configuration, du modèle choisi et de la complexité de la tâche. Voyez-les comme un ordre de grandeur, pas comme un devis.

Côté Copilot Chat, en revanche, le mode de raisonnement approfondi (Think Deeper, ou les agents Researcher et Analyst) est inclus dans la licence : aucun crédit. L’arbitrage n’est donc pas le coût mais la profondeur face à la vitesse.

Mon retour terrain : l’agent n’est pas infaillible, et c’est sain de le savoir. Deux pièges m’ont marqué. D’abord la planification : il a d’abord affirmé que Cowork ne savait pas planifier et m’a renvoyé vers Power Automate, alors que Cowork le fait nativement (onglet Scheduled). Ensuite la création de fichiers : il a cru à tort que Copilot Chat ne pouvait pas créer de fichiers. En réalité, Copilot a bien sorti un PowerPoint et un Word, mais en version squelette (une ligne par slide, sections vides). La leçon : Copilot sait créer des fichiers, mais pour du fini fini, c’est Cowork. Vérifiez toujours quand l’agent invente une limite.

Concrètement, ça donne quoi ?

Voilà, en un agent gratuit, vous transformez une question floue (Cowork ou Copilot ?) en une réponse chiffrée, avec le bon prompt déjà prêt. Sur mes tests, il a routé chaque tâche au bon endroit : Cowork pour la surveillance PIM récurrente, Copilot pour le résumé de mail, sans jamais me faire payer un crédit inutile.

Les trois choses à retenir :

  1. L’agent ne coûte rien : il tourne sous votre licence Copilot, sa seule mission est de réduire la facture Cowork.
  2. Le modèle est votre premier levier de coût : Auto ou Sonnet par défaut, Opus pour le fort enjeu, et on évite GPT 5.5 par réflexe.
  3. Ne croyez pas l’agent sur parole quand il invente une limite : Cowork sait planifier, envoyer, publier et déplacer des fichiers nativement. Vérifiez avant de partir sur Power Automate.

Dernier point utile, que l’agent connaît aussi : même quand une tâche est complexe, certaines choses sortent du périmètre de Cowork. À écarter d’office.

Ce que Cowork ne fait pasDétail
Fichiers locauxIl ne touche qu’aux fichiers OneDrive et SharePoint, pas à ceux de votre poste
Supprimer des fichiersImpossible dans OneDrive ou SharePoint, à faire manuellement
Fichiers chiffrésNon lus, même si vous y avez accès
Pièces jointesChaque fichier doit faire moins de 200 Mo
Systèmes externesSalesforce, ServiceNow, Entra admin : un plugin ou un export est nécessaire au préalable

Foncez le monter dans votre tenant, en générateur léger pour tester, puis dans Copilot Studio pour le faire approuver. Et si vous voulez d’abord comprendre le modèle de facturation qui rend tout ça pertinent, c’est par ici : Copilot Cowork passe en PAYG

Configurez Copilot Cowork en CSP

Vous administrez un tenant Microsoft 365, Copilot Cowork vient de passer en GA, et vous voulez faire les choses bien : poser une spending policy pour cadrer la dépense avant d’ouvrir les vannes. Sauf que votre tenant est onboardé dans le programme CSP, et là, sur la page Cost management, votre compte Global Admin se prend une bannière « managed by your solution provider » en pleine figure.

On part d’un Global Admin permanent qui devrait tout pouvoir, et on déroule, capture après capture, pourquoi il est bloqué, pourquoi un License Admin se mange un 403, et pourquoi (c’est le clou) un Global Admin activé en just-in-time via PIM, lui, passe. Et tant qu’à parler d’incohérences, j’en ai relevé une seconde, côté licence, que je partage en fin d’article.

Pour vous guider plus facilement dans cet article, voici des liens rapides :

Si vous débarquez sur le sujet des Copilot Credits et des spending policies, je vous renvoie d’abord à mon article précédent qui pose tout le décor de la facturation à l’usage de Cowork : Copilot Cowork passe en PAYG. Ici, on attaque un cas plus tordu, observé sur des tenants CSP.

1. Le contexte en deux lignes

Pour rappel, depuis la GA du 16 juin 2026, l’usage de Copilot Cowork se facture à la consommation en Copilot Credits, et tout se pilote depuis le centre d’administration Microsoft 365, menu Copilot puis Cost management. Le geste fondateur côté admin, c’est la création d’une spending policy : c’est elle qui décide qui peut dépenser des crédits, combien, et sur quelle méthode de facturation. Sans elle, rien ne s’active. J’ai détaillé toute cette mécanique dans l’article cité plus haut.

Le problème que je vous décris ici n’apparaît que sur les tenants passés sous gestion CSP (Cloud Solution Provider). Toutes les captures qui suivent ont été anonymisées : le tenant est nommé contoso, et le second compte d’administration admin2. La logique observée, elle, est strictement celle de mon lab.

2. Le symptôme : avant et après l’onboarding CSP

Commençons par l’état sain. Connecté avec mon compte Global Admin, j’ouvre Copilot puis Cost management. Tout est normal : l’expérience de facturation à l’usage est disponible, le bouton Get started m’est proposé, aucune restriction à l’horizon.

Maintenant, le tenant est onboardé dans le programme CSP. Même compte, même page, même navigateur. Et la page a changé de visage : une bannière s’affiche pour me dire que mon organisation est gérée par un solution provider, et que la gestion des Copilot Credits doit être configurée par ce provider. Plus de Get started, plus de configuration possible de mon côté.

La seule variable qui a changé entre les deux captures, c’est l’onboarding CSP. Pas le compte, pas le rôle, pas la page. C’est donc bien le CSP qui déclenche le blocage.

3. Ce n’est pas un problème de rôle

Premier réflexe quand un admin se fait jeter : vérifier le rôle. Direction le centre d’administration Microsoft Entra. Et c’est sans appel : mon compte porte bien le rôle Global Administrator, en assignation active, directe et permanente. Le plus haut niveau de privilège du tenant.

Le blocage de l’étape 2 n’est donc pas une histoire de droits insuffisants. Un Global Admin permanent reste bloqué. On tient là le premier vrai mystère.

4. Le License Administrator : l’assistant va au bout, puis 403

Deuxième piste : et si je tentais avec un rôle moins privilégié, par bonne hygiène de moindre privilège ? Je crée un second compte, admin2, à qui j’attribue uniquement le rôle License Administrator, en permanent.

Bonne surprise au premier abord : connecté en License Admin, l’onglet Configuration de Cost management se charge, et le bouton Add spending policy est bien là :

Un message transitoire passe au chargement, « We couldn’t load your latest policies from the admin service », mais l’assistant s’ouvre :

Je remplis le wizard de bout en bout : nom de la policy, périmètre All users, services Copilot Cowork et Work IQ API, méthode de facturation pay-as-you-go sur une souscription Azure dédiée, plafond mensuel et alertes. Tout passe, écran après écran. Puis je clique sur Create spending policy, et là, le couperet :

Le message est explicite : « Failed to create Copilot Credits billing plan: Request failed with status 403 ». L’assistant m’a laissé tout remplir pour échouer à la toute dernière étape. Frustrant, mais en fait, la documentation Microsoft éclaire ce point précis.

La page Microsoft Learn sur la gestion de la facturation à l’usage distingue deux familles de rôles. Les rôles AI Administrator et License Administrator peuvent créer des spending policies, gérer les limites et les alertes, et consulter le tableau de bord. Mais pour la méthode de facturation, c’est une autre histoire :

They can’t set or modify the billing method.

Source : Managing AI experiences enabled by usage-based billing, Microsoft Learn

Définir ou modifier la méthode de facturation est réservé aux rôles Global Administrator et Billing Administrator. Or créer une policy en pay-as-you-go, c’est précisément rattacher une méthode de facturation. D’où le 403 à l’étape finale : le License Admin pouvait dérouler le wizard, mais pas poser le billing plan.

Attention : ce 403 n’est donc pas un bug, c’est une frontière de privilège. Le bon réflexe de moindre privilège pour la partie facturation, ce n’est pas Global Admin, c’est le rôle Billing Administrator. Microsoft recommande d’ailleurs de réserver Global Administrator aux scénarios d’urgence.
Mon retour terrain : le message « couldn’t load your latest policies from the admin service » a été observé pendant la fenêtre de déploiement de la GA, les 16 et 17 juin. Possible indisponibilité intermittente du service d’administration ce jour-là, je n’ai pas pu trancher s’il a un lien avec le blocage CSP ou non.

5. Le contournement qui marche : Global Admin en JIT via PIM

Le 403 du License Admin s’explique. Mais souvenez-vous : mon compte principal, lui, est Global Admin permanent, et il reste bloqué par la bannière CSP. Alors j’ai tenté autre chose sur le second compte. En plus de son License Administrator permanent, admin2 dispose du rôle Global Administrator en éligible via Privileged Identity Management (PIM).

J’active donc Global Administrator en just-in-time pour admin2, de façon limitée dans le temps via PIM :

Le rôle passe à Activated, à côté de l’assignation License Administrator permanente :

Je relance le même assistant Add spending policy, avec exactement les mêmes choix qu’à l’étape précédente. Et cette fois :

« Spending policy created ». La policy s’affiche dans la liste Configuration et s’applique immédiatement aux utilisateurs ciblés. De retour sur mon compte Global Admin principal, je la vois bien active, pour tous les utilisateurs, facturée en pay-as-you-go.

6. Première incohérence : Global Admin permanent contre JIT

Récapitulons le paradoxe, parce que c’est lui le cœur du sujet. Sur le même tenant, contre le même backend, à quelques minutes d’intervalle :

  • un Global Administrator permanent est bloqué en amont par la bannière CSP, il ne peut même pas lancer la configuration :
  • un License Administrator atteint la dernière étape puis échoue en 403, ce qui s’explique par la frontière de privilège sur le billing :
  • un Global Administrator activé en just-in-time via PIM, sur un autre compte, réussit la création de bout en bout :

Le rôle effectif est pourtant le même entre le compte bloqué (Global Admin permanent) et le compte qui réussit (Global Admin JIT). La différence tient au contexte d’activation : permanent contre just-in-time. Mon hypothèse, et je le présente bien comme une hypothèse, c’est que le blocage CSP se joue au niveau du contexte de session ou d’autorisation, pas au niveau du rôle effectif. Comme si les deux chemins ne touchaient pas exactement la même condition côté backend.

Attention : ce contournement par PIM fonctionne sur mon lab, mais ce n’est pas un comportement documenté. Je ne le présente pas comme la méthode supportée, juste comme une observation. Un changement côté Microsoft pourrait le faire disparaître du jour au lendemain.

7. Seconde incohérence : Cowork sans licence Microsoft 365 Copilot

Le blocage CSP n’est pas la seule bizarrerie que j’ai relevée. En creusant sur plusieurs tenants, je suis tombé sur une seconde incohérence, cette fois côté licence. Dans mon premier article, je posais la licence Microsoft 365 Copilot comme le ticket d’entrée obligatoire de Cowork. C’est d’ailleurs la lecture que Microsoft met en avant dans sa documentation, où la licence sert de point d’entrée vers les services facturés à l’usage :

(…) licenses act as an entry point enabling access to AI services (…)

Source : Usage-Based Billing and Cost Management for Copilot Credits, Microsoft Learn

Sauf que sur le terrain, le tableau est plus flou. Sur plusieurs tenants, j’ai vu Cowork consommer des crédits sans qu’aucune licence Microsoft 365 Copilot ne soit assignée à l’utilisateur. Les crédits étaient tirés soit du pack de capacité apporté par une licence Copilot Studio, soit directement de la souscription Azure en pay-as-you-go. Dans les deux cas, pas de licence Microsoft 365 Copilot sur le compte, et Cowork fonctionne quand même.

J’avais déjà effleuré le sujet dans mon premier article, avec un utilisateur sans licence Microsoft 365 Copilot qui avait quand même pu utiliser Cowork pendant la période de grâce. Ce que je constate maintenant va plus loin : ce n’est pas un simple effet de la période de grâce, et ça se répète sur plusieurs tenants, avec des sources de crédits différentes.

Mon retour terrain : la question que ça pose est simple. La licence Microsoft 365 Copilot est-elle vraiment un prérequis dur pour Cowork, ou juste un des points d’entrée possibles, à côté des crédits Copilot Studio et du pay-as-you-go Azure ? Le « in some scenarios » de la doc laisse la porte ouverte, mais ce point n’est documenté nulle part de façon claire. À confirmer avec Microsoft.

8. Mes questions ouvertes à Microsoft

À ce stade, j’ai des observations solides, captures à l’appui, mais pas toutes les réponses. Voici les cinq questions que je porte à Microsoft, dans l’ordre d’importance :

  1. La bannière « managed by your solution provider » est-elle le comportement attendu pour un tenant CSP ? Si oui, quel est le chemin supporté et documenté pour qu’un client CSP (ou son provider) crée et gère ses spending policies Copilot Credits ?
  2. Pourquoi un Global Administrator permanent est-il bloqué, alors qu’un Global Administrator activé en just-in-time via PIM sur un second compte réussit, contre le même backend ?
  3. Le 403 renvoyé au License Administrator est-il bien le comportement attendu vu la frontière de privilège sur le billing, et le rôle Billing Administrator suffit-il pour la partie méthode de facturation sur un tenant CSP ?
  4. La licence Microsoft 365 Copilot est-elle un prérequis strict pour utiliser Cowork, ou un simple point d’entrée parmi d’autres ? J’observe Cowork consommer des crédits, via un pack Copilot Studio ou la souscription Azure, sans aucune licence Microsoft 365 Copilot assignée.
  5. Le message « couldn’t load your latest policies from the admin service » était-il une condition transitoire du rollout des 16 et 17 juin, ou est-il lié au blocage CSP ?
Update à venir : je mettrai cet article à jour dès que j’aurai un retour officiel de Microsoft sur ces points. Si vous observez le même comportement de votre côté, ou si vous avez une explication, les commentaires sont ouverts.

9. Récap : la checklist si vous êtes en CSP

Voilà, en quelques étapes, ce qu’il faut avoir en tête si votre tenant Copilot est sous gestion CSP et que vous butez sur la création d’une spending policy.

ConstatCe que ça signifieQuoi faire
Bannière « managed by your solution provider »Le blocage est déclenché par l’onboarding CSP, pas par un rôle manquantVérifier la relation CSP, solliciter votre provider, et poser la question à Microsoft
403 en License AdministratorCe rôle ne peut pas définir la méthode de facturationUtiliser Billing Administrator pour la partie billing, pas un rôle trop faible
Global Admin permanent bloqué, JIT PIM qui passeLe blocage semble lié au contexte de session, pas au rôle effectifContournement observé via PIM, mais non documenté : à confirmer avec Microsoft
Cowork actif sans licence Microsoft 365 CopilotLa licence présentée comme ticket d’entrée n’est pas toujours requise en pratiqueVérifier l’assignation réelle des licences et la source des crédits, et confirmer avec Microsoft
Message « couldn’t load your latest policies »Possible indisponibilité transitoire du service d’adminRéessayer, et surveiller si ça persiste hors fenêtre de rollout

Concrètement, ça donne quoi ? Sur un tenant CSP, la création d’une spending policy Copilot Credits ne se comporte pas comme sur un tenant classique, et les garde-fous de rôle de Microsoft (moindre privilège côté policy, billing réservé à Global ou Billing Admin) se doublent d’une couche CSP qui, elle, n’est pas documentée à ce jour. Les deux pièges côté CSP : un Global Admin permanent ne vous garantit pas de pouvoir configurer les crédits sur un tenant managé, et le bon rôle pour la facturation reste Billing Administrator, pas Global Admin par défaut. À ça s’ajoute la surprise côté licence : Cowork peut tourner sans licence Microsoft 365 Copilot, en tirant sur des crédits Copilot Studio ou sur le pay-as-you-go Azure, ce qui mérite d’être vérifié de près avant de bâtir votre modèle de coût.

Foncez tester en lab si vous gérez des tenants CSP, et documentez ce que vous voyez : c’est exactement le genre de cas limite qui se précise à mesure que la GA se déploie.

Je complèterai dès que Microsoft me répond.

Copilot Cowork passe en PAYG

Ces derniers jours nous ont donné le vertige côté nouveautés IA, et celle-ci n’est pas sans impact. Vous administrez un tenant Microsoft 365, vous avez vu passer l’annonce de la disponibilité générale de Copilot Cowork le 16 juin 2026, et votre première question n’est pas « qu’est-ce que ça va faire » mais « qu’est-ce que ça va coûter, et comment je garde la main dessus » ? Cet article est fait pour vous.

On va laisser de côté la démo marketing pour aller droit au sujet qui nous concerne, nous les admins : la GA de Cowork s’accompagne d’un vrai changement de modèle de facturation.

Pour rappel, jusqu’ici Microsoft 365 Copilot, c’était un tarif fixe, prévisible, par utilisateur et par mois :

Cowork, lui, a introduit le 16 juin une facturation à l’usage, comptée en Copilot Credits. On va dérouler ensemble ce que ça change, combien ça coûte réellement (chiffres à l’appui), où ça se pilote dans l’Admin Center, et comment activer tout ça sans laisser filer la facture.

Pour vous guider plus facilement dans cet article, voici des liens rapides :

1. Ce qui change vraiment le 16 juin

Le 16 juin 2026, Microsoft a annoncé la disponibilité générale mondiale de Copilot Cowork, après trois mois de preview dans le programme Frontier. Sur le papier, c’est l’arrivée d’un assistant agentique capable d’exécuter des tâches longues, multi-outils, du début à la fin : vous définissez le travail, Cowork le mène de bout en bout et vous rend un résultat fini, pas juste un brouillon ou une recommandation. Très différent du Copilot Chat que vos utilisateurs connaissent déjà.

Pour un admin, le vrai changement n’est pas la fonctionnalité, c’est le modèle économique qui vient avec. Deux points à retenir tout de suite. D’abord, Cowork est désactivé par défaut : rien ne se déclenche tant que vous n’avez pas pris la décision de l’activer dans votre tenant et de choisir qui y a accès. Ensuite, son usage se facture à la consommation, en plus de la licence. C’est ce second point qui mérite qu’on s’y attarde.

2. Le modèle de coût en clair

Première chose à comprendre : la licence Microsoft 365 Copilot (la USL, User Subscription License) reste obligatoire, mais elle ne suffit plus pour utiliser Cowork. Elle devient un simple ticket d’entrée. Microsoft le dit noir sur blanc dans sa documentation :

In some scenarios, licenses act as an entry point enabling access to AI services billed on a pay-as-you-go basis.

Source : Usage-Based Billing and Cost Management for Copilot Credits, Microsoft Learn

Concrètement, ça donne quoi ? Chaque tâche que vous lancez dans Cowork a un prix, calculé à partir de quatre paramètres qui convergent tous vers un nombre de Copilot Credits consommés :

  • Models : le modèle d’IA retenu pour la tâche, qui varie selon la qualité, la vitesse et le coût demandés.
  • Context : la récupération du contexte, vos e-mails, fichiers, réunions et historiques que la tâche doit aller comprendre.
  • Tools : les actions menées pour faire le travail, envoyer un mail, planifier, mettre à jour un document.
  • Runtime : le temps d’orchestration cloud, qui fait tourner les agents, y compris sur les tâches longues.

Côté paiement, vous avez trois options :

  • Le pay-as-you-go (PayGo), facturé 0,01 $ par Copilot Credit sur une souscription Azure, pour la souplesse.
  • Le P3, qui consiste à engager un volume d’usage à l’avance en échange d’une remise.
  • Le pack de capacité apporté par la licence Microsoft Copilot Studio sur votre tenant :

À vous de voir selon votre visibilité sur la consommation à venir, et on va justement parler de cette consommation.

3. Combien ça coûte concrètement ?

C’est la question que tout le monde se pose, et Microsoft y répond en classant les tâches en trois profils : légères, moyennes et lourdes :

Voici les fourchettes de crédits annoncées, auxquelles j’ai ajouté l’équivalent en dollars au tarif PayGo (0,01 $ le crédit) pour que ce soit parlant.

Type de tâcheProfilCrédits Copilot estimésCoût PayGo indicatif
Légère (Light)Peu de sources, raisonnement léger, une sortie ou moins100 à 3001 à 3 $
Moyenne (Medium)Sources multiples, raisonnement structuré, deux sorties ou plus400 à 7004 à 7 $
Lourde (Heavy)Agrégation large, analyse profonde, nombreuses sortiesplus de 700plus de 7 $

Pour rendre les choses concrètes, Microsoft donne des exemples :

  • Une tâche légère, c’est typiquement « crée une mise à jour hebdo pour mon équipe le lundi matin, avec mes priorités et mes réunions clés ».
  • Une tâche moyenne, c’est « prépare ma réunion client : e-mails, agenda, fichiers récents dans un doc de briefing, un aperçu Excel des ventes et une présentation prête à montrer ».
  • Une tâche lourde, c’est « analyse six mois de données d’usage produit et sors un rapport pour la direction ». On voit bien la logique : plus la tâche brasse de sources et produit de livrables, plus elle pèse en crédits.
Attention : ces fourchettes sont des estimations, basées sur le modèle Opus 4.8. Le coût réel d’une tâche dépend de votre configuration, du modèle choisi et de la complexité réelle. Pour modéliser votre propre consommation, Microsoft fournit un calculateur, le Customer Cowork Estimator (accès authentifié requis).

4. Estimer votre budget avec le calculateur Microsoft

Bonne nouvelle : Microsoft ne vous laisse pas deviner à l’aveugle. Un classeur Excel téléchargeable, le Customer Cowork Estimator, vous permet de modéliser votre consommation et d’obtenir une estimation de budget directionnelle, à affiner dans le temps.

Le principe est simple : pour chaque profil d’utilisateur, on multiplie le nombre d’utilisateurs par le volume de prompts attendu (légers, moyens, lourds), on applique le coût en crédits de chaque type de prompt, et on additionne le tout. Vous passez ainsi d’un coût par tâche un peu abstrait à un budget mensuel global, présentable à votre direction financière.

Concrètement, le classeur se remplit en quatre étapes :

  • Qui va utiliser Cowork ? Vous renseignez le nombre d’utilisateurs, répartis selon les profils définis par Microsoft.
  • Combien de prompts par mois ? Pour chaque profil, vous indiquez le volume mensuel de prompts légers, moyens et lourds.
  • Combien de crédits par prompt ? Le classeur applique un nombre de crédits par type de prompt, sur la base du modèle Opus 4.8.
  • Le résultat : les crédits mensuels estimés et le coût correspondant, au tarif de 0,01 $ le crédit.
Attention : ces chiffres restent directionnels. Le classeur est fourni à titre d’illustration et suppose le modèle Opus 4.8 : votre coût réel dépendra du modèle effectivement utilisé, du contexte mobilisé et de la complexité des tâches. Voyez-le comme un point de départ, à recalibrer une fois vos premières semaines de consommation observées.

5. Le nouveau menu Cost management

Si vous ouvrez votre centre d’administration Microsoft 365 ces jours-ci, vous allez remarquer que les menus ont bougé, et ce n’est pas un hasard d’affichage :

Mon retour terrain : sur mon tenant, entre le 16 et le 17 juin au matin, le menu qui s’appelait « Billing and usage » dans la section Copilot a été renommé « Cost management », et un menu « Cowork » dédié est apparu. La page de documentation Microsoft Learn correspondante est d’ailleurs datée du 16 juin 2026, soit le jour même de la GA. Le renommage suit donc le déploiement, ce n’est pas un bug local.

Le menu Cowork, lui, affiche un tableau de bord dédié au suivi de l’adoption, de la consommation et des limites de Cowork : nombre d’utilisateurs actifs, nombre de tâches lancées, période de grâce restante, demandes de crédits en attente et gestion des plugins :

Ce tableau de bord Cost management est l’endroit où tout se pilote. Il s’organise autour de trois onglets :

  • Overview pour la photo en temps réel de la consommation et de la capacité restante
  • Configuration pour activer la facturation à l’usage et définir vos politiques de dépense
  • Consumption pour analyser en détail qui consomme quoi.

C’est votre poste de pilotage des Copilot Credits, à mettre en favori dès maintenant :

6. Activer Cowork et créer une spending policy

Rappel important : Cowork est désactivé par défaut. Tant que vous ne faites rien, vos utilisateurs n’y ont pas accès et rien ne se facture.

L’activation côté utilisateur et le mode Frontier, je les ai déjà détaillés dans un précédent article, je vous y renvoie pour cette partie : activer et tester Copilot Cowork. Ici, on se concentre sur le nerf de la guerre côté admin : la spending policy, la politique de dépense qui encadre qui peut consommer des crédits, et combien :

Comme pour l’activation de Frontier, tout se joue au niveau du tenant, et on commence par cadrer un périmètre maîtrisé. Direction le tableau de bord Cost management, onglet Configuration, puis Add spending policy :

L’assistant se déroule en cinq étapes, visibles dans le volet de gauche :

Applies to : donnez un nom à la politique (champ Name this policy), puis choisissez qui peut dépenser des crédits. Trois options :

  • All users (toute l’organisation, idéal pour une politique par défaut)
  • Specific groups (limiter à des groupes de sécurité, la liste étant pré-remplie avec les groupes ayant déjà fait des demandes de crédits)
  • Specific users (Coming soon, il faut pour l’instant passer par un groupe de sécurité) :

Limits and alerts : posez le plafond de crédits de la politique et les seuils d’alerte :

Agents and services : choisissez les services couverts par la politique :

Billing method : rattachez le mode de paiement :

  • pay-as-you-go (PayGo) (et l’abonnement Azure qui portera la facturation)
  • Crédits prépayés Copilot (P3)
  • Pack de capacité Copilot Studio

Review & add policy : relisez le récapitulatif et créez la spending policy :

Attendez quelques minutes la création de la spending policy :

Quelques minutes plus tard, la spending policy est créée :

La spending policy est donc maintenant en place, comme on peut le voir :

Et cela est également visible dans le portail Azure :

Enfin, le message d’alerte sur la copie d’écran ci-dessous nous rappelle que Microsoft a prévu de commencer la facturation au 1er juillet :

7. Plafonner et surveiller la dépense

C’est le cœur du sujet pour un admin, et la bonne nouvelle, c’est que Microsoft a mis le paquet sur les garde-fous. Ils se rangent en trois familles.

Le contrôle d’abord. Vous décidez quand Cowork s’allume, qui y accède et combien peut être dépensé :

Vous posez des plafonds de dépense au niveau du tenant, d’un groupe ou d’un utilisateur, via des politiques de facturation cadrées avec des caps par utilisateur :

Vous configurez des alertes d’usage personnalisables, avec vos propres seuils et les personnes à notifier quand ils sont franchis :

Et quand un utilisateur a besoin de crédits supplémentaires pour finir une tâche, il peut en faire la demande directement depuis Cowork, ce qui vous évite de jouer les pompiers.

La visibilité ensuite. Le reporting d’usage descend jusqu’au niveau utilisateur, groupe et fonctionnalité, avec une vraie responsabilité par périmètre. L’onglet Consumption permet de creuser par utilisateur, groupe, service ou agent, d’identifier les gros consommateurs et les postes de coût :

Avec un détail par utilisateur :

Microsoft annonce aussi, peu après la GA, l’affichage du coût de chaque tâche en crédits côté utilisateur, au moment où il la lance.

L’efficacité enfin. Au-delà du choix PayGo ou P3, là où plusieurs modèles sont disponibles, un sélecteur de modèle permet d’ajuster le coût par tâche. Et Microsoft promet trois leviers de baisse dans le temps : des modèles moins chers, un meilleur appariement modèle/tâche, et une récupération de contexte plus efficace.

Le modèle maison Cowork 1, annoncé pour bientôt, vise justement les tâches courantes à coût nettement réduit.

8. Calendrier et période de grâce

La facturation de Cowork démarre dès le 16 juin. Mais Microsoft a prévu un filet pour les early adopters :

Attention : les tenants ayant eu au moins un utilisateur actif sur Cowork pendant le programme Frontier (du 30 mars au 16 juin) bénéficient d’une période de grâce et ne seront pas facturés avant le 1er juillet 2026. Profitez de cette fenêtre pour poser vos plafonds et allouer vos budgets avant que la consommation ne monte.

J’ai par contre pu constater une petite chose étrange sur mon tenant :

Comme vous le voyez, un de mes utilisateurs n’avait pas de licence Microsoft 365 Copilot, et il y a quand même pu utiliser Cowork, en consommant des crédits non facturés durant cette période de grâce :

9. Récap : la checklist admin

Voilà, en quelques étapes, ce qu’il faut avoir en tête avant d’ouvrir Cowork à vos utilisateurs.

ActionOù / commentPourquoi
Estimer le budgetCustomer Cowork Estimator (Excel)Anticiper la dépense mensuelle par profil
Configurer la facturationCost management, onglet ConfigurationChoisir PayGo ou P3, connecter l’abonnement Azure
Créer une spending policyConfiguration, Add spending policyCadrer qui peut dépenser et combien
Poser les plafonds et alertesÉtape Limits and alerts de la policyÊtre prévenu avant le dérapage, pas après
Activer Cowork sur un pilotePérimètre d’accès par groupeTester l’usage réel avant d’élargir
Suivre la consommationOnglets Overview et ConsumptionIdentifier les gros postes de coût

Concrètement, ça donne quoi ? Cowork est une vraie nouvelle façon de travailler, mais c’est aussi la première fois que Microsoft 365 vous met une facturation à l’usage entre les mains. Les trois pièges à retenir :

  1. La licence M365 Copilot ne suffit pas, l’usage de Cowork se paie en plus, en Copilot Credits.
  2. Une tâche lourde peut dépasser 700 crédits, soit plus de 7 $ : sans plafond, une poignée d’utilisateurs actifs peut vite chiffrer.
  3. La création de la spending policy demande un Global Admin et une source de financement (PayGo ou crédits prépayés) : sans elles, l’assistant refuse de créer le plan.

Foncez tester, mais plafonnez d’abord. Profitez de la période de grâce pour cadrer vos budgets et vos alertes pendant que la facture est encore à zéro. C’est le meilleur moment pour apprivoiser le modèle sans mauvaise surprise.

Fable 5 dans Copilot Cowork

Claude Fable 5 vient de débarquer dans Microsoft 365 Copilot, vous avez vu passer l’annonce, et vous vous posez déjà deux questions : qu’est-ce que ce modèle change concrètement, et pourquoi reste-t-il introuvable dans votre tenant ? Cet article est fait pour vous.

On va dérouler les trois temps qui comptent pour un admin ou un archi cloud : comprendre ce qu’apporte ce modèle de classe Mythos, l’activer proprement depuis le centre d’administration Microsoft 365, et garder l’œil sur le vrai point de vigilance, la rétention de données côté Anthropic et le réglage désactivé par défaut en Europe. Capture après capture, vous saurez exactement quoi cocher, et ce que vous engagez en le faisant.

Pour vous guider plus facilement dans cet article, voici des liens rapides :

1. Fable 5, c’est quoi au juste ?

Anthropic a annoncé Claude Fable 5 le 9 juin 2026. C’est leur premier modèle de classe Mythos rendu disponible pour un usage général, et selon l’éditeur ses capacités dépassent celles de tous les modèles qu’il avait ouverts au grand public jusqu’ici. Concrètement, Fable 5 vise les tâches longues et complexes : plus la mission s’étire dans le temps, plus son avance se creuse sur les modèles précédents.

Pour un admin, retenez les points saillants :

  • Code et travail agentique : refactorings massifs, tâches multi-étapes qui tournent en autonomie sur la durée.
  • Travail de connaissance : synthèse documentaire longue, analyse de données, raisonnement financier.
  • Vision : extraction de chiffres précis depuis des figures, reconstruction d’une app à partir de captures.
  • Mémoire et long contexte : le modèle reste concentré sur des millions de tokens et améliore ses sorties grâce à ses propres notes.

Le point qui intéresse la gouvernance : Anthropic a livré Fable 5 avec des garde-fous. Quand une requête touche à la cybersécurité, à la biologie ou à la chimie, ou à la distillation de modèles, la réponse est automatiquement prise en charge par Claude Opus 4.8, et l’utilisateur en est informé. L’éditeur précise que ce repli concerne, en moyenne, moins de 5 % des sessions : pour le reste, c’est bien Fable 5 qui répond.

When Fable’s classifiers detect a request related to cybersecurity, biology and chemistry, or distillation, the response is automatically handled by Claude Opus 4.8 instead. Users will be informed whenever this occurs.

Source : Claude Fable 5 and Claude Mythos 5, Anthropic

2. Intégration : Copilot Cowork et les apps Microsoft 365

C’est là que ça devient intéressant pour un archi. Fable 5 n’arrive pas comme un simple modèle de plus dans le sélecteur : il vient nourrir Copilot Cowork, la brique agentique de Microsoft 365 Copilot. Microsoft a en effet repris la plateforme qui fait tourner Claude Cowork pour la porter dans Copilot, et l’a ouverte le 30 mars 2026 via le programme Frontier.

bringing the technology platform that powers Claude Cowork into Microsoft 365 Copilot.

Source : Copilot Cowork: Now available in Frontier, Microsoft 365 Blog

Microsoft le formule sans détour dans son billet d’annonce du 10 juin : Claude Fable 5 arrive comme modèle preview pour les workflows longs et multi-étapes, ancré dans Work IQ, avec protections entreprise, contrôles d’admin et choix du modèle. Et l’éditeur pose lui-même la réserve sur la rétention de données, à intégrer dans la décision d’activation.

Because use of Claude Fable 5 is subject to data retention by Anthropic, organizations should review this consideration as part of their enablement decision.

Source : Available today: Anthropic Claude Fable 5 in Microsoft 365 Copilot, Microsoft Community Hub

Concrètement, Cowork est pensé pour le travail long et multi-étapes directement dans M365 : il ne se contente pas de répondre, il enchaîne des actions à travers Outlook, Teams, Excel, Word et PowerPoint, vous montre son plan, et l’exécute après votre validation. Le tout reste ancré dans Work IQ (le contexte de votre organisation) et protégé par l’Enterprise Data Protection. C’est exactement le terrain de jeu d’un modèle de classe Mythos : missions asynchrones, refactoring, synthèse documentaire lourde, là où le long contexte et l’autonomie de Fable 5 font la différence.

Où le trouver à ce stade de la preview, et avec quel statut :

  • Copilot Cowork : via le programme Frontier.
  • Copilot in Excel et Copilot in PowerPoint : en private preview.
  • Désactivé par défaut : contrairement à des modèles précédents, personne ne l’active à votre place, c’est un choix d’admin assumé.

Un mot sur le statut, parce qu’il conditionne tout le reste. Dans la nomenclature Microsoft, un modèle est soit Experimental, soit Preview, soit GA (disponible), soit Default. Fable 5 est un modèle Preview with Data Retention : un accès anticipé qui peut évoluer ou disparaître sans préavis, et que Microsoft déconseille explicitement en production. À réserver à l’évaluation et aux tests, sur un périmètre maîtrisé.

Preview and experimental models are intended for exploration and testing and are not recommended for production use.

Source : Preview AI models in Microsoft Online Services, Microsoft Support

Côté facture, bonne nouvelle : le choix du modèle est inclus dans la licence Microsoft 365 Copilot. Vous ne payez pas un supplément au token pour préférer Claude au modèle par défaut, contrairement au prix public API d’Anthropic (10 $ le million de tokens en entrée, 50 $ en sortie), qui ne concerne que l’API directe ou Microsoft Foundry, pas votre siège Copilot. Le vrai ticket d’entrée, c’est l’inscription au programme Frontier pour l’accès anticipé à Cowork et aux agents Office, dont la tarification définitive sera calée à la disponibilité générale.

Available via Frontier program, pricing final upon GA.

Source : Microsoft 365 Copilot Plans and Pricing, Microsoft

Et c’est là que se cache le vrai sujet. Jusqu’ici, les modèles Anthropic dans Copilot (Claude Sonnet, Claude Opus 4.8) étaient déjà gouvernés par le réglage subprocesseur, mais ils tournent en Zero Data Retention. Fable 5 casse cette logique : son usage est soumis à une rétention de données obligatoire côté Anthropic, ce qui le range dans une catégorie à part, et soulève la question que tout le monde se pose trop tard, où partent physiquement mes données ? On déballe tout dans la section vigilance.

3. Activation côté admin, le pas-à-pas

L’activation se fait en deux temps : on autorise d’abord Anthropic comme sous-traitant Microsoft (le prérequis global), puis on active le modèle preview lui-même. Il vous faut le rôle Global Admin ou AI Administrator.

Étape 0, le prérequis global. Rendez-vous dans le centre d’administration Microsoft 365, puis Copilot > Settings > View all. Ouvrez AI providers operating as Microsoft subprocessors et activez Anthropic. C’est la porte d’entrée : sans elle, aucun modèle Anthropic n’est utilisable dans Copilot. Et si vous aviez opté à l’époque pour l’ancien réglage sous conditions commerciales Anthropic, il faut re-opter : ce toggle hérité a été déprécié, et le nouveau repart sur Off en UE, EFTA et au Royaume-Uni.

Customers within the EU Data Boundary and customers in the UK will have Anthropic models disabled by default.

Source : Anthropic as a subprocessor for Microsoft Online Services, Microsoft Learn

Étape 1, le modèle preview. Toujours dans la même zone, ouvrez la catégorie AI models in preview, puis sélectionnez Anthropic Models with Data Retention. C’est ici que Fable 5 s’active, et le libellé ne laisse aucun doute sur ce que vous engagez.

Étape 2, la portée. Au moment d’activer, vous choisissez qui y a droit. Trois options, à caler sur votre stratégie de déploiement :

PortéeEffetQuand l’utiliser
All usersTout le tenantAprès un pilote concluant, déploiement large
No usersPersonnePour préparer la config sans ouvrir l’accès
Specific users and groupsUtilisateurs ou groupes Entra ID ciblésPilote sur une équipe (produit, R&D) avant généralisation
Mon retour terrain : commencez par Specific users and groups sur un groupe de pilotes. Vous gardez la main sur la rétention de données pendant que vous validez les cas d’usage, et vous élargissez à All users seulement une fois la décision de conformité documentée.

4. Sélection côté utilisateur

Une fois l’accès ouvert, plus rien de compliqué pour l’utilisateur. Il retrouve Fable 5 dans le sélecteur de modèles de Copilot et le choisit comme n’importe quel autre. Petit détail qui compte pour la traçabilité : un indicateur visuel signale quand un modèle Claude est à l’œuvre, l’utilisateur sait donc toujours quel moteur traite sa demande.

5. Cas d’usage concrets

Concrètement, ça donne quoi ? Voici les terrains où Fable 5 mérite le détour pendant votre pilote :

  • Synthèse documentaire longue : bundles de réunions, rapports volumineux, dossiers à recouper sur des centaines de pages.
  • Analyse de données et finance : raisonnement sur tableaux et graphiques dans Copilot in Excel, où le long contexte fait la différence.
  • Workflows agentiques multi-étapes : tâches qui enchaînent plusieurs actions en autonomie, là où Fable 5 garde le cap sur la durée.
  • Vision : lecture de captures, de schémas, de figures techniques pour en extraire des données exploitables.
  • Comparatif A/B : lancez le même prompt sur le modèle par défaut et sur Fable 5, et tranchez sur pièces plutôt que sur intuition.

Et quand ne pas le sortir ? Pour un résumé, un mail ou une reformulation, Fable 5 n’apporte rien de plus qu’Opus ou Sonnet, tout en consommant davantage et en déclenchant la rétention. Gardez-le pour ce qui justifierait un expert humain : réflexion longue, analyse en profondeur, agentique multi-étapes. Le réflexe à transmettre à vos utilisateurs pilotes, c’est de réserver Fable 5 aux tâches que les autres modèles ne savent pas mener à bout.

Beaucoup de tests commencent à être disponibles sur YouTube, dont certains en français :

Sa conclusion : nos usages quotidiens sont sans doute encore trop basiques pour révéler le plein potentiel de ce modèle. Autrement dit, ce n’est pas Fable 5 qui manque de puissance, ce sont nos demandes qui manquent d’ambition. Pour l’utilisateur classique, Sonnet et Opus suffisent largement ; Fable 5 attend les tâches lourdes et complexes que personne n’osait encore confier à une IA, et son coût supérieur impose de toute façon d’être sélectif. À nous d’apprendre à le prompter autrement : moins le diriger, plus lui confier des terrains à défricher.

6. Le point de vigilance : rétention et default-off en UE

C’est la section à ne pas survoler, surtout depuis l’Europe. Trois choses se cumulent et changent vraiment la donne par rapport aux autres modèles Claude déjà présents dans Copilot : la rétention obligatoire, l’absence de Zero Data Retention, et la sortie de l’EU Data Boundary.

Pourquoi Fable 5 n’est pas un Claude comme les autres

Anthropic classe Fable 5 (et Mythos 5) parmi les Covered Models. Pour cette catégorie, une rétention de données de 30 jours est exigée, et le Zero Data Retention n’est tout simplement pas disponible. La raison est directement liée aux garde-fous vus plus haut : les classifiers de sécurité qui redirigent les requêtes sensibles vers Opus 4.8 ont besoin de conserver les échanges pour fonctionner et détecter les abus. À l’inverse, Claude Sonnet et Opus restent éligibles au ZDR, et c’est toute la différence.

Zero data retention is not available for Claude Fable 5 or Claude Mythos 5.

Source : API and data retention, Claude API Docs

Les durées, côté Anthropic : 30 jours de rétention standard des entrées et sorties, après quoi elles sont supprimées (sauf enquête de sécurité ou obligation légale), jusqu’à 2 ans si un échange est signalé par les classifiers comme contraire à la politique d’usage, et jusqu’à 7 ans pour les scores de classification associés. Ces données ne sont pas utilisées pour entraîner les modèles. C’est documenté noir sur blanc dans les pratiques de rétention pour les modèles de classe Mythos, ce ne sont pas des estimations de presse.

CritèreClaude Sonnet / OpusClaude Fable 5
Zero Data RetentionPossibleNon disponible
Rétention standard0 (ZDR) ou selon contrat30 jours obligatoires
Si contenu signaléSelon politiqueJusqu’à 2 ans (scores : 7 ans)
Entraînement modèleNonNon

Qui contrôle quoi : le contrat chez Microsoft, la rétention chez Anthropic

Le contrat, c’est Microsoft. Depuis le 7 janvier 2026, Anthropic opère comme sous-traitant (subprocessor) de Microsoft : vous ne signez rien avec Anthropic, tout passe par votre contrat Microsoft existant, à savoir les Product Terms, le Data Protection Addendum, l’Enterprise Data Protection et la garantie copyright (Customer Copyright Commitment). Microsoft précise même qu’Anthropic opère sous sa supervision. Et la portée que vous définissez (utilisateurs ou groupes) vaut d’un coup pour Microsoft 365 Copilot et pour Copilot Studio.

La rétention, en revanche, c’est Anthropic. Microsoft l’écrit lui-même dans sa documentation : quand un modèle exige une rétention de données, comme Fable 5, c’est le fournisseur du modèle qui contrôle la manière dont elles sont stockées et traitées, pas Microsoft. L’usage de Fable 5 reste donc soumis aux conditions d’Anthropic (Commercial Terms of Use, Data Protection Addendum et pratiques de rétention Mythos).

L’image simple à retenir : Microsoft vous loue la voiture et vous assure. Mais avec Fable 5, le trajet passe par un garage Anthropic aux États-Unis, qui garde une copie du carnet de bord pendant 30 jours, selon ses règles à lui. Microsoft vous prévient honnêtement, et vous laisse décider d’activer ou non.

Où partent vos données, concrètement

Attention : dans Microsoft 365 Copilot, Anthropic opère comme sous-traitant Microsoft, sous Microsoft Product Terms et le Data Protection Addendum. Mais le traitement des modèles Anthropic a lieu hors EU Data Boundary, et hors engagements de traitement in-country quand ils s’appliquent. En clair, depuis un tenant européen, activer Fable 5 revient à accepter que les prompts concernés sortent de la frontière des données européenne et soient traités, puis conservés 30 jours, dans des systèmes Anthropic hors UE.

When Anthropic models are used in Copilot experiences in Word, Excel, or PowerPoint, data processing for these models occurs outside of the Microsoft EU Data Boundary (EUDB).

Source : Copilot in Microsoft 365 apps with Anthropic models, Microsoft Learn

Microsoft reste discret sur l’emplacement physique exact, mais l’analyse de Directions on Microsoft apporte la précision qui manque : à la différence des modèles OpenAI qui tournent dans Azure, les données traitées par Claude sont transférées depuis Azure vers des serveurs Anthropic hébergés sur des datacenters AWS ou GCP situés principalement aux États-Unis.

Pour une organisation soumise au RGPD, c’est l’information à avoir en tête : ce ne sont ni vos datacenters, ni ceux de Microsoft en Europe. L’éditeur pourrait à terme étendre Claude à ses datacenters européens, mais aucun calendrier n’est annoncé à ce jour.

Le piège classique : croire que c’est un Claude comme les autres et l’ouvrir à tout le tenant d’un clic. Et son symétrique, moins connu : certaines fonctionnalités ne marchent que si Anthropic est activé, donc couper le subprocesseur après coup peut casser des usages déjà en place.

Les garde-fous qu’Anthropic met en face

Pour être juste, la rétention ne rime pas avec accès libre. La page officielle d’Anthropic détaille les protections : ses employés n’accèdent pas à vos conversations, sauf signalement pour risque grave ou demande écrite du client. Seuls quelques relecteurs habilités peuvent le faire, via un outillage qui empêche l’export, la copie ou le téléchargement, et chaque accès est inscrit dans un journal infalsifiable. Au-delà des 30 jours, suppression automatique. Les organisations éligibles peuvent en plus ajouter leurs propres clés de chiffrement et des journaux d’audit de transparence d’accès.

Anthropic employees cannot access your conversations unless they are flagged for potential serious harm or upon a customer’s written request.

Source : Data retention practices for Mythos-class models, Anthropic

La preuve par Microsoft

Le signal le plus parlant pour un admin ? Microsoft elle-même a restreint l’usage de Fable 5 pour ses propres salariés dans ses versions internes de GitHub Copilot, le temps que ses équipes juridiques évaluent la politique de rétention, tout en vendant le modèle à ses clients. Les autres modèles Claude, eux, restent disponibles en interne parce qu’ils tournent en Zero Data Retention. Quand l’éditeur qui distribue le modèle hésite à l’ouvrir à ses propres équipes, ça mérite votre attention.

Tous les autres modèles Claude restent accessibles, car ils fonctionnent sous les règles de Zero Data Retention (ZDR).

Source : The Verge, relayé par Les Numériques
Mon retour terrain : avant d’activer, posez la question à vos équipes conformité avec trois éléments concrets : données traitées hors EU Data Boundary, rétention de 30 jours non contournable (pas de ZDR) sous les conditions d’Anthropic, et conservation prolongée possible en cas de signalement. Limitez Fable 5 à un groupe pilote, excluez les données réglementées (RGPD, données client, code propriétaire), et documentez la décision pour l’audit.

7. Conclusion

Voilà, en deux réglages dans l’admin et un clic côté utilisateur, vous ouvrez l’accès au modèle le plus capable jamais proposé par Anthropic dans Copilot. Concrètement, vous gagnez un moteur taillé pour les tâches longues, l’analyse documentaire et le travail agentique, avec un repli automatique vers Opus 4.8 sur les sujets sensibles.

Les quatre pièges à retenir avant de cliquer :

  1. C’est une preview : statut mouvant, comportements susceptibles d’évoluer.
  2. C’est désactivé par défaut chez nous en UE, rien ne s’active tout seul.
  3. L’usage impose une rétention de 30 jours, sans option Zero Data Retention, contrôlée par Anthropic et non par Microsoft.
  4. Le traitement a lieu hors EU Data Boundary, dans des systèmes hors UE, à arbitrer avec vos équipes conformité.

Si votre cadre de conformité le permet, ouvrez un pilote sur un groupe restreint et comparez Fable 5 au modèle par défaut sur vos vrais dossiers. Foncez tester, mais les yeux ouverts sur le statut preview et les termes de rétention.

Microsoft Flex routing

Vous avez entendu parler de l’EU Data Boundary à droite à gauche, vous savez vaguement que Microsoft a passé des années à le construire comme un argument de souveraineté pour ses clients européens… et puis, en silence, un réglage par défaut a basculé le 17 avril 2026. Bienvenue dans Flex Routing : votre prompt Copilot peut désormais sortir de l’EU Data Boundary pendant les pics de charge, sans que personne ne le sache.

Cet article décortique ce qui change vraiment, pour qui, et comment décider, avec le cas particulier des tenants ADR qui ont payé pour de la souveraineté locale stricte.

Sommaire

1. C’est quoi Flex Routing, concrètement ?

Pour rappel, jusqu’ici Microsoft s’était engagé à maintenir le traitement des données des clients Copilot EU et EFTA à l’intérieur de l’EU Data Boundary. Stockage at rest, traitement in transit, inférence du modèle : tout devait rester dans les datacenters européens.

Flex Routing change ça. Concrètement, c’est un mécanisme de load balancing géographique : pendant les pics de demande, l’étape d’inferencing (le moment où le modèle traite votre prompt pour produire une réponse) peut être routée vers des datacenters hors EU. Trois destinations sont nommées par Microsoft.

If flex routing is enabled, LLM inferencing may occur in the United States, Canada, or Australia during times of peak demand.

Source : Flex routing (EU and EFTA) — Microsoft Learn

L’idée côté Microsoft est de préserver l’expérience utilisateur quand les GPU européens saturent. Quand le moteur Azure OpenAI en EU est saturé, plutôt que de faire timeout, Copilot va frapper à la porte des datacenters US, canadiens ou australiens. C’est défendable d’un point de vue ingénierie. C’est moins défendable d’un point de vue souveraineté surtout en opt-out.

2. Le calendrier et le défaut piégeux

Le calendrier officiel, tel que documenté par Microsoft :

  • Tenants créés après le 25 mars 2026 : Flex Routing activé par défaut, dès la provision du tenant.
  • Tenants existants avant le 25 mars 2026 : Microsoft renvoie vers le Message Center pour connaître le réglage par défaut appliqué à votre tenant.

En pratique, le rollout généralisé pour les tenants existants s’est fait le 17 avril 2026, via les messages MC1269219 et MC1269223 dans le Message Center M365. Plusieurs analyses de cabinets de conformité européens convergent sur cette date.

On 17 April 2026, Microsoft enabled flex routing for all Microsoft 365 Copilot tenants in the EU and EFTA. Most organisations did not notice.

Source : LinkedIn
Attention : selon Microsoft et les retours de terrain, une modification du réglage Flex Routing peut prendre jusqu’à une semaine pour se propager. Si vous décidez de désactiver, ne considérez pas que c’est immédiat : vérifiez ensuite que le réglage est bien appliqué côté tenant.

Le piège classique : ce changement est opt-out, pas opt-in. Microsoft a effectué un changement matériel de la localisation de traitement, par défaut, sans demande de consentement explicite côté admin. C’est le cœur du débat conformité que je détaille dans la section 4.

3. Quelles données sortent réellement de l’EU ?

C’est là qu’il faut être précis, parce que les raccourcis du type « vos données partent aux US » sont à la fois vrais et faux. Microsoft fait une distinction nette entre stockage et traitement :

No matter where LLM inferencing occurs, data will be encrypted in transit and at rest. Data at rest will continue to be stored inside the EU Data Boundary, except for limited pseudonymized data which may be stored outside the EU Data Boundary for security and operational purposes.

Source : Microsoft Learn

Décortiquons concrètement ce qui se passe pendant un appel Copilot routé en flex :

  1. Le prompt et son contexte sont assemblés en EU : votre question, plus le grounding (mails, fichiers SharePoint/OneDrive, métadonnées Graph) que Copilot va injecter pour répondre.
  2. Le paquet part chiffré vers un datacenter hors EU (US, Canada ou Australie selon la capacité disponible).
  3. L’inférence a lieu hors EU : le modèle traite le prompt, le contexte et produit la réponse.
  4. La réponse revient chiffrée en EU : elle est restituée à l’utilisateur, et les données d’origine restent stockées en EU.
  5. Des données pseudonymisées peuvent rester stockées hors EU, à des fins opérationnelles et sécurité (logs système, télémétrie).

Le mot-clé, c’est pseudonymisation au sens du RGPD Article 4 (5) : la donnée n’est plus directement attribuable à une personne sans information additionnelle, mais elle reste une donnée à caractère personnel. Microsoft applique chiffrement, masquage, tokenisation et data blurring sur ces logs, mais l’autorité de réidentification reste théoriquement possible.

Mon retour terrain : beaucoup de DPO et RSSI européens lisent « data at rest stays in the EU » et concluent que tout va bien. Le point dur, c’est le moment de l’inférence — c’est que votre prompt, et donc potentiellement vos documents et mails, sont exposés au modèle dans un datacenter hors EU. C’est ce point-là qui doit être tracé dans vos analyses de transferts.

4. L’enjeu conformité : GDPR, NIS2, DORA

Concrètement, ça donne quoi côté conformité ? Trois cadres se cumulent et chacun a sa lecture du sujet.

RGPD : un transfert vers pays tiers, par défaut

Le traitement de données personnelles dans un pays tiers est un transfert au sens des articles 44 et suivants du RGPD. Il faut une base légale :

  • États-Unis : décision d’adéquation via l’EU-U.S. Data Privacy Framework (Article 45 RGPD), sous réserve que Microsoft soit listé et que le transfert tombe dans le périmètre du DPF.
  • Canada et Australie : Clauses Contractuelles Types (Article 46(2)(c) RGPD), accompagnées d’un Transfer Impact Assessment (TIA).

Et même quand un mécanisme de transfert s’applique, ça ne dispense pas de tracer la chose proprement. Si votre DPIA mentionne un traitement intra-EU et que l’inférence se passe désormais aux US, votre DPIA est périmée. Si votre privacy policy parle d’un traitement européen, elle est inexacte. Si votre registre des traitements (RoPA, Article 30 RGPD) ne reflète pas ce transfert, c’est un manquement.

NIS2 : la chaîne d’approvisionnement IT

Pour les entités essentielles et importantes au sens NIS2, le risque de la chaîne d’approvisionnement IT est explicitement dans le scope. Un changement matériel de la localisation de traitement chez un fournisseur critique, par défaut, sans revue, c’est exactement le genre de scénario que les obligations de due diligence fournisseurs sont censées détecter.

DORA : résilience opérationnelle financière

Pour les entités financières, DORA impose une due diligence active sur les prestataires TIC critiques. Microsoft 365 Copilot relève typiquement de cette catégorie : un changement de localisation de traitement doit être tracé, évalué et documenté dans le registre des prestataires.

Attention : aucun de ces points ne nécessite une violation de données pour devenir un problème réglementaire. Un audit, une inspection CNIL ou une simple plainte suffisent. Le Message Center Microsoft n’est plus seulement un canal IT : c’est devenu un canal conformité que quelqu’un dans l’organisation doit suivre.

5. Pas-à-pas : désactiver dans le Microsoft 365 Admin Center

Si vous décidez de désactiver, voici le chemin exact. Vous aurez besoin du rôle AI Administrator (ou Global Administrator).

  1. Connectez-vous au Microsoft 365 Admin Center.
  2. Dans la navigation latérale, ouvrez Copilot, puis Settings.
  3. Cliquez sur View all pour afficher les options avancées.
  4. Trouvez l’entrée Flex routing during peak load periods.
  5. Sélectionnez Do not allow flex routing.
  6. Validez.

Résultat technique : tout l’inferencing LLM reste forcé dans l’EU Data Boundary, y compris pendant les pics. Le compromis assumé, c’est une dégradation potentielle de performance ou de disponibilité de Copilot pendant les périodes de surcharge régionale. Pour la plupart des usages bureautiques, c’est acceptable. Pour des usages temps réel exigeants, ça mérite un test.

6. Le piège Power Platform : un deuxième switch

Le piège que beaucoup d’admins ratent : ce premier switch ne couvre peut-être pas tous vos besoins. Le réglage du Microsoft 365 Admin Center couvre Microsoft 365 Copilot et Copilot Chat. Pour les Copilot dans Dynamics 365, Power Platform et Copilot Studio, il existe un deuxième réglage dans le Power Platform Admin Center, géré au niveau de l’environnement.

La dépendance est hiérarchique :

  • Si Flex Routing est désactivé côté M365 Admin Center, le réglage côté Power Platform est verrouillé sur off.
  • Si Flex Routing est activé côté M365 Admin Center, le réglage côté Power Platform est configurable

Pour le désactiver côté Power Platform :

  1. Connectez-vous au Power Platform Admin Center.
  2. Dans le panneau de navigation, allez dans Manage > Environments.
  3. Sélectionnez l’environnement concerné.
  4. Dans la carte Generative AI features, cliquez sur Edit.
  5. Décochez Allow flex routing during periods of peak load.
  6. Validez.

Ce message apparaît si vous souhaitez le modifier ici, alors qu’il a déjà été désactivé sur Microsoft 365 Admin Center :

Mon retour terrain : sur un tenant avec à la fois Microsoft 365 Copilot et des agents Copilot Studio, j’ai vu des équipes désactiver consciencieusement le réglage M365… en oubliant que les agents Copilot Studio en environnement Power Platform restaient sur le défaut hérité. Si vous opérez des deux côtés, vérifiez les deux switches, environnement par environnement.

7. Le paradoxe ADR : vous avez payé pour la souveraineté locale, et ?

Petit rappel produit pour situer : Advanced Data Residency (ADR) est un add-on M365 qui apporte un engagement durable de résidence des données dans une Local Region Geography : France, Allemagne, Norvège, Suisse, Suède, etc. C’est l’add-on que beaucoup d’entreprises européennes ont souscrit pour aller au-delà de la promesse « EU Data Boundary » de base, et garantir que leurs données restent dans leur pays.

Concrètement, ça donne quoi avec Flex Routing ?

La documentation Microsoft sur Flex Routing exclut nommément les tenants Multi-Geo du scope EU Data Boundary (donc le réglage n’apparaît pas dans le M365 Admin Center pour eux) :

Les clients qui ont acheté ou utilisé des fonctionnalités multigéographiques ne sont pas dans l’étendue de la limite de données de l’UE pour Microsoft 365, même si leur locataire est répertorié comme étant dans un pays ou une région de l’UE ou de l’AELE. Le paramètre de routage flexible n’est pas disponible dans le Centre d’administration Microsoft 365 pour les clients qui ont acheté ou utilisé des fonctionnalités multigéographiques. L’achat de fonctionnalités multigéographiques n’a pas d’impact sur la disponibilité du paramètre de routage flexible dans le centre d’administration Power Platform.

Source : Microsoft Learn

En revanche, elle ne mentionne aucune exclusion pour les tenants ADR. La conclusion logique : si vous êtes un tenant ADR localisé dans un pays EU/EFTA, vous êtes dans le scope EU Data Boundary, donc dans le scope Flex Routing. Le réglage est affiché, activable, et soumis au même défaut opt-out que les autres tenants.

Mon retour terrain : c’est là le vrai paradoxe. Les clients qui ont payé l’ADR sont précisément ceux qui ont posé un engagement de souveraineté plus strict que la moyenne. Que leur inférence Copilot puisse partir vers les US ou le Canada par défaut, sans revue documentée, c’est précisément ce qu’ils voulaient éviter en signant l’ADR. Ces tenants-là doivent vérifier le réglage en priorité, et tracer la décision dans leur RoPA et leur DPIA.

Le point dur n’est pas que Microsoft ait fait quelque chose d’illégal : les Clauses Contractuelles Types et le DPF peuvent couvrir techniquement le transfert. Le point dur, c’est que la promesse commerciale de l’ADR (résidence locale stricte) et le comportement par défaut de Flex Routing (inférence hors EU possible) ne sont pas alignés.

Conclusion

Voilà, ce que Flex Routing change pour votre tenant Microsoft 365 Copilot. Le sujet n’est pas dramatique en soi, les mécanismes de transfert juridique existent, le chiffrement tient, le stockage at rest reste en EU. Mais le défaut opt-out, sur un sujet où Microsoft avait construit une promesse forte de souveraineté, méritait largement une décision consciente de chaque admin tenant.

Les pièges principaux à retenir :

  1. Le défaut opt-out : votre tenant est probablement déjà en flex routing actif. Vérifiez avant de conclure quoi que ce soit.
  2. Le délai de propagation : jusqu’à une semaine après modification du réglage. Anticipez si une échéance d’audit approche.
  3. Le deuxième switch Power Platform : désactiver côté M365 ne suffit pas si vous opérez des agents Copilot Studio ou des Copilot Dynamics 365.
  4. Le paradoxe ADR : les tenants qui ont payé pour la résidence locale stricte sont les premiers à devoir trancher cette question, sous peine d’incohérence entre l’engagement commercial et le comportement par défaut.

Foncez vérifier votre tenant aujourd’hui. C’est cinq minutes dans l’admin center, et c’est précisément le genre de point que vous ne voulez pas découvrir le jour d’un audit CNIL ou d’une revue interne sur la souveraineté des données.

Microsoft Copilot Cowork

Comme moi, vous faites peut-être déjà partie des premiers utilisateurs de Copilot Cowork dans votre organisation ? Fraîchement accessible pour les entreprises ayant déjà activé le mode Frontier, découvrons ensemble ce que Microsoft propose avec Copilot Cowork. Voyons si cette Wave 3 peut être perçue comme une amélioration majeure de Microsoft 365 Copilot. Je vous propose quelques exemples concrets pour démarrer du bon pied.

Saviez-vous que seulement 5% des utilisateurs de Microsoft ne dépassent pas encore la phase de test ? Pourquoi cela ? Parce que Copilot classique reste bloqué une simple assistance.

Pour vous guider plus facilement dans cet article, voici des liens rapides :

Wave 3 Copilot Qu’est-ce que cette révolution ?

La Wave 3 est la troisième génération majeure de Microsoft 365 Copilot, annoncée le 9 mars 2026 lors de l’événement « Frontier Transformation » :

Toute cette mécanique s’appuie sur Work IQ, la couche d’intelligence contextuelle de Microsoft 365 qui agrège les signaux issus des e-mails, réunions, conversations Teams, fichiers SharePoint et relations professionnelles de l’utilisateur.

Chaque action de Copilot est transparente, réversible et soumise aux permissions et labels de sensibilité déjà en place dans l’organisation. Dit autrement, la Wave 3 veut initier une transformation opérationnelle à l’échelle de l’entreprise en plaçant l’IA agentique au cœur de la plateforme collaborative.

informatiquenews.fr

Les 5 piliers de la Wave 3 sont donc :

  • Copilot devient multi-modèle : Il y avait encore quelque temps, seulement OpenAI était disponible. Maintenant, vous pouvez choisir le meilleur modèle pour la tâche à réaliser :
ModèleCas d’usage
Claude (Anthropic)Analyse complexe, tâches nécessitant raisonnement
OpenAITâches générales, génération de contenu
  • Work IQ : le cerveau contextuel apportant la couche d’intelligence introduite à Microsoft Ignite 2025. Pourquoi est-ce crucial ? Car sans contexte, pas de valeur économique réelle.
  • Copilot Cowork : co-développé avec Anthropic, intègre la technologie Claude Co-work dans M365 Copilot. C’est la grande nouveauté de cette wave 3 :
Ce que tu peux faireExemple concret
Déléguer des tâches complexesPréparer une réunion : créer une invitation Teams + générer support présentation + résumer échanges précédents.
Tasks en arrière-planTâches qui tournent minutes ou heures sans que tu attendes.
Multitâche parallèleSoumettre plusieurs tâches qu’elles exécutent en parallèle, interférer pendant l’exécution.
Actions concrètesDéplacer réunions, créer Excel, envoyer des e-mails, planifier du temps de focalisation.
  • Agents agentic natifs : dans Word, Excel, PowerPoint, Outlook L’ancien mode agent devient le fonctionnement standard de Copilot dans ces applications (déjà à présent ou dans les prochains mois) :
ApplicationCe que l’agent fait (nativement)
ExcelCréation de vraies formules Excel, analyse de variance, structure sur le canvas
WordRédaction de documents complets, insertion de formules, …
PowerPointTransformation contenu fade → slides engageantes (objets éditables, pas images plates)
OutlookPlanification, rédaction et envoi emails (avec revue avant envoi)
  • Agent 365 : gouvernance & sécurité au programme, dont la disponibilité générale est prévu le 1er mai. Ce panneau de contrôle unique pour tous vos agents (Microsoft + développeurs + IT + partenaires externes)

Qu’est-ce que Claude Cowork ?

Claude Cowork est un produit d’Anthropic lancé en janvier 2026, qui change radicalement la manière d’interagir avec l’intelligence artificielle.

Alors que Claude classique se contente de répondre à vos questions ou de générer du texte dans une fenêtre de chat, Claude Cowork est conçu pour exécuter des tâches complexes de bout en bout, en travaillant directement sur votre ordinateur et dans vos fichiers.

Vous ne lui demandez plus de vous aider à écrire, vous lui déléguez un projet entier et il l’accomplit de manière autonome, pendant que vous faites autre chose.

La transparence est un principe clé du fonctionnement de Cowork.

Quand Claude exécute une tâche, des indicateurs de progression vous montrent ce qu’il est en train de faire à chaque étape. Il expose son raisonnement et son approche, ce qui vous permet de suivre le processus et de comprendre pourquoi il prend telle ou telle décision. Vous pouvez intervenir à tout moment pour corriger la direction, ou fournir des directives supplémentaires au milieu de la tâche.

Qu’est-ce que Copilot Cowork ?

Le 9 mars dernier, Microsoft a officiellement lancé Copilot Cowork, développé en étroite collaboration avec Anthropic et propulsé par le modèle Claude. Ce n’est pas une mise à jour technique de Copilot, c’est un changement fondamental de nature.

Alors que les premières versions de Copilot restaient cantonnées à un rôle d’assistance conversationnelle, Cowork introduit une nouvelle catégorie de produit : l’agent IA capable d’accomplir des tâches complexes sur plusieurs minutes voire plusieurs heures, sans intervention humaine constante.

La différence est radicale quand on compare ce que Copilot faisait avant et ce que fait Cowork maintenant. Avec la version classique, vous posiez une question, Copilot répondait par du texte généré. Vous lui demandiez de résumer un document, il le faisait. Ou alors il rédigeait un brouillon Word selon vos directives. Mais tout restait dans le domaine conversationnel.

Copilot Cowork change cette logique :

Copilot Wave 1-2Copilot Cowork (Wave 3)
Vous posez une question → il répond du texteVous donnez une mission → il exécute le travail
Résume-moi ce documentPrépare ma réunion de mardi avec Romuald
Génère un brouillon WordCrée Word + Excel + PowerPoint + envoie un e-mail + planifie un meeting
Conversation ponctuelleTâches en arrière-plan pendant minutes / heure

Microsoft a choisi d’intégrer la technologie Claude d’Anthropic plutôt que d’utiliser uniquement ses propres modèles OpenAI. Les raisons sont pragmatiques. Les tests indépendants placent Claude en tête pour la planification de tâches complexes, le débogage de code et l’analyse financière.

La disponibilité de Copilot Cowork est progressive. Le programme Frontier est ouvert maintenant pour les utilisateurs qui souhaitent tester les features avant leur sortie publique. La généralisation large est attendue fin mars 2026.

Qu’est-ce que Frontier chez Microsoft ?

Frontier chez Microsoft, c’est en réalité trois choses liées à l’IA :

  • Programme Frontier : Un espace d’accès en avant-première pour explorer les dernières innovations IA dans Microsoft 365 avant leur disponibilité générale :
    • Essayer de nouvelles expériences avec Copilot (agents expérimentaux, fonctionnalités en préversion)
    • Accéder à des modèles IA avancés (comme Claude dans Copilot Chat, en plus d’OpenAI)
    • Partager des commentaires pour façonner les futures fonctionnalités
  • Frontier Transformation : Les entreprises Frontier sont des pionnières qui intègrent l’IA agentique au cœur de leurs opérations. Les 3 traits d’une Frontier Firm sont :
    • Les personnes aux centres : IA dans le flux de travail (Word, Excel, Outlook), pas outil séparé
    • Tout le monde peut contribuer : Chacun crée/utilise des agents IA
    • Visibilité à chaque couche : vous gouvernez, contrôlez et observez les agents.
  • Suite Frontier (Microsoft 365 E7) : Nouvelle de licence offre premium. Lancée le 1er mai 2026, cette suite regroupera :
ComposantCe que ça inclut
Microsoft 365 E5Productivité, sécurité, conformité de base
Microsoft 365 CopilotIA générative complète (Word, Excel, PowerPoint, Outlook, Copilot Chat) + Work IQ + Copilot Studio + Agent Builder
Agent 365Plateforme de gouvernance/sécurisation des agents IA ($15/utilisateur seul)
Microsoft Entra SuiteGouvernance des identités, accès, sécurité réseau (SSE/ZTNA)

Comment active-t-on le mode Frontier ?

Pour y accéder, il faut que votre administrateur active Frontier dans le tenant Microsoft 365 Admin Center, puis attribue l’accès à des groupes d’utilisateurs pilotes. Vous pouvez aussi participer au programme Frontier en individuel si vous avez une licence Microsoft 365 Personal ou Famille.

Pour un compte Microsoft particulier : Ouvrez Word, Excel ou PowerPoint sur le web (https://www.office.com), allez dans les Options, recherchez les paramètres Copilot, puis activez cette option :

Pour chaque application Office, il est nécessaire de l’activer (Word, Excel, PowerPoint, … ):

  • Pour un compte Microsoft entreprise : Dans le cadre d’une entreprise, l’activation de Frontier est géré au niveau tenant. C’est donc l’administrateur IT de votre tenant qui doit l’activer pour que les utilisateurs puissent en profiter.

Cette option se trouve sur la page d’administration de Microsoft 365 :

Comment sait-on si Frontier est activé ?

D’un point de vue utilisateur, c’est assez simple de vérifier que Frontier a bien été activé.

  • Pour un compte Microsoft entreprise : Rendez-vous sur la page https://m365.cloud.microsoft, puis recherchez si les agents Frontier vous sont accessibles dans le catalogue :

Quelles sont les limites de Copilot Cowork ?

Nous sommes encore sur une préversion de l’outil, c’est pour cela que certaines contraintes temporaires sont encore présentes :

LimitationDétails
Appareils mobilesCowork n’est pas encore disponible sur mobile. Seuls le navigateur (m365.cloud.microsoft) et applications de bureau Windows/Mac sont supportés
VoixLa fonction vocale dépend du navigateur. Tous les navigateurs ne la supportent pas
Programme nécessaireIl faut être inscrit au programme Frontier preview pour accéder à Cowork

Mais, Microsoft ne communique pas beaucoup sur sa FAQ les limites mensuelles d’usage de Copilot Cowork dans sa documentation.

Cette absence totale de chiffre officiel dans la documentation Microsoft Learn suggère que Cowork est géré en usage illimité dans le cadre de l’abonnement Microsoft 365, mais cette absence de transparence crée des incertitudes pratiques sur les limites réelles en production.

Mais d’autres limites sont déjà documentées :

LimitationDétails
Fichiers locauxCowork ne peut pas accéder ni modifier les fichiers stockés localement sur votre appareil. Il travaille uniquement avec les fichiers de OneDrive et SharePoint
Suppression de fichiersCowork ne peut pas supprimer de fichiers ou dossiers dans OneDrive ou SharePoint
Fichiers encryptésCowork ne peut pas lire les fichiers chiffrés, même si l’utilisateur y a accès
Taille des fichiersLes fichiers joints doivent faire moins de 200 Mo

Enfin, dans le cadre de mon abonnement Microsoft 365 Famille, seul l’utilisateur principal dispose de fonctions Copilot. De plus, des limitations d’usage s’appliquent bien à ces nouvelles fonctions :

Comment puis-je tester Copilot Cowork ?

Vous êtes enfin prêts à tester Copilot Cowork ? C’est parti !

Pour cela, commencez par vous rendre sur la page web de Copilot, recherchez puis ajoutez Copilot Cowork ajouté à votre liste d’agents :

Une fois l’agent Copilot Cowork ajouté, ouvrez-le afin de constater les premières fonctionnalités :

L’écran ressemble à Copilot Work, puis que les requêtes comment elles aussi par un prompt. Des tuiles sont également visibles afin de démarrer rapidement, Microsoft vous propose quatre cas d’usage de base :

  • Organize my inbox pour trier vos e-mails
  • Organize my week pour remettre de l’ordre dans ton agenda
  • Prep for a meeting pour préparer un rendez-vous
  • Research a company pour faire une recherche sur une entreprise.

Enfin, les Tasks ou tâches, correspondent à l’historique des missions que tu as déjà lancées dans Cowork. On voit dans mon exemple deux tâches déjà marquées comme terminées.

Testons maintenant Copilot Cowork ensemble.

Première tâche recherche d’une entreprise :

Voici l’exemple le plus simple et le plus facile, la recherche d’une entreprise :

Dès que la tâche démarre, celle-ci se crée et change de statut. Microsoft documente quatre statuts :

  • In progress quand Cowork travaille encore dessus
  • Needs user input quand il attend votre réponse pour continuer
  • Done quand c’est fini
  • Failed quand la tâche a échoué

Dans mon cas, la tâche a besoin d’une réponse pour avancer :

De façon assez logique Copilot Cowork a besoin de connaître le nom de l’entreprise pour effectuer sa recherche. Pour cela, un formulaire vous invite à lui fournir le nom :

Une fois l’information fournie, Copilot Cowork repart alors travail :

Le statut de la tâche rechange à nouveau :

Pour un meilleur suivi et une traçabilité, toutes les interactions avec l’agent sont affichées à droite de l’écran :

Cowork vous montre son plan d’action détaillé, l’avancement en temps réel, les dossiers source/destination, et les skills qu’il mobilise. On peut suivre précisément ce qu’il fait. :

  • Barre de progression : on y voit ici les 6 étapes planifiées par Cowork :
    • Researching TD SYNNEX
    • Researching TD SYNNEX financial data
    • Create Word document cover sheet
    • Build financial spreadsheet
    • Verifying findings
    • Writing the report
  • Output folder : le dossier où Cowork va déposer les résultats
  • Input folder : le dossier source avec les données d’entrée
  • Skills : 1 compétence active appelée Deep Research

Durant toutes les phases de travail, il nous est toujours possible de re-prompter Copilot Cowork afin de lui apporter des précisions, des contre-ordres ou des informations ou fichiers :

Sur cette autre capture, Cowork est passé de 0/6 à 4/6 : la recherche TD SYNNEX est terminée, il construit un fichier .md :

Un clic sur le fichier .md nous montre directement son contenu :

Sur cette dernière capture, Cowork a terminé toutes les étapes : recherche TD SYNNEX bouclée, Word de 3 pages et Excel 5 onglets créés dans ton OneDrive, avec synthèse détaillée des comptes, trésorerie et ratios financiers :

Tout y est très bien présenté :

L’ensemble des fichiers, générés ou utilisés, sont stockés et accessibles dans un dossier OneDrive créé spécialement pour cette conversation :

Copilot Cowork vous avertit même, au besoin, via un système de notification quand il a besoin de vous ou quand le travail est terminé :

Continuons avec une autre tâche.

Deuxième tâche optimisation d’un planning de vacances :

Dans cette seconde démonstration, que j’ai testé dans le mode Office Agent en Frontier sur un Copilot personnel, mais que j’ai aussi réalisé sur Copilot Cowork Enterprise, j’ai pris un fichier Excel de planning vacances incorrect et mal formaté. J’ai donc demandé à Cowork de le reprendre complètement, de créer une page web interactive avec toutes les activités.

Voici le prompt utilisé pour cette tâche :

J'ai un fichier Excel de planification de vacances à Londres en mai 2026. Il est bancal : dates dans 4 formats différents, prix mélangés en £ et en €, c... J'aimerais que tu fasses les choses suivantes dans l'ordre :

Diagnostic — Analyse le fichier et liste tous les problèmes que tu détectes.
Nettoyage — Corrige tous les problèmes, standardise tous les prix en livres sterling (indique le taux de conversion utilisé en note de bas de fichier), et génère un fichier Excel propre avec 4 onglets : 
ACTIVITES (activités groupées par zone géographique, avec statut Gratuit/Payant), PLANNING (jour par jour avec horaires et transport), BUDGET (formules propres, zéro erreur) et CARTE DES ZONES (carte visuelle des quartiers de Londres avec activités et budget par zone). Page web interactive — Génère un fichier HTML autonome, sans dépendance externe, utilisable hors connexion sur téléphone le jour de la visite. Il doit contenir : une carte cliquable des 7 zones de Londres (City, South Bank, West End, Kensington, North London, East London, Excursions) avec les activités de chaque zone cochables, un planning jour par jour en accordéon, un suivi de budget avec saisie des dépenses réelles, et un onglet Tips pratiques (réservations obligatoires, transport, food). Commence par le diagnostic, attends ma validation, puis enchaîne sur le nettoyage et la page web.

Et voici le fichier Excel de départ utilisé avec ce prompt :

Voyons ce que cela donne en vidéo :

Preuve que Cowork ne se contente pas de répondre, il exécute et livre des fichiers concrets.

Troisième tâche organisation d’un calendrier :

Shervin nous montre comment apporter des optimisations intelligentes sur son calendrier :

Quatrième tâche Création d’un rapport d’incident :

John nous propose un exemple d’analyse de rapports d’incidents dans un dossier OneDrive générant une matrice des menaces, top 5 priorités et allocation de ressources :

Autres exemples de tâches :

Enfin, d’autres bons exemples d’analyse sont proposés par Elliott :

Conclusion

Copilot Cowork marque un tournant décisif dans l’évolution de Microsoft 365 Copilot. En passant d’un simple assistant conversationnel à un agent IA exécuteur capable de mener des projets entiers de bout en bout, Microsoft répond enfin au défi majeur de l’adoption de l’IA en entreprise.

Les premiers tests montrent un potentiel immense. Copilot Cowork livre des fichiers concrets, pas juste du texte. La transparence du processus, la possibilité d’intervenir à tout moment et l’exécution en arrière-plan transforment radicalement la relation à l’IA.

Bien que certaines limitations subsistent, la technologie est déjà fonctionnelle et prête pour la production dans le cadre du programme Frontier. La disponibilité générale attendue fin mars 2026 (et la suite Microsoft 365 E7 le 1er mai) devrait démocratiser l’accès.

Le passage de « résume-moi ce document » à « prépare ma réunion de mardi avec Christophe» n’est pas une simple évolution : c’est une révolution.

L’IA agentique n’est plus de la science-fiction. Elle est déjà dans Word, Excel, PowerPoint et Outlook. Et elle ne fait que commencer à transformer notre manière de travailler.

Pour finir, voici encore une autre vidéo qui pourrait vous donner quelques idées :

Combinez Copilot Studio avec Windows 365 pour Agent

Depuis l’annonce d’Opal, Microsoft a franchi une nouvelle étape vers des assistants capables de réfléchir et d’agir. Windows 365 pour Agent prolonge cette vision en offrant un PC cloud entièrement géré pour les agents IA : il exécute des tâches réelles au sein de Windows en toute sécurité. Ce nouvel article vous montre comment, pas à pas, créer un Computer‑Using Agent dans Microsoft Copilot Studio, connecter ce nouvel agent à un Cloud PC, puis le déclencher depuis un flux Power Automate.

Pour vous donner une première idée sur Opal, voici le lien sur mon premier article parlant justement d’Opal et de ses fonctionnalités.

Ensuite, beaucoup d’informations présentes dans cet article sont issues de la documentation Microsoft.

Qu’est-ce que Windows 365 pour Agent ?

Windows 365 pour les agents fait partie des nouveautés récemment annoncées par Microsoft :

Windows 365 pour les agents fournit une nouvelle classe de PC cloud pour l’utilisation de l’agent, basée sur la même plateforme Windows 365 qui alimente Windows 365 pour les entreprises. Au cœur de la plateforme se trouve le PC cloud, un bureau virtuel Windows ou Linux dans le cloud Microsoft.

Microsoft Learn

En d’autres termes, il s’agit de machines virtuelles Windows, ou Linux, dans le cloud, gérées via Microsoft, auxquelles des agents d’IA peuvent accéder pour effectuer des tâches complexes de façon autonome ou semi-autonome :

Pourquoi faire ?

Imaginez votre entreprise disposant de nombreux Cloud PCs prêts à effectuer des tâches administratives, comme la création de notes de frais ou autres ?

Imaginez ensuite que ces agents puissent être sollicités par des humains, d’autres agents ou encore des déclencheurs automatiques ?

Une fois en marche, l’agent sait exactement ce qu’il doit faire, il dispose d’un environnement sécurisé, potentiellement connecté à des ressources Cloud ou on-premise.

Il est même capable de solliciter l’intervention humaine si nécessaire :

Tout cela ….

Qu’est-ce qu’un pool de Cloud PCs ?

Le pool de cloud PC offre des machines virtuelles à vos agents Copilot Studio pour effectuer des tâches informatiques sans avoir à configurer et gérer des machines physiques. Si vous développez des agents qui doivent interagir avec des applications Windows (comme ouvrir des fichiers, utiliser des logiciels ou naviguer sur des sites web), un pool Cloud PC gère l’infrastructure pour vous.

Microsoft Learn

Actuellement, Microsoft permet d’évaluer le pool de PC cloud en autorisant la création de maximum de deux pools de PC cloud par tenant, sans avoir besoin d’un plan de facturation Windows 365 pour les agents dans votre environnement Power Platform.

L’utilisation du pool de PC cloud n’est pas facturable lorsqu’elle est déclenchée à partir d’une conversation de test intégrée, et chaque tenant dispose de 50 heures d’utilisation gratuite du pool de PC cloud pour l’agent publié s’exécutant de manière autonome.

Pourquoi utiliser un Computer‑Using Agent ?

Un Computer‑Using Agent (CUA) associe l’intelligence d’un agent Copilot avec la capacité d’exécuter des actions réelles sur un PC cloud. Il peut effectuer des tâches répétitives ou multi-étapes : extraire des informations d’un PDF, remplir un formulaire web, mettre à jour un fichier Excel, etc.

L’intérêt est de décharger l’utilisateur final des tâches manuelles tout en respectant les contrôles de sécurité (liste d’URL autorisées, authentification via Entra ID, suivi des actions).

Windows 365 pour Agent vs Power Automate Unattended RPA ?

Windows 365 pour Agent introduit un changement de paradigme : ce n’est plus le flow qui pilote l’exécution, mais un agent IA disposant d’un PC cloud complet.

  • Automatisation agent-centric
  • Capacité de raisonnement contextuel
  • L’agent décide comment accomplir l’objectif, dans un cadre contrôlé

En opposition, Power Automate Unattended RPA était conçu pour exécuter des scénarios pré-définis, sans interaction humaine, sur une machine dédiée. Le flux décide quand et quoi exécuter, et le robot applique uniquement et exactement les étapes décrites.

Quels sont les prérequis pour Windows 365 pour Agent ?

Certains prérequis sont nécessaires pour profiter de ce service :

  • Licences : une licence Microsoft 365 Copilot avec accès au programme Frontier et un abonnement Windows 365 Enterprise ou Business.
  • Gestion de l’identité et des appareils : votre Cloud PC doit être joint à Entra ID et inscrit dans Intune (ou Configuration Manager) pour appliquer les stratégies de sécurité.
  • Environnement Power Platform : un environnement Power Platform avec Dataverse pour héberger votre agent Copilot Studio.
  • Power Automate Desktop : le machine runtime doit être installé sur le Cloud PC pour permettre l’automatisation de l’interface utilisateur.

Une fois ces prérequis atteints, la mise en place de ce nouveau type d’agent est très facile car elle passe par la plate-forme désormais très connue, Copilot Studio :

Quelles versions d’OS sont prises en charge ?

Les Cloud PC Windows 365 pour Agent sont disponibles sous Windows 11 et Linux.
Pour ce tutoriel, Windows 11 a été utilisé car les extensions du navigateur et Power Automate Desktop y sont pleinement supportées.

Comment la sécurité est-elle gérée ?

Le Cloud PC est isolé et rattaché à Entra ID, ce qui permet d’appliquer des politiques conditionnelles et de gestion des appareils via Intune.

Dans Power Automate, vous pouvez définir une liste d’URL autorisées pour limiter les sites que l’agent peut ouvrir. Les identifiants nécessaires aux actions (login Microsoft 365, mots de passe) sont stockés dans un coffre sécurisé :

Enfin, chaque exécution laisse une trace dans l’historique du Cloud PC et dans Copilot Studio › Activity, facilitant l’audit :

Combien coûte Windows 365 pour Agent ?

Durant la phase de préversion, l’utilisation d’un poste pour un agent Copilot est facturée cinq crédits Copilot.

Chaque exécution de l’utilisation de l’ordinateur s’appuie sur un modèle d’IA qui exécute une séquence d’étapes. Une étape peut impliquer une ou plusieurs actions de bas niveau (par exemple, cliquer, taper ou naviguer). Chaque étape consomme 5 crédits Copilot.

Microsoft propose un détail de la facturation via cet exemple :

Si vous configurez l’utilisation de l’ordinateur pour remplir un formulaire de feuille de temps en ligne, l’exécution peut effectuer les étapes suivantes :

  • Lancer le navigateur et accéder au portail de la feuille de temps.
  • Sélectionner Créer une nouvelle feuille de temps.
  • Remplir les champs Heure de début, Heure de fin et Code de projet.
  • Sélectionner le bouton Soumettre.

Dans cet exemple, l’utilisation de l’ordinateur exécute 4 étapes, consommant au total 20 crédits Copilot.

Puis‑je utiliser mon propre poste plutôt qu’un Cloud PC ?

Oui, lors de la configuration de l’outil Computer Use, vous pouvez choisir l’option Bring‑your‑own machine et installer le machine runtime sur un poste local.

C’est d’ailleurs ce que nous ferons dans l’Etape IIa :

Toutefois, l’utilisation d’un Cloud PC évite d’exposer votre machine de production et simplifie la gestion des permissions.

Comme pour les tests sur Opal, l’architecture repose sur trois entités :

  • Copilot Studio : le cerveau qui orchestre l’agent, gère les prompts et déclenche les outils.
  • Windows 365 pour Agent : le corps qui exécute les actions UI au travers du machine runtime.
  • Power Automate : le déclencheur qui surveille un événement (arrivée d’e‑mail, webhook, etc.) et invoque l’agent avec les paramètres nécessaires.

Voici les différentes étapes de notre test :

Ce test s’appuie sur la même base que l’exercice réalisé sur Opal. Ce nouvel exemple IA effectue les actions suivantes :

  • La réception d’un e‑mail notifiant l’arrivée d’une nouvelle facture
  • L’extraction des données d’un PDF
  • La saisie automatique un formulaire web
  • La saisie automatique un formulaire SharePoint
  • La saisie automatique un feuille Excel

Etape 0 – Rappel des prérequis :

Avant de commencer, assurez‑vous d’avoir :

  1. Un abonnement Windows 365 Enterprise
  2. Une licence Microsoft 365 Copilot

Commençons par configurer un tout nouvel environnement sur Power Platform.

Etape I – Configuration Power Platform :

Ouvrez le Power Platform Admin Center, puis cliquez ici pour créer un nouvel environnement :

Choisissez un type d’environnement adapté : Sandbox ou Production, activez Dataverse (Sans Dataverse, Copilot Studio ne pourra pas créer d’agent), puis assurez‑vous que la région est compatible avec Windows 365 pour Agent :

Cliquez sur Sauvegarder, puis attendez que ce dernier soit créé :

Une fois le nouvel environnement prêt, vous pouvez y accéder depuis une URL dans la forme suivante :

https://copilotstudio.preview.microsoft.com/environments

Vous devriez alors pouvoir sélectionner le choix suivant car maintenant dégrisé :

Avant d’aller plus loin sur Copilot Studio, il est nécessaire de s’intéresser au poste que va utiliser l’agent pour effectuer les opérations.

Plusieurs choix s’offrent à vous :

Les étapes IIa et IIb de cet article vous proposent de tester différentes alternatives.

Etape IIa – Utilisation d’un PC personnel :

Pour mes tests, j’ai décidé d’utiliser un Cloud PC Entreprise via Power Automate afin que ce dernier le considère comme une machine personnelle.

Si vous êtes dans le même cas que le mien, ouvrez une session Windows de votre Cloud PC :

Sur votre Cloud PC, ouvrez le portail de Power Automate, choisissez le bon environnement créé via Power Platform, puis allez dans vos machines :

Téléchargez le Power Automate machine runtime :

Installez‑le sur le Cloud PC :

Acceptez les conditions, puis démarrez l’installation :

Attendez quelques minutes la fin de l’installation :

Sélectionnez l’extension de navigateur (Edge, Chrome ou Firefox) selon votre usage :

Confirmez l’action d’installation :

Après cela, ouvrez l’application Power Automate machine runtime sur votre Cloud PC :

Connectez-vous avec vos identifiants Microsoft 365 :

Enregistrez la machine dans l’environnement Power Platform créé :

Attendez quelques minutes le message de succès de l’inscription de votre poste :

Dans la liste des machines doit figurer votre Cloud PC avec le statut Connecté :

L’option Computer use est pour le moment encore désactivée. Lisez attentivement l’avertissement : l’agent ne pourra accéder qu’aux sites autorisés et la machine sera contrôlée via l’interface utilisateur.

Si vous êtes d’accord, cliquez sur Activer pour confirmer :

Votre machine est maintenant prête à exécuter des instructions IA. Vous pouvez également configurer une liste d’URL autorisées (allowlist) pour restreindre les destinations.

À la place d’utiliser une machine personnelle, il est aussi possible d’utiliser un Pool de Cloud PC.

Etape IIb – Utilisation d’un Pool de Cloud PC :

Il est possible, durant cette phase de préversion, de tester la création d’un Cloud PC Pool, composé de machines virtuelles hébergées sur Azure.

Pour cela, rendez-vous dans la console d’administration de Power Platform afin d’autoriser Microsoft à créer des machines virtuelles aux US, potentiellement en dehors de votre région :

Ouvrez Copilot Studio, sélectionnez l’environnement créé, puis créez un nouvel agent comme ceci :

Ne renseignez rien, cliquez directement ici :

Cliquez ici pour créer un Pool de Cloud PCs :

Renseignez son nom, puis cliquez sur Créer :

La création du pool commence et déclenche également la création de deux Cloud PCs :

Environ 30 minutes plus tard, les Cloud PC dédiés à Copilot Studio sont correctement provisionnés :

Le Pool de Cloud PCs est visible dans la console de Power Automate :

Ces machines virtuelles provisionnées sont également visibles dans Intune :

Etape III – Configuration Entra :

Comme tous mes tests reposent sur des postes Windows 365, certains prérequis IT sont nécessaires pour assurer un bon fonctionnement :

  • Un tenant Intune et Microsoft Entra valides
  • Restrictions d’inscription des types d’appareils Intune configurées
  • L’authentification Microsoft Entra pour RDP est activée
  • Dialogue d’invite de consentement caché pour les groupes d’appareils cibles
  • Principaux de service requis créés (Windows 365 et Azure Virtual Desktop)

Afin de masquer la boîte de dialogue en configurant la liste des hôtes Windows 365 approuvés, je crée un groupe dans Entra ID contenant les hôtes de session :

Autorisez Microsoft Entra dans l’authentification pour Windows sur le tenant via Azure Cloud Shell depuis le portail Azure :

Importez les deux modules Microsoft Graph suivants, puis connectez-vous avec le compte aux permissions appropriées :

Import-Module Microsoft.Graph.Authentication
Import-Module Microsoft.Graph.Applications

Connect-MgGraph -Scopes "Application.Read.All","Application-RemoteDesktopConfig.ReadWrite.All"

Je récupère l’ID d’objet pour le principal du service Microsoft Remote Desktop :

$WCLspId = (Get-MgServicePrincipal -Filter "AppId eq 'a4a365df-50f1-4397-bc59-1a1564b8bb9c'").Id

Je modifie la propriété isRemoteDesktopProtocolEnabled sur True :

If ((Get-MgServicePrincipalRemoteDesktopSecurityConfiguration -ServicePrincipalId $WCLspId) -ne $true) {
    Update-MgServicePrincipalRemoteDesktopSecurityConfiguration -ServicePrincipalId $WCLspId -IsRemoteDesktopProtocolEnabled
}

Enfin, toujours dans la même session d’Azure Cloud Shell, j’ajoute l’ID de groupe à une propriété sur le principal du service SSO Microsoft Remote Desktop :

$tdg = New-Object -TypeName Microsoft.Graph.PowerShell.Models.MicrosoftGraphTargetDeviceGroup
$tdg.Id = "<Group object ID>"
$tdg.DisplayName = "<Group display name>"
New-MgServicePrincipalRemoteDesktopSecurityConfigurationTargetDeviceGroup -ServicePrincipalId $WCLspId -BodyParameter $tdg

Enfin, profitez-en pour exclur cette même application dans vos règles d’accès conditionnel Entra afin de ne pas bloquer votre Cloud PC avec un prompt de MFA :

Passons maintenant à la création de notre agent dans Copilot Studio.

Etape IV – Création de l’agent :

Si cela n’est pas déjà fait, ouvrez Copilot Studio, sélectionnez l’environnement créé, puis créez un nouvel agent :

Renseignez les informations suivantes :

  • Nom de l’agent : Invoicing Agent
  • Icône pour personnaliser l’avatar
  • Description :
Automates a deterministic invoice-processing workflow using Computer Use. The agent always executes the Invoice Entry tool once per trigger and never retries or reasons.

Choisissez le modèle d’IA suivant :

Renseignez ensuite la description suivante, puis sauvegardez :

When the trigger fires : 
- Do not ask questions.
- Do not reply to the user.
- Do not request clarification.
- Ignore the email content completely.
- Do not interpret the email.
- Do not extract data from the email.
- Immediately execute the tool "Invoice Entry" exactly once

Importez des documents (PDF, Word, sites SharePoint) qui aideront l’agent à répondre aux questions. Si votre scénario est purement déterministe, cette section peut rester vide :

Pour lancer l’agent à la réception d’un e‑mail de facture, ajoutez-lui un déclencheur :

Recherchez et sélectionnez le déclencheur When a new email arrives in a shared mailbox (V2) :

Saisissez l’adresse de la boîte partagée (ex. Invoices‑inbox@contoso.com), puis cliquez sur Créer :

Dans Settings › Generative AI, activez l’orchestration générative si vous souhaitez que l’agent puisse raisonner :

Dans Topics, désactivez tous les sujets système pour éviter les réponses conversationnelles :

L’outil Computer Use est le cœur de notre agent car il décrit exactement ce que l’agent doit faire sur le PC. Cliquez alors ici pour le créer :

Dans les outils disponibles, choisissez Computer use :

Rédigez des étapes claires et impératives. Utilisez le vous pour s’adresser à l’agent afin d’être cohérent avec le style formel du blog. Voici plusieurs exemples simples proposés par Microsoft :

ScenarioNameDescriptionInstructions
Invoice processingTransfer and submit invoice detailsTransfer invoice data from a PDF and submit it to another form.1. Go to https://computerusedemos.blob.core.windows.net/web/Contoso/invoice-manager.html, set the Date filter to Last 24 hours, and open the invoice PDF.
2. In a new tab, open https://computerusedemos.blob.core.windows.net/web/Contoso/index.html and fill out the form with the data from that PDF. Submit the invoice form, no confirmation needed.
Data entrySubmit inventory itemsAdd products to the inventory system.1. Go to https://computerusedemos.blob.core.windows.net/web/Adventure/index.html.
2. Submit a new entry for each of the following items:
Rear Derailleur, RD-4821, 50, 42.75, Tailspin Toys
Pedal Set, PD-1738, 80, 19.99, Northwind Traders
Brake Lever, BL-2975, 35, 14.50, Trey Research
Chainring Bolt Set, CB-6640, 100, 5.25, VanArsdel, Ltd.
Bottom Bracket, BB-9320, 60, 24.90, Tailwind Traders
Data extractionLook up portfolio manager and valueGet the manager name and value for a portfolio.1. Go to https://computerusedemos.blob.core.windows.net/web/Portfolio/index.html.
2. Find the row for Fourth Coffee and record the Portfolio Manager name and the current Portfolio Value exactly as shown.
3. Return those two values as the final output.

Cliquez ensuite sur Ajouter :

Nommez votre outil, puis indiquez-lui une description :

Processes exactly one invoice only. Runs once per trigger. Must not repeat under any condition.

Choisissez Computer‑Using Agent (Preview) :

Selon votre cas (IIa ou IIb), sélectionnez Bring‑your‑own machine ou Cloud PC Pool :

Fournissez les identifiants nécessaires de votre utilisateur de test :

Cliquez sur Ajouter :

Créez une nouvelle connexion à votre PC :

Renseignez les identifiants de votre utilisateur de test :

Attendez la validation de la connexion :

Enregistrez l’outil afin de pouvoir effectuer un premier test.

Etape V – Test de l’outil Computer‑Using Agent :

Toujours sur Copilot Studio, cliquez sur Test pour lancer un test interactif :

Copilot Studio ouvre alors un écran du Cloud PC et exécute chaque étape en votre présence :

  • Récupération de la dernière facture :
  • Saisie de la facture dans le formulaire web :
  • Saisie de la facture dans le formulaire Microsoft Office :
  • Saisie de la facture dans la feuille Excel :

Quand le test est terminé, la mention suivante apparaît :

Tous les lancements de l’agent sont visibles et traçables dans l’onglet suivant :

Afin de vous faire une meilleure idée du processus complet, voici un enregistrement accéléré de toutes les étapes :

Passons maintenant au dernier test incluant le test du déclencheur de notre agent via l’envoi d’un e-mail vide à l’adresse de messagerie partagée.

Etape VI – Test du déclenchement de l’agent :

Commencez par cliquer sur Publier dans l’en‑tête de l’agent pour le rendre disponible. Les utilisateurs autorisés pourront ainsi déclencher l’agent en lui envoyant un e‑mail ou via une commande spécifique :

Envoyez un e‑mail de test à la boîte partagée :

Dans les activités de Copilot Studio, observez une ligne indiquant que le déclencheur a été détecté :

Cliquez dessus pour ouvrir la vue détaillée de chaque action générant une copie d’écran :

La dernière copie d’écran nous indique la feuille Excel, preuve que le traitement a pu aller jusqu’au bout :

Conclusion

Windows 365 pour Agent marque une évolution importante dans la façon dont nous concevons l’automatisation : on ne parle plus simplement d’exécuter un scénario figé, mais de fournir à un agent IA un environnement Windows complet, sécurisé et gouverné, capable d’agir dans des interfaces qui n’exposent aucune API.

Dans cet article, nous avons volontairement construit un scénario déterministe afin de démontrer que cette approche n’est pas réservée aux cas d’usage “expérimentaux”. Lorsqu’il est correctement cadré, un Computer-Using Agent peut s’intégrer dans un SI existant tout en respectant les exigences de sécurité, de traçabilité et de gouvernance attendues en entreprise.

Cette solution reste toutefois en préversion. Elle implique une réflexion approfondie sur les coûts, la disponibilité régionale et la gestion des identités, et ne remplace pas les automatisations API-first ou les scénarios RPA classiques lorsqu’ils sont plus adaptés.

Windows 365 pour Agent ouvre cependant une voie nouvelle : celle d’agents capables d’opérer dans des environnements hérités ou fermés, là où aucune intégration moderne n’est possible. C’est probablement dans ces zones “grises” du système d’information que cette technologie prendra tout son sens.

Ajoutez du MCP à votre IA !

Alex Wolf, de la chaîne YouTube The Code Wolf, continue de peaufiner son application DBChatPro version après version et dévoile la v6 ! Cette nouvelle version intègre maintenant un serveur MCP, exposant les fonctionnalités clés de DBChatPro à d’autres outils d’IA (GitHub Copilot, etc.) ou même à vos propres applications. Dans cet article, nous explorons les fondamentaux du MCP, puis nous détaillons l’installation du serveur MCP de DBChatPro.

Avant toute manipulation technique, et pour bien saisir l’intérêt d’une architecture MCP, je vous recommande la lecture de l’excellent billet disponible sur Digidop, écrit par Thibaut Legrand. Voici un extrait de ce billet qui illustre parfaitement l’avantage d’une architecture MCP :

Qu’est-ce que le Model Context Protocol (MCP) ?

Le Model Context Protocol (MCP) est un standard ouvert conçu par Anthropic (l’entreprise à l’origine de Claude) qui offre aux modèles d’IA un accès sécurisé à diverses sources de données et outils externes.

Il fonctionne comme un « USB-C universel » pour l’IA, facilitant la communication avec n’importe quel service ou base de données.

Pourquoi le MCP a été créé ?

Avant le MCP, relier un LLM à des sources externes était laborieux et non standardisé. Les grands modèles de langage (GPT, Claude, Gemini…) présentent deux limites majeures :

  1. Limite de contexte : Ils ne peuvent raisonner que sur les informations présentes dans leur contexte immédiat
  2. Impossibilité d’action : Ils peuvent générer du texte mais ne peuvent pas agir sur le monde extérieur

La métaphore du « problème M×N » illustre parfaitement cette situation : pour connecter un nombre M modèles d’IA à un nombre N outils externes, il fallait créer M×N intégrations différentes. Le MCP transforme cette équation en M+N, réduisant drastiquement la complexité d’intégration.

Prenons un exemple concret :

une entreprise utilisant 4 modèles d’IA différents (Claude, GPT-4, Gemini, Deepseek) qui souhaite les connecter à 5 services externes (GitHub, Slack, Google Drive, Salesforce, base de données interne).

Sans MCP, cela nécessiterait 4×5=20 intégrations personnalisées. Avec MCP, on passe à seulement 4+5=9 composants (4 clients MCP et 5 serveurs MCP), soit une réduction de 55% de la complexité et du temps de développement.

MCP vs API traditionnelles : quelles différences ?

Pour comprendre l’importance du MCP, comparons-le aux API REST traditionnelles :

CaractéristiqueMCPAPI REST traditionnelles
CommunicationBidirectionnelle et en temps réelGénéralement requête-réponse unidirectionnelle
Découverte d’outilsAutomatique et dynamiqueConfiguration manuelle nécessaire
Conscience du contexteIntégréeLimitée ou inexistante
ExtensibilitéPlug-and-playEffort d’intégration linéaire
StandardisationProtocole unifié pour tous les modèlesVariable selon les services
OrientationConçu spécifiquement pour les modèles d’IAUsage général

Cette standardisation représente un changement de paradigme pour quiconque souhaite développer des applications IA véritablement connectées.

Architecture et fonctionnement du MCP

L’architecture du MCP repose sur trois composants principaux qui interagissent de façon coordonnée :

Les composants clés du MCP

  1. Hôtes MCP : Ce sont les applications qui intègrent l’IA et ont besoin d’accéder à des données externes. Par exemple, Claude Desktop, un IDE comme Cursor, ou toute application intégrant un LLM.
  2. Clients MCP : Ce sont des intermédiaires qui maintiennent les connexions sécurisées entre l’hôte et les serveurs. Chaque client est dédié à un serveur spécifique pour garantir l’isolation.
  3. Serveurs MCP : Ce sont des programmes externes qui fournissent des fonctionnalités spécifiques et se connectent à diverses sources comme Google Drive, Slack, GitHub, ou des bases de données.

Le flux de communication MCP se déroule typiquement en quatre étapes bien définies :

  1. Découverte : L’hôte (comme Claude Desktop) identifie les serveurs MCP disponibles dans son environnement
  2. Inventaire des capacités : Les serveurs MCP déclarent leurs fonctionnalités disponibles (outils, ressources, prompts)
  3. Sélection et utilisation : Quand l’utilisateur pose une question nécessitant des données externes, l’IA demande l’autorisation d’utiliser un outil spécifique
  4. Exécution et retour : Le serveur MCP exécute l’action demandée (recherche web, accès à un fichier, etc.) et renvoie les résultats à l’IA qui peut alors formuler une réponse complète

Ce processus standardisé permet une communication fluide entre l’IA et les sources de données externes, tout en maintenant un contrôle transparent pour l’utilisateur.

Serveurs MCP existants

Plutôt que de développer vos propres serveurs MCP depuis zéro, vous pouvez exploiter l’écosystème grandissant de serveurs préexistants. Ces solutions prêtes à l’emploi vous permettent d’intégrer rapidement des fonctionnalités avancées dans vos projets IA :

Serveurs officiels et communautaires

  • GitHub : Ce serveur MCP vous permet d’interagir avec des dépôts de code directement depuis votre application IA. Vous pouvez rechercher des fichiers, créer des issues, analyser des pull requests, ou même générer des commits et du code. Idéal pour les assistants de développement qui nécessitent une compréhension du contexte du code.
  • Google Drive : Offre un accès complet aux documents stockés sur Google Drive. Votre modèle d’IA peut ainsi lire, créer, modifier ou organiser des documents, présentations et feuilles de calcul, en conservant le contexte des informations partagées.
  • Slack : Permet à vos modèles d’IA d’interagir avec les canaux et conversations Slack. Ils peuvent envoyer des messages, surveiller des chaînes spécifiques, ou même répondre automatiquement à certains types de requêtes, créant ainsi une intégration transparente dans les flux de communication d’équipe.
  • Puppeteer : Un puissant serveur MCP qui apporte la capacité de naviguer sur le web. Vos modèles d’IA peuvent visiter des sites, remplir des formulaires, capturer des captures d’écran et extraire des données, ouvrant la voie à l’automatisation avancée des tâches web.
  • Brave Search : Donne à vos modèles d’IA la capacité d’effectuer des recherches web en temps réel via le moteur Brave. Cela permet de répondre à des questions sur l’actualité récente ou d’accéder à des informations au-delà de la date limite de formation du modèle.
  • PostgreSQL : Connecte vos modèles d’IA directement à vos bases de données PostgreSQL. Les modèles peuvent effectuer des requêtes SQL, analyser des données et même assister à la conception de schémas de base de données.
  • SQLite : Variante plus légère pour les bases de données locales, particulièrement utile pour les applications de bureau ou les projets avec des exigences de stockage plus modestes.
  • Qdrant : Serveur spécialisé pour les bases de données vectorielles, essentiel pour les applications IA nécessitant une recherche sémantique ou par similarité.

Afin de voir comment cela marche, voici les différentes étapes que nous allons suivre sur un environnement de test :

Maintenant, il nous reste plus qu’à tester tout cela 😎

Etape 0 – Rappel des prérequis :

Pour réaliser cet exercice, il vous faudra disposer de :

  • Un tenant Microsoft
  • Une souscription Azure valide

Commençons par créer quelques ressources (IA et DB) sur Azure et Entra.

Etape I – Création des ressources Azure :

Connectez-vous au portail Entra Admin Center pour enregistrer une nouvelle application, puis récupérez ensuite l’Application ID et le Tenant ID :

Créez un secret client puis copiez immédiatement sa valeur car elle ne sera plus visible par la suite :

Ouvrez une session Windows PowerShell, puis définissez trois variables d’environnement pour l’App ID, le Directory ID et le Client Secret :

setx AZURE_CLIENT_ID    "xxx"
setx AZURE_TENANT_ID    "yyy"
setx AZURE_CLIENT_SECRET "zzz"

Vérifiez ces variables dans les Propriétés système de Windows, section « Variables d’environnement », afin de confirmer leur bonne configuration :

Créez un service Azure OpenAI depuis le portail Azure, puis ajoutez votre application en tant que « Cognitive Services OpenAI User » dans « Contrôle d’accès (IAM) » :

Revenez à la page principale de votre service Azure OpenAI, puis cliquez sur Ouvrir dans la Fonderie pour accéder à l’interface de déploiement :

Dans la Fonderie, ouvrez l’onglet Déploiements et cliquez sur Nouveau déploiement, puis nommez-le (par ex : gpt-4o) et copiez l’URL de l’endpoint :

Créez une base de données Azure SQL Database avec des données en exemple, puis copiez la chaîne de connexion complète pour la réutiliser plus tard :

Notre environnement Azure est prêt. Nous allons maintenant pouvoir déployer l’application DBChatPro sur notre poste en local.

Etape II – Déploiement et test de l’application DBChatPro :

Accédez au dépôt GitHub de l’application via le lien, puis téléchargez l’archive ZIP sur votre poste :

Extrayez l’archive ZIP, puis placez-vous dans le dossier extrait pour préparer l’ouverture du projet :

Lancez Visual Studio Code, puis cliquez ici pour sélectionner le dossier du projet :

Sélectionnez le dossier extrait contenant le projet, puis validez pour l’ouvrir dans VS Code :

Observez la nouvelle architecture de DBChatPro avec la partie MCP distincte de l’interface graphique, puis passez à la configuration UI :

Commencez par l’interface graphique en renseignant les endpoints de votre choix dans le fichier de configuration, puis sauvegardez vos modifications :

Dans mon cas, j’ai utilisé le modèle Azure OpenAI :

Ouvrez la console intégrée Terminal de VS Code, positionnez-vous dans le dossier racine de l’application, lancez l’application, puis patientez quelques secondes pour que le serveur local démarre :

Copiez l’URL locale générée par l’application, puis ouvrez-la dans votre navigateur préféré :

Dans le navigateur, constatez que la base de données n’est pas encore configurée, puis cliquez sur Connexion :

Collez votre chaîne de connexion SQL en modifiant le mot de passe, puis cliquez sur Check Connection pour tester la liaison :

Vérifiez la découverte automatique du schéma de la base de données, puis cliquez ici pour sauvegarder pour valider l’import :

Dans le terminal, observez également l’import du plan et du schéma de votre base SQL :

Sur la page principale de l’application, sélectionnez le modèle et la plateforme d’IA, puis saisissez votre prompt :

Patientez quelques secondes pour afficher le résultat généré par le modèle :

Consultez l’onglet Insight pour obtenir des informations complémentaires sur la réponse, puis analysez les données fournies :

Sur l’onglet SQL Editor, constatez la transformation de votre requête en SQL :

Observez les résultats sous forme de tableau retournés par la requête SQL :

Accédez à l’historique des requêtes exécutées, puis identifiez celles que vous souhaitez réutiliser :

La fonction Chat vous permet de relancez une seconde requête basée sur les résultats de la première :

Testez cette seconde requête et constatez les résultats :

Au final, on constate que l’interface graphique de DBChatPro ne cesse d’évoluer pour offrir plus de facilité et une meilleure gestion des bases de données.

Passons maintenant à la partie MCP qui nous intéresse également.

Etape III – Déploiement du serveur MCP :

Revenez sur Visual Studio Code dans le programme MCP afin de paramétrer l’endpoint Azure OpenAI :

Collez également votre connexion SQL complète :

Cliquez sur le bouton Démarrer pour lancer le serveur MCP, puis patientez quelques instants :

Vérifiez que le serveur est démarré et affiche l’état Running :

Ouvrez la fenêtre Chat dans Visual Studio Code :

Assurez-vous que vous êtes en mode agent pour l’intelligence artificielle :

Dans la boîte à outils, confirmez que le serveur MCP et ses sous-modules sont actifs, puis refermez le panneau :

Effectuez un test de base pour vérifier que l’IA vous répond :

Lancez un prompt en spécifiant l’utilisation de DBChatPro avec un modèle et une plateforme AI, puis validez l’alerte :

use DbChatPro to get 10 customers from the database using AzureOpenAI and gpt-4o

Constatez que la connexion à la base de données et au modèle a bien fonctionné :

Observez en chat l’input et l’output de la requête :

Visualisez le résultat sous forme de tableau retourné par l’IA :

Lancez un second prompt sans redéfinir les paramètres du modèle, puis constatez que la réponse est tout de même générée :

Effectuez un autre test avec un prompt différent sur la même base :

Observez le résultat structuré cette fois en liste :

Si vous le souhaitez, testez la plateforme IA de GitHub en paramétrant un token d’accès sur cette page, puis copiez-le :

Sur ce token, autorisez l’accès en lecture pour interroger les modèles GitHub Copilot, puis confirmez cette permission :

Renseignez le modèle GitHub dans la configuration MCP et redémarrez le serveur, puis patientez quelques instants :

Relancez un prompt en utilisant le modèle GitHub Copilot comme plateforme IA :

Constatez le retour de résultats :

Envoyez cette fois un prompt combiné, interrogeant le serveur MCP via les deux modèles d’IA, puis constatez la fusion des réponses :

Enfin, découvrez sur sa vidéo, toujours depuis Visual Studio Code, des fonctions de troubleshooting très pratiques :

Conclusion

L’intégration du MCP transforme votre assistant en un véritable pont entre l’IA et le monde réel. Fini les intégrations sur mesure : grâce à ce protocole standard, un modèle peut interagir avec des bases de données, GitHub Copilot ou tout autre outil compatible.

On passe d’une complexité M×N à un système modulaire, extensible et sécurisé.

En adoptant le Model Context Protocol dès aujourd’hui, vous préparez vos solutions à l’IA de demain : une IA connectée, actionnable et interopérable, capable de faire bien plus que répondre, mais également d’interagir.

Faites tourner votre propre IA RAG en local

Dans la série des démonstrations très intéressantes sur l’intelligence artificielle, j’appelle le RAG local ! Comme toujours, Alex de la chaîne YouTube The Code Wolf nous montre comment en quelques clics il est possible d’installer et tester une IA sur votre poste local, tout en y ajoutant des données spécifiques (RAG) afin d’en améliorer les réponses.

Mais qu’est-ce que le RAG ?

Le Retrieval Augmented Generation (RAG) est une approche novatrice qui combine le meilleur de deux mondes en IA : la recherche d’informations (retrieval, qui ne génère pas de réponse originale) et la génération de contenu (qui ne s’appuie que sur les données de son entraînement). Traditionnellement, les LLM génèrent du contenu en s’appuyant uniquement sur les informations apprises durant leur phase d’entraînement. Le RAG, en revanche, permet au modèle de « consulter » une base de données ou un corpus de documents externes en temps réel pour enrichir sa génération de texte. Cette capacité de recherche améliore significativement la précision, la pertinence et la richesse du contenu généré.

Datascientest.com

Comment fonctionne le RAG ?

La qualité de la base de données est un élément crucial pour le fonctionnement du RAG. Une base de données riche, variée et actualisée permet au modèle d’acquérir une connaissance approfondie et de générer des réponses plus précises et pertinentes.

La recherche d’informations joue également un rôle important en permettant au RAG de trouver les éléments les plus pertinents dans la base de données et de les utiliser pour inspirer ses réponses.

reglo.ai

Voici un exemple des étapes pour mieux comprendre les interactions :

ÉtapeDescription
1. QuestionL’utilisateur demande : « Quelle est la vitesse de la lumière dans le vide ? »
2. Embedding de texteLa question est convertie en vecteur (séquence numérique) pour capturer sa signification.
3. Corpus et base de données vectorielleLes documents sont découpés en passages courts et convertis en vecteurs, stockés dans une base de données vectorielle.
4. RechercheLe module de recherche compare les vecteurs de la question aux vecteurs des documents pour trouver les plus similaires.
5. RéponseLe LLM utilise la question et les extraits récupérés pour générer une réponse pertinente : « La vitesse de la lumière dans le vide est de 299 792 458 mètres par seconde »

Mais comment tester le RAG en local ?

Voici un exemple des ressources nécessaires pour y parvenir :

ComposantDescription
Bibliothèques et outilsSentenceTransformers pour les embeddings de texte.
– Un modèle de langage comme ollama.
– qdrant, Faiss ou Annoy pour la base de données vectorielle.
Données– Corpus de documents à utiliser pour la recherche.
– Données prétraitées et converties en vecteurs.
Environnement de développement– Python ou .NET
– Docker
Serveur RAG– Framework comme R2R (Ready-to-Run) pour déployer le pipeline RAG.
– API pour interagir avec le pipeline.

Faut-il un GPU pour faire du RAG ?

L’utilisation d’un GPU pour mettre en place le RAG n’est pas strictement nécessaire, mais elle peut grandement améliorer les performances, surtout pour les tâches de génération de texte et de traitement de grandes quantités de données. Voici quelques points à considérer :

  1. Sans GPU :
    • Possible : Tu peux utiliser un CPU pour les tâches de RAG, mais cela peut être plus lent, surtout pour les modèles de langage volumineux.
    • Limité : Les performances peuvent être limitées, ce qui peut affecter la rapidité et l’efficacité du système.
  2. Avec GPU :
    • Accélération : Un GPU peut accélérer les calculs nécessaires pour les embeddings de texte et la génération de réponses.
    • Efficacité : Améliore la capacité à traiter des requêtes en temps réel et à gérer des corpus de données plus importants.

En résumé, bien que l’on puisse mettre en place un système RAG sans GPU, l’utilisation de ce dernier est recommandée pour des performances optimales, surtout si l’on travaille avec des modèles de langage avancés et des bases de données volumineuse.

Voici donc la vidéo de The Code Wolf qui va nous servir de base à notre démonstration :

Son programme, lui-même basé sur les données de ce GitHub, met en place un chatbot intelligent utilisant des données de Zelda, grâce à la technique RAG.

Dans cet article, je vous propose de tester son application via deux machines virtuelles Azure :

Maintenant, il nous reste plus qu’à tester tout cela 😎💪

Etape 0 – Rappel des prérequis :

Afin de mettre en place une application RAG en local, nous allons avoir besoin de :

  • Un poste local ayant un GPU puissant pouvant effectuer de la virtualisation

ou

  • Un tenant Microsoft active
  • Une souscription Azure valide

Ayant des crédits Azure, je vous propose dans ma démonstration de partir sur la seconde solution. Un petit souci vient malheureusement heurter mon raisonnement : les SKUs de machine virtuelle Azure pouvant faire de la virtualisation n’ont pas de GPU puissant.

Je vais donc créer 2 machines virtuelles Azure :

  • Machine virtuelle CPU pour Docker + tests RAG CPU
  • Machine virtuelle GPU pour tests RAG GPU

Commençons par créer la première machine virtuelle CPU.

Etape I – Préparation de la machine virtuelle CPU :

Depuis le portail Azure, commencez par rechercher le service des réseaux virtuels :

Cliquez-ici pour créer votre réseau virtuel :

Nommez ce dernier, puis lancez la validation Azure :

Une fois la validation Azure réussie, lancez la création de votre réseau virtuel :

Environ 30 secondes plus tard, la ressource Azure est créée, cliquez-ici :

Cliquez-ici pour déployer le service Azure Bastion :

N’attendez-pas la fin du déploiement d’Azure Bastion, recherchez le service des machines virtuelles :

Cliquez-ici pour créer votre machine virtuelle CPU :

Renseignez tous les champs, en prenant soin de bien sélectionner les valeurs suivantes :

Choisissez une taille de machine virtuelle présente dans la famille Dasv6 :

Renseignez un compte d’administrateur local, puis cliquez sur Suivant :

Rajoutez ou non un second disque de données, puis cliquez sur Suivant :

Retirez l’adresse IP publique pour des questions de sécurité, puis lancez la validation Azure :

Une fois la validation réussie, lancez la création des ressources Azure :

Quelques minutes plus tard, cliquez-ici pour voir votre machine virtuelle CPU :

Renseignez les identifiants renseignés lors de la création de votre VM :

Acceptez les conditions Microsoft :

Rendez-vous sur la page suivante afin de télécharger la version 9.0 de .NET :

Une fois téléchargée, lancez l’installation :

Une fois l’installation réussie, fermez l’installation :

Rendez-vous sur la page suivante afin de télécharger Visual Studio Code :

Une fois téléchargée, lancez l’installation :

Une fois l’installation réussie, redémarrez la machine virtuelle :

Quelques secondes plus tard, relancez une connexion via Azure Bastion :

Rendez-vous sur la page suivante afin de télécharger Ollama :

Une fois téléchargée, lancez l’installation :

Une fois l’installation réussie, vérifiez via l’URL suivante le bon fonctionnement du service :

http://localhost:11434/

Depuis le menu Démarrer, ouvrez l’application CMD, puis lancez la commande suivante :

ollama pull phi3:mini

Ollama télécharge alors la version mini de Phi3 d’environ 2 Go :

Lancez la seconde commande suivante :

ollama pull nomic-embed-text

Ollama télécharge alors un modèle ouvert d’environ 270 Mo :

Vérifiez la liste des modèles en place avec la commande suivante :

ollama list

Rendez-vous sur la page suivante afin de télécharger Docker en version Desktop :

Conservez ces 2 cases cochées, puis cliquez sur OK pour lancer l’installation :

Attendez quelques minutes que l’installation se termine :

Cliquez-ici pour redémarrer à nouveau la machine virtuelle CPU :

Quelques secondes plus tard, relancez une connexion via Azure Bastion :

Attendez si nécessaire la fin de l’installation de composants additionnels :

Depuis le menu Démarrer de la session Windows, ouvrez l’application Docker :

Acceptez les conditions d’utilisation de Docker :

Cliquez sur le bouton Finaliser :

Cliquez-ici :

Cliquez-ici :

Attendez le démarrage du service de virtualisation Docker :

Une fois le service correctement démarré, vous ne devriez voir pour le moment aucun conteneurs :

Depuis le menu Démarrer, ouvrez l’application CMD, puis lancez la commande suivante :

docker run -p 6333:6333 -p 6334:6334 -d --name qdrant qdrant/qdrant

Cette commande Docker permet de Qdrant, qui est une base de données vectorielle sous forme de conteneur.

Cela te permet d’utiliser Qdrant pour stocker et rechercher des vecteurs dans ton pipeline RAG :

Autorisez Docker à pouvoir passer au travers de Windows Firewall :

Retournez sur la console de Docker afin de constater le bon démarrage du conteneur :

Notre environnement de test est en place, nous allons maintenant pouvoir récupérer l’application et les données RAG.

Etape II – Chargement de la base de données vectorielle :

Ce premier programme effectue plusieurs tâches pour créer une base de données vectorielle avec Qdrant et générer des embeddings de texte à l’aide d’Ollama.

Voici un résumé des étapes :

  1. Création des clients :
    • Crée un client Qdrant pour interagir avec la base de données vectorielle.
    • Crée un client Ollama pour générer des embeddings de texte.
  2. Chargement des données :
    • Charge des enregistrements de différents fichiers JSON (lieux, boss, personnages, donjons, jeux) et les désérialise en objets ZeldaRecord.
  3. Vectorisation des données chargées :
    • Pour chaque enregistrement, génère un embedding en utilisant le client Ollama.
    • Crée une liste de structures de points (PointStruct) contenant les embeddings et les informations associées (nom et description).
  4. Insertion des données dans Qdrant :
    • Crée une collection dans Qdrant pour stocker les enregistrements vectorisés.
    • Insère les enregistrements dans la base de données Qdrant.

Téléchargez l’archive ZIP de l’application via le lien GitHub suivant, qui n’est qu’un fork du dossier original d’Alex :

Lancez l’extraction des fichiers dans un dossier local de votre choix :

Ouvrez Visual Studio Code installé précédemment, puis ouvrez le dossier créé :

Confirmez la confiance dans le dossier comme ceci :

Ouvrez le terminal de Visual Studio Code via le menu suivant :

Positionnez-vous dans le dossier populateDb, puis lancez la commande suivante :

dotnet run

Le chargement des données dans la base de données vectorielle commence :

Ouvrez le gestionnaire des tâches Windows afin constater l’utilisation du CPU pour ce traitement :

Quelques minutes plus tard, en fonction de la performance de votre machine virtuelle, le traitement se termine via le message de succès suivants :

Ouvrez la page web suivante afin de constater dans la console qdrant la création de la collection RAG, puis cliquez-ici :

http://localhost:6333/dashboard

Choisissez sur un point présent dans la liste de la collection, puis cliquez ici pour y voir plus détail :

Constatez la représentation graphique de la base de données :

Cliquez sur un des points en relation avec le premier consulté :

Cliquez à nouveau sur un des points en relation avec le second consulté :

Copiez les vecteurs d’un des points consultés :

Ouvrez Notepad pour y coller les valeurs de vecteur afin de voir comment ces derniers sont formulés :

Nos données RAG sont maintenant chargées. Nous allons maintenant pouvoir tester les prompts depuis la seconde partie de l’application.

Etape III – Lancement de prompts IA RAG :

Ce programme va nous permettre de poser des questions sur des sujets liés à Zelda et d’obtenir des réponses pertinentes en utilisant des données spécifiques grâce à la recherche vectorielle et à la génération de texte.

Avant de lancez le programme, vérifiez, et modifiez au besoin la version exacte de celle téléchargée pour phi3, puis sauvegardez vos modifications :

Positionnez-vous dans le dossier RagApp, puis lancez la commande suivante :

dotnet run

Posez une question sans rapport avec l’univers de Zelda dans un premier temps :

Posez ensuite une question en rapport avec l’univers de Zelda :

Constatez les lenteurs de réponse de l’intelligence artificielle et l’utilisation intensive du CPU :

Confirmez la durée d’utilisation du CPU en fonction de la longueur des réponses de l’IA :

Confirmez l’utilisation exclusive du CPU par la commande suivante :

ollama ps

Bien que l’utilisation d’un CPU soit possible pour certaines tâches d’IA, l’absence de GPU peut entraîner des performances réduites, des limitations dans l’utilisation de modèles avancés, une consommation accrue de ressources et des défis en termes de scalabilité.

Nous allons donc continuer les tests avec la mise en place d’une seconde machine virtuelle GPU dans Azure.

Etape IV – Préparation de la machine virtuelle GPU :

Avant de créer la machine virtuelle GPU depuis Azure, créez la règle de firewall Windows suivante sur la première machine virtuelle afin de rendre accessible qdrant :

Recherchez à nouveau le service des machines virtuelles :

Renseignez tous les champs, en prenant soin de bien sélectionner les valeurs suivantes :

Choisissez une taille de machine virtuelle présente dans la famille N :

Renseignez un compte d’administrateur local, puis cliquez sur Suivant :

Retirez l’adresse IP publique pour des questions de sécurité, puis lancez la validation Azure :

Une fois la validation réussie, lancez la création des ressources Azure :

Quelques minutes plus tard, cliquez-ici pour voir votre machine virtuelle GPU :

Renseignez les identifiants renseignés lors de la création de votre VM :

Acceptez les conditions Microsoft :

Rendez-vous sur la page suivante afin de télécharger la version 9.0 de .NET :

Une fois téléchargée, lancez l’installation :

Rendez-vous sur la page suivante afin de télécharger Visual Studio Code :

Une fois téléchargée, lancez l’installation :

Une fois l’installation réussie, redémarrez la machine virtuelle :

Quelques secondes plus tard, relancez une connexion via Azure Bastion :

Sur cette page, téléchargez le pilote NVIDIA GRID :

Confirmez le dossier de décompression au niveau local :

Attendez environ 30 secondes que la décompression se termine :

Après une rapide vérification système, cliquez sur Accepter et Continuer :

Cliquez sur Suivant :

Une fois l’installation terminée avec succès, cliquez sur Fermer :

Ouvrez le Gestionnaire des tâches Windows afin de constater l’apparition d’une section GPU :

Rendez-vous sur la page suivante afin de télécharger Ollama :

Une fois téléchargée, lancez l’installation :

Une fois l’installation réussie, vérifiez via l’URL suivante le bon fonctionnement du service :

http://localhost:11434/

Depuis le menu Démarrer, ouvrez l’application CMD, puis lancez la commande suivante :

ollama pull phi3:mini

Ollama télécharge alors la version mini de Phi3 d’environ 2 Go :

Lancez la seconde commande suivante :

ollama pull nomic-embed-text

Ollama télécharge alors un modèle ouvert d’environ 270 Mo :

Vérifiez la liste des modèles en place avec la commande suivante :

ollama list

Vérifiez le bon accès à qdrant situé lui sur la machine virtuelle CPU :

Téléchargez à nouveau l’archive ZIP de l’application via le lien GitHub suivant, qui n’est qu’un fork du dossier original d’Alex :

Lancez l’extraction des fichiers dans un dossier local de votre choix :

Etape V – Chargement de la base de données vectorielle :

Ouvrez Visual Studio Code, ouvrez le dossier créé, puis indiquez l’IP locale de la machine virtuelle CPU :

Modifiez également 2 fois le nom de la nouvelle collection créée sur la machine virtuelle GPU, puis Sauvegardez :

Positionnez-vous dans le dossier populateDb, puis lancez la commande suivante :

dotnet run

Ouvrez le Gestionnaire des tâches Windows afin constater l’utilisation plus efficace du GPU pour ce traitement de chargement :

Ouvrez la page web suivante afin de constater dans qdrant la création de la seconde collection RAG, puis cliquez-ici :

http://10.0.0.4:6333/dashboard

Etape VI – Lancement de prompts IA RAG :

Avant de lancez le second programme, vérifiez, et modifiez au besoin l’adresse IP, la version de phi3, la collection utilisée, puis Sauvegardez vos modifications :

Positionnez-vous dans le dossier RagApp, lancez la commande suivante, puis posez une question en rapport avec l’univers de Zelda :

dotnet run

Constatez la pleine puissance GPU pour le traitement :

Constatez la rapidité du texte généré par l’IA :

Confirmez l’utilisation du GPU par la commande suivante :

ollama ps

Conclusion

En conclusion, la mise en place d’une IA RAG (Retrieval-Augmented Generation) sur votre propre PC est un processus réalisable, même sans GPU.

Cependant, l’utilisation d’un GPU est fortement recommandée pour améliorer les performances, surtout pour les tâches de génération de texte et de traitement de grandes quantités de données.

Maintenant, il ne reste plus qu’à tester et affiner votre application et vos données pour obtenir des résultats RAG parfait😎

Promptez votre base de données SQL !

En combinant les capacités de l’IA et des bases de données SQL, vous pouvez optimiser l’utilisation des ressources informatiques et humaines. Les utilisateurs peuvent obtenir des informations pertinentes plus rapidement et plus facilement, améliorant ainsi leur expérience globale. Enfin, l’intégration de l’IA permet d’explorer de nouvelles façons d’utiliser les données pour innover et rester compétitif.

Pourquoi établir une communication DB -> IA ?

Mettre en place une connexion entre une application, une base de données et un modèle d’IA présente plusieurs avantages :

Automatisation et Efficacité

  • Automatisation des tâches répétitives : L’IA peut automatiser des requêtes complexes et des analyses de données, réduisant ainsi le temps et les efforts nécessaires pour obtenir des informations pertinentes.
  • Réponses rapides et précises : En utilisant l’IA pour interroger la base de données, vous pouvez obtenir des réponses rapides et précises à des questions spécifiques sans avoir à écrire des requêtes SQL complexes.

Amélioration de la Prise de Décision

  • Analyses avancées : L’IA peut analyser de grandes quantités de données et identifier des tendances ou des anomalies que les humains pourraient manquer.
  • Prédictions et recommandations : Les modèles d’IA peuvent fournir des prédictions basées sur les données historiques et offrir des recommandations pour des actions futures.

Accessibilité et Utilisabilité

  • Interface utilisateur simplifiée : Les utilisateurs peuvent interagir avec la base de données via des prompts en langage naturel, rendant l’accès aux données plus intuitif et accessible même pour ceux qui ne maîtrisent pas le langage de base de données.
  • Support multilingue : Azure OpenAI peut comprendre et répondre dans plusieurs langues, ce qui est utile pour les entreprises internationales.

Sécurité et Conformité

  • Contrôle d’accès : Vous pouvez définir des niveaux d’accès pour différents utilisateurs, garantissant que seules les personnes autorisées peuvent interroger certaines parties de la base de données.
  • Surveillance et audit : Les interactions avec la base de données peuvent être surveillées et auditées pour assurer la conformité avec les régulations et les politiques internes.

Flexibilité et Évolutivité

  • Scalabilité : Azure offre des solutions évolutives qui peuvent gérer des volumes de données croissants sans compromettre les performances.
  • Intégration facile : Les services Azure sont conçus pour s’intégrer facilement avec d’autres outils et plateformes, facilitant ainsi l’expansion et l’adaptation aux besoins changeants de l’entreprise.

Mais comment y parvenir ?

Bien que la mise en place de cette interface puisse sembler complexe, elle est tout à fait réalisable avec une planification adéquate et les bonnes compétences.

Si vous avez une équipe technique compétente ou si vous pouvez faire appel à des experts, cela facilitera grandement le processus.

Configuration de la Base de Données

  • Création et gestion de la base de données : Assurez-vous que votre base de données est bien structurée et optimisée pour les requêtes que vous souhaitez exécuter.
  • Sécurité et accès : Configurez les permissions et les accès pour garantir la sécurité des données.

Intégration de l’Application

  • Développement de l’application : Utilisez un langage de programmation compatible (comme Python, C#, etc.) pour développer l’application qui interagira avec la base de données et l’IA.
  • API et connecteurs : Utilisez des API et des connecteurs pour permettre à l’application de communiquer avec la base de données SQL et les services Azure.

Configuration du Modèle d’IA

  • Choix du modèle : Sélectionnez le modèle d’IA approprié sur Azure OpenAI en fonction de vos besoins (par exemple, GPT-4).
  • Entraînement et ajustement : Si nécessaire, entraînez le modèle avec des données spécifiques à votre domaine pour améliorer sa précision.

Développement de l’Interface Utilisateur

  • Interface utilisateur : Créez une interface utilisateur intuitive qui permet aux utilisateurs de saisir des prompts en langage naturel.
  • Traitement des requêtes : Développez des mécanismes pour convertir les prompts en requêtes SQL et pour afficher les résultats de manière compréhensible.

Considérations Techniques

  • Compétences requises : Vous aurez besoin de compétences en développement logiciel, en gestion de bases de données et en IA.
  • Ressources : Assurez-vous d’avoir les ressources nécessaires, y compris le temps, le budget et l’infrastructure.
  • Maintenance : Préparez-vous à effectuer une maintenance régulière pour assurer la sécurité et la performance de l’application.

Outils et Services Utiles disponibles sur Azure

  • Azure SQL Database : Pour la gestion de la base de données.
  • Azure OpenAI Service : Pour l’intégration du modèle d’IA.

Maintenant, il nous reste plus qu’à tester tout cela 😎💪

Etape 0 – Rappel des prérequis :

Afin de tester la mise en place d’une application entre Azure OpenIA et une base de données Azure SQL, nous allons avoir besoin de :

Etape I – Préparation du poste local :

Installez Visual Studio Code ou un éditeur de code similaire :

Téléchargez puis installez la version 6.0 de .NET, disponible via ce lien officiel :

Téléchargez et installez SQL Server Management Studio (SSMS) depuis cette page :

Afin de publier les 2 applications sur une URL publique, téléchargez ngrok, puis inscrivez-vous chez eux avec un compte gratuit :

Sur leur site, téléchargez l’installateur de ngrok :

Copiez la commande suivante affichée sous l’installateur pour configurer votre ngrok :

Depuis le dossier de téléchargement, ouvrez une invite de commande, puis lancez celle-ci afin de préparer votre configuration ngrok :

Le poste local est maintenant correctement configuré, la prochaine étape consiste à créer une base de données SQL avec de la données fictives sur notre souscription Azure.

Etape II – Création de la base de données Azure SQL :

Pour cela, rendez-vous sur la page du portail Azure afin de rechercher le service Azure SQL Database :

Cliquez-ici pour créer votre base de données SQL :

Nommez votre base de données Azure SQL, puis cliquez-ici pour créer une serveur de base de données Azure pour héberger notre base :

Nommez votre serveur Azure SQL, choisissez sa région, puis renseignez des identifiants SQL pour simplifier notre test :

Conservez votre environnement en Développement, réduisez la redondance de votre base de données SQL, puis cliquez sur Suivant :

Conservez les caractéristiques réseaux d’origine, puis cliquez sur Suivant :

Conservez les caractéristiques de sécurités d’origine, puis cliquez sur Suivant :

Ne configurez pas de source de données particulière, puis lancez la validation Azure :

Une fois la validation Azure réussie, lancez la création des ressources Azure :

Attendez environ 5 minutes, puis cliquez-ici pour accéder à votre base de données Azure SQL :

Copiez les informations de connexion à votre base de données SQL, celles-ci seront nécessaire par la suite :

Retournez sur la page principale de votre base de données SQL, puis cliquez sur votre serveur Azure SQL :

Dans la section réseau, activez l’option suivante, puis rajoutez votre adresse IP publique en exception Firewall afin de pouvoir connecter votre poste à la base de données SQL, puis cliquez sur Sauvegarder :

Rendez-vous sur la page GitHub suivante afin de récupérer le script de chargement d’une base de données SQL (Northwind) en exemple, puis cliquez-ici :

Téléchargez le script de chargement en cliquant sur le bouton suivant :

Une fois le script téléchargé, ouvrez SQL Server Management Studio sur votre poste :

Renseignez les informations reprises sur votre serveur Azure SQL créé précédemment, puis cliquez sur Connecter :

Cliquez-ici pour rechercher votre script SQL téléchargé précédemment :

Choisissez le script SQL, puis cliquez sur Ouvrir :

Une fois le script affiché dans une nouvelle fenêtre, cliquez sur Exécuter pour démarrer ce dernier :

Attendez environ 30 secondes que celui-ci se termine avec le message suivant :

Contrôlez dans la base de données Azure SQL créés en premier que les différentes tables sont présentes et que des données y sont stockées :

Nos données sont maintenant stockées dans notre base Azure SQL. Nous pouvoir maintenant mettre en place notre LLM grâce au service Azure OpenAI.

Etape III – Création du modèle Azure OpenAI :

Pour cela, retournez sur la page du portail Azure afin de rechercher le service Azure OpenAI :

Cliquez-ici pour créer votre service Azure Open AI ;

Renseignez les informations de base de ce dernier, puis cliquez sur Suivant :

Conservez les caractéristiques réseaux d’origine, puis cliquez sur Suivant :

Ajoutez au besoin des étiquettes, puis cliquez sur Suivant :

Une fois la validation Azure réussie, lancez la création des ressources Azure :

Attendez environ 1 minutes puis cliquez-ici pour accéder à votre service Azure OpenAI :

Copiez les 2 informations suivantes pour ouvrir un accès auprès de votre service Azure OpenAI :

Cliquez-ici pour ouvrir le portail Azure OpenAI Studio :

Cliquez-ici pour déployer un nouveau model :

Choisissez le type gpt-4, puis cliquez sur Confirmer :

Nommez votre déploiement, définissez une limite de tokens par minute qui convient, puis cliquez sur Déployer :

Attendez environ 1 minute le temps de déploiement de votre modèle :

L’infrastructure sur Azure est maintenant en place. Il nous nous reste qu’à configurer les applications web sur notre poste afin que celle-ci travaille avec le schéma de votre base de données et votre modèle AI.

Commençons par la version 1 proposée par Alex Wolf.

Etape IV – Configuration de l’application v1 :

Voici un lien vers son excellente vidéo présentant l’application v1, sa configuration, son code ainsi qu’une comparaison intéressante faite avec les services Search basés sur l’IA :

Rendez-vous sur un fork de la page GitHub d’Alex Wolf afin de télécharger l’application v1 sous format ZIP :

Un fois l’archive ZIP téléchargée, décompressez celle-ci dans le dossier local de votre choix :

Ouvrez votre éditeur de code local, puis cliquez-ici pour ouvrir le dossier de l’application v1 :

Ouvrez le dossier correspondant au dossier suivant :

Dans le dossier SchemaLoader\SchemaLoader ouvrez le fichier Program.cs, puis renseignez la connexion à votre base de données Azure SQL copiée précédemment :

N’oubliez pas de de modifier le mot de passe de votre compte SQL, puis sauvegardez :

Ouvrez une première fenêtre Windows Terminal, positionnez-vous dans le dossier suivant, puis saisissez la commande ci-dessous :

dotnet build ".\SchemaLoader.csproj" -c Debug -o .\bin\Debug\net6.

Une fois la compilation terminée, démarrez votre application via la commande ci-dessous :

dotnet run

Une fois l’application démarrée, copiez le texte généré par celle-ci et contenant le schéma de votre base de données Azure SQL :

Retournez sur votre éditeur de code, puis allez dans le dossier dbchatui, ouvrez le fichier DataService.cs, renseignez à nouveau la connexion à votre base de données Azure SQL, puis sauvegardez le fichier :

Allez dans le dossier dbchatui\Pages, ouvrez le fichier Index.cshtml.cs, copiez le schéma de votre base de données Azure SQL :

Cela donne la présentation suivante :

Toujours dans le fichier Index.cshtml.cs, renseignez les 3 informations suivantes pour connecter votre application à votre modèle Azure OpenAI, puis sauvegardez :

Rouvrez la fenêtre Windows Terminal, positionnez-vous dans le dossier suivant, puis saisissez la commande ci-dessous :

dotnet build ".\YourOwnData.csproj" -c Debug -o .\bin\Debug\net6.

Une fois la compilation terminée, démarrez votre application via la commande ci-dessous :

dotnet run

Votre application v1 est maintenant démarrée. Copiez le numéro du port local ouvert pour cette application :

Ouvrez une seconde fenêtre Windows Terminal, puis saisissez la commande suivante afin d’exposer votre application locale au travers de ngrok :

Copiez l’URL publique générée par ngrok ci-dessous :

Tout l’environnement de test est maintenant en place, il nous reste qu’à tester le fonctionnement de l’application v1. Ouvrez un navigateur web, collez l’URL ngrok précédemment copiée, puis confirmez la navigation en cliquant ici :

Commencez par tester une requête SQL simple en promptant une question basique :

L’application vous retourne d’abord sa compréhension de votre demande, et la transpose en une requête SQL correspondante :

Juste en dessous est affiché les enregistrement correspondants au résultat de la requête exécutée sur votre serveur de base de données Azure SQL :

Continuez en testant des prompts incluant des filtres, des classements, … :

Continuez en testant des prompts incluant des relations de tables et des filtres basés sur un raisonnement :

Tous ces prompts nous montrent l’immense potentiel de pouvoir prompter une IA qui a une connaissance du schéma de toute la base de données source, sans pour autant avoir la données en elles-mêmes.

Etape V – Configuration de l’application v2 :

Il existe une nouvelle application toujours développée par Alex Wolf dont la vidéo est juste là :

Le principe est le même, rendez-vous sur un fork de la page GitHub d’Alex Wolf afin de télécharger l’application v2 sous format ZIP :

Un fois l’archive ZIP téléchargée, décompressez celle-ci dans le dossier local de votre choix :

Ouvrez votre éditeur de code local, cliquez-ici pour ouvrir le dossier de l’application v2, renseignez les 3 informations suivantes pour connecter votre application à votre modèle Azure OpenAI, puis sauvegardez :

Ouvrez une première fenêtre Windows Terminal, positionnez-vous dans le dossier suivant, puis saisissez la commande ci-dessous :

dotnet build ".\DBChatPro.csproj" -c Debug -o .\bin\Debug\net6.

Une fois la compilation terminée, démarrez votre application via la commande ci-dessous :

dotnet run

Votre application v2 est maintenant démarrée. Copiez le numéro du port local ouvert pour cette application :

Ouvrez une seconde fenêtre Windows Terminal, puis saisissez la commande suivante afin d’exposer votre application locale au travers de ngrok :

Copiez l’URL publique générée par ngrok ci-dessous :

Tout l’environnement de test est maintenant en place, il nous reste qu’à tester le fonctionnement de l’application v1. Ouvrez un navigateur web, collez l’URL ngrok précédemment copiée, puis confirmez la navigation en cliquant ici :

Renseignez la connexion à votre base de données Azure SQL copiée précédemment, puis cliquez-ici pour le schéma :

Cliquez sur Sauvegarder :

La connexion apparaît alors dans la liste des connexions existantes :

Retournez sur le premier onglet, puis commencez par tester une requête SQL simple en promptant une question basique :

L’application v2 vous retourne les enregistrement correspondants au résultat de la requête exécutée sur votre serveur de base de données Azure SQL :

Le second onglet affiche une requête SQL correspondante :

Le troisième onglet vous retourne la compréhension de votre demande comprise par le modèle IA :

Un historique des précédentes prompts est également disponible :

Il également possible de mettre des prompts en favoris :

Conclusion

En conclusion, l’utilisation de prompts pour interagir avec les bases de données représente une avancée importante, simplifiant l’accès aux informations et permettant une utilisation plus intuitive de SQL.

En expérimentant avec cette méthode, les utilisateurs peuvent améliorer leur efficacité et mieux exploiter leurs données.

Avec l’évolution rapide de ces technologies, maîtriser le langage des prompts pourrait devenir une compétence clé pour les professionnels de la donnée, ouvrant la voie à de nouvelles façons de gérer et analyser des volumes d’informations toujours croissants.