Gabarit de pilote de cas d'usage IA — Pilier 5

Pour qui : la personne qui pilote un cas d'usage (souvent l'employé qui a proposé l'intake) Niveau minimum recommandé : niveau 3 du pilier Cas d'usage Temps de complétion : 45 min au lancement ; 15 min/check-point hebdo ; 45 min en clôture

Pourquoi ce gabarit existe

Sauter l'étape pilote (« c'est évident, généralisons ») est l'erreur la plus coûteuse du pilier 5. Même les cas évidents ont des aspects qui apparaissent en usage réel : qui maintient le prompt ? que fait-on quand l'outil hallucine ? Un pilote de 4-6 semaines avec 2-3 personnes coûte peu et apprend beaucoup.

Le contenu du gabarit

À copier-coller au lancement. Tient sur 1-2 pages. Décision finale via criteres-scaling-vs-kill.md.


Pilote — [Nom court du cas d'usage] — [Nom de l'organisation]

Date de lancement : ______________________ Date de clôture prévue : ______________________ Durée : [4 / 6 / 8 semaines] Personne-référence IA : ______________________ Pilote leader : ______________________ Fonction : ______________________


1. Cas d'usage

Item Description
Tâche augmentée (rappel intake)
Outil IA utilisé
Famille (A/B/C)
Catégorie de données
Valeur ajoutée humaine qui reste

2. Participants au pilote

Volontariat obligatoire. Aucun employé n'est obligé de participer. Droit de non-adoption (voir templates/07-conduite-changement/cadre-resistance-droit-non-adoption.md) : retrait possible en cours de route, sans justification, décision documentée.

Personne Fonction Volontaire confirmé ?
Oui / Non
Oui / Non
Oui / Non

Recommandation : 2-3 personnes en PME 10-30 ; 3-5 en PME 30-75. Au-delà, c'est un déploiement.


3. Métriques avant / après

3-4 métriques maximum. Plus = on ne mesure rien sérieusement.

Métrique Méthode Baseline Cible pilote Mesure réelle (fin)
Temps par occurrence Auto-déclaration
Qualité (auto-évaluée 1-5) Sondage en fin de chaque occurrence
Satisfaction d'usage (1-5) Sondage fin de pilote n/a ≥ 3,5/5
Incidents (hallucinations majeures, erreurs livrées) Journal n/a ≤ 1 grave

4. Critères de succès

À définir au lancement, jamais en cours de route.

  • Critère 1 (quantitatif) : ex. « gain ≥ 30 % par occurrence sur les 6 dernières »
  • Critère 2 (qualitatif) : ex. « ≥ 2 participants sur 3 veulent continuer »
  • Critère 3 (sécurité) : ex. « aucun incident grave »

3 critères remplis → candidat scale (criteres-scaling-vs-kill.md). 1-2 critères remplis → candidat ajustement (re-pilote 4 semaines). 0 critère rempli → kill (arrêt documenté).


5. Critères d'arrêt en cours

Le pilote s'arrête immédiatement si :

  • Incident grave (fuite cat. 3-4 en outil non-conforme, hallucination majeure livrée à un destinataire externe)
  • Plus de 50 % des participants se retirent
  • Évolution réglementaire/contractuelle rend le pilote non conforme

6. Check-points hebdomadaires

15 min/semaine entre la personne-référence et le pilote leader.

Semaine Date Observations Ajustements Risques émergents
1
2
3
4
5
6

7. Journal d'incidents (le cas échéant)

Date Description Gravité (1-3) Action Apprentissage

8. Mention financement public (le cas échéant)

Si votre pilote dépasse 5-10 k$ (outil payant, accompagnement, infrastructure), regardez les programmes québécois :

Couverture possible 30-50 % d'un pilote ambitieux. Pas obligatoire.


9. Clôture du pilote

Item Réponse
Date effective de clôture
Décision finale (scale / ajuster / kill)
Critère décisif (criteres-scaling-vs-kill.md)
Apprentissages clés (3 max) • • •
Documentation archivée où ?

Comment l'utiliser

  • Au lancement : personne-référence + pilote leader remplissent sections 1-5. Validé par la direction (5 min).
  • Annonce à l'équipe : factuelle en réunion (« on pilote ceci pendant 6 semaines, voici les participants volontaires, voici l'objectif »). Voir templates/07-conduite-changement/plan-communication-interne.md.
  • Check-points hebdo : 15 min en personne ou visio. Le pilote leader remplit la ligne.
  • En cas d'incident : action immédiate (cesser, signaler), puis documentation. Post-mortem sans blâme.
  • À la clôture : 45 min pour décision finale via critères 3 et criteres-scaling-vs-kill.md. Présenté à la revue trimestrielle.

Exemple ancré — Aliments Lebel (manufacturier agroalimentaire, 28 personnes). Pilote sur « génération du premier brouillon des réponses aux audits qualité trimestriels de la principale chaîne retail ». Volontaires : Caroline (présidente) et Geneviève (responsable qualité, championne). Durée 6 semaines. Outil : Copilot M365 (famille B). Données : cat. 3 — Confidentielle (statistiques agrégées, sans nom client retail dans le prompt). Cibles : gain ≥ 30 % (baseline 12 h/réponse → ≤ 8 h) ; qualité ≥ 4/5 ; 0 incident grave. Check-points le mardi (15 min). Semaine 3 : incident mineur — référence HACCP incorrecte dans le brouillon, repérée à la relecture (pas livré). Apprentissage : ajout « vérification systématique des références réglementaires source » à la bibliothèque. Clôture après 6 semaines : 7 h (-42 %), qualité 4,5/5, 1 incident mineur sans conséquence. Décision : scale — voir criteres-scaling-vs-kill.md.

Quand revisiter

Pas vivant après clôture — archivé pour mémoire. Si scale, le gabarit sert de base à la bascule en production.

Ressources liées

  • intake-idee-cas-usage.md
  • grille-priorisation.md
  • criteres-scaling-vs-kill.md
  • templates/02-classification-donnees/grille-classification.md
  • templates/02-classification-donnees/regles-usage-ia-par-niveau.md
  • templates/07-conduite-changement/cadre-resistance-droit-non-adoption.md
  • templates/07-conduite-changement/plan-communication-interne.md
  • templates/06-mesure-evolution/kpis-minimaux.md
  • framework.md section 2.1 — verrou tâche vs poste