Projects
Enterprise AgentApril 21, 2026

OpsBot - Operational AI Assistant

Operational AI assistant for maintenance, safety, and compliance questions in Google Chat. Built with governed-source RAG, Gemini, Vertex AI RAG Engine, Cloud Run, Cloud SQL, MLflow, Terraform, safe fallback, and evaluation traces. ROI hypothesis: 85% first-line resolution target, 14,500+ hours/year reallocated, ~€540k productivity reallocation.

Overview

OpsBot is an operational AI assistant for maintenance, safety, compliance, and day-to-day operating procedures in Google Chat. The product brings governed knowledge directly into the chat interface employees already use, with source-backed answers and safe fallback behavior when evidence is weak. My role: led product and technical delivery, from scope and source governance to RAG architecture, Google Chat integration, evaluation traces, runtime observability, and deployment.
OpsBot est un assistant IA opérationnel pour les procédures de maintenance, sécurité, conformité et exploitation quotidienne dans Google Chat. Le produit amène la connaissance gouvernée directement dans l’interface de chat déjà utilisée par les collaborateurs, avec des réponses sourcées et un fallback sécurisé quand les preuves sont faibles. Mon rôle : pilotage produit et delivery technique, du cadrage et de la gouvernance des sources jusqu’à l’architecture RAG, l’intégration Google Chat, les traces d’évaluation, l’observabilité runtime et le déploiement.

Business Impact

MetricValue
Target population3,972+ collaborators across store and support roles
Knowledge demand~12,000 monthly views on the operating knowledge base
Instant resolution target85% of first-line questions answered immediately
Time reallocated14,500+ hours/year across stores and regional support
ROI hypothesis~€540k in productivity reallocation
The ROI is framed as a hypothesis / target until production impact is fully measured. The value is a faster and safer operating loop: fewer repetitive questions, less time lost searching for the right procedure, and higher trust because answers remain grounded in approved sources.
IndicateurValeur
Population cible3 972+ collaborateurs sur des rôles magasin et support
Demande de connaissance~12 000 vues mensuelles sur la base documentaire exploitation
Objectif de résolution instantanée85% des questions de premier niveau traitées immédiatement
Temps réalloué14 500+ heures/an entre magasins et support régional
Hypothèse ROI~540 k€ de productivité réallouée
Le ROI est présenté comme hypothèse / cible jusqu’à mesure complète de l’impact en production. La valeur est une boucle opérationnelle plus rapide et plus sûre : moins de questions répétitives, moins de temps perdu à chercher la bonne procédure, et plus de confiance parce que les réponses restent ancrées dans des sources validées.

Product Design

What the assistant answers

  • Maintenance procedures and troubleshooting steps
  • Safety processes, checklists, and crisis guidance
  • Compliance questions and operating standards
  • FAQ-style operational questions from the approved corpus

What makes it usable in the field

  • Google Chat-first UX instead of yet another separate tool
  • Grounded retrieval so answers come from approved sources instead of freeform guessing
  • Safe fallback behavior when evidence is too weak
  • Guardrails for banned or out-of-scope topics
  • Incremental source sync so the corpus can stay fresh as documents evolve

Ce que l'assistant traite

  • Procédures de maintenance et dépannage
  • Process sécurité, checklists et gestion de crise
  • Questions de conformité et standards opérationnels
  • Questions FAQ issues du corpus approuvé

Ce qui le rend utile sur le terrain

  • Expérience Google Chat-first au lieu d'un outil séparé de plus
  • Retrieval fondé sur les sources pour éviter les réponses inventées
  • Fallback sûr quand la preuve est insuffisante
  • Guardrails pour les sujets interdits ou hors périmètre
  • Sync incrémentale pour garder un corpus frais quand les documents évoluent

Technical Architecture

The runtime keeps the DAISI-style operational discipline, but simplifies the product into a focused single-assistant RAG flow rather than a broader multi-agent setup.

Core runtime

  • FastAPI for the webhook runtime
  • Cloud Run for the serving layer
  • Google Chat as the user channel
  • Gemini for answer generation
  • Vertex AI RAG Engine for grounded retrieval
  • Cloud SQL PostgreSQL for conversation memory and checkpoint state

Source layer

  • Google Docs
  • Google Sheets
  • Google Drive exports
  • PDFs
  • Approved web pages

Platform operations

  • Terraform for infrastructure delivery
  • Cloud Run Jobs + Scheduler for background workloads
  • MLflow for traces, evaluations, and feedback analysis
  • Structured source registry to define what enters the corpus and how it is synced
Le runtime reprend la discipline opérationnelle de DAISI, mais simplifie le produit autour d'un flux RAG mono-assistant plutôt qu'un setup multi-agents plus large.

Runtime principal

  • FastAPI pour le runtime webhook
  • Cloud Run pour la couche de service
  • Google Chat comme canal utilisateur
  • Gemini pour la génération de réponse
  • Vertex AI RAG Engine pour le retrieval fondé
  • Cloud SQL PostgreSQL pour la mémoire conversationnelle et l'état checkpointé

Couche sources

  • Google Docs
  • Google Sheets
  • Exports Google Drive
  • PDFs
  • Pages web approuvées

Opérations plateforme

  • Terraform pour la livraison infra
  • Cloud Run Jobs + Scheduler pour les workloads de fond
  • MLflow pour les traces, évaluations et analyses feedback
  • Source registry structuré pour définir ce qui entre dans le corpus et comment la sync fonctionne

Architecture diagrams

The page splits the architecture into three readable views: the system map, the request flow, and the source sync loop.

System architecture

This view keeps the core responsibilities separate: Google Chat for the user channel, Cloud Run and FastAPI for the webhook runtime, Gemini and Vertex AI RAG Engine for grounded answering, governed documents for the corpus, and Cloud SQL / MLflow / scheduled jobs for operations.

Request flow

A user asks in Google Chat. The webhook normalizes the event, applies policy checks, retrieves evidence from the approved corpus, generates a grounded answer, persists useful state, logs the trace, and replies in the same chat thread. If evidence is weak, the assistant falls back instead of inventing a procedure.

Source sync loop

The source registry controls what can enter the corpus. Scheduled jobs export documents, parse and normalize content, enrich chunks with metadata, refresh the Vertex AI RAG corpus, and feed quality issues back to the source owners.
La page sépare l'architecture en trois vues lisibles : la carte système, le flux de requête et la boucle de synchronisation des sources.

Architecture système

Cette vue sépare les responsabilités : Google Chat pour le canal utilisateur, Cloud Run et FastAPI pour le runtime webhook, Gemini et Vertex AI RAG Engine pour les réponses fondées sur les sources, les documents gouvernés pour le corpus, puis Cloud SQL / MLflow / jobs planifiés pour l'exploitation.

Flux de requête

Un utilisateur pose une question dans Google Chat. Le webhook normalise l'événement, applique les règles de réponse, récupère les preuves dans le corpus approuvé, génère une réponse fondée, persiste l'état utile, journalise la trace, puis répond dans le même fil. Si les preuves sont faibles, l'assistant se met en repli au lieu d'inventer une procédure.

Boucle de synchronisation des sources

Le registre des sources contrôle ce qui peut entrer dans le corpus. Des jobs planifiés exportent les documents, analysent et normalisent le contenu, enrichissent les chunks avec des métadonnées, rafraîchissent le corpus Vertex AI RAG, puis remontent les problèmes de qualité aux propriétaires des sources.

Stack

CategoryTechnologies
LLM / RAGGemini, Vertex AI RAG Engine
BackendPython 3.11, FastAPI, Pydantic
MemoryCloud SQL PostgreSQL
CloudGCP, Cloud Run, Cloud Run Jobs, Cloud Scheduler, GCS
Knowledge sourcesGoogle Docs, Google Sheets, Google Drive, PDFs, approved web pages
ObservabilityMLflow, structured tracing, feedback evaluation
InfrastructureTerraform, Docker
QualityPytest, Ruff, Mypy, CI automation
CatégorieTechnologies
LLM / RAGGemini, Vertex AI RAG Engine
BackendPython 3.11, FastAPI, Pydantic
MémoireCloud SQL PostgreSQL
CloudGCP, Cloud Run, Cloud Run Jobs, Cloud Scheduler, GCS
Sources de connaissanceGoogle Docs, Google Sheets, Google Drive, PDFs, pages web approuvées
ObservabilitéMLflow, traces structurées, évaluation du feedback
InfrastructureTerraform, Docker
QualitéPytest, Ruff, Mypy, CI automation

Delivery Scope

Lot 1 focus

  • Maintenance workflows
  • Safety procedures
  • Compliance and regulatory operational content

Hard constraints that shaped the MVP

  • Keep the assistant simple and governed in V1
  • Prefer direct ingestion from Google Workspace sources over unnecessary live integrations
  • Exclude sensitive documents from the corpus instead of overbuilding permission logic too early
  • Treat the document pipeline as a first-class problem: parsing quality, OCR, metadata, chunking, and sync matter as much as the prompt layer

Focus lot 1

  • Workflows maintenance
  • Procédures sécurité
  • Contenus conformité et réglementation opérationnelle

Contraintes fortes qui ont structuré le MVP

  • Garder l'assistant simple et gouverné en V1
  • Préférer l'ingestion directe depuis Google Workspace aux intégrations live inutiles
  • Exclure du corpus les documents trop sensibles au lieu de surconstruire la logique de permissions trop tôt
  • Traiter la chaîne documentaire comme un vrai sujet produit : qualité du parsing, OCR, métadonnées, chunking et sync comptent autant que la couche prompt

Why this project matters

OpsBot earns trust by being useful, grounded, and operationally maintainable. The interesting part is not only the model choice — it is the combination of governed content, safe answer behavior, runtime observability, and delivery discipline that makes the assistant viable beyond a prototype.
OpsBot fait partie des projets IA qui gagnent la confiance de manière sobre : en étant utiles, fondés et opérables dans la durée. Le point intéressant n'est pas seulement le choix du modèle — c'est la combinaison contenu gouverné, comportement de réponse sûr, observabilité runtime, et discipline de delivery qui rend l'assistant crédible au-delà du prototype.