Projects
GenAIApril 21, 2026

OpsBot - Operational AI Assistant

Grounded operational AI assistant for maintenance, safety, and compliance questions in Google Chat. Built with FastAPI, Gemini 2.5 Flash, Vertex AI RAG Engine, Cloud Run, Cloud SQL, MLflow, and Terraform.

Overview

OpsBot is a grounded operational assistant designed for store and field teams who need reliable answers about maintenance, safety, compliance, and day-to-day operating procedures. Instead of forcing people to search across fragmented documents, the assistant brings the knowledge base directly into Google Chat. The product is intentionally simple where that matters: one chat entry point, governed retrieval, source-backed answers, and clear fallback behavior when evidence is weak or a topic should not be answered.
OpsBot est un assistant opérationnel fondé sur les sources conçu pour les équipes magasin et terrain qui ont besoin de réponses fiables sur la maintenance, la sécurité, la conformité et les procédures d'exploitation du quotidien. Au lieu de forcer les équipes à naviguer entre des documents fragmentés, l'assistant amène la base de connaissance directement dans Google Chat. Le produit reste volontairement simple là où c'est important : un point d'entrée conversationnel, un retrieval gouverné, des réponses appuyées sur les sources, et un comportement de repli clair quand la preuve est trop faible ou qu'un sujet ne doit pas être traité.

Business Impact

MetricValue
Target population3,972+ collaborators across store and support roles
Knowledge demand~12,000 monthly views on the operating knowledge base
Instant resolution target85% of first-line questions answered immediately
Time reallocated14,500+ hours/year across stores and regional support
ROI hypothesis~€540k in productivity reallocation
The real value is not a flashy chatbot demo. It is a faster and safer operating loop: fewer repetitive questions, less time lost searching for the right document, and better trust because answers stay grounded in approved sources.
IndicateurValeur
Population cible3 972+ collaborateurs sur des rôles magasin et support
Demande de connaissance~12 000 vues mensuelles sur la base documentaire exploitation
Objectif de résolution instantanée85% des questions de premier niveau traitées immédiatement
Temps réalloué14 500+ heures/an entre magasins et support régional
Hypothèse ROI~540 k€ de productivité réallouée
La vraie valeur n'est pas une démo de chatbot spectaculaire. C'est une boucle opérationnelle plus rapide et plus sûre : moins de questions répétitives, moins de temps perdu à chercher le bon document, et plus de confiance parce que les réponses restent ancrées dans des sources validées.

Product Design

What the assistant answers

  • Maintenance procedures and troubleshooting steps
  • Safety processes, checklists, and crisis guidance
  • Compliance questions and operating standards
  • FAQ-style operational questions from the approved corpus

What makes it usable in the field

  • Google Chat-first UX instead of yet another separate tool
  • Grounded retrieval so answers come from approved sources instead of freeform guessing
  • Safe fallback behavior when evidence is too weak
  • Guardrails for banned or out-of-scope topics
  • Incremental source sync so the corpus can stay fresh as documents evolve

Ce que l'assistant traite

  • Procédures de maintenance et dépannage
  • Process sécurité, checklists et gestion de crise
  • Questions de conformité et standards opérationnels
  • Questions FAQ issues du corpus approuvé

Ce qui le rend utile sur le terrain

  • Expérience Google Chat-first au lieu d'un outil séparé de plus
  • Retrieval fondé sur les sources pour éviter les réponses inventées
  • Fallback sûr quand la preuve est insuffisante
  • Guardrails pour les sujets interdits ou hors périmètre
  • Sync incrémentale pour garder un corpus frais quand les documents évoluent

Technical Architecture

The runtime keeps the DAISI-style operational discipline, but simplifies the product into a focused single-assistant RAG flow rather than a broader multi-agent setup.

Core runtime

  • FastAPI for the webhook runtime
  • Cloud Run for the serving layer
  • Google Chat as the user channel
  • Gemini 2.5 Flash for answer generation
  • Vertex AI RAG Engine for grounded retrieval
  • Cloud SQL PostgreSQL for conversation memory and checkpoint state

Source layer

  • Google Docs
  • Google Sheets
  • Google Drive exports
  • PDFs
  • Approved web pages

Platform operations

  • Terraform for infrastructure delivery
  • Cloud Run Jobs + Scheduler for background workloads
  • MLflow for traces, evaluations, and feedback analysis
  • Structured source registry to define what enters the corpus and how it is synced
Le runtime reprend la discipline opérationnelle de DAISI, mais simplifie le produit autour d'un flux RAG mono-assistant plutôt qu'un setup multi-agents plus large.

Runtime principal

  • FastAPI pour le runtime webhook
  • Cloud Run pour la couche de service
  • Google Chat comme canal utilisateur
  • Gemini 2.5 Flash pour la génération de réponse
  • Vertex AI RAG Engine pour le retrieval fondé
  • Cloud SQL PostgreSQL pour la mémoire conversationnelle et l'état checkpointé

Couche sources

  • Google Docs
  • Google Sheets
  • Exports Google Drive
  • PDFs
  • Pages web approuvées

Opérations plateforme

  • Terraform pour la livraison infra
  • Cloud Run Jobs + Scheduler pour les workloads de fond
  • MLflow pour les traces, évaluations et analyses feedback
  • Source registry structuré pour définir ce qui entre dans le corpus et comment la sync fonctionne

Stack

CategoryTechnologies
LLM / RAGGemini 2.5 Flash, Vertex AI RAG Engine
BackendPython 3.11, FastAPI, Pydantic
MemoryCloud SQL PostgreSQL
CloudGCP, Cloud Run, Cloud Run Jobs, Cloud Scheduler, GCS
Knowledge sourcesGoogle Docs, Google Sheets, Google Drive, PDFs, approved web pages
ObservabilityMLflow, structured tracing, feedback evaluation
InfrastructureTerraform, Docker
QualityPytest, Ruff, Mypy, CI automation
CatégorieTechnologies
LLM / RAGGemini 2.5 Flash, Vertex AI RAG Engine
BackendPython 3.11, FastAPI, Pydantic
MémoireCloud SQL PostgreSQL
CloudGCP, Cloud Run, Cloud Run Jobs, Cloud Scheduler, GCS
Sources de connaissanceGoogle Docs, Google Sheets, Google Drive, PDFs, pages web approuvées
ObservabilitéMLflow, traces structurées, évaluation du feedback
InfrastructureTerraform, Docker
QualitéPytest, Ruff, Mypy, CI automation

Delivery Scope

Lot 1 focus

  • Maintenance workflows
  • Safety procedures
  • Compliance and regulatory operational content

Hard constraints that shaped the MVP

  • Keep the assistant simple and governed in V1
  • Prefer direct ingestion from Google Workspace sources over unnecessary live integrations
  • Exclude sensitive documents from the corpus instead of overbuilding permission logic too early
  • Treat the document pipeline as a first-class problem: parsing quality, OCR, metadata, chunking, and sync matter as much as the prompt layer

Focus lot 1

  • Workflows maintenance
  • Procédures sécurité
  • Contenus conformité et réglementation opérationnelle

Contraintes fortes qui ont structuré le MVP

  • Garder l'assistant simple et gouverné en V1
  • Préférer l'ingestion directe depuis Google Workspace aux intégrations live inutiles
  • Exclure du corpus les documents trop sensibles au lieu de surconstruire la logique de permissions trop tôt
  • Traiter la chaîne documentaire comme un vrai sujet produit : qualité du parsing, OCR, métadonnées, chunking et sync comptent autant que la couche prompt

Why this project matters

OpsBot is the kind of AI product that earns trust the hard way: by being useful, grounded, and operationally maintainable. The interesting part is not only the model choice — it is the combination of governed content, safe answer behavior, runtime observability, and delivery discipline that makes the assistant viable beyond a prototype.
OpsBot fait partie des projets IA qui gagnent la confiance de manière sobre : en étant utiles, fondés, et opérables dans la durée. Le point intéressant n'est pas seulement le choix du modèle — c'est la combinaison contenu gouverné, comportement de réponse sûr, observabilité runtime, et discipline de delivery qui rend l'assistant crédible au-delà du prototype.