Overview
DAISI (Decathlon AI Suppliers Information) is a production-level enterprise GenAI chatbot deployed on Google Chat, enabling Decathlon Finance collaborators to ask questions about supplier processes. Built with a modern LangGraph agent architecture, the system leverages RAG (Retrieval-Augmented Generation) with Vertex AI Vector Search for accurate, grounded responses.
The application is currently running in production, serving real users at Decathlon with automated infrastructure management via Terraform and comprehensive observability through MLflow and OpenTelemetry.
DAISI (Decathlon AI Suppliers Information) est un chatbot GenAI d'entreprise en production déployé sur Google Chat, permettant aux collaborateurs Finance de Decathlon de poser des questions sur les processus fournisseurs. Construit avec une architecture agent moderne basée sur LangGraph, le système exploite le RAG (Retrieval-Augmented Generation) avec Vertex AI Vector Search pour des réponses précises et fondées.
L'application est actuellement en production, au service d'utilisateurs réels chez Decathlon, avec une gestion automatisée de l'infrastructure via Terraform et une observabilité complète grâce à MLflow et OpenTelemetry.
Business Impact
| Metric | Value |
|---|---|
| Time Saved | 13,000 hours/year for the suppliers team |
| Availability | 24/7 instant answers vs. waiting for human response |
| Coverage | Trained on internal procedures and accounting guides |
| Escalation | Automatic redirection to accountants when needed |
| Indicateur | Valeur |
|---|---|
| Temps économisé | 13 000 heures/an pour l'équipe fournisseurs |
| Disponibilité | Réponses instantanées 24/7 vs. attente d'une réponse humaine |
| Couverture | Entraîné sur les procédures internes et les guides comptables |
| Escalade | Redirection automatique vers les comptables si nécessaire |
Technical Architecture
AI/ML Stack
- LangGraph - Agent orchestration framework with stateful conversation flows
- LangChain - LLM application framework for chains and prompts
- Google Gemini via Vertex AI - Foundation model for text generation
- Vertex AI Vector Search - High-performance semantic search for RAG
- FAISS - Local vector similarity search
- Model Armor - GCP security templates for anti-prompt injection and content filtering
Backend Infrastructure
- FastAPI - High-performance async API framework
- Cloud Run - Serverless container deployment with autoscaling
- Cloud SQL PostgreSQL - Managed database for conversation persistence
- Google Cloud Storage - Object storage for knowledge base and configurations
- Uvicorn - ASGI server for FastAPI
Observability & MLOps
- MLflow 3.7+ - Experiment tracking with LangGraph autologging
- LiteLLM - Unified LLM API gateway
- OpenTelemetry - Distributed tracing with OTLP/gRPC export
- Cloud Logging - Centralized log aggregation
Scheduled Jobs (Cloud Run Jobs)
The application includes automated maintenance jobs orchestrated by Cloud Scheduler:| Job | Schedule | Purpose |
|---|---|---|
| TTL Cleanup | Daily 03:00 | GDPR compliance - deletes checkpoints and MLflow traces older than 12 months |
| Trace Evaluation | Daily 04:00 | LLM-as-Judge quality scoring with custom scorers (relevance, language consistency, conciseness) |
| Data Sync | On config update | Syncs knowledge base from Google Sheets to GCS |
Infrastructure as Code
- Terraform - Complete GCP infrastructure management with modular design:
- cloud-run - Main service deployment
- cloud-run-job - Batch job definitions
- cloud-scheduler - Scheduled triggers
- iam - Service accounts and role bindings
- model-armor - Security template configuration
- vertex-ai-vector-search - Vector index management
- storage - GCS bucket configuration
DevOps & CI/CD
- Docker - Containerized deployments
- GitHub Actions - Automated CI/CD pipelines
- SonarCloud - Code quality and security analysis
- Pre-commit hooks - Automated code checks
- Ruff - Python linting and formatting
- Mypy - Static type checking
- Pytest - Async test framework with coverage
Project Management
- Jira - Sprint planning and issue tracking
- Confluence - Technical documentation with auto-sync from /docs
Stack IA/ML
- LangGraph - Framework d'orchestration d'agents avec flux conversationnels à état
- LangChain - Framework applicatif LLM pour les chaînes et les prompts
- Google Gemini via Vertex AI - Modèle fondation pour la génération de texte
- Vertex AI Vector Search - Recherche sémantique haute performance pour le RAG
- FAISS - Recherche locale de similarité vectorielle
- Model Armor - Templates de sécurité GCP pour la protection anti-prompt injection et le filtrage de contenu
Infrastructure Backend
- FastAPI - Framework API asynchrone haute performance
- Cloud Run - Déploiement serverless de conteneurs avec autoscaling
- Cloud SQL PostgreSQL - Base de données managée pour la persistance des conversations
- Google Cloud Storage - Stockage objet pour la base de connaissances et les configurations
- Uvicorn - Serveur ASGI pour FastAPI
Observabilité & MLOps
- MLflow 3.7+ - Suivi d'expériences avec autologging LangGraph
- LiteLLM - Passerelle API LLM unifiée
- OpenTelemetry - Traçage distribué avec export OTLP/gRPC
- Cloud Logging - Agrégation centralisée des logs
Jobs Planifiés (Cloud Run Jobs)
L'application inclut des jobs de maintenance automatisés orchestrés par Cloud Scheduler :| Job | Planification | Objectif |
|---|---|---|
| TTL Cleanup | Quotidien 03:00 | Conformité RGPD - supprime les checkpoints et traces MLflow de plus de 12 mois |
| Trace Evaluation | Quotidien 04:00 | Scoring qualité LLM-as-Judge avec des scorers personnalisés (pertinence, cohérence linguistique, concision) |
| Data Sync | Sur mise à jour de config | Synchronise la base de connaissances depuis Google Sheets vers GCS |
Infrastructure as Code
- Terraform - Gestion complète de l'infrastructure GCP avec conception modulaire :
- cloud-run - Déploiement du service principal
- cloud-run-job - Définitions des jobs batch
- cloud-scheduler - Déclencheurs planifiés
- iam - Comptes de service et liaisons de rôles
- model-armor - Configuration des templates de sécurité
- vertex-ai-vector-search - Gestion des index vectoriels
- storage - Configuration des buckets GCS
DevOps & CI/CD
- Docker - Déploiements conteneurisés
- GitHub Actions - Pipelines CI/CD automatisés
- SonarCloud - Analyse de qualité de code et de sécurité
- Pre-commit hooks - Vérifications automatisées du code
- Ruff - Linting et formatage Python
- Mypy - Vérification statique de types
- Pytest - Framework de tests asynchrones avec couverture
Gestion de Projet
- Jira - Planification de sprints et suivi des tickets
- Confluence - Documentation technique avec synchronisation automatique depuis /docs
Core Features
Intelligent Question Answering
RAG-powered responses grounded in operational and accounting practical guides ("fiches pratiques").Contextual Disambiguation
Multi-turn conversations with follow-up questions to clarify ambiguous requests.Conversation Memory
PostgreSQL-backed checkpointer for persistent conversation state with IAM authentication.System Integrations
- IAM - User context (Cost Center, job title, department)
- Accountant Lookup - Automatic assignment to the right contact
- Invoice Status - Real-time invoice status queries
- Purchasing Info - Indirect purchasing information
Security & Compliance
- Model Armor templates for prompt injection protection
- Prohibited topics detection (salary, HR issues)
- GDPR-compliant data retention with automated TTL cleanup
- Access restricted to @decathlon.com domain
Réponses Intelligentes aux Questions
Réponses alimentées par le RAG, fondées sur les guides pratiques opérationnels et comptables (fiches pratiques).Désambiguïsation Contextuelle
Conversations multi-tours avec questions de suivi pour clarifier les demandes ambiguës.Mémoire Conversationnelle
Checkpointer adossé à PostgreSQL pour un état conversationnel persistant avec authentification IAM.Intégrations Système
- IAM - Contexte utilisateur (Centre de Coûts, intitulé de poste, département)
- Recherche de comptable - Affectation automatique au bon interlocuteur
- Statut des factures - Requêtes en temps réel sur le statut des factures
- Informations Achats - Informations sur les achats indirects
Sécurité & Conformité
- Templates Model Armor pour la protection contre l'injection de prompts
- Détection des sujets interdits (salaire, problématiques RH)
- Rétention des données conforme au RGPD avec nettoyage TTL automatisé
- Accès restreint au domaine @decathlon.com
Technologies Summary
| Category | Technologies |
|---|---|
| AI/ML | LangGraph, LangChain, Google Gemini, Vertex AI Vector Search, FAISS, Model Armor |
| Backend | Python 3.11, FastAPI, Uvicorn, Pydantic |
| Database | Cloud SQL PostgreSQL, langgraph-checkpoint-postgres, psycopg3 |
| Cloud | GCP, Cloud Run, Cloud Run Jobs, Cloud Scheduler, GCS |
| Observability | MLflow, LiteLLM, OpenTelemetry |
| Infrastructure | Terraform, Docker |
| CI/CD | GitHub Actions, SonarCloud, Pre-commit |
| Quality | Ruff, Mypy, Pytest, pytest-asyncio |
| Catégorie | Technologies |
|---|---|
| IA/ML | LangGraph, LangChain, Google Gemini, Vertex AI Vector Search, FAISS, Model Armor |
| Backend | Python 3.11, FastAPI, Uvicorn, Pydantic |
| Base de données | Cloud SQL PostgreSQL, langgraph-checkpoint-postgres, psycopg3 |
| Cloud | GCP, Cloud Run, Cloud Run Jobs, Cloud Scheduler, GCS |
| Observabilité | MLflow, LiteLLM, OpenTelemetry |
| Infrastructure | Terraform, Docker |
| CI/CD | GitHub Actions, SonarCloud, Pre-commit |
| Qualité | Ruff, Mypy, Pytest, pytest-asyncio |
