ProjectsFebruary 7, 2026

RAG Equity Research Agent

RAG Equity Research Agent - Image 2
RAG Equity Research Agent - Image 3

Overview

RAG Equity Research Agent is an autonomous AI system that performs professional-grade equity research by aggregating and analyzing multiple data sources in real-time. Built with LangGraph for multi-agent orchestration, hybrid RAG (BM25 + dense embeddings) for SEC filings analysis, and deployed on Azure Container Apps with a Telegram bot interface.
RAG Equity Research Agent est un système d'IA autonome qui réalise des analyses financières de qualité professionnelle en agrégeant et analysant de multiples sources de données en temps réel. Construit avec LangGraph pour l'orchestration multi-agents, le RAG hybride (BM25 + embeddings denses) pour l'analyse des documents SEC, et déployé sur Azure Container Apps avec une interface bot Telegram.

Key Features

FeatureDescription
Deep AnalysisAutonomous research combining market data, SEC filings, and sentiment analysis
Hybrid RAGBM25 sparse + dense embeddings with RRF reranking for accurate document retrieval
Multi-Agent SystemLangGraph orchestration with specialized agents (market data, news, RAG, synthesizer)
Real-time DataYahoo Finance integration for live quotes, financials, and historical data
Risk ScoringAutomated risk assessment from 10-K filings with keyword extraction
Telegram BotFull-featured bot with inline keyboards, watchlists, and price alerts
FonctionnalitéDescription
Analyse approfondieRecherche autonome combinant données de marché, documents SEC et analyse de sentiment
RAG hybrideBM25 sparse + embeddings denses avec reranking RRF pour une récupération précise de documents
Système multi-agentsOrchestration LangGraph avec agents spécialisés (données de marché, actualités, RAG, synthétiseur)
Données en temps réelIntégration Yahoo Finance pour les cotations en direct, les données financières et l'historique
Scoring de risqueÉvaluation automatisée des risques à partir des rapports 10-K avec extraction de mots-clés
Bot TelegramBot complet avec claviers inline, watchlists et alertes de prix

Technology Stack

LayerTechnologies
LLMGroq (Llama 3.3 70B), Azure OpenAI (GPT-4o-mini)
OrchestrationLangGraph, LangChain
RAGQdrant Vector DB, BM25, Hybrid Search, RRF Reranking
Data SourcesYahoo Finance, SEC EDGAR, Reddit API, DuckDuckGo
BackendFastAPI, Pydantic, Python 3.11+
Botpython-telegram-bot with async handlers
InfrastructureDocker, Azure Container Apps, Terraform
CI/CDGitHub Actions (lint, test, security, deploy)
QualityRuff, pytest (53% coverage), Bandit security scan
CoucheTechnologies
LLMGroq (Llama 3.3 70B), Azure OpenAI (GPT-4o-mini)
OrchestrationLangGraph, LangChain
RAGQdrant Vector DB, BM25, Hybrid Search, RRF Reranking
Sources de donnéesYahoo Finance, SEC EDGAR, Reddit API, DuckDuckGo
BackendFastAPI, Pydantic, Python 3.11+
Botpython-telegram-bot avec handlers asynchrones
InfrastructureDocker, Azure Container Apps, Terraform
CI/CDGitHub Actions (lint, test, sécurité, déploiement)
QualitéRuff, pytest (53% de couverture), scan de sécurité Bandit

Telegram Commands

CommandDescription
/analyze TICKERDeep multi-source analysis
/quote TICKERReal-time stock quote
/compare TICKER1 TICKER2Side-by-side comparison
/dcf TICKERDiscounted Cash Flow valuation
/risk TICKERRisk score from 10-K analysis
/peers TICKERAutomatic peer comparison
/reddit TICKERReddit/WSB sentiment analysis
/watchlistManage personal watchlist
/alert TICKER PRICESet price alerts
CommandeDescription
/analyze TICKERAnalyse multi-sources approfondie
/quote TICKERCotation boursière en temps réel
/compare TICKER1 TICKER2Comparaison côte à côte
/dcf TICKERValorisation par Discounted Cash Flow
/risk TICKERScore de risque issu de l'analyse du 10-K
/peers TICKERComparaison automatique avec les pairs
/reddit TICKERAnalyse de sentiment Reddit/WSB
/watchlistGestion de la watchlist personnelle
/alert TICKER PRICEDéfinition d'alertes de prix

RAG Pipeline

The hybrid search pipeline combines multiple retrieval strategies:
  • Chunking - SEC filings split into semantic chunks with metadata
  • BM25 Sparse - Traditional keyword matching for exact terms
  • Dense Embeddings - Semantic similarity via text-embedding-ada-002
  • RRF Fusion - Reciprocal Rank Fusion combines both rankings
  • Reranking - Final relevance scoring for top-k results
Le pipeline de recherche hybride combine plusieurs stratégies de récupération :
  • Chunking - Les documents SEC sont découpés en chunks sémantiques avec métadonnées
  • BM25 Sparse - Correspondance traditionnelle par mots-clés pour les termes exacts
  • Embeddings denses - Similarité sémantique via text-embedding-ada-002
  • Fusion RRF - Le Reciprocal Rank Fusion combine les deux classements
  • Reranking - Scoring de pertinence final pour les top-k résultats

Cloud Infrastructure

Deployed on Azure with infrastructure-as-code:
  • Container Apps - Serverless containers with scale-to-zero
  • Container Registry - Private Docker image storage
  • Azure OpenAI - GPT-4o-mini with 10K TPM quota
  • Qdrant - Vector database on Container Instance
  • Key Vault - Secure secrets management
  • Log Analytics - Centralized logging and monitoring
Déployé sur Azure avec infrastructure-as-code :
  • Container Apps - Conteneurs serverless avec scale-to-zero
  • Container Registry - Stockage privé d'images Docker
  • Azure OpenAI - GPT-4o-mini avec quota de 10K TPM
  • Qdrant - Base de données vectorielle sur Container Instance
  • Key Vault - Gestion sécurisée des secrets
  • Log Analytics - Journalisation et monitoring centralisés

Results

MetricValue
Code Coverage53%
Lines of Code10,400+
Test Cases205
CI PipelineLint + Test + Security + Build
Estimated Cost~$50-110/month (Azure)
IndicateurValeur
Couverture de code53%
Lignes de code10 400+
Cas de test205
Pipeline CILint + Test + Sécurité + Build
Coût estimé~50-110$/mois (Azure)