ProjectsFebruary 5, 2026

AI Video Comment Analyzer

AI Video Comment Analyzer - Image 2
AI Video Comment Analyzer - Image 3
AI Video Comment Analyzer - Image 4

Overview

AI Video Comment Analyzer is a full-stack application that extracts YouTube video comments and performs ML-powered analysis including sentiment classification, topic modeling, and AI-generated summaries. The tool helps content creators and researchers understand audience feedback through actionable insights.
AI Video Comment Analyzer est une application full-stack qui extrait les commentaires de vidéos YouTube et effectue une analyse basée sur le ML, incluant la classification de sentiments, la modélisation de sujets et la génération de résumés par IA. L'outil aide les créateurs de contenu et les chercheurs à comprendre les retours de leur audience grâce à des insights exploitables.

Key Features

FeatureDescription
Comment ExtractionFetch up to 100+ comments per video using yt-dlp
Sentiment AnalysisBERT-powered multilingual classification (positive/negative/neutral/suggestion)
Topic ModelingBERTopic clustering to identify key discussion themes
AI SummariesLocal LLM-powered summaries via Ollama (llama3.2:3b)
Real-time ProgressSSE streaming with live ML metrics during analysis
Multi-Page DashboardDedicated pages for Overview, Charts, Topics, and Comments
FonctionnalitéDescription
Extraction de CommentairesRécupération de plus de 100 commentaires par vidéo via yt-dlp
Analyse de SentimentsClassification multilingue par BERT (positif/négatif/neutre/suggestion)
Modélisation de SujetsClustering BERTopic pour identifier les thèmes clés de discussion
Résumés IARésumés générés localement via Ollama (llama3.2:3b)
Progression en Temps RéelStreaming SSE avec métriques ML en direct pendant l'analyse
Dashboard Multi-PagesPages dédiées pour Vue d'ensemble, Graphiques, Sujets et Commentaires

Analysis Pipeline

The ML pipeline processes comments through several stages:
  • Extraction - yt-dlp fetches comments with metadata (likes, replies, timestamps)
  • Sentiment Analysis - BERT model classifies each comment with confidence scores
  • Topic Modeling - BERTopic clusters similar comments into themes
  • Summarization - Ollama generates actionable summaries per sentiment category
Le pipeline ML traite les commentaires en plusieurs étapes :
  • Extraction - yt-dlp récupère les commentaires avec leurs métadonnées (likes, réponses, horodatages)
  • Analyse de Sentiments - Le modèle BERT classifie chaque commentaire avec des scores de confiance
  • Modélisation de Sujets - BERTopic regroupe les commentaires similaires par thèmes
  • Synthèse - Ollama génère des résumés exploitables par catégorie de sentiment

Dashboard Pages

Overview

  • At-a-glance sentiment breakdown with net tone indicator
  • Evidence strip showing top comments by engagement
  • Structured summary cards with themes, evidence, and actions

Charts

  • Sentiment distribution pie chart
  • Engagement by sentiment bar chart
  • Topic bubble visualization
  • ML confidence histogram

Topics

  • Topic list grouped by sentiment with comment counts
  • Detail panel with keywords and related comments
  • Sentiment filter bar for focused exploration

Comments

  • Full comment list with topic pills
  • Sort by likes, confidence, or recency
  • Sentiment word highlighting

Vue d'ensemble

  • Répartition des sentiments en un coup d'œil avec indicateur de tonalité globale
  • Bandeau de preuves affichant les commentaires les plus engageants
  • Cartes de résumé structurées avec thèmes, preuves et actions

Graphiques

  • Diagramme circulaire de répartition des sentiments
  • Graphique en barres de l'engagement par sentiment
  • Visualisation en bulles des sujets
  • Histogramme de confiance ML

Sujets

  • Liste des sujets groupés par sentiment avec nombre de commentaires
  • Panneau de détails avec mots-clés et commentaires associés
  • Barre de filtre par sentiment pour une exploration ciblée

Commentaires

  • Liste complète des commentaires avec badges de sujets
  • Tri par likes, confiance ou récence
  • Mise en surbrillance des mots liés au sentiment

Technical Stack

Frontend

  • Next.js 15 - React 19 with App Router
  • TypeScript - Type-safe development
  • Tailwind CSS v4 - Utility-first styling with custom design system
  • shadcn/ui - Accessible UI components
  • Recharts - Data visualization

Backend

  • FastAPI - High-performance Python API
  • SQLAlchemy - ORM with SQLite database
  • yt-dlp - YouTube comment extraction
  • Transformers - BERT sentiment model
  • BERTopic - Topic modeling with UMAP + HDBSCAN
  • Ollama - Local LLM inference

ML Models

ModelPurpose
nlptown/bert-base-multilingual-uncased-sentimentSentiment classification
all-MiniLM-L6-v2Sentence embeddings for BERTopic
llama3.2:3bAI summary generation

DevOps

  • GitHub Actions - CI/CD with lint, format, and test checks
  • Ruff - Python linting and formatting
  • pytest - Backend testing with 65% coverage threshold
  • ESLint - Frontend code quality

Frontend

  • Next.js 15 - React 19 avec App Router
  • TypeScript - Développement type-safe
  • Tailwind CSS v4 - Styling utility-first avec design system personnalisé
  • shadcn/ui - Composants UI accessibles
  • Recharts - Visualisation de données

Backend

  • FastAPI - API Python haute performance
  • SQLAlchemy - ORM avec base de données SQLite
  • yt-dlp - Extraction de commentaires YouTube
  • Transformers - Modèle BERT pour l'analyse de sentiments
  • BERTopic - Modélisation de sujets avec UMAP + HDBSCAN
  • Ollama - Inférence LLM locale

Modèles ML

ModèleFonction
nlptown/bert-base-multilingual-uncased-sentimentClassification de sentiments
all-MiniLM-L6-v2Embeddings de phrases pour BERTopic
llama3.2:3bGénération de résumés IA

DevOps

  • GitHub Actions - CI/CD avec vérifications de lint, formatage et tests
  • Ruff - Linting et formatage Python
  • pytest - Tests backend avec seuil de couverture de 65%
  • ESLint - Qualité du code frontend

Technologies Summary

CategoryTechnologies
FrontendNext.js 15, React 19, TypeScript, Tailwind v4, shadcn/ui
BackendFastAPI, SQLAlchemy, SQLite
ML/AITransformers, BERTopic, Ollama
Extractionyt-dlp
CI/CDGitHub Actions, Ruff, pytest
CatégorieTechnologies
FrontendNext.js 15, React 19, TypeScript, Tailwind v4, shadcn/ui
BackendFastAPI, SQLAlchemy, SQLite
ML/IATransformers, BERTopic, Ollama
Extractionyt-dlp
CI/CDGitHub Actions, Ruff, pytest