
YouTube Transcription Agent
par gilbertsahumada
Serveur MCP qui transcrit et résume des vidéos YouTube via OpenAI Whisper, avec support des micropaiements x402 pour les appels A2A.
Ce qu'il fait
Ce serveur MCP permet à votre assistant IA de transcrire et de résumer des vidéos YouTube. Il télécharge l'audio via yt-dlp, le traite avec OpenAI Whisper pour la transcription, et renvoie du texte horodaté ou des résumés concis. Il expose également une interface HTTP Agent-to-Agent (A2A) avec des micropaiements x402 sur Base Sepolia, permettant à d'autres agents IA de payer par requête.
Outils
- transcribe_video — Télécharge l'audio YouTube et le transcrit avec des horodatages via l'API Whisper
- summarize_video — Transcrit la vidéo et génère un résumé avec les points clés
- chat — Conversation générale avec l'agent
Installation
Ajoutez à votre claude_desktop_config.json :
{
"mcpServers": {
"youtube-transcriber": {
"command": "npx",
"args": ["tsx", "/path/to/src/mcp-server.ts"],
"env": {
"OPENAI_API_KEY": "sk-..."
}
}
}
}
Nécessite les dépendances système : ffmpeg et deno (pour yt-dlp).
Hôtes supportés
Claude Desktop et Cursor (confirmé dans le README via l'interface MCP stdio). L'interface A2A est agnostique au protocole pour l'utilisation agent-à-agent.
Installation rapide
npx tsx src/mcp-server.tsInformations
- Tarification
- freemium
- Publié
- 4/10/2026






