Doc Scraper

Name: Doc Scraper
Availability: InStock
Author: Sriram-PR

Interface UI

par Sriram-PR

Convertissez les sites de documentation technique en Markdown propre pour l'ingestion par LLM et les pipelines RAG.

0 étoiles

Fonctionne dans:Cursor

Expose:ToolsResources

Voir sur GitHub Documentation

Ce qu'il fait

Doc Scraper est un crawler web haute performance développé en Go, spécifiquement conçu pour transformer des sites de documentation complexes en fichiers Markdown structurés. Il élimine le superflu du web, préserve la hiérarchie du site et optimise le contenu pour les grands modèles de langage (LLM), ce qui en fait un outil essentiel pour construire des systèmes RAG (Retrieval-Augmented Generation).

Outils

list_sites : Liste tous les sites configurés dans le fichier de configuration.
get_page : Récupère une URL unique et renvoie le contenu au format markdown.
crawl_site : Lance un crawl en arrière-plan pour un site spécifique.
get_job_status : Vérifie la progression d'une tâche de crawl en arrière-plan.
search_crawled : Recherche dans le contenu précédemment crawlé au sein des fichiers JSONL.

Installation

Ajoutez ceci à votre fichier claude_desktop_config.json :

{
  "mcpServers": {
    "doc-scraper": {
      "command": "/chemin/vers/doc-scraper",
      "args": ["mcp-server", "-config", "/chemin/vers/config.yaml"]
    }
  }
}

Hôtes supportés

Support confirmé pour Claude Desktop, Cursor et Claude Code.

Installation rapide

go install github.com/Sriram-PR/doc-scraper/cmd/doc-scraper@latest

Informations

Tarification: free
Publié: 4/18/2026
étoiles: 0

Catégories

Developer Tools

Choisissez votre client IA et suivez les étapes ci-dessous.

Cursor

mcp.json entry in ~/.cursor/ or project .cursor/

Claude Desktop

{
  "mcpServers": {
    "doc-scraper": {
      "command": "/path/to/doc-scraper",
      "args": ["mcp-server", "-config", "/path/to/config.yaml"]
    }
  }
}

Apps similaires

DiffSitter MCP

MCP Server

AI-powered structural code navigation using tree-sitter ASTs for semantic understanding across 14+ languages.

OpenAI Apps SDK Examples

MCP App

Official example gallery of interactive MCP widgets for ChatGPT — 3D viewers, maps, carousels, shopping carts, and more.

Human MCP

MCP Server

Give AI agents human-like senses: visual analysis, image/video generation, speech synthesis, browser automation, and advanced reasoning — 29 MCP tools in one se

Shopify MCP Server

MCP Server

Direct interaction with Shopify store data via GraphQL API for managing products, customers, and orders.

Git MCP Server

MCP Server

Full-featured Git MCP server exposing 28 tools for AI agents to clone, commit, branch, diff, merge, rebase, and more via STDIO or Streamable HTTP.

CodexPotter

MCP Server

Autonomous reconciliation loop that drives Codex to align your codebase with instructed states.

Smart Coding MCP

MCP Server

Semantic code search for AI assistants using local embeddings — find code by meaning, not just keywords.

Snowflake MCP Server

MCP Server

Direct Snowflake database interaction via MCP, enabling AI to run SQL queries, explore schemas, and manage data insights.

Retour aux applications

Doc Scraper

Interface UI

par Sriram-PR

Convertissez les sites de documentation technique en Markdown propre pour l'ingestion par LLM et les pipelines RAG.

0 étoiles

Fonctionne dans:Cursor

Expose:ToolsResources

Voir sur GitHub Documentation

Ce qu'il fait

Outils

list_sites : Liste tous les sites configurés dans le fichier de configuration.
get_page : Récupère une URL unique et renvoie le contenu au format markdown.
crawl_site : Lance un crawl en arrière-plan pour un site spécifique.
get_job_status : Vérifie la progression d'une tâche de crawl en arrière-plan.
search_crawled : Recherche dans le contenu précédemment crawlé au sein des fichiers JSONL.

Installation

Ajoutez ceci à votre fichier claude_desktop_config.json :

{
  "mcpServers": {
    "doc-scraper": {
      "command": "/chemin/vers/doc-scraper",
      "args": ["mcp-server", "-config", "/chemin/vers/config.yaml"]
    }
  }
}

Hôtes supportés

Support confirmé pour Claude Desktop, Cursor et Claude Code.

Installation rapide

go install github.com/Sriram-PR/doc-scraper/cmd/doc-scraper@latest

Informations

Tarification: free
Publié: 4/18/2026
étoiles: 0

Catégories

Developer Tools

Choisissez votre client IA et suivez les étapes ci-dessous.

Cursor

mcp.json entry in ~/.cursor/ or project .cursor/

Claude Desktop

{
  "mcpServers": {
    "doc-scraper": {
      "command": "/path/to/doc-scraper",
      "args": ["mcp-server", "-config", "/path/to/config.yaml"]
    }
  }
}

Apps similaires

DiffSitter MCP

MCP Server

AI-powered structural code navigation using tree-sitter ASTs for semantic understanding across 14+ languages.

OpenAI Apps SDK Examples

MCP App

Official example gallery of interactive MCP widgets for ChatGPT — 3D viewers, maps, carousels, shopping carts, and more.

Human MCP

MCP Server

Give AI agents human-like senses: visual analysis, image/video generation, speech synthesis, browser automation, and advanced reasoning — 29 MCP tools in one se

Shopify MCP Server

MCP Server

Direct interaction with Shopify store data via GraphQL API for managing products, customers, and orders.

Git MCP Server

MCP Server

Full-featured Git MCP server exposing 28 tools for AI agents to clone, commit, branch, diff, merge, rebase, and more via STDIO or Streamable HTTP.

CodexPotter

MCP Server

Autonomous reconciliation loop that drives Codex to align your codebase with instructed states.

Smart Coding MCP

MCP Server

Semantic code search for AI assistants using local embeddings — find code by meaning, not just keywords.

Snowflake MCP Server

MCP Server

Direct Snowflake database interaction via MCP, enabling AI to run SQL queries, explore schemas, and manage data insights.