
de anakin20
API de web scraping auto-hébergée retournant du markdown nettoyé ou du JSON structuré ; inclut le rendu navigateur et la rotation de proxys pour les sites lourds en JS ou protégés.
AnakinScraper expose une API de scraping auto-hébergée qui convertit des pages web arbitraires en markdown lisible ou en JSON structuré. Elle est conçue pour gérer les applications monopages (SPA) riches en JavaScript et les protections anti-bots via un navigateur anti-détection et une auto-sélection de proxys. La compétence documente les points de terminaison disponibles pour le scraping synchrone et asynchrone, les tâches par lots et le polling de jobs, ainsi que l'utilisation recommandée des paramètres pour le rendu navigateur et l'extraction JSON.
Utilisez AnakinScraper lorsque vous avez besoin d'une extraction robuste à partir de pages où les récupérations HTTP standard échouent — pages de listes de produits, archives d'articles, contenu piloté par SPA ou sites avec des mesures anti-bot basiques. Préférez les points de terminaison asynchrones pour les pages lentes et les points de terminaison par lots pour plusieurs URL.
Agents avec accès réseau et capacité d'appeler des API HTTP locales ou d'exécuter des conteneurs ; utile pour les tâches d'extraction de données, de recherche et de migration de contenu.
AnakinScraper is a self-hosted web scraper API skill that provides tools for scraping websites into clean markdown or structured JSON, with browser rendering (Camoufox) and proxy rotation. No bundled scripts were present to test. The SKILL.md is well-documented with clear tool descriptions and usage guidelines. Setup requires cloning a separate repo and running `make up`, which is a minor friction point but standard for self-hosted tools.
No security concerns found. No scripts to audit. The skill is purely a SKILL.md that defines tools calling a local REST API. AGPL-3.0 license noted in frontmatter.