Markdrop

Score de confiance 80/100

Convertit les PDF en Markdown structuré ou en HTML interactif et génère des descriptions d'images et de tableaux propulsées par l'IA via plusieurs fournisseurs de LLM.

déclencheurs:convert pdfpdf to markdownextract tablesdescribe imagesbatch image description

GitHub SKILL.md

Ce qu'il fait

Markdrop fournit une API Python et une CLI pour convertir des documents PDF en Markdown structuré et en HTML interactif, extraire des images et des tableaux, et utiliser des modèles de vision IA pour générer des descriptions contextuelles pour le contenu extrait. Il supporte le traitement par lots et plusieurs backends LLM (Gemini, OpenAI, Anthropic, Groq, OpenRouter, LiteLLM).

Quand l'utiliser

Utilisez Markdrop lorsque vous avez besoin de transformer des rapports, des articles ou des PDF en Markdown/HTML réutilisable avec des légendes riches générées par IA pour les images et les tableaux — pour la documentation, la publication ou les flux d'extraction de données. Il est approprié pour les conversions de fichiers uniques ou les gros travaux par lots.

Ce qui est inclus

Scripts : Aucun détecté dans ce snapshot du repo (has_scripts=false)
Références : Aucune détectée (has_references=false)
Instructions : Des exemples d'utilisation détaillés pour l'intégration Python, les commandes CLI, la description d'images par lots et les replis de modèles recommandés sont inclus dans le corps du skill.

Agents compatibles

Probablement compatible avec les agents pouvant exécuter des commandes Python et shell et invoquer des LLM externes (agents de code de style Copilot/Codex, agents capables de CLI).

Étiquettes

#pdf #document-processing #markdown #html #vision #llm #ai-augmentation #batch-processing #cli #python

Aucun script exécutéAudité le April 21, 2026

Résumé de l'audit

Markdrop est un outil Python pour convertir des PDF en Markdown/HTML structuré avec des descriptions d'images et de tableaux alimentées par l'IA utilisant plusieurs fournisseurs de LLM. Aucun script groupé n'était présent pour les tests. Le SKILL.md est bien documenté avec des exemples clairs d'API Python et de CLI, bien qu'il manque des conseils sur la gestion des erreurs et le dépannage.

Points d'attention

Nécessite des clés API pour les fonctionnalités d'IA (Gemini, OpenAI, Anthropic, Groq, OpenRouter ou LiteLLM)
Aucun avertissement de sécurité .env — les utilisateurs pourraient accidentellement commettre des clés API

Notes

Compétence propre sans problème de sécurité. Documentation bien écrite couvrant à la fois la CLI et l'API Python. L'architecture est simple (un seul SKILL.md, pas de scripts ou de références). Pourrait s'améliorer avec des exemples de gestion des erreurs, une section de dépannage et une meilleure séparation des préoccupations.

Informations

Dépôt: markdrop
Étoiles: 198

Score de confiance

Global80

Sécurité95

Qualité du code72

Architecture55

Utilité78

Compétences similaires

Readwise Reader Document Management

Manage Readwise Reader documents: list, save, search, move, tag, highlight, export and bulk-edit via official and custom CLIs.

ezBookkeeping API Tools

Command-line API tools for ezBookkeeping: record and query transactions, retrieve accounts/categories/tags, and fetch exchange rates for self-hosted personal fi

Jx Component Library

Build server-rendered UIs using reusable .jx components in Python/Jinja2 with typed props and automatic asset management.

Tmux Bridge

Give an agent controlled access to a local tmux terminal bridge so it can run shell commands, capture output, and manage sessions on the user's machine.

SourceSage CLI

Generate concise, LLM-friendly repository summaries (Markdown) using the SourceSage CLI — supports lite mode, language switching, and targeted repo analysis.

Nit (Nitter CLI)

Terminal client to browse tweets, view profiles, and search posts via Nitter instances without opening a browser.

hn — Hacker News CLI

Terminal-based Hacker News client with a CLI and optional interactive TUI for browsing top/new/best/ask/show/jobs stories, viewing threads with nested comments,

Supabase SDK Patterns (TypeScript & Python)

Production-ready patterns for using Supabase clients in TypeScript and Python: client initialization, typed queries, auth, realtime, storage, RPC, and error-han

Retour aux compétences