PhD Deep Read Workflow

Score de confiance 83/100

Un flux de travail CLI guidé qui extrait le texte des PDF académiques (PyMuPDF + Tesseract), génère des notes Obsidian structurées et crée des canevas de réflexion critique JSON

déclencheurs:phd deep readpdf extractionobsidian notestesseractpymupdfliterature review

GitHub SKILL.md

Ce qu'il fait

PhD Deep Read propose un pipeline en quatre étapes pour transformer des PDF académiques en notes de littérature richement structurées et en canevas de réflexion critique. Il utilise un arbre de décision "Texte d'abord" (PyMuPDF pour les pages consultables avec repli sur l'OCR Tesseract) pour extraire le texte et les images, puis génère du markdown compatible Obsidian avec frontmatter YAML et callouts Dataview. La compétence produit également des fichiers JSON Canvas pour une analyse approfondie et inclut des étapes de vérification pour assurer la cohérence des résultats.

Quand l'utiliser

Utilisez cette compétence lors du traitement individuel ou par lots de PDF académiques pour des revues de littérature, la génération de notes reproductibles pour Obsidian, ou lorsque vous avez besoin d'une synthèse et d'une critique structurées (évaluation des hypothèses, des preuves, directions futures). Approprié pour les chercheurs, les étudiants diplômés et les travailleurs du savoir préparant des corpus de lecture.

Ce qui est inclus

Scripts : scripts d'automatisation du flux de travail (setup, extract, generate, canvas, run, verify, batch) — note : la sortie fetch indique has_scripts=false mais la SKILL décrit des commandes CLI et des modèles
Références : les modèles et la documentation de démonstration sont référencés dans le dépôt
Instructions : guide détaillé étape par étape (extraction Texte-d'abord, génération de notes structurées, création de canevas, vérification). Inclut des exemples d'utilisation et des conseils de dépannage.

Agents compatibles

Fonctionne avec les agents pouvant exécuter ou orchestrer des outils CLI/python (Claude Code, shells d'assistant ou wrappers CLI locaux). Idéal lorsque l'environnement fournit PyMuPDF et Tesseract pour l'OCR et que l'agent peut lire/écrire des fichiers pour l'intégration Obsidian.

Étiquettes

#pdf #academic #research #obsidian #note-taking #ocr #workflow #pythontools

Scripts exécutés dans un bac à sableExécution réussieAudité le May 1, 2026

Résumé de l'audit

Le flux de travail PhD Deep Read traite les PDF académiques en notes Obsidian structurées en utilisant un arbre de décision Text-First (PyMuPDF + fallback OCR Tesseract). Il génère des canevas de pensée critique JSON Canvas et des prompts de notes de littérature structurées. Le point d'entrée CLI et deux scripts d'aide ont fonctionné correctement ; la plupart des autres scripts nécessitent des arguments obligatoires ou des dépendances manquantes (PyMuPDF, Tesseract). Aucun problème de sécurité trouvé — pas d'appels réseau, pas d'exposition d'identifiants, pas d'opérations destructrices.

Points d'attention

Nécessite PyMuPDF et éventuellement Tesseract OCR installés
Configuration d'un environnement virtuel recommandée avant l'utilisation
Les fichiers de modèles (scripts/templates/) sont attendus mais ne sont pas inclus dans les scripts de la compétence

Dépendances manquantes

PyMuPDF (fitz)tesseract-ocrpytesseractpillow

Notes

Outil académique propre et bien documenté. process.py effectue automatiquement un chmod des scripts .sh à 0o755 — mineur mais inoffensif. extract.py passe l'argument --lang directement au sous-processus tesseract — risque d'injection théorique si la valeur de lang n'est pas fiable, mais gravité faible car l'utilisateur contrôle l'entrée.

Informations

Dépôt: phd-deepread-workflow
Étoiles: 28

Score de confiance

Global83

Sécurité92

Qualité du code76

Architecture72

Utilité52

Compétences similaires

Maestro Orchestrate

Orchestrates complex engineering workflows with enforced design and approval gates, child-agent delegation, and session state management.

Run Execute

Orchestrates execution of work items across modes (autopilot, confirm, validate) with scripted init/complete tooling, plan/test/report artifacts and strict gati

Markdrop

Convert PDFs to structured Markdown or interactive HTML and generate AI-powered descriptions for images and tables using multiple LLM providers.

arxiv2md

Convert arXiv papers into clean, LLM-ready Markdown via a REST API or CLI for fast reading, summarization, and downstream processing.

Chinese Software Copyright Application

Generate complete Chinese software copyright application materials (application form, code documentation, user manual, design docs) and export them to PDF from

Ip2Location IO Automation (Composio)

Automate Ip2location IO tasks via Composio's Rube MCP toolkit — discover tools, verify connections, and execute schema-compliant workflows safely.

Scite Database (Smart Citations)

Query Scite.ai Smart Citations by DOI to report supporting, contrasting, and mentioning citation counts and help assess a paper's reliability.

Writing Implementation Plans

Generate detailed, engineer-ready implementation plans from design docs: file paths, step-by-step tasks, tests, and verification instructions.

Retour aux compétences