Exemples d'Entraînement Prospectifs (GRPO)

Score de confiance 88/100

Exemples et pipelines de travail pour générer des ensembles de données de prévision binaire prospectifs (GRPO) : graines → génération de questions → étiquetage → lint → division → entraînement.

déclencheurs:forward-lookingforecastinggrpoquestion-pipelinelightningrod

GitHub SKILL.md

Ce qu'il fait

Fournit des pipelines d'exemples prêts pour la production pour générer des ensembles de données de prévisions binaires prospectives (GRPO). La compétence documente des modèles de bout en bout : génération de graines (actualités, GDELT ou ensembles de fichiers), génération de questions avec ForwardLookingQuestionGenerator, génération de contexte, étiquetage automatisé, linting, division temporelle et recommandations de configuration d'entraînement pour l'ajustement fin (fine-tuning) des modèles. De multiples exemples de domaines (sport, politique, militaire, prévisions générales, documents horodatés) illustrent les paramètres pratiques et les notebooks pour reproduire les résultats.

Quand l'utiliser

À utiliser lors de la construction d'ensembles de données de prévision ou de l'expérimentation avec le fine-tuning de style GRPO. Utile pour les équipes préparant des données de prévision étiquetées de haute qualité, testant des pipelines de questions sur de petites graines ou passant à l'échelle d'ensembles de données de production (milliers de graines). Non destiné aux Q&A occasionnels — c'est pour les ingénieurs de données et les modélisateurs.

Ce qui est inclus

Scripts : aucun déclaré sous le répertoire de la compétence, mais de nombreux notebooks et pipelines d'exemples sont référencés dans le dépôt (notebooks pour le golf, la politique de Trump, les frappes militaires, GDELT, FileSet RAG).
Références : notebooks d'exemples et chemins de notebooks référencés dans le corps de la compétence et le dépôt.
Instructions : exemples de code concrets montrant la construction du pipeline, recommandations d'entraînement/config (gpt-oss-120b, lora_rank, num_rollouts), modèles de linting de données et de division temporelle, et conseils spécifiques au domaine (intervalles, questions_per_seed, formatage des réponses).

Agents compatibles

Consommateurs du SDK Python et ingénieurs utilisant l'outillage LightningRod ; compatible avec les agents pouvant exécuter des appels SDK Python, des flux de travail basés sur des notebooks et des orchestrations d'entraînement (agents Python locaux, Jupyter/Colab et pipelines d'entraînement pilotés par CI).

Étiquettes

#forecasting #dataset-generation #fine-tuning #llm-datasets #training #foresight #forecasting-pipelines #gdelt

Aucun script exécutéAudité le July 1, 2026

Résumé de l'audit

Compétence de documentation uniquement fournissant 5 exemples concrets pour construire des ensembles de données de prévision GRPO avec le SDK LightningRod. Couvre le golf, la politique de Trump, les frappes militaires, les prévisions générales GDELT et les pipelines RAG FileSet. Aucun script joint ou code exécutable — purement du matériel de référence. Bien structurée avec des modèles d'exemples bons/mauvais et des tableaux de référence des paramètres.

Points d'attention

Nécessite le SDK LightningRod et une clé API
Aucun script exécutable — les exemples sont du code de référence uniquement

Notes

Compétence de documentation pure sans scripts à auditer. Clé API externe référencée dans les extraits de code mais jamais codée en dur. Référence propre pour un pipeline d'entraînement ML de niche.

Informations

Dépôt: lightningrod-python-sdk
Étoiles: 47

Score de confiance

Global88

Sécurité95

Qualité du code82

Architecture78

Utilité58

Compétences similaires

Microsoft Foundry Classic — Expert Guidance

Comprehensive guidance for building, configuring, troubleshooting, and deploying Microsoft Foundry Classic agents and integrations.

Synalinks Framework

Keras-inspired framework for building structured, neuro-symbolic LLM programs with DataModel schemas, modular Programs, and training/optimization tools.

Runtime Communication (research_mvp)

Rules and workflows for messaging, delegation, and task coordination in the research_mvp local multi-agent runtime (leader, researcher, trainer).

Deliberate Practice

Guided framework for accelerating skill acquisition using focused practice, immediate feedback, and progressive challenge—useful for learning technical skills,

As-Built Documentation Tracker

Track, manage, and forecast as-built drawing submissions and revisions to ensure complete handover documentation.

Relax: Development & Remote Training Debugging

Tools and procedures to develop the Relax project and validate changes by submitting and monitoring remote Ray training jobs (non-blocking, debug-friendly).

KnowBe4 (Membrane)

Integrate with KnowBe4 via the Membrane CLI to manage users, phishing and training campaigns, groups, reports, and account settings.

Learning Opportunities

Adds short interactive learning exercises during AI-assisted coding to help developers understand design decisions and new code before merging.

Retour aux compétences