
Exemples et pipelines de travail pour générer des ensembles de données de prévision binaire prospectifs (GRPO) : graines → génération de questions → étiquetage → lint → division → entraînement.
Fournit des pipelines d'exemples prêts pour la production pour générer des ensembles de données de prévisions binaires prospectives (GRPO). La compétence documente des modèles de bout en bout : génération de graines (actualités, GDELT ou ensembles de fichiers), génération de questions avec ForwardLookingQuestionGenerator, génération de contexte, étiquetage automatisé, linting, division temporelle et recommandations de configuration d'entraînement pour l'ajustement fin (fine-tuning) des modèles. De multiples exemples de domaines (sport, politique, militaire, prévisions générales, documents horodatés) illustrent les paramètres pratiques et les notebooks pour reproduire les résultats.
À utiliser lors de la construction d'ensembles de données de prévision ou de l'expérimentation avec le fine-tuning de style GRPO. Utile pour les équipes préparant des données de prévision étiquetées de haute qualité, testant des pipelines de questions sur de petites graines ou passant à l'échelle d'ensembles de données de production (milliers de graines). Non destiné aux Q&A occasionnels — c'est pour les ingénieurs de données et les modélisateurs.
Consommateurs du SDK Python et ingénieurs utilisant l'outillage LightningRod ; compatible avec les agents pouvant exécuter des appels SDK Python, des flux de travail basés sur des notebooks et des orchestrations d'entraînement (agents Python locaux, Jupyter/Colab et pipelines d'entraînement pilotés par CI).
Cette compétence n'a pas encore été examinée par notre pipeline d'audit automatisé.