
de deepswarm112
Orchestrez des travailleurs IA parallèles à grande échelle pour des tâches par lots et multi-tours avec calcul automatique du nombre de travailleurs, décalage et délégation de modèles hiérarchisée pour l'efficacité des coûts.
DeepSwarm exécute et gère N processus de travailleurs parallèles pour exécuter des tâches API par lots ou multi-tours de grande envergure. Il auto-calibre le nombre de travailleurs, les délais de décalage et la taille des lots pour maximiser le débit tout en évitant les limites de débit (rate limits). Il prend en charge la délégation hiérarchisée où un orchestrateur (modèle de pointe) planifie et des travailleurs moins coûteux exécutent à grande échelle.
À utiliser pour les pipelines de génération, de traduction, de résumé ou de classification de longue durée qui bénéficient de la parallélisation (durées d'appel >10s), ou lorsque vous avez besoin d'un point de contrôle (checkpointing) résistant aux plantages et d'un débit élevé sur de nombreuses graines (seeds). Non destiné aux appels synchrones courts ou aux tâches inter-travailleurs étroitement coordonnées.
Utile pour les agents capables de planifier et de surveiller des tâches de fond de longue durée, des pipelines ou des flux de travail CLI exécutés par des développeurs (orchestrateurs de style Hermes, orchestrateurs d'agents tmux et outils de traitement par lots).
Cette compétence n'a pas encore été examinée par notre pipeline d'audit automatisé.