Déploiement Flash Runpod

Name: Déploiement Flash Runpod
Author: runpod

Déployez et itérez rapidement vos charges de travail IA via des GPU/CPU serverless sur Runpod avec rechargement à chaud et logs en direct.

déclencheurs:deploy to runpodrunpod-flashserverless gpu deploymentflash devremote gpu execution

GitHub SKILL.md

Ce que cela fait

Runpod Flash offre un cycle de développement à haute vélocité pour les charges de travail IA. Il permet aux développeurs d'écrire du code localement et de l'exécuter sur des GPU ou CPU Runpod distants via flash dev, avec un rechargement à chaud qui synchronise instantanément les corps de fonctions. Une fois stable, flash deploy expédie la charge de travail sous forme de point de terminaison serverless stable.

Quand l'utiliser

Utilisez cette compétence lorsque vous devez déployer des fonctions IA basées sur Python, gérer des ressources GPU (des RTX 4090 aux H100), ou configurer des API serverless avec équilibrage de charge pour des modèles ML sans la surcharge d'une gestion manuelle de Docker.

Ce qui est inclus

Instructions : Guide CLI détaillé pour l'authentification, l'initialisation du projet et la gestion de l'environnement. Il comprend une analyse complète du constructeur Endpoint, des types d'instances GPU/CPU, et des "pièges" spécifiques concernant cloudpickle et les importations de modules.

Agents compatibles

Agents avec accès shell et capacités Python (par exemple, Claude Code, Codex, ou tout harnais ACP) pouvant piloter un processus d'arrière-plan de longue durée et interagir avec lui via HTTP.

Étiquettes

#runpod #serverless-gpu #ai-deployment #python #mlops #gpu-scaling #cloud-computing #developer-tools

Pas encore audité

Cette compétence n'a pas encore été examinée par notre pipeline d'audit automatisé.

Informations

Dépôt: skills
Étoiles: 31

Compétences similaires

Extract Circuit Netlist Edge Features

Extract structured edge features from a bipartite circuit netlist (NetworkX MultiGraph), normalizing device/net ordering, mapping terminal colors, and detecting

Markdrop

Convert PDFs to structured Markdown or interactive HTML and generate AI-powered descriptions for images and tables using multiple LLM providers.

FastAPI Project Templates

Creates production-ready FastAPI project scaffolds with async patterns, DI, middleware, and testing best practices for high-performance APIs.

GraphQL Inspector — Validate

Validate GraphQL operations against a schema with configurable depth, complexity, alias and directive limits to catch errors before runtime.

Unitree Robot Controller

Control and command Unitree robots (GO1/GO2/G1/H1) via OpenClaw: initialization, basic motion commands, and sensor integrations.

Alpha Forge Pre-Ship Quality Gates

Pre-merge quality gates for PRs that validate RNG determinism, forked URLs, runtime parameter ranges, and manifest synchronization to reduce review cycles.

JJ Hunk

Programmatic hunk selection for Jujutsu (jj): list, split, commit, or squash specific hunks to enable partial commits and fine-grained history editing without a

Codex Collab

Bridge Claude and Codex to run tasks, perform code reviews, and run background jobs for research or implementation workflows.

Retour aux compétences