Run LLMs Locally (Harbor)

Score de confiance 74/100

Déployez, configurez et dépannez une pile LLM locale complète (Ollama, llama.cpp, vLLM, Open WebUI, SearXNG, Open Terminal) à l'aide de la boîte à outils Harbor.

déclencheurs:run llmharbor uppull modelgpu troubleshootingopen webuivllmllama.cpp

GitHub SKILL.md

Ce qu'il fait

La compétence Run LLMs de Harbor documente la manière d'installer, de configurer et d'opérer une pile LLM locale complète. Elle couvre le lancement des services par défaut, le téléchargement de modèles depuis Ollama et HuggingFace, la gestion des backends (Ollama, llama.cpp, vLLM), l'activation de la recherche web (SearXNG) et l'ajout de l'exécution de code via Open Terminal. La compétence inclut des guides de dépannage pratiques pour les problèmes de GPU, les erreurs de mémoire (OOM) des modèles, les redémarrages de services et l'exposition réseau/tunnel.

Quand l'utiliser

Utilisez cette compétence lorsque vous souhaitez un environnement IA local reproductible et conteneurisé pour l'expérimentation ou une production à petite échelle : lancer une interface utilisateur LLM, changer de backend, télécharger des modèles, diagnostiquer des pannes de GPU ou de démarrage, ou activer le chat augmenté par le web et l'exécution de code. Elle est destinée aux développeurs travaillant sur des machines locales, des homelabs ou des serveurs.

Ce qui est inclus

Scripts : aucun script n'est regroupé dans le répertoire de la compétence, mais le dépôt Harbor contient l'outillage CLI (harbor) référencé partout.
Références : des exemples de commandes détaillés et des conseils de configuration sont intégrés dans le corps de la compétence (pull, restart, logs, overrides d'env).
Instructions : flux de travail étape par étape pour l'installation initiale, le téléchargement de modèles, le changement de backend, l'optimisation de la VRAM et des guides de dépannage courants.

Agents compatibles

Les agents et CLI qui exécutent des commandes de terminal ou gèrent des conteneurs trouveront cela utile (GitHub CLI, agents basés sur le shell, runners d'automatisation et outils d'agent pouvant exécuter des opérations Docker/CLI).

Étiquettes

#llm #local-ai #docker #harbor #infrastructure #gpu #model-management #troubleshooting #webui #searxng

Aucun script exécutéAudité le June 29, 2026

Résumé de l'audit

Comprehensive guide skill for setting up and running local LLMs using Harbor (a containerized LLM toolkit). Covers Ollama, llama.cpp, vLLM, Open WebUI, SearXNG, and Open Terminal with detailed decision trees, CLI references, configuration, and troubleshooting. No bundled scripts — purely instructional. The only security concern is the curl-pipe-bash install method.

Points d'attention

Install command uses curl | bash pattern (curl https://av.codes/get-harbor.sh | bash) — users should inspect the script first
harbor logs command tails indefinitely and will hang agent executions — must use docker logs instead
Default JWT secret 'h@rb0r' should be changed in production

Notes

Very well-written reference skill. Decision trees are excellent for autonomous agent use. The curl | bash install is standard for CLI tools but a security deduction applies. No scripts to test. SKILL.md is very long (~800 lines) which could benefit from splitting into references/ but remains well-organized with clear sections.

Informations

Dépôt: harbor
Étoiles: 2,955

Score de confiance

Global74

Sécurité65

Qualité du code92

Architecture68

Utilité82

Compétences similaires

Yielding Bear — Unified LLM Routing

A unified LLM routing API that automatically routes requests to the cheapest capable model across providers to reduce inference cost by ~60-80%.

Sync Production Database to Development

Run a safe, scripted workflow to download production database dumps and restore them into a development environment (download-only and restore options).

Markdrop

Convert PDFs to structured Markdown or interactive HTML and generate AI-powered descriptions for images and tables using multiple LLM providers.

Terragrunt Infrastructure

Best-practice patterns and operational guidance for Terragrunt/OpenTofu infrastructure: catalog/live/module layout, state backend setup, and deployment workflow

Azure Impact Reporting — Integration & Troubleshooting

Guidance for configuring, troubleshooting, and integrating Azure Impact Reporting with Monitor, Logic Apps, Service Health and HPC guest health APIs.

Microsoft Foundry Classic — Expert Guidance

Comprehensive guidance for building, configuring, troubleshooting, and deploying Microsoft Foundry Classic agents and integrations.

Docker Compose Generator

Generate and validate Docker Compose files for multi-container apps with templates, best-practice guidance, and deployment/runbook outputs.

Code Audit

Perform professional code security audits across 9 languages with configurable quick/standard/deep modes and Docker-backed verification.

Retour aux compétences