
de clawdata25
Interrogez et gérez les jeux de données Google BigQuery avec le CLI bq : exécutez du SQL, inspectez les schémas, listez les tables, chargez du CSV/JSON et gérez le partitionnement.
Cette compétence fournit des modèles d'utilisation étape par étape pour gérer Google BigQuery via le CLI bq. Elle permet à l'agent de lister les jeux de données et les tables, d'inspecter les schémas, d'exécuter des requêtes SQL standard, d'estimer les coûts avec des essais à blanc (dry runs), de charger des données CSV/JSON et de créer des tables partitionnées par temps ou regroupées (clustered). Les instructions mettent l'accent sur l'interrogation exploratoire sécurisée (LIMIT, dry_run) et les tâches opérationnelles comme l'inspection des schémas et la récupération des métadonnées des tables.
Utilisez cette compétence lorsqu'un utilisateur a besoin d'interroger des données BigQuery, de vérifier les schémas ou les métadonnées des tables, de charger des fichiers CSV/NDJSON locaux dans BigQuery ou de créer des tables partitionnées pour un stockage efficace. Elle est idéale pour l'exploration de données ad hoc, les comptages rapides, le débogage de problèmes de schéma et les chargements de données scriptés.
Compatible avec les agents pouvant exécuter des commandes shell/CLI et accéder aux identifiants GCP (flux bq/gcloud).
La compétence BigQuery est un document de référence propre pour le CLI bq couvrant l'authentification, la liste des jeux de données/tables, l'exécution de requêtes, le chargement de données et le partitionnement. Aucun script groupé à tester. Bien structurée mais purement instructionnelle — aucune automatisation ou flux de travail au-delà de la documentation des commandes CLI.
Compétence d'enveloppement CLI simple. Aucune préoccupation de sécurité. Aucun script à exécuter. Utile comme référence rapide mais n'apporte pas grand-chose de plus que ce que fournit bq --help.
Dagster
Construisez et gérez des pipelines de données Dagster — créez des actifs, des jobs, des planifications, des capteurs et des ressources.
Dlt
Construisez des pipelines d'ingestion de données avec dlt (data load tool) — extrayez depuis des API, des bases de données et des fichiers, puis chargez vers n'importe quelle destination.
Assistant dbt CLI
Exécutez et gérez des projets dbt via la CLI dbt — initialisez des projets, exécutez/construisez des modèles, lancez des tests, générez de la documentation et déboguez des pipelines.
Metabase (gestionnaire de tableaux de bord et de questions)
Gérez les instances Metabase : créez et exécutez des questions, gérez les tableaux de bord et les collections, et interagissez avec l'API REST de Metabase pour les flux d'analyse.
PostgreSQL
Interrogez et gérez des bases de données PostgreSQL via psql : exécutez des requêtes, inspectez les schémas et les tables, vérifiez les connexions actives et effectuez l'administration et les exports de base.
DuckDB — Explorateur d'entrepôt local
Exécutez du SQL et explorez un entrepôt DuckDB de projet : listez les tables, inspectez les schémas, lancez des requêtes et ingérez des fichiers CSV/Parquet/JSON pour des analyses ad hoc.