Humaniser le Chinois

Score de confiance 84/100

Détecte et humanise le texte généré par IA en chinois grâce à des fonctionnalités statistiques et basées sur des règles ; propose des modes CLI pour la détection, la réécriture et les flux de travail de dé-AIGC académiques.

déclencheurs:去AI味humanize chineseAIGC降重detect AI text论文降重

GitHub SKILL.md

Ce que cela fait

Humanize Chinese est un ensemble d'outils et un guide de prompt locaux, sans dépendance, pour détecter et réécrire le texte généré par IA en chinois. Il combine plus de 20 catégories de détection basées sur des règles avec 8 fonctionnalités statistiques calibrées HC3 (CV de longueur de phrase, fraction de phrases courtes, densité de virgules, buckets GLTR, métriques de surprisal) pour évaluer la probabilité d'AIGC et propose des stratégies de réécriture adaptatives et des transformations de style (décontracté, Zhihu, Xiaohongshu, WeChat, académique). Le projet fournit une CLI unifiée pour les flux de détection/réécriture/académique/style/comparaison et des modèles étendus pour la paraphrase et les remplacements académiques.

Quand l'utiliser

À utiliser lorsqu'un utilisateur demande de "supprimer la saveur IA", d'"humaniser le texte", de "réduire le score AIGC", ou pour préparer du contenu académique pour soumission (CNKI/VIP/Wanfang) nécessitant une réduction de l'AIGC. Approprié pour les éditeurs, les chercheurs et les plateformes nécessitant une atténuation locale et auditable de l'AIGC.

Ce qui est inclus

Scripts : points d'entrée CLI et scripts autonomes dans le dépôt (détection, réécriture, transformations de style, mode académique)
Références : calibration avec le benchmark HC3-Chinese et signaux statistiques documentés
Instructions : utilisation détaillée de la CLI, flux de travail étape par étape (détecter → réécrire → vérifier → styliser) et fichiers de configuration pour les motifs et les poids

Agents compatibles

Compatibilité inférée : agents capables de coder et environnements d'exécution locaux (agents avec privilèges Read/Write/Exec, agents de type Claude Code ou Copilot).

Étiquettes

#nlp #aigc #chinese #text-processing #humanization #cli #academic

Scripts exécutés dans un bac à sableExécution réussieAudité le May 11, 2026

Résumé de l'audit

Boîte à outils de détection et d'humanisation de textes IA en chinois avec 24 scripts, dont un CLI unifié, la détection, la réécriture, les transformations de style et l'entraînement de modèles LR. Le CLI principal (humanize.py) s'exécute sans erreur et présente une aide bien documentée. Plusieurs scripts échouent gracieusement avec des entrées vides (attendu en DRY_RUN). Les scripts d'entraînement utilisent des chemins macOS codés en dur et nécessitent des corpus externes. Les actifs de données JSON vérifiés sont vides ou manquants (noté par check_assets.py doctor). Aucun problème de sécurité — Python pur, hors ligne, sans appels réseau ni identifiants.

Points d'attention

Les actifs de données principaux (patterns_cn.json, ngram_freq_cn.json, fichiers de coefficients LR) font 0 octet dans le dépôt — un nouveau clone aura une détection/réécriture dégradée jusqu'à ce que les actifs soient reconstruits
Les scripts d'entraînement utilisent des chemins codés en dur /Users/mac/ — ne fonctionneront pas immédiatement sur d'autres systèmes
Les messages d'erreur sont en chinois — peuvent confondre les utilisateurs ne parlant pas chinois
Certains scripts échouent en l'absence de --style ou avec une entrée vide sans indications d'utilisation claires

Notes

Outil de niche impressionnant — bien documenté, sans dépendances, conçu pour l'utilisation hors ligne. Le problème principal réside dans les actifs de données manquants dans le dépôt (fichiers JSON de 0 octet), ce qui dégrade la précision de la détection. Le SKILL.md est complet mais monolithique (pas de répertoire references/ pour une divulgation progressive). Les scripts d'entraînement sont inclus mais nécessitent des corpus externes non présents dans le dépôt.

Informations

Dépôt: humanize-chinese
Étoiles: 145

Score de confiance

Global84

Sécurité92

Qualité du code78

Architecture72

Utilité68

Compétences similaires

Academic Research Search

Search academic literature across multiple sources, deduplicate results, resolve DOIs, and surface trusted papers with concise takeaways.

Readwise Reader Document Management

Manage Readwise Reader documents: list, save, search, move, tag, highlight, export and bulk-edit via official and custom CLIs.

Junshi — Research Advisor

Daily strategic research advisor that scans arXiv/venues, digests papers, and proposes bold, ranked research ideas tailored to the user's profile.

ezBookkeeping API Tools

Command-line API tools for ezBookkeeping: record and query transactions, retrieve accounts/categories/tags, and fetch exchange rates for self-hosted personal fi

注意力计算器 (Attention Calculator)

Thin-client skill that queries a hosted service to generate rigorous integral proofs for 29 classes of mathematical inequalities (returns LaTeX proofs).

Tmux Bridge

Give an agent controlled access to a local tmux terminal bridge so it can run shell commands, capture output, and manage sessions on the user's machine.

SourceSage CLI

Generate concise, LLM-friendly repository summaries (Markdown) using the SourceSage CLI — supports lite mode, language switching, and targeted repo analysis.

Nit (Nitter CLI)

Terminal client to browse tweets, view profiles, and search posts via Nitter instances without opening a browser.

Retour aux compétences