
de humanize-chinese145
Détecte et humanise le texte généré par IA en chinois grâce à des fonctionnalités statistiques et basées sur des règles ; propose des modes CLI pour la détection, la réécriture et les flux de travail de dé-AIGC académiques.
Humanize Chinese est un ensemble d'outils et un guide de prompt locaux, sans dépendance, pour détecter et réécrire le texte généré par IA en chinois. Il combine plus de 20 catégories de détection basées sur des règles avec 8 fonctionnalités statistiques calibrées HC3 (CV de longueur de phrase, fraction de phrases courtes, densité de virgules, buckets GLTR, métriques de surprisal) pour évaluer la probabilité d'AIGC et propose des stratégies de réécriture adaptatives et des transformations de style (décontracté, Zhihu, Xiaohongshu, WeChat, académique). Le projet fournit une CLI unifiée pour les flux de détection/réécriture/académique/style/comparaison et des modèles étendus pour la paraphrase et les remplacements académiques.
À utiliser lorsqu'un utilisateur demande de "supprimer la saveur IA", d'"humaniser le texte", de "réduire le score AIGC", ou pour préparer du contenu académique pour soumission (CNKI/VIP/Wanfang) nécessitant une réduction de l'AIGC. Approprié pour les éditeurs, les chercheurs et les plateformes nécessitant une atténuation locale et auditable de l'AIGC.
Compatibilité inférée : agents capables de coder et environnements d'exécution locaux (agents avec privilèges Read/Write/Exec, agents de type Claude Code ou Copilot).
Boîte à outils de détection et d'humanisation de textes IA en chinois avec 24 scripts, dont un CLI unifié, la détection, la réécriture, les transformations de style et l'entraînement de modèles LR. Le CLI principal (humanize.py) s'exécute sans erreur et présente une aide bien documentée. Plusieurs scripts échouent gracieusement avec des entrées vides (attendu en DRY_RUN). Les scripts d'entraînement utilisent des chemins macOS codés en dur et nécessitent des corpus externes. Les actifs de données JSON vérifiés sont vides ou manquants (noté par check_assets.py doctor). Aucun problème de sécurité — Python pur, hors ligne, sans appels réseau ni identifiants.
Outil de niche impressionnant — bien documenté, sans dépendances, conçu pour l'utilisation hors ligne. Le problème principal réside dans les actifs de données manquants dans le dépôt (fichiers JSON de 0 octet), ce qui dégrade la précision de la détection. Le SKILL.md est complet mais monolithique (pas de répertoire references/ pour une divulgation progressive). Les scripts d'entraînement sont inclus mais nécessitent des corpus externes non présents dans le dépôt.