Retour à Deepseek R1 Distill
DeepSeek's R1 reasoning distilled into an 8B Qwen3 base — strong chain-of-thought at a compact, deployable size.
164K tokensGratuit / Poids ouvertsTransformerMIT
Aucun score de benchmark disponible pour ce modèle.
DeepSeek's R1 reasoning distilled into an 8B Qwen3 base — strong chain-of-thought at a compact, deployable size.
Aucun score de benchmark disponible pour ce modèle.