Retour à Deepseek R1 Distill
DeepSeek's R1 reasoning distilled into Llama 70B — frontier-level chain-of-thought at 70B scale on a Llama architecture.
164K tokensGratuit / Poids ouvertsTransformerMIT
Aucun score de benchmark disponible pour ce modèle.