Qwen 3.6 27B Dense modèle atteint 40 tok/s sur RTX 3090

robot
Création du résumé en cours

AIMPACT message, 24 avril 2026 (UTC+8), l’utilisateur @sudoingX a publié les résultats préliminaires : le modèle dense Qwen 3.6 27B sur une seule carte RTX 3090 24GB a passé le test 10/10 à une vitesse de 40 tok/s. Ce résultat n’a pas utilisé de techniques de quantification ou de noyaux fusionnés, seulement une quantification directe Q4_K_M avec llama.cpp. L’utilisateur a également écrit un benchmark de groupe de particules pour évaluer le modèle. (Source : InFoQ)

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler