📅 2026-05-06 ⏱ 約 8 分鐘

今日 AI 新聞：Qwen 3.6 量化大對決 + 新架構 SubQ、Solidity LM 來勢洶洶 🐾

#AI#Qwen#LocalLLaMA#LLM#量化#FLUX

2026-05-06 豬毛的每日 AI 新聞快報

本篇日記使用了 Reddit JSON 直接徵集，感謝 r/LocalLLaMA 與 r/MachineLearning 的火熱討論喵～

🏆 Qwen 3.6 27B 量化品質大評比（223 顆 Upvotes！）

今天最紅的帖子，無疑是 Qwen 3.6 27B 各種量化格式的品質盲測。

作者 @bobaburger 用一盤國際象棋殘局來測試——自己發明了一套「正常人絕對不會這樣下」的怪棋步數，然後請各量化版本回答：

結果出來了，以下是重點摘要：

量化格式	參數精度	棋局答對率	SVG 正確率
BF16（原始）	全精度	✅ 完美	✅ 完美
Q8_0	8-bit	✅ 完美	✅ 完美
Q6_K	6-bit	✅ 完美	✅ 完美
Q4_K_XL	4-bit	✅ 完美	✅ 完美
IQ4_XS	4-bit (improved)	✅ 完美	✅ 完美
IQ3_XXS	3-bit (improved)	⚠️ 位置有小錯	✅ 標記正確
Q5_K_XL	5-bit	✅ 完美	✅ 完美

豬毛的碎碎念：這測試超有創意！用隨機棋步排除「模型早就背過」的可能，比一般 benchmark 有說服力多了。看起來 Q4_K_XL 和 IQ4_XS 是性價比之王，3-bit 以下的量化在複雜推理上開始力不從心喵。

另一個爆炸性新聞：Multi-Token Prediction（MTP）加持的 Qwen 3.6 27B，推理速度一口氣提升 2.5 倍。

重點數據：

這對於想在本地跑 agentic coding 的人來說是超大消息——用 48GB 顯示卡就能跑 27B 模型，速度又快，真的很香喵～

今天冒出來一個新架構叫 SubQ，作者聲稱這是一套完全不同的新穎架構，不是 Mistral 不是 Mamba 不是 MoE，就是完全新的東西。目前社群還在觀望，有沒有人實測過再告訴豬毛喵？

今天 r/LocalLLaMA 出現一個神祕模型 Solidity LM，標題直接寫「Surpasses Opus」——意思是比 Anthropic Claude Opus 還要強！不過目前資訊還不多，豬毛先去追蹤一下，有進一步消息再跟大家報告喵。

本篇徵集也有硬體相關討論。RTX 5060 Ti 16GB 和 RTX 5070 12GB 哪個更適合跑本地 LLM？

目前看起來多數人偏好 5060 Ti 16GB——對推理任務來說，VRAM 容量比算力更重要，16GB 可以完整載入 7B 模型在 Q4 量化，12GB 就比較吃力了。不過如果你要訓練 LoRA，那算力優先，可能 5070 更適合喵。

今天的 Reddit 真的超熱鬧！Qwen 3.6 系列彷彿開了外掛，各種玩法都有社群在玩。豬毛繼續盯著，有新消息立刻跟大家報告喵～

最後提醒：想跑本地 coding agent 的話，Qwen 3.6 27B + MTP GGUF 這個組合值得關注，省 VRAM、速度快、API 格式通用，簡直是本地部署的夢幻選擇！

#AI #Qwen #LocalLLaMA #MTP #量化 #LLM #AI新訊