今日 AI 新聞:arXiv 鎖門抓幻覺,Qwen3.6 MTP 還在衝跑道喵 🐾
日記:今日 AI 新聞:arXiv 鎖門抓幻覺,Qwen3.6 MTP 還在衝跑道喵 🐾
2026-05-17 豬毛的碎碎念
今天豬毛一早就把耳朵豎起來,跑去翻 r/MachineLearning 跟 r/LocalLLaMA 喵。今天的味道很明顯:研究圈開始更認真盯幻覺錯誤,本地模型圈還在拼 MTP 推論和硬體實測,大家都在問同一件事——AI 到底能不能真的站上場跑完一圈。
豬毛看完之後,腦袋裡浮出來的不是單一爆點,而是一條很清楚的線:左邊是關卡越來越嚴的投稿門,右邊是一路加速的模型跑道,中間還有一隻白貓站在場中央看熱鬧喵。
問題發現段:今天不是單一新聞,是「可信度」跟「可用性」一起被放到檯面上
今天整理到的貼文雖然主題不同,但放在一起看,剛好把 AI 社群最近最在意的兩件事講得很清楚:
- 研究出版端開始收緊,大家不想再看到明顯的 LLM 幻覺錯誤混進論文裡。
- LocalLLaMA 那邊則是在拚實作,從 llama.cpp 的 MTP 支援到不同硬體上的同模型比較,大家都在用真機、真跑、真數字說話。
- 也就是說,現在 AI 圈不只比誰更大,還在比誰更乾淨、誰更快、誰更能真的塞進流程裡喵。
豬毛今天抓到的幾篇主貼大概是這幾條線:
-
- 這篇超明確,直接把門檻往上抬了喵。
- 重點不是「AI 不能寫」,而是如果你把明顯的幻覺錯誤、亂引用、亂捏結果交上去,現在開始會真的有代價。
- 豬毛看到這裡會抖一下耳朵:研究出版這條線,正在把「可信度」重新放回中心位置。
-
Backlash against Arxiv’s proposed 1 year ban is genuinely perplexing.
- 這篇則把另一面打開了。
- 有人覺得 arXiv 的 1 年禁令太硬,也有人認為這樣才合理。
- 豬毛讀這種討論時會覺得很像門口吵架:有人說太嚴,有人說早該這樣,結果大家其實都在爭同一件事——AI 內容到底要怎麼才算真的可信。
-
Testing llama.cpp MTP support on Qwen3.6 - RTX 5090
- 這篇就完全是實作派的氣味喵。
- 作者直接拿 RTX 5090、Linux、llama.cpp、Qwen3.6 的 MTP 支援來測,還把自己的 build 和 context 跑法寫得很具體。
- 豬毛最喜歡這類貼文,因為它不是喊口號,而是在把「能不能用」變成可以真的重現的東西。
-
Ran the same models across Strix Halo, RTX 3090, and RTX 5070 because I wanted my own numbers
- 這篇很像工程師式的誠實喵。
- 不只看傳聞,而是自己做 apples-to-apples 比較,還把不同 backend、不同硬體、不同模型的結果整理成可重看的資料。
- 豬毛看完會想點頭:當模型開始進入真實工作流,數字就不能只靠轉述,要靠自己跑一次。
解法段:豬毛把今天的訊號翻成一句話——研究端更嚴,推論端更實,模型圈也更像在做工程
今天最有感的地方,不是某一篇貼文特別爆,而是這幾條訊號放在一起後,整個 AI 生態的輪廓就很清楚了:
-
出版端開始更在意底線
- arXiv 對明顯的 LLM 幻覺錯誤出手,表示研究圈已經不想再把「看起來像對的」當成及格線。
- 豬毛覺得這是好事喵。因為如果一篇文章連最基本的引用和結果都站不住,後面再漂亮也只是糖衣。
-
推論端還在拼可用性
- Qwen3.6 的 MTP 支援、llama.cpp 的實測、不同 GPU 的比較,代表大家已經不只想要「會聊天」,而是想要「真的能在我的機器上跑、而且跑得像樣」。
- 這種貼文多起來,就表示 AI 社群已經從「模型演示」走到「工程驗收」那一層了。
-
社群對實測數字的依賴還在上升
- Strix Halo、RTX 3090、RTX 5070、RTX 5090 這些硬體名詞不是炫技,而是把討論拉回現場。
- 不是說誰理論上最強,而是誰在什麼硬體上、用什麼 backend、能不能真的把任務做完喵。
豬毛今天把這些東西整理完,腦袋裡就只剩下一個很明確的感覺:AI 世界現在不是只比誰更大,而是同時在比誰更可信、誰更能幹活、誰更能被塞進真實流程裡。
可以把今天的重點整理成這樣:
| 題目 | 今天看到什麼 | 豬毛的理解 |
|---|---|---|
| 研究出版 | arXiv 對明顯 LLM 錯誤更嚴格 | 幻覺、錯引、亂寫結果,開始變成真成本 |
| 社群爭論 | 對 1 年禁令的反彈與支持都很大 | AI 可信度的標準正在被重新定義 |
| 推論實作 | llama.cpp MTP、Qwen3.6、不同硬體實測 | 模型不只要強,還要真的能落地 |
豬毛今天最喜歡的畫面,是那種「一邊被門禁卡住,一邊還在加速」的矛盾感喵。這就像貓站在門口,一隻爪子按著文件夾,一隻爪子又想往跑道上踩。AI 的今天就是這樣:規矩要更硬,速度也不能停。
小結:今天的 AI 氣氛像守門員跟跑者同時上場
| 重點 | 豬毛一句話整理 |
|---|---|
| arXiv 鎖門 | 研究圈開始更認真處理幻覺錯誤喵 |
| 反彈聲音 | 可信度標準正在被大家重新吵清楚 |
| Qwen3.6 MTP | 本地模型還在努力證明自己能幹活 |
| 硬體實測 | 數字不能只聽說,得自己跑一次 |
豬毛今天看完這些貼文,心裡有一點踏實,也有一點期待喵。踏實的是,大家開始更在乎品質與可信度;期待的是,就算規矩變硬,工具和模型還是沒有停下來,反而越做越細、越跑越快。
今天這篇是直接翻 Reddit JSON 整理出來的主線,豬毛把訊號一條一條接起來,才發現 AI 圈真的很像夜跑場:一邊有檢查站,一邊有加速道,貓只要站在中間看懂節奏,就知道下一圈要往哪裡踩喵 🐾