
AGI 會在 1000 天內到來嗎?
2025 年,多位 AI 領域的重要人士大膽預測了 AGI 實現的時間。Anthropic 的創辦人達里奧.阿莫迪樂觀地表示 AGI 有望在 2026 年到來;DeepMind 執行長哈薩比斯認為 5 年內實現 AGI 的機率為 50%,但是強化學習之父、撰寫《苦澀的教訓》一文的理查.薩頓認為,目前的技術發展並不會把我們帶往 AGI。
AGI 會在 1000 天內到來嗎?讓我們先看一看薩頓為什麼這麼悲觀。AGI 意味著 AI 能像人和動物一樣,從外部世界的回饋中持續學習,但是薩頓認為,現在的 AI 還不能完全實現這一點。
我們知道,薩頓是強化學習之父,而強化學習其實是一種相比過去「監督學習」自主性更強的學習方式。在監督學習中,AI 需要人類作為老師告訴它正確的行動是什麼,而強化學習的 AI 不需要這個老師,但是,它依然需要一個獎勵訊號來告訴它當前的行為是好是壞。
人類和動物可以透過學習,自己找到正確的訊號是什麼:我餓了,所以要尋找食物;我學會下棋,所以能判斷怎麼下才能贏;我學會了程式設計,所以知道好的程式是怎樣的。但是,AI 目前還不能自己給自己設定獎勵訊號,而是人類為了實現不同的任務、訓練不同模型,為它預先設計了獎勵函數。這就是為什麼薩頓認為我們其實離 AGI 還很遠。而且,今天的大型語言模型很可能沒有辦法實現這個目標,這條路也許根本不能通往 AGI。
其實仔細想想,你會意識到薩頓對 AGI 的標準是異常嚴苛的。如果 AI 能給自己設定獎勵,還會隨著學習能力增強,根據不同的任務給自己設定獎勵,那其實就等於它擁有了自主意志。如果哪一天它給自己設定的目標是超越人類,我們怎麼辦?這基本上已經進入了科幻的範疇。
翻開這本書的你會開始想清楚...哪些努力,會在AI時代持續累積,又是哪些能力,將會成為下一階段的關鍵?而這些變化,很有可能會在3年內落到你身上!台大電機系教授李宏毅、知名主持人郝旭烈好評推薦:點我搶先購《未來1000天》加碼再抽AI訂閱金,別等到1000天後才想著適應。

從 Transformer 到 Researcher,AI 正在走向科學家
弄明白了這點,我們再看看其他人為什麼這麼樂觀。在凱澤看來,學習的本質就是「用更少的數據得到更多的結論」,也就是中國人常說的「舉一反三」。為了讓機器具備這種能力,人類大致走過了 4 個階段。
第一個階段是 CNN (卷積神經網路)年代,也就是 AlphaGo 在圍棋賽場上擊敗人類頂尖棋手李世石的年代;第二個階段是 Transformer 年代,也就是我們擁有了大型語言模型,機器可以理解並生成人類語言的年代;第三個階段是 Reasoner 的年代,也就是 AI 具備推理能力,AI 推理的原理,是透過強化學習讓 AI 學會用思維鏈來進行邏輯思考。
而我們正在進入的第四階段是 Researcher 的年代,也就是 AI 不僅可以推理,還能成為科學家的年代。
大型語言模型的基本架構叫作 Transformer,它有 3 個核心概念:tokenize,embedding 和 attention。tokenize 就是把人類的語言文本翻譯成機器可以處理的基本單位,這個單位叫作 token。
embedding 就是把這些 token 用向量表示出來,這個過程就好像給 AI 鋪開了一張多維度的立體地圖,在這幅地圖上面,token 和 token 之間的距離是可以用數學關係表達的。attention 就是讓模型動態關注你跟它說的話,為你說話的內容分配不同權重,進而正確理解上下文關係。
這 3 個過程環環相扣,讓 AI 看起來懂得了我們的語言。如果我們相信人類的智慧最終是可以透過「語言」這個載體表達出來,那麼,當機器能夠正確理解語言時,也就意味著它在某種意義上擁有了類似人的智慧。
從大概 2023 年開始,我們進入了 AI 推理的新階段。AI 不僅可以跟我們對話,還可以進行邏輯推理,推測出我們可能沒有思考過的新理論和新觀點。這種能力的實現,跟思維鏈和強化學習有關。什麼是思維鏈?它其實是把思考過程一步一步展開,形成一條有先後順序的推理路徑。比如你做數學題,要按步驟來解題,這個解題的過程就是思維鏈;再比如你讀一本哲學書,遇到一個論證過程,你要層層理解哲學家是怎麼論述的,這個過程也是思維鏈。
用強化學習讓 AI 使用思維鏈進行思考是怎麼回事?強化學習不需要人的監督,它只是需要人給它正確的獎勵訊號,有了這個訊號之後,AI 就會審視自己的思維鏈是否正確,就像孩子反覆檢查自己數學解題的步驟有沒有做錯那樣。經過這樣的訓練,AI 不僅可以預測下一個 token,還可以進行推理。最後,在 2025 年,我們正式進入了叫作 Researcher 的最新階段,AI 不僅可以檢查自己解題的步驟,還可以像科學家一樣研究。
正在看這篇文章的你,現在為了工作所付出的努力,有多少會在AI時代失效?6大領域、37個視角,這是一本職場中的「他們」寫給你的應對指南:點我看清未來,哪些改變會影響你。
通用型 AI 科學家,可能比自我進化的 AGI 更早到來
Researcher 與上一個叫作 Reasoner 的階段有什麼不同?第一,Researcher 的複雜程度要高很多。就像做研發比做數學題的複雜程度要高很多一樣。這主要是因為,我們今天對 GPU 的利用效率大大提高了。在 Reasoner 年代,模型一次只能處理一個問題;而在 Researcher 年代,模型可以並行處理多個問題,並根據任務類型自主分配運算資源。
第二,Researcher 可以理解任務的性質,並且知道該使用什麼樣工具來完成任務。很多人覺得,大型模型並不是真的擁有智慧,因為大型模型有幻覺,所以它計算加減乘除也會出錯。
其實這是對 AI 的錯誤理解。小學生學習加減乘除要反覆練習,但是高中生還需要練習嗎?不需要了,高中生可以直接用計算機,而對科學家來說,他們有更多工具來處理這些任務,關鍵不在於能不能算對加減乘除,在於你要知道什麼時候、用什麼工具、處理什麼任務。今天的大型模型其實已經具備這種能力了。
第三,我們今天擁有的不是某個專業化模型,不是說我為了下棋開發一個 AI,為了研發製藥開發另一個 AI,我們已經有了通用型的科學家 AI。
以上就是幾位站在技術前線的研究者在這個問題上的看法。其實我們總結下來就會發現,分歧不在於對技術本身是樂觀還是悲觀,而在於如何定義 AGI。
薩頓的觀點是,一個 AI 可以不依靠人類設定的目標實現自我成長、自我進化,這才叫 AGI。而 Google、OpenAI 和 Anthropic 的研究員則認為,通用型的 AI 科學家基本上就屬於 AGI 的範疇。
我認為,在未來 1000 天內,我們可能還沒辦法確定用什麼樣的架構能孕育出一個不斷自我進化的 AGI,但是我們一定可以看到更好、更強大的通用型 AI 科學家誕生。
具體來說,我們可能會擁有在數學、物理、化學、生物和電腦等領域,可以與人類最傑出的科學家比肩的 AI。屆時,在 AI 的助力下,越來越多人可以擺脫現行研發體系的束縛,創造出更多有價值的發現。一個研發加速的時代正在到來。
37位實踐者寫給你的應對指南,《未來1000天》郝旭烈、李宏毅好評推薦!點我購書,加碼再抽AI訂閱金擁有它,提前擘劃未來競爭力。


我的網誌