極客網(wǎng)·極客觀察5月26日 如果能精準(zhǔn)預(yù)測未來,就能在生活中占盡先機(jī),無論是預(yù)判房價(jià)漲跌,還是捕捉下一個(gè)產(chǎn)業(yè)風(fēng)口,預(yù)測的魅力都無人可擋。隨著 AI 技術(shù)的蓬勃發(fā)展,一個(gè)核心問題開始引發(fā)思考:人工智能能否成為超越人類的超級預(yù)測者?
在這一思潮的推動下,預(yù)測領(lǐng)域正加速構(gòu)建 AI 預(yù)測機(jī)器人。事實(shí)上,這類技術(shù)早就已經(jīng)出現(xiàn)在金融市場,比如 DeepSeek就是憑借算法交易模型起家的。但目前業(yè)界的共識是:頂尖人類預(yù)測者仍全面領(lǐng)先于機(jī)器。
以專業(yè)預(yù)測平臺 Metaculus 為例,它定期舉辦季度預(yù)測錦標(biāo)賽。最開始時(shí)賽事只允許人類參與,近年新增 AI 機(jī)器人組別。觀察2024 年三季度、四季度及 2025年一季度的預(yù)測結(jié)果,我們可以發(fā)現(xiàn)人類超級預(yù)測者優(yōu)于機(jī)器。
不過 Metaculus CEO 德格?圖蘭(Deger Turan)指出一個(gè)關(guān)鍵趨勢:人類預(yù)測的能力基本穩(wěn)定,而 AI 的進(jìn)步肉眼可見,兩者的差距正在縮小。
能否優(yōu)化AI的預(yù)測能力
預(yù)測能力蘊(yùn)含著巨大價(jià)值:律師想預(yù)判對手是否接受和解,建筑項(xiàng)目要估算竣工時(shí)間,電影制片人想押中爆款劇本,甚至單身者都想知道約會對象更愛咖啡還是啤酒。毫無疑問,人人都想成為預(yù)測大師。
從技術(shù)本質(zhì)看,AI 預(yù)測的邏輯并不復(fù)雜:通過海量數(shù)據(jù)訓(xùn)練大模型,使其具備對未知場景的推演能力。預(yù)測已經(jīng)形成獨(dú)特的知識體系,比如“基礎(chǔ)率”(某現(xiàn)象的歷史發(fā)生概率,以避免過度樂觀或悲觀的預(yù)測偏差)、“布里爾分?jǐn)?shù)”(用于衡量概率預(yù)測準(zhǔn)確性的評估指標(biāo))、“校準(zhǔn)度”(模型預(yù)測的概率與實(shí)際事件發(fā)生概率之間的一致性)已經(jīng)成為預(yù)測學(xué)的基石。人類將終極目標(biāo)指向 “超級預(yù)測者”,它們的準(zhǔn)確率遠(yuǎn)超平均水平,預(yù)測結(jié)果具有持續(xù)可靠性。
2024 年 10 月,國際AI領(lǐng)域非營利組織人工智能安全中心(Center for AI Safety)宣稱,僅通過大語言模型抓取新聞就能實(shí)現(xiàn) “超人級” 預(yù)測,但這一結(jié)論很快因 “數(shù)據(jù)污染” 崩塌,模型誤將本不該獲取的信息納入其中,導(dǎo)致結(jié)果無法復(fù)現(xiàn)。
相比之下,加州大學(xué)伯克利分校的方案更具參考價(jià)值,它的預(yù)測模型也是基于大模型開發(fā)的,但增加了許多限制,比如,不允許機(jī)器人自動運(yùn)行,而是按特定順序執(zhí)行系列任務(wù)。具體來說就是增加的特定框架,首先要求模型制定一系列問題,根據(jù)問題獲取相關(guān)新聞內(nèi)容;第二步,新聞服務(wù)給出回應(yīng),大語言模型判斷哪些回應(yīng)最實(shí)用;然后根據(jù)相關(guān)度最高的回應(yīng)進(jìn)行匯總。
實(shí)驗(yàn)數(shù)據(jù)顯示,若直接調(diào)用大語言模型進(jìn)行預(yù)測,不做結(jié)構(gòu)化處理,其準(zhǔn)確率經(jīng)常接近甚至低于隨機(jī)猜測水平,這表明單純依賴大模型難以有效捕捉復(fù)雜邏輯關(guān)系。而經(jīng)過結(jié)構(gòu)化訓(xùn)練后,AI 機(jī)器人的預(yù)測準(zhǔn)確率顯著提升。
盡管近年來 AI 能力取得顯著進(jìn)步,但在預(yù)測領(lǐng)域仍未能超越人類,更無法企及 "超級預(yù)測者" 水平。展望未來,預(yù)測模型將更趨 "結(jié)構(gòu)化" 發(fā)展,人機(jī)協(xié)作的深度與廣度也將進(jìn)一步提升。
預(yù)測的難點(diǎn)在哪里
開發(fā) AI 預(yù)測工具的 FutureSearch 公司 CEO 丹?施瓦茨指出:“從學(xué)術(shù)層面看,至今沒有成果能超越加州大學(xué)伯克利分校的論文,而那篇研究已發(fā)布超一年?!痹?AI 領(lǐng)域,一年時(shí)光足以見證技術(shù)迭代。這一現(xiàn)狀既印證了伯克利團(tuán)隊(duì)的突破性,也暴露了 AI 預(yù)測的深層困境:語言模型在定量分析與邏輯推理上存在天然缺陷,面對復(fù)雜問題時(shí),大模型的預(yù)測能力更糟糕。
但伯克利研究團(tuán)隊(duì)仍保持樂觀。他們強(qiáng)調(diào),盡管 AI 存在局限性,但從 ChatGPT 問世至今不過數(shù)年,當(dāng)前 AI 預(yù)測能力已逼近人類平均水平。若能將專業(yè)預(yù)測概念深度植入 AI 系統(tǒng),其表現(xiàn)完全有可能超越人類頂尖預(yù)測團(tuán)隊(duì)。
回望歷史,人類本就是極不擅長預(yù)測的物種,無論是經(jīng)濟(jì)危機(jī)還是技術(shù)變革,無數(shù)誤判早已證明這一點(diǎn)。
想擁有良好的預(yù)測能力,需要誠實(shí)面對錯(cuò)誤,不斷汲取教訓(xùn),要不斷調(diào)整觀點(diǎn),不能被新聞評論或者別人的討論干擾,還要對所有信息都給予恰當(dāng)重視,這本來就反人性的。如果讓AI來處理,可能效果會更好。
幾年前,美國曾出版過一本名叫《超級預(yù)測》的書,作者是賓夕法尼亞大學(xué)心理學(xué)家Philip Tetlock,雖然本書曾引起熱議,但幾乎沒多少人認(rèn)為有明確的預(yù)測策略存在。一個(gè)耐人尋味的現(xiàn)象是:當(dāng)印巴沖突升級或中美關(guān)稅談判膠著時(shí),鮮見 “超級預(yù)測者” 在媒體頭條發(fā)表觀點(diǎn);在白宮政策制定過程中,也難覓他們的身影;就連最依賴預(yù)測的投資機(jī)構(gòu)也極少將 “超級預(yù)測者” 納入決策鏈條。
如此現(xiàn)狀引出另一個(gè)問題:世界對人類超級預(yù)測者的需求并不強(qiáng),但如果是由機(jī)器來預(yù)測呢,情況會不會改變?
從當(dāng)前各大科技公司的研發(fā)方向看,"超級 AI 預(yù)測工具" 尚未成為重點(diǎn)研發(fā)領(lǐng)域。即便成功研發(fā)出強(qiáng)大的 AI 預(yù)測工具,如何獲取決策者的信任仍是一大難題。
現(xiàn)代大語言模型本質(zhì)上是一個(gè) "黑箱" 系統(tǒng):當(dāng)人們提出問題并讓其預(yù)測時(shí),實(shí)際上無法知曉大模型是如何通過計(jì)算得出最終答案的。
未來,人類可能會要求 AI 對預(yù)測結(jié)果進(jìn)行解釋,而決策者往往只會在解釋合理的情況下才采納其建議。當(dāng)工具出現(xiàn)時(shí),我們最開始肯定會保持懷疑態(tài)度,隨著時(shí)間推移,AI需要用令人信服的預(yù)測成績征服人類,然后才能改變?nèi)祟惖臎Q策方式。(小刀)
- 鯤鵬向“智”,“轅”啟未來
- 人形機(jī)器人格斗首秀背后:一場生態(tài)體系的中美較量
- 開放創(chuàng)新托舉產(chǎn)業(yè)生態(tài),昇騰AI持續(xù)升騰
- 硅基模型vs.碳基大腦:AI能否成為超越人類的超級預(yù)測者?
- 1ms城市算網(wǎng)中國行正式啟動,城市數(shù)字化發(fā)展迎新方向
- “創(chuàng)新取實(shí)”vs.“投機(jī)主義”:5G與ORAN六年發(fā)展結(jié)果迥異
- AI遭遇生產(chǎn)力和營收困境,“索洛悖論”正在重演?
- 特朗普極力向沙特推銷AI 項(xiàng)目能否落地要打個(gè)問號
- 華為鴻蒙電腦來了!真正挑戰(zhàn)Wintel的先鋒力量
- 模型越新幻覺越重!AI幻覺扣住產(chǎn)業(yè)發(fā)展命脈
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。