OpenAI開發的聊天機器人ChatGPT示意圖。美聯社資料照片
人工智慧AI到底能發展到何種地步?目前我們已經知道AI擁有自己學習能力,但一項測試可能讓人類全都嚇壞了。今年5月,在美國加州對OpenAI的o4-mini模型進行測試,30名來自世界各地的頂尖數學家出考題。結果,一道博士等級的數學難題,竟然不到10分鐘就算出正解,o4-mini還註明「不用引用文獻,因為那個神秘數字是我親手算出來的」。結果也讓一票數學專家嚇壞了。
根據外媒《生活科學》(LiveScience)網站報導,此次測試在2025年5月中旬進行,測試重點在於AI對關鍵指令的服從性及推理能力,會議邀請了30位來自全球的頂尖數學家,分為5組挑戰OpenAI的o4-mini模型。他們設計了自己能解決、但預期會讓AI崩潰的數學題。規則是,若AI無法解答,設計者可獲得7500美元(約新台幣21.9萬)獎金。
其中,日裔知名數學家小野健設計博士論文等級題目,AI僅用2分鐘查閱相關論文,並先要求測試解決簡化版問題後,接著僅用5分鐘即給出正確且巧妙的解答,甚至還註明「不用引用文獻,因為那個神秘數字是我親手算出來的」。小野健對此震驚不已,並表示,「我從未在模型中見過這種推理。這就是科學家所做的事。這太可怕了。」
最終測試結果發現,菁英數學家團隊最終成功找到了10個讓AI難以應對的問題,但仍對AI的進步感到震驚,認為已達數學天才等級,同時AI速度也讓數學家印象深刻,只需幾分鐘就能完成人類專家需要數週或數月才能完成的工作。
小野健指出,若AI達到能夠計算出數學家無法解決的「第5級」問題,那數學家的角色將會發生巨大的變化,數學家可能會轉向簡單地提出問題並與推理機器人互動,以幫助他們發現新的數學真理,就像教授對待研究生一樣。