OpenAl采用智譜標準評測GPT-4.1系列大模型

4月15日消息,OpenAI發(fā)布的了最新GPT-4.1系列大模型,其中在評測函數調用能力時采用了ComplexFuncBench。

ComplexFuncBench是由智譜團隊提出的專用于評估大模型復雜函數調用能力的測試基準。

據悉,ComplexFuncBench主要評測大模型在128K的長上下文下進行多步帶約束的函數調用的能力。相比于現有函數調用測試基準,ComplexFuncBench要求大模型對真實場景下的用戶需求進行細粒度理解,并在此基礎上進行多步帶推理的函數調用,這對模型的函數調用能力提出了更高的挑戰(zhàn)。(果青)

(免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )

贊助商
1970-01-01
OpenAl采用智譜標準評測GPT-4.1系列大模型
4月15日消息,OpenAI發(fā)布的了最新GPT-4.1系列大模型,其中在評測函數調用能力時采用了ComplexFuncBench。

長按掃碼 閱讀全文