今天,在 FORCE 原動力大會上,火山引擎正式發(fā)布豆包大模型1.6、豆包·視頻生成模型 Seedance 1.0 pro、豆包·語音播客模型,豆包·實時語音模型在火山引擎全量上線,豆包大模型家族已成為擁有全模態(tài)、全尺寸、高性價比的領先模型。截至2025年5月底,豆包大模型日均 tokens 使用量超過16.4萬億,較去年5月剛發(fā)布時增長137倍。
字節(jié)跳動 CEO 梁汝波表示,做好火山引擎對字節(jié)跳動成為一家優(yōu)秀的科技公司、保持技術競爭力很重要。未來,字節(jié)跳動會堅定長期投入,追求智能突破,服務產業(yè)應用。
字節(jié)跳動 CEO 梁汝波
在價格方面,豆包大模型1.6采用統(tǒng)一定價模式,首創(chuàng)按“輸入長度”區(qū)間定價,在企業(yè)使用最多的輸入?yún)^(qū)間0-32K 范圍內,豆包大模型1.6的價格為輸入0.8元/百萬 tokens、輸出8元/百萬 tokens,綜合成本比豆包1.5·深度思考模型、DeepSeek R1降低63%。Seedance 1.0 pro 模型每千 tokens 0.015元,相當于每生成一條5秒的1080P 視頻只需3.67元,行業(yè)最低。
目前,能自主思考、規(guī)劃、完成任務的 Agent 正在逐步進入企業(yè)生產場景,這不僅需要模型做到強推理、多模態(tài)、低成本,也需要升級 AI 云原生全棧服務。大會上,字節(jié)跳動技術副總裁洪定坤、火山引擎總裁譚待發(fā)布了12款面向 Agent 開發(fā)和應用的工具產品。
針對 Agent 開發(fā),升級 AI IDE“TRAE”,發(fā)布火山引擎 MCP 服務、Prompt 優(yōu)化工具“PromptPilot”、開源的 veRL 強化學習框架、AI 知識管理產品;大數(shù)據(jù)服務上,發(fā)布多模態(tài)數(shù)據(jù)湖、AI 數(shù)字專家“Data Agent”;AI 基礎設施上,針對 Agent 開發(fā)、模型訓練和推理,發(fā)布 AgentKit、TrainingKit、Servingkit;安全是一切 Agent 運行的基礎,為此火山引擎發(fā)布 AICC 私密計算、大模型應用防火墻。
譚待表示,AI 時代,開發(fā)范式、大數(shù)據(jù)、計算、安全都在發(fā)生重大變化,由此構成的“AI 云原生”全新技術棧,是企業(yè)構建好 Agent、創(chuàng)新發(fā)展的關鍵。
火山引擎總裁 譚待
豆包大模型1.6正式發(fā)布 更強模型 更高性價比
全新發(fā)布的豆包大模型1.6系列由三個模型組成,為企業(yè)提供多樣化選擇。
doubao-seed-1.6:All-in-One 的綜合模型,是國內首個支持256K 上下文的思考模型,支持深度思考、多模態(tài)理解、圖形界面操作等多項能力。支持選擇開啟或關閉深度思考、自適應思考三種方式,其中自適應思考模式可根據(jù)提示詞難度自動決定是否開啟思考,提升效果的同時大幅減少 tokens 消耗。
doubao-seed-1.6-thinking:豆包大模型1.6系列在深度思考方面的強化版本;在代碼、數(shù)學、邏輯推理等基礎能力上進一步提升;支持256K 上下文。
doubao-seed-1.6-flash:豆包大模型1.6系列的極速版本,支持深度思考、多模態(tài)理解、256K 上下文;延遲極低,TOPT 僅需10ms;視覺理解能力比肩友商旗艦模型。
豆包大模型1.6具有更強的模型效果,在眾多權威測評集上,得分均屬于國際第一梯隊。在推理能力、多模態(tài)理解能力、GUI 操作能力上具備領先優(yōu)勢。
推理能力
豆包大模型1.6在推理速度、準確度與穩(wěn)定性上顯著提升,可支撐更復雜的業(yè)務場景落地。
例如,有媒體針對今年的高考全國新一卷數(shù)學單科做了測評,豆包的成績是144分,全國第一。而在高考前,在針對海淀區(qū)模擬全卷的測評中,相比去年的模型,豆包大模型1.6理科成績顯著提升了154分,文科提升了90分。
豆包大模型1.6具有邊想邊搜、DeepResearch 深度研究能力,能獨立思考、規(guī)劃、使用搜索等各種研究工具。例如豆包 APP 和 PC 端正在小流量測試的 DeepResearch 功能,可以把過去需要多名專業(yè)人士花費數(shù)天寫成的調研報告,縮短到5-30分鐘內完成,還能自動提煉信息,總結成網(wǎng)頁,方便查閱。
為方便企業(yè)使用“邊想邊搜”和 DeepResearch 功能,火山引擎打造了大模型應用實驗室,并開源了手機助手、實時視頻理解、DeepSearch 等應用,幫助企業(yè)快速搭建 AI 應用原型,靈活編排自己的專屬智能體。用戶可在火山引擎官網(wǎng)大模型應用實驗室、GitHub 方舟開源站點下載使用。
多模態(tài)理解
多模態(tài)理解的核心是“讓模型像人一樣理解世界”。豆包大模型1.6全系列均原生支持多模態(tài)思考能力,讓模型可以理解和處理真實世界的問題。該能力支持了豆包 APP 最新的實時視頻通話功能,在企業(yè)端可廣泛應用于電商商品審核、自動駕駛標注、安全巡檢等場景。
GUI操作能力
豆包大模型1.6憑借領先的視覺深度思考能力、精準的視覺定位能力,能夠讓智能體與瀏覽器及其他軟件進行交互和操作,高效執(zhí)行各類任務。
更高性價比
豆包大模型1.6采用統(tǒng)一定價模式,無論是否開啟深度思考模式,無論是文本還是視覺,tokens 價格均一致,按照輸入上下文長度區(qū)間定價。
在絕大部分企業(yè)使用的輸入?yún)^(qū)間0-32K 范圍內,價格是輸入0.8元/百萬 tokens,輸出8元/百萬 tokens
在輸入?yún)^(qū)間32K-128K 的范圍內,價格是輸入1.2元/百萬 tokens,輸出16元/百萬 tokens
在輸入?yún)^(qū)間128K-256K 的范圍內,價格是輸入2.4元/百萬 tokens,輸出24元/百萬 tokens
從綜合成本來看,絕大部分請求輸入都在32K 以內,輸入輸出占比在3:1,豆包大模型1.6的綜合成本(2.6元)比豆包大模型1.5·深度思考模型、DeepSeek R1的綜合成本(7元)下降63%,相當于只需原來三分之一的價格,就能使用能力更強、原生多模態(tài)的新模型。
此次火山引擎還增設特惠區(qū),對于輸入32K、輸出200 tokens 以內的請求,豆包大模型1.6的價格將進一步降低到輸入0.8元/百萬 tokens、輸出2元/百萬 tokens。相當于絕大部分非思考模型的需求,也可以安心使用更好效果的新模型。
豆包·視頻生成模型Seedance 1.0 pro正式發(fā)布
全新發(fā)布的豆包·視頻生成模型 Seedance 1.0 pro 具備三大特性:無縫多鏡頭敘事、多動作及隨心運鏡、穩(wěn)定運動與真實美感,在電商、影視、游戲等行業(yè)應用前景廣闊。
根據(jù)第三方權威榜單 Artificial Analysis 最新結果,Seedance 1.0 pro 在文生視頻、圖生視頻兩個維度都超越了業(yè)界諸多主流模型,登頂全球競技場第一。
Seedance 1.0 pro 的價格是每千 tokens 1分5厘,相當于每生成一條5秒的1080P 視頻只需3.67元。假如有1萬元預算,通過 Seedance 1.0 Pro 可制作2,700多條5秒的1080P 視頻,通過 Seedance 1.0 lite 可以制作9,700多條視頻。
兩款豆包語音大模型上新
語音正在成為 AI 應用和 Agent 的核心交互方式,小米汽車、OPPO、美圖、兒歌多多等企業(yè)已使用豆包語音大模型提升產品創(chuàng)新體驗。
今天,豆包·實時語音模型全量上線火山方舟,對企業(yè)客戶開放使用。該模型支持自然語言高級指令控制,具備唱歌表演、聲線模仿、方言演繹等多種能力,語氣、用語、思考方式等擬人感大幅提升,能隨時打斷與主動搭話。
此外,火山引擎還發(fā)布了豆包·語音播客模型。只需輸入一句話、網(wǎng)頁鏈接、長文本或文檔,語音播客模型即可快速搜索學習,生成播客腳本后創(chuàng)作出來;模型可秒級生成雙人對話式播客作品,效果自然,具有互相附和、插話、猶豫等播客節(jié)奏;自帶的深度搜索功能可生成跟進熱點話題的播客內容。
AI云原生全棧服務發(fā)布 讓Agent從Demo走進企業(yè)生產系統(tǒng)
AI 時代,開發(fā)范式將發(fā)生重大變化,調用中心正在從程序員轉移到大模型,這就需要更好的模型和模型工具平臺。在基礎設施層,計算(以 GPU 為核心的計算和網(wǎng)絡系統(tǒng))、大數(shù)據(jù)(多模態(tài))、安全(防御惡意AI)也正在發(fā)生巨變。為此,火山引擎發(fā)布AI云原生全棧服務,幫助企業(yè)加速 Agent 落地。
Agent開發(fā) 用好AI+做好AI
火山引擎智能算法負責人吳迪表示,要構建高生產力的 Agent,既要用好 AI,整合高質量的應用;又要做好 AI,關注底層技術本身的優(yōu)化和創(chuàng)新。
為幫助企業(yè)高效構建 Agent,此次火山引擎發(fā)布和升級了五款產品:
AI IDE產品TRAE升級:為開發(fā)者提供代碼補全、局部代碼生成功能,支持代碼重構、批量修改、知識問答等復雜任務,下一個版本還將整合不同 Agent 和工具,協(xié)調任務流程,實現(xiàn)自動串聯(lián)操作,逐步從 AI 輔助編程向支持 AI 開發(fā)全流程進階。今年1月上線至今,TRAE 月活用戶已經超過了100萬。
發(fā)布火山引擎MCP服務:鏈接 Agent 開發(fā)體系、大模型工具生態(tài)、云服務。與 TRAE、 火山方舟、 扣子打通,一鍵選擇200+豐富 MCP 服務;開發(fā)者可以通過 MCP,控制火山引擎的云服務組件,便捷地完成計算、網(wǎng)絡、存儲等環(huán)境部署,更快地把一個創(chuàng)意,變成一個成熟的產品。
發(fā)布PromptPilot:可以幫助開發(fā)者把模糊的訴求變?yōu)榫呦蠡哪繕?,在互動中引導用戶明確需求、理想回答和評估標準;自動撰寫和優(yōu)化提示詞;產生 badcase 能自動優(yōu)化提示詞,實現(xiàn)精準調控;具備多輪對話、視覺理解、復雜工具調用的優(yōu)化能力,以及自主判斷是否開啟模型精調等。
發(fā)布AI知識管理產品:支持文本、圖像、音頻、視頻等多模態(tài)內容對話式交互,融合本地與互聯(lián)網(wǎng)知識,提供內容理解和問答服務;首創(chuàng)可交互的推理“做個計劃”功能,實現(xiàn)人機協(xié)作制定、修改計劃。目前已在火山引擎全量邀測。
發(fā)布開源的veRL強化學習框架:可輕松擴展多種強化學習算法,無縫集成現(xiàn)有 LLM 基礎設施與模塊化 API,助力開發(fā)者快速搭建 RL 模型開發(fā)管線,提升對話規(guī)劃、智能編程、復雜策略優(yōu)化等場景的開發(fā)效率與資源利用率。 除了提供開源框架,此次還上線了 veRL 平臺,用充沛的算力支持強化學習需求。
數(shù)據(jù) 從支持BI到支持AI
AI 時代,數(shù)據(jù)基礎設施的價值已從 “支持 BI” 邁向 “支持 AI”?;鹕揭姘l(fā)布多模態(tài)數(shù)據(jù)湖解決方案、Data Agent,助力企業(yè)構建智能化、可感知、可行動的數(shù)據(jù)體系,實現(xiàn)數(shù)據(jù)的“主動思考”,讓數(shù)據(jù)真正成為企業(yè)的智慧大腦”。
多模態(tài)數(shù)據(jù)湖:新一代 AI Native 的數(shù)據(jù)基建,幫助企業(yè)在多模態(tài)數(shù)據(jù)處理、檢索和分析場景上,更快、更好地識別和利用多模態(tài)數(shù)據(jù)資產,成為驅動企業(yè) AI 模型訓練與決策的核心設施。
Data Agent:新一代企業(yè)級 AI 數(shù)字專家,具備數(shù)據(jù)主動分析、智能洞察、策略生成能力;可將日常取數(shù)速度從小時級到分鐘級,數(shù)據(jù)獲取成本降低80%;復雜分析效率從周級到小時級,洞察及時性提升90%;深度分析報告及營銷方案的產出時間和人力成本都能大幅節(jié)省。
AI基礎設施 更強、更易用、更開放的AI Infra
火山引擎 AI infra 提供性能和功能更強大、使用更簡易的 Agent 套件、推理套件、訓練套件,幫助企業(yè)全鏈路加速 Agent 構建。
AgentKit:為企業(yè)級 Agent 打造的全棧開發(fā)和服務工具鏈,集成豆包大模型1.6與 Computer Use 等工具;基于火山引擎 veFaaS 預置模板,用戶只需選擇模型和配置參數(shù)即可快速部署,可實現(xiàn)分鐘級10萬核擴容;構建完整工具生態(tài)體系,支持多終端 Tool Use、覆蓋數(shù)十類三方 MCP Server。
云原生訓練套件TrainingKit:實現(xiàn)高達60%+的 MFU(算力利用率);面向后訓練環(huán)節(jié),通過 veRL 框架、 Sandbox 百萬核秒并發(fā)能力,有效提升后訓練效率,為 AI 訓練全流程筑牢技術底座。
云原生推理套件ServingKit:從模型部署、在線推理、服務運維三個階段進行加速和提效,支持開源推理框架,并針對主流模型進行算子優(yōu)化,性能相比社區(qū)最新版本可以提升2-3倍;已在互聯(lián)網(wǎng)、物流、汽車等各行業(yè)應用,提升模型訓推效率,降低成本。
安全 一切Agent運行的基礎
針對企業(yè)數(shù)據(jù)和用戶隱私保護,如何防止惡意攻擊等安全挑戰(zhàn),火山引擎發(fā)布兩款 AI 安全產品,目前已在聯(lián)想、中國銀聯(lián)、長安汽車等眾多企業(yè)落地。
AICC密態(tài)計算:通過用戶個人密鑰加密、CPU/GPU 硬件可信環(huán)境計算、數(shù)據(jù)流轉落盤全密文的方式,在不損失推理效果的前提下,讓企業(yè)像使用私部模型一樣安全合規(guī)的使用云端模型。
大模型應用防火墻:通過精調的小參數(shù)模型、分層漏斗策略、流式送檢機制,保障精準攔截攻擊變種,同時不會增加推理延遲,為企業(yè)智能體應用構建安全可信的大模型推理空間。
(免責聲明:本網(wǎng)站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )