——聚焦行業(yè)、深入場(chǎng)景的應(yīng)用,才是大模型的未來(lái)
將研究報(bào)告的撰寫(xiě)時(shí)間,從兩個(gè)星期縮短到5分鐘。這不是給一兩句提示詞就自己生成通用報(bào)道的個(gè)人應(yīng)用,而是保證準(zhǔn)確度的行業(yè)應(yīng)用,能撰寫(xiě)提綱、能按需修改、能補(bǔ)充數(shù)據(jù)和產(chǎn)業(yè)政策……
在拓爾思拓天大模型成果發(fā)布會(huì)的現(xiàn)場(chǎng)實(shí)景演示中,其大模型產(chǎn)品展現(xiàn)了以上“驚人”的能力,給行業(yè)用戶(hù)帶來(lái)了功能上的震撼。
與當(dāng)下大量出現(xiàn)的通用大模型不同,拓爾思拓天大模型聚焦在媒體、金融和政務(wù)三個(gè)行業(yè),同時(shí)深入到十個(gè)細(xì)分場(chǎng)景提供應(yīng)用,能夠解決通用大模型存在的質(zhì)量、時(shí)效、可控、成本等問(wèn)題,很好地滿(mǎn)足行業(yè)客戶(hù)對(duì)大模型的需求。
拓爾思總裁施水才介紹說(shuō),除了行業(yè)場(chǎng)景的落地,高質(zhì)量的數(shù)據(jù)、自研+開(kāi)源增強(qiáng)+商業(yè)大模型合作的基礎(chǔ)能力,也是拓天行業(yè)大模型的核心競(jìng)爭(zhēng)優(yōu)勢(shì)所在。
核心特點(diǎn):不僅聚焦行業(yè),而且深入場(chǎng)景
今年以來(lái),全球和中國(guó)的大模型市場(chǎng)都非?;鸨?,國(guó)內(nèi)已經(jīng)和即將發(fā)布的大模型就達(dá)到近百個(gè)。ChatGPT的流行帶火了大模型,但也把大家引上了toC的道路,這上百個(gè)大模型絕大多數(shù)都是類(lèi)ChatGPT的通用大模型。
實(shí)際上,大模型未來(lái)的真正出路在toB。如今,很多大模型廠(chǎng)商已經(jīng)認(rèn)識(shí)到了這個(gè)問(wèn)題,開(kāi)始發(fā)力行業(yè)市場(chǎng)。其中絕大多數(shù)采用了“通用大模型+行業(yè)優(yōu)化定制”進(jìn)入路徑,而拓爾思則直接從行業(yè)切入,打造媒體、金融和政務(wù)三個(gè)領(lǐng)域的行業(yè)大模型。
施水才表示,打造行業(yè)大模型,可以充分發(fā)揮拓爾思過(guò)去30年所積累的優(yōu)勢(shì)資源,“我們這些年做的事情,就是把技術(shù)落實(shí)到行業(yè)應(yīng)用當(dāng)中”。
他介紹說(shuō),之所以選擇媒體、金融和政務(wù),是因?yàn)檫@三個(gè)行業(yè)的非結(jié)構(gòu)化文本數(shù)據(jù)占比高,能凸顯語(yǔ)言大模型的優(yōu)勢(shì);與此同時(shí),拓爾思自1993年成立以來(lái),也一直專(zhuān)注在這些行業(yè),擁有很好的積淀。
值得注意的是,拓爾思的拓天行業(yè)大模型,不僅僅實(shí)現(xiàn)了行業(yè)聚焦,而且進(jìn)一步深入到細(xì)分的場(chǎng)景化應(yīng)用,包括媒體行業(yè)的內(nèi)容生產(chǎn)智能助手、新一代搜索與推薦、多模態(tài)傳播與服務(wù),金融行業(yè)的投研、風(fēng)控、審查、客服,政務(wù)行業(yè)的政策服務(wù)、新一代政民咨詢(xún)、公文輔助寫(xiě)作等。
據(jù)悉,未來(lái)拓爾思還將面向更多行業(yè)、更多場(chǎng)景推出大模型服務(wù)。其中,網(wǎng)絡(luò)輿情大模型、公安大模型、知識(shí)產(chǎn)權(quán)大模型、法律大模型、審計(jì)大模型,已經(jīng)列入計(jì)劃,將于年內(nèi)推出。
先發(fā)優(yōu)勢(shì):NLP技術(shù)、高質(zhì)量數(shù)據(jù)、用戶(hù)積累
眾所周知,大模型是一個(gè)高投入、高成本的領(lǐng)域,尤其對(duì)數(shù)據(jù)和算力的要求很高。如果沒(méi)有雄厚的資金或者深厚的技術(shù)支持,很難將其實(shí)現(xiàn)商業(yè)落地。但對(duì)于在行業(yè)應(yīng)用領(lǐng)域有著豐富經(jīng)驗(yàn)和積累的垂類(lèi)技術(shù)型企業(yè),這反而成為了其在大模型領(lǐng)域的競(jìng)爭(zhēng)優(yōu)勢(shì)。
施水才介紹說(shuō),能夠搶先躋身行業(yè)大模型賽道,是因?yàn)橥貭査紦碛衅渌鸌CT廠(chǎng)商難以企及的先發(fā)優(yōu)勢(shì),其中包括在NLP領(lǐng)域30年的技術(shù)積累、超過(guò)10年的高質(zhì)量數(shù)據(jù)積累、一大批垂直行業(yè)頭部客戶(hù)積累等。
在NLP技術(shù)方面,拓爾思自成立以來(lái),一直在引領(lǐng)國(guó)內(nèi)全文檢索和搜索型數(shù)據(jù)庫(kù)、自然語(yǔ)言處理(NLP)技術(shù)的原始創(chuàng)新,并在輿情監(jiān)測(cè)等應(yīng)用場(chǎng)景中落地。賽迪顧問(wèn)前不久發(fā)布的報(bào)告顯示,在中國(guó)NLP市場(chǎng)競(jìng)爭(zhēng)力分析中,拓爾思已經(jīng)處于領(lǐng)導(dǎo)者象限。施水才也是我國(guó)該領(lǐng)域的專(zhuān)家。
在高質(zhì)量數(shù)據(jù)方面,拓爾思擁有的數(shù)據(jù)量已經(jīng)超過(guò)1500億,日均采集的數(shù)據(jù)量過(guò)億條。這些數(shù)據(jù)并非低質(zhì)量的互聯(lián)網(wǎng)公開(kāi)數(shù)據(jù),而是來(lái)源權(quán)威可靠的高質(zhì)量數(shù)據(jù),比如全國(guó)數(shù)字報(bào)刊數(shù)據(jù)、各級(jí)新聞網(wǎng)站數(shù)據(jù)、新聞客戶(hù)端APP數(shù)據(jù)、團(tuán)體機(jī)構(gòu)社交媒體數(shù)據(jù)等。而且,這些數(shù)據(jù)都是實(shí)時(shí)更新的,能夠保證大模型推理內(nèi)容的時(shí)效性。
在用戶(hù)積累方面,拓爾思的數(shù)智產(chǎn)品與服務(wù)已被國(guó)內(nèi)外10000余家企業(yè)級(jí)用戶(hù)廣泛使用,并且在企業(yè)數(shù)字化轉(zhuǎn)型、數(shù)字政府、網(wǎng)絡(luò)內(nèi)容安全、融媒體、金融科技和開(kāi)源情報(bào)等領(lǐng)域?qū)崿F(xiàn)了深度應(yīng)用。拓天大模型,也集中在這些優(yōu)勢(shì)行業(yè),并充分融入了拓爾思多年積累的行業(yè)知識(shí),提升大模型的準(zhǔn)確度和專(zhuān)業(yè)性。
在NLP技術(shù)、高質(zhì)量數(shù)據(jù)、行業(yè)應(yīng)用場(chǎng)景方面的深厚積累,使得拓爾思能夠先行一步,在行業(yè)大模型市場(chǎng)中建立起領(lǐng)先優(yōu)勢(shì)。
基礎(chǔ)能力:以自主研發(fā)和工程化交付為保障
雖然拓天大模型不提供我們常見(jiàn)的通用toC服務(wù),而是聚焦在三大行業(yè)、十大場(chǎng)景,但其底層仍然需要強(qiáng)大的AI基礎(chǔ)能力,包括內(nèi)容生成、多輪對(duì)話(huà)、語(yǔ)義理解、跨模態(tài)交互、知識(shí)型搜索、邏輯推理、安全合規(guī)、數(shù)學(xué)計(jì)算、編程能力和插件擴(kuò)展等能力。
施水才介紹說(shuō),拓爾思的大模型基礎(chǔ)能力,以自主研發(fā)為主,同時(shí)積極擁抱開(kāi)源,在客戶(hù)需要時(shí)也可以與商業(yè)大模型進(jìn)行合作。在中文特性增強(qiáng)的可控生成技術(shù)、融合搜索引擎的生成結(jié)果可信核查、融合稠密向量的跨模態(tài)能力加強(qiáng)、支持外界知識(shí)及時(shí)更新等四個(gè)方面,拓天大模型擁有領(lǐng)先的創(chuàng)新能力。
在自主研發(fā)之外,AI工程化能力,也是行業(yè)大模型從業(yè)者必備的能力,畢竟行業(yè)應(yīng)用落地速度慢,是阻礙大模型迅速普及的一大瓶頸。
施水才說(shuō),與其他大模型公司不同,拓爾思一直在從事行業(yè)落地解決最后一公里的問(wèn)題,具有很強(qiáng)的工程化交付能力。落實(shí)到行業(yè)大模型業(yè)務(wù)上,這樣的工程化交付能力,體現(xiàn)在模型預(yù)訓(xùn)練、本地化部署、算力調(diào)優(yōu)、業(yè)務(wù)系統(tǒng)融合等多個(gè)方面。
拓天大模型可以通過(guò)私有化部署,來(lái)解決企業(yè)客戶(hù)最關(guān)心的數(shù)據(jù)安全可控問(wèn)題;同時(shí)通過(guò)剪枝、量化、稀疏、蒸餾等優(yōu)化方案,有效降低大模型對(duì)算力資源的要求,實(shí)現(xiàn)大模型的輕量化部署。
強(qiáng)大的工程化交付能力,也讓拓爾思更了解大模型應(yīng)該如何與企業(yè)的核心業(yè)務(wù)系統(tǒng)緊密融合。只有將大模型變成各業(yè)務(wù)板塊的“副駕駛”,才能真正在生產(chǎn)流程中發(fā)揮降本增效的價(jià)值。
面向未來(lái):沿著正確的道路繼續(xù)向前
與市場(chǎng)上很多大模型公司只有PPT和DEMO不同,拓爾思此次發(fā)布的拓天行業(yè)大模型,已經(jīng)落地應(yīng)用。
施水才介紹說(shuō),拓爾思大模型的啟動(dòng),始于今年2月9日啟動(dòng)的“209工程”。這一工程其實(shí)并不是從零開(kāi)始的,而是把拓爾思多年的技術(shù)積累遷移到大模型上,形成新的商業(yè)模式。
如今,百度、阿里、華為都開(kāi)始發(fā)力大模型的行業(yè)應(yīng)用市場(chǎng)。施水才并不懼怕與巨頭的競(jìng)爭(zhēng),行業(yè)know-how的積累、客戶(hù)需求的認(rèn)知,能夠幫助拓爾思建立起自己獨(dú)有的競(jìng)爭(zhēng)優(yōu)勢(shì)。
與此同時(shí),拓爾思也在積極構(gòu)建行業(yè)大模型的生態(tài)合作體系,與模型伙伴、算力伙伴、應(yīng)用伙伴、數(shù)據(jù)伙伴、投資伙伴等建立起緊密的合作關(guān)系,共同研發(fā)和推廣行業(yè)大模型,甚至與客戶(hù)共同拓展市場(chǎng)。
除了在行業(yè)大客戶(hù)的項(xiàng)目式交付,SaaS化交付模式也在施水才的構(gòu)想當(dāng)中。他希望通過(guò)云服務(wù)的模式,將行業(yè)大模型的場(chǎng)景化應(yīng)用,落地到更多的中小企業(yè)客戶(hù),實(shí)現(xiàn)AI的普惠化。
施水才認(rèn)為,行業(yè)大模型的未來(lái)在于:場(chǎng)景集成化、AI應(yīng)用原生化、部署工業(yè)化。沿著這種路徑,拓爾思正在實(shí)現(xiàn)行業(yè)大模型應(yīng)用的快速落地,推動(dòng)如今火熱的大模型市場(chǎng)朝著有應(yīng)用、有場(chǎng)景、有商業(yè)模式的軌道健康發(fā)展。
面向未來(lái),施水才表示,做大模型需要有理想、有信念、有情懷。作為一家上市公司,拓爾思既要背負(fù)當(dāng)期業(yè)績(jī)的壓力,保證投資的回報(bào),又要為長(zhǎng)遠(yuǎn)的發(fā)展布局,但施水才仍然堅(jiān)定地把行業(yè)大模型這一面向未來(lái)的事業(yè)做下去,因?yàn)樗嘈胚@是一條正確的道路。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )