ChatGPT是OpenAI公司開發(fā)的一個大型預訓練語言模型。根據UBS發(fā)布的研究報告顯示,ChatGPT在1月份的月活躍用戶數(shù)已經達1億,成為史上用戶增長最快的消費者應用。
為什么ChatGPT能在2個月內達到月活過億?這與其卓越的智能程度及豐富的應用場景息息相關。它能在不同行業(yè)促進數(shù)實共生,促進產業(yè)升級。下文首先會對ChatGPT的原理及應用場景進行簡單介紹,然后會重點介紹安恒信息在安全領域對ChatGPT的研究以及應用。
ChatGPT簡介
ChatGPT的算法基于Transformer架構,這是一種使用自注意力機制處理輸入數(shù)據的深度神經網絡。Transformer架構廣泛應用于語言翻譯、文本摘要、問答等自然語言處理任務。ChatGPT使用了GPT-3.5大規(guī)模語言模型(LLM Large Language Model)并在該模型的基礎上,引入強化學習來微調(fine-turn)預訓練的語言模型。這里的強化學習采用的是RLHF(Reinforcement Learning from Human Feedback),即采用人工標注的方式。目的是通過其獎勵懲罰機制(reward)讓LLM模型學會理解各種NLP任務并學會從helpfulness、honest、harmless三個維度,判斷什么樣的答案是優(yōu)質的。
ChatGPT模型的主要訓練流程如下:
1、首先利用一系列問答對模型進行監(jiān)督訓練(這個操作也叫監(jiān)督指令微調);
2、在完成監(jiān)督指令微調后,就開始利用強化學習(模型在給定的環(huán)境中,不斷地根據環(huán)境的懲罰和獎勵,擬合到一個最適應環(huán)境的狀態(tài))對模型進行進一步的指令微調,具體地,首先在人類的幫助下訓練一個獎賞網絡,這個獎賞網絡具有對多個聊天回復好壞進行排序的能力;
3、利用這個獎賞網絡,進一步通過強化學習不斷優(yōu)化模型。
ChatGPT應用場景
ChatGPT可以進行多輪問答,如實現(xiàn)造句和增加細節(jié)。
ChatGPT可以用于編寫代碼,如用Python實現(xiàn)快速排序。
ChatGPT可以用于做數(shù)學題,如計算哥哥要給弟弟多少個蘋果,才能使得哥倆的蘋果數(shù)量相同。
從ChatGPT可以編寫代碼,可以很容易聯(lián)想到編程技術的門檻降低,這是一把雙刃劍,能被網絡犯罪集團用來生成攜帶惡意載荷的惡意軟件、編寫巧妙的網絡釣魚郵件等,普通人嘗試進行網絡攻擊也將變得更加容易。從另一面來講,ChatGPT也可以和安全領域的眾多場景結合起來,提升安全防護能力及運營效率。安恒信息已經將類ChatGPT的AI算法和智能數(shù)據分類分級、智能生成檢測規(guī)則、智能告警處置分析、智能客服問答系統(tǒng)、智能釣魚郵件分析、智能加密流量檢測等多個場景進行結合,推進研究并逐步落地到產品中。下面將詳細介紹這6個場景。
智能數(shù)據分類分級
數(shù)據分類分級是數(shù)據安全治理的基石,只有對數(shù)據進行有效分類分級,才能在數(shù)據安全管理上采用更加精細的控制。分類分級的依據通常來源于法律法規(guī)、行業(yè)標準或地區(qū)標準文件,例如《JR/T 0197-2020 金融數(shù)據安全 數(shù)據安全分級指南》中規(guī)定微信號、手機號等個人聯(lián)系信息的最低安全級別為3級。專業(yè)的數(shù)據安全分類分級服務人員通過熟悉這些標準文件,憑主觀判斷完成數(shù)據的類別級別梳理工作。
人工智能模型在數(shù)據安全分類分級場景中占據越來越重要的地位,正在逐步取代人工繁瑣單調的數(shù)據分類分級標注工作?;趶娀瘜W習的人工智能模型已經在安恒信息AiSort數(shù)據安全分級產品中部署應用,AiSort能夠精準識別數(shù)據業(yè)務含義,進行自動分類分級,大幅提高數(shù)據梳理的工作效率。
強化學習 RLH流程示意
AiSort 內置了融合法律法規(guī)、行業(yè)標準等領域知識的預訓練模型,同時支持模型有監(jiān)督訓練。用戶利用有標簽的數(shù)據源對模型進行訓練,學習數(shù)據的特征與類別級別之間的內在關聯(lián),可預測出其它類似數(shù)據源的分類分級結果。產品在交互中接收人工反饋,引入強化學習 RLHF(Reinforcement Learning from Human Feedback)來微調預訓練的分類分級模型,在模型給出的候選分類分級結果中選擇最優(yōu)結果,通過獎勵懲罰機制使模型不斷優(yōu)化自身,訓練出一個分類分級領域適合客戶的專有AI模型。
產品可根據數(shù)據的內容和描述等特征給出正確的分級結果,并且理解并引用標準文件中判斷依據,幫助服務人員提升數(shù)據治理工作效率,在不同行業(yè)、不同業(yè)務條件下都能提供更加優(yōu)質的數(shù)據安全分類分級服務。
智能生成檢測規(guī)則
檢測規(guī)則是檢測網絡入侵,保護網絡安全的重要手段。當前大部分的網絡安全規(guī)則主要是依靠安全研究人員的經驗來制作的,面對黑客層出不窮的攻擊手段,專家經驗的規(guī)則存在誤報和無法識別新的攻擊的問題。ChatGPT可以幫助更好地自動生成檢測規(guī)則。
針對內網環(huán)境,ChatGPT可以根據客戶現(xiàn)場對誤報的處理,從大量的原始日志、告警信息、誤報中自動學習,自動生成檢測規(guī)則。例如自動學習運營人員經常對哪些IP及端口的告警進行誤報標記,給出生成檢測規(guī)則的建議,并對這些IP及端口加入白名單或者封禁。
針對云上環(huán)境。ChatGPT可以利用安恒信息MSS安全托管運營服務平臺大量收集全國數(shù)據,在此基礎上研究場景,利用強化學習訓練模型和人工反饋不斷調試優(yōu)化。開發(fā)運營反饋模塊,針對告警排查過程中的各種日志證據,進行錄入上報,利用ChatGPT學習到其中的模式并自動生成告警規(guī)則,在降低誤報的同時也可以對新產生的攻擊方式和手法自動生成檢測規(guī)則。
智能告警處置分析
告警分析是安全運營的核心內容。伴隨著組織機構的擴張、業(yè)務邏輯的復雜化,一個大中型企業(yè)每日的告警量很容易達到百萬量級,從海量告警中篩選出重要風險事件給安全運營人員帶來沉重負擔。ChatGPT技術在告警響應處置中發(fā)揮重要作用。
針對告警處置,ChatGPT可以學習安全分析師對各類風險場景的處置動作,自動生成處置規(guī)則。借助運營反饋模塊,將告警排查過程中的各種日志證據進行錄入上報。針對云上環(huán)境,可以利用MSS平臺收集全國數(shù)據。在此大量數(shù)據基礎上訓練用于風險研判的ChatGPT模型。針對特定告警和風險場景,由模型生成若干處置建議,通過人工反饋訓練模型判斷出最優(yōu)的處置動作,使其學會生成正確的處置規(guī)則。
在日常的運營過程中,使用ChatGPT技術學習大量歷史運營分析報告內容之后,能夠針對各類安全設備產生的告警事件和統(tǒng)計指標,迅速生成分析報告、捕捉關鍵異常、生成處置建議,協(xié)助分析師更快地洞察事件全貌。
智能客服問答系統(tǒng)
隨著產品數(shù)量種類的增加,不同產品的安裝部署、系統(tǒng)運維、常見問題、安全服務等都不盡相同,面對大量不同客戶的不同問題,如果僅僅依靠人工的方式來集解答和處理,會極大增加人工的成本。
使用ChatGPT技術,通過對不同產品的各類文檔和客戶常見問題的學習,使用強化學習的方式來訓練一個智能客服問答系統(tǒng),系統(tǒng)可以根據大量的<問題,解答>對學習到不同文檔中的知識,并且可以在實踐的過程中根據人工反饋不斷微調以優(yōu)化系統(tǒng)。智能客服問答系統(tǒng),可以及時的響應客戶在網頁端提出的關于系統(tǒng)、產品、運維等相關的常見問題,從而有效降低人力溝通成本。
當前,安恒信息已經根據多年積累的數(shù)據訓練了初步的模型,并在公司內部開始試用,模型可以實現(xiàn)常見系統(tǒng)問題的應答,另外,對于智能語音問答方面也在積極的探索。
智能釣魚郵件分析
群發(fā)式釣魚郵件和針對式魚叉攻擊都仍然是目前網絡攻擊的一種主要途徑。它通過發(fā)送一封看似是從信任的發(fā)件人發(fā)出的電子郵件,來誘導收件人提供個人信息(如用戶名、密碼、銀行賬號)或者打開惡意網站或附件。如何精準識別、攔截潛在的釣魚郵件,是網絡安全領域重要的研究方向。
一方面,ChatGPT使得海量、自動化、多樣性的生成釣魚郵件模版變成一件很容易的事情。攻擊者可以通過指定的社工關鍵字,根據每個目標人物特點,針對性的生成釣魚郵件,ChatGPT大幅降低偽造的人工成本,同時最大程度提高了釣魚郵件成功率。
另一方面,安恒信息從多年累積的攻防實踐經驗出發(fā),基于AI技術,聯(lián)動郵件附件智能沙箱技術、郵件正文語言分析技術和郵件收發(fā)賬號UEBA技術,可以準確識別可疑郵件、及時做出釣魚郵件預警。同時,未來將積極追蹤研究Bard、ChatGPT等大型語言模型,試驗模型內容指紋技術,自動化分析判別郵件內容來源。對非自然人構建的語言內容及時給出提醒,并作為釣魚郵件告警系統(tǒng)的重要輸入維度,全方位守護用戶的郵件安全。
智能加密流量檢測
隨著新一代網絡技術的發(fā)展,如云計算和物聯(lián)網,加密技術的使用提高了數(shù)據傳輸?shù)陌踩?,但也為網絡安全帶來了更大的挑戰(zhàn),攻擊者可以利用加密技術傳輸敏感信息和惡意數(shù)據。
使用ChatGPT技術可以幫助網絡安全領域的專家們構建科學的加密流量分析方案,通過分析網絡流量,以及應用層面的安全檢測,實現(xiàn)加密流量的安全檢測,有效的抵御惡意攻擊。ChatGPT技術在加密流量檢測中可以通過分析網絡流量,用來分析密鑰空間,檢測攻擊模式,以及識別攻擊行為來發(fā)現(xiàn)未知的網絡攻擊。ChatGPT技術的應用可以讓網絡安全管理者更有效地發(fā)現(xiàn)、識別和響應安全漏洞和攻擊行為,為網絡安全實現(xiàn)有效把控提供有力保障。另外,ChatGPT技術可以分析攻擊者行為、以及及時響應各種威脅,為安全團隊提供有效的應對措施。
安恒信息的EMT智能流量檢測系統(tǒng)是一個支持大規(guī)模網絡全流量捕獲、檢索,網絡攻擊檢測、分析,威脅行為評估、 溯源的綜合系統(tǒng)。EMT智能流量檢測系統(tǒng)可以結合ChatGPT技術進行更全面的流量分析,通過深度分析加速網絡威脅檢測,實時發(fā)現(xiàn)和響應所有攻擊行為,以及未知的攻擊模式。
人工智能未來已來,網絡安全在這個時代也將發(fā)生巨變,新的攻擊形式層出不窮,對檢測及防護能力也必將提出新的要求。安恒信息一直擁抱AI變化,積極布局AI前沿研究。產品逐步AI智能化是安恒信息實現(xiàn)“構建安全可信的數(shù)字世界”企業(yè)使命的必經之路。
(免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現(xiàn)的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )