近幾年隨著AlphaGO的驕人戰(zhàn)績(jī),人工智能和大數(shù)據(jù)備受追捧,熱度空前。而在實(shí)際接觸中,大家對(duì)人工智能和大數(shù)據(jù)的認(rèn)知普遍是“只知其名不知其意”,因此對(duì)企業(yè)而言,獵頭的推薦也往往與崗位匹配度不高。那么被人們認(rèn)為高深莫測(cè)的AI和大數(shù)據(jù)的關(guān)系究竟是怎樣的? 下圖清晰表達(dá)了其邏輯及關(guān)聯(lián)性。
上圖中主要是三大塊內(nèi)容,分別是大數(shù)據(jù),AI技術(shù)和解決問(wèn)題,他們的關(guān)系如下:
- 大數(shù)據(jù)層 -
主要分為數(shù)據(jù)采集、數(shù)據(jù)存儲(chǔ)及數(shù)據(jù)訪(fǎng)問(wèn)三個(gè)步驟。
? 數(shù)據(jù)采集
主要通過(guò)智能手環(huán)、智能手表、智能手機(jī)等各類(lèi)智能硬件,重力傳感器、溫度傳感器、濕度傳感器等各類(lèi)傳感器以及攝像頭、話(huà)筒等多種手段來(lái)采集各種所需數(shù)據(jù)。
? 數(shù)據(jù)存儲(chǔ)
主要是將采集數(shù)據(jù)存儲(chǔ)到數(shù)據(jù)庫(kù)中。大數(shù)據(jù)的存儲(chǔ)方式與傳統(tǒng)的數(shù)據(jù)存儲(chǔ)有很大不同。主要體現(xiàn)在存儲(chǔ)格式、存儲(chǔ)結(jié)構(gòu)、以及分布式存儲(chǔ)等方面。而分布式存儲(chǔ)、共享存儲(chǔ)則是數(shù)據(jù)存儲(chǔ)中重要的核心技術(shù)。
? 數(shù)據(jù)訪(fǎng)問(wèn)
主要解決如何讓AI技術(shù)層能夠快速的獲取所需數(shù)據(jù)。該層是大數(shù)據(jù)技術(shù)與AI技術(shù)的重要承接層,其最核心的技術(shù)為負(fù)載均衡。該技術(shù)解決了數(shù)據(jù)訪(fǎng)問(wèn)中的大數(shù)據(jù)并發(fā)、網(wǎng)絡(luò)負(fù)荷過(guò)重等問(wèn)題。
- AI技術(shù)層 -
分為基礎(chǔ)算法、AI算法、AI框架和AI技術(shù)四個(gè)步驟,目的是獲取數(shù)據(jù)之后,利用人工智能的算法和技術(shù)對(duì)數(shù)據(jù)進(jìn)行分析。
? 基礎(chǔ)算法層
基礎(chǔ)算法層主要包含高等數(shù)學(xué)、矩陣分析、數(shù)值分析、概率統(tǒng)計(jì)分析等,是AI算法的奠基層。而AI算法來(lái)自于基礎(chǔ)算法的支撐。我們對(duì)基礎(chǔ)算法理解越深刻,對(duì)AI算法理解的也會(huì)更透徹。好像蓋大樓的地基,地基打的越深,大樓才能蓋的越高。
? AI算法層
AI算法層是在基礎(chǔ)算法層之上構(gòu)建的解決人類(lèi)問(wèn)題的人工智能算法層。
人類(lèi)遇到的問(wèn)題通常是由單一問(wèn)題合并組成的復(fù)雜問(wèn)題,解決問(wèn)題的路徑為將復(fù)雜問(wèn)題拆解成多個(gè)單一問(wèn)題后逐一進(jìn)行解決。AI算法層即解決單一問(wèn)題的通用方法層。比如拍照計(jì)算食物熱量實(shí)際上包含食物識(shí)別、體積計(jì)算、質(zhì)量計(jì)算、熱量計(jì)算等四個(gè)子問(wèn)題,而四個(gè)子問(wèn)題則由各自組成的通用方法來(lái)解決。經(jīng)過(guò)長(zhǎng)達(dá)半個(gè)多世紀(jì)的發(fā)展,AI算法層已經(jīng)研究出了一些通用方法即算法,包含分類(lèi)算法、聚類(lèi)算法、回歸算法、優(yōu)化算法、降維算法、深度學(xué)習(xí)算法等等。
? AI框架層
AI框架主要是對(duì)AI算法層的單個(gè)算法進(jìn)行重新封裝,它定義了很多類(lèi)、方法、接口,使用者只需要調(diào)整相關(guān)參數(shù)即可實(shí)現(xiàn)算法,而不需要將算法完全實(shí)現(xiàn)出來(lái),這樣節(jié)省了大量的時(shí)間,使得應(yīng)用算法來(lái)解決問(wèn)題的AI研發(fā)人員更加專(zhuān)注于解決問(wèn)題本身。目前常見(jiàn)的分類(lèi)、聚類(lèi)等傳統(tǒng)的人工智能算法框架有SkLearn、Pandas等等,深度學(xué)習(xí)框架有Tensorflow、Caffe、Torch、PaddlePaddle。
? AI技術(shù)層
AI技術(shù)層主要是針對(duì)利用AI算法解決專(zhuān)業(yè)領(lǐng)域問(wèn)題而提出的專(zhuān)用方法和算法。這種算法不具有通用性,是為解決某個(gè)領(lǐng)域的問(wèn)題而定制研發(fā)的方法。目前AI技術(shù)主要包含自然語(yǔ)言處理(NLP)、機(jī)器視覺(jué)、語(yǔ)音識(shí)別、知識(shí)圖譜、數(shù)據(jù)挖掘、分析決策。大家耳熟能詳?shù)募夹g(shù)都出自該層,也是AI技術(shù)層的最頂層。
? 自然語(yǔ)言處理(NLP)
自然語(yǔ)言處理領(lǐng)域主要是語(yǔ)義識(shí)別,開(kāi)放域?qū)υ?huà)聊天,基于任務(wù)的對(duì)話(huà),自動(dòng)翻譯(例如中翻英,英翻中)等。
? 機(jī)器視覺(jué)
機(jī)器視覺(jué)主要分為圖像識(shí)別(識(shí)別圖像或視頻中的物體是什么),圖像跟蹤(視頻中跟蹤某個(gè)物體),三維重建(通過(guò)2D圖片進(jìn)行3D物體的構(gòu)建)。
? 語(yǔ)音識(shí)別
該技術(shù)通俗的講就是對(duì)人說(shuō)的話(huà)轉(zhuǎn)化成文字。
? 知識(shí)圖譜
該技術(shù)是用來(lái)構(gòu)建知識(shí)的網(wǎng)狀結(jié)構(gòu),將一個(gè)個(gè)看似沒(méi)有關(guān)系的知識(shí)點(diǎn),通過(guò)該技術(shù)建立他們之間的關(guān)聯(lián)關(guān)系,比如包含關(guān)系、并列關(guān)系、最終構(gòu)建各個(gè)領(lǐng)域的知識(shí)網(wǎng)。然后再根據(jù)這個(gè)知識(shí)網(wǎng)解決用戶(hù)的問(wèn)答、推薦、預(yù)測(cè)、推理等問(wèn)題。
? 數(shù)據(jù)挖掘
數(shù)據(jù)挖掘主要是對(duì)數(shù)據(jù)進(jìn)行分類(lèi)、聚類(lèi)、預(yù)測(cè)等處理。
? 分析決策
主要是做策略制定,通過(guò)多維度收集的數(shù)據(jù)進(jìn)行某個(gè)領(lǐng)域的決策并給出答案。
- 解決問(wèn)題 -
基于大數(shù)據(jù)與AI技術(shù)的結(jié)合,能夠真正實(shí)現(xiàn)為人類(lèi)解決各種各樣的問(wèn)題。將這些問(wèn)題進(jìn)行歸類(lèi)匯總成幾大類(lèi)問(wèn)題,常見(jiàn)的有聚類(lèi)、分類(lèi)、預(yù)測(cè)、推薦等問(wèn)題。
? 分類(lèi)問(wèn)題
分類(lèi)問(wèn)題主要是判別某個(gè)物體屬于哪個(gè)類(lèi)別,比如橘子屬于水果類(lèi)、白菜屬于蔬菜類(lèi)。分類(lèi)又分為二分類(lèi)、多分類(lèi)問(wèn)題;二分類(lèi)即是與不是的問(wèn)題,比如這個(gè)物體不是香蕉,這個(gè)物體是香蕉;多分類(lèi)問(wèn)題,比如多種食物,一種食物是蔬菜,一種食物是水果,一種食物是肉。
? 聚類(lèi)問(wèn)題
聚類(lèi)問(wèn)題主要是將一批數(shù)據(jù)自動(dòng)分成幾類(lèi),比如說(shuō)網(wǎng)站的用戶(hù)群,自動(dòng)分為活躍用戶(hù)群、忠誠(chéng)用戶(hù)群、沉默用戶(hù)群,這種用戶(hù)群的確定是通過(guò)人工智能算法算的,而不是通過(guò)人工篩選的。
? 預(yù)測(cè)問(wèn)題
預(yù)測(cè)問(wèn)題主要是對(duì)某個(gè)趨勢(shì)進(jìn)行預(yù)測(cè),比如房?jī)r(jià)趨勢(shì)預(yù)測(cè)、網(wǎng)站的流量預(yù)測(cè)等等。
? 推薦問(wèn)題
推薦問(wèn)題主要是推薦同類(lèi)偏好。比如A用戶(hù)喜歡旅游,且是戶(hù)外愛(ài)好者,而戶(hù)外愛(ài)好者除了喜歡旅游,還喜歡戶(hù)外裝備,那就可以向A用戶(hù)推薦戶(hù)外裝備,這就是典型的網(wǎng)站推薦邏輯。
- 京東外賣(mài)又爆頻繁超時(shí)!客服回應(yīng):高峰期騎手接單有延遲
- 聯(lián)想發(fā)布多款智能新物種,端側(cè)AI引領(lǐng)未來(lái),輕觸現(xiàn)實(shí)生活革新
- 黃仁勛開(kāi)場(chǎng)白中多次提及華為:別樣的話(huà)題,不回避的態(tài)度
- 黃仁勛警告:不善用AI者將面臨失業(yè)危機(jī),未來(lái)競(jìng)爭(zhēng)看誰(shuí)更懂AI
- 馬斯克AI超算項(xiàng)目被指污染空氣:每年排放大量有害氣體,環(huán)保問(wèn)題引關(guān)注
- 蘋(píng)果突破創(chuàng)新!iPhone 18 Pro首次支持可變光圈,華為領(lǐng)先一步?
- 五一假期蔚來(lái)?yè)Q電單量創(chuàng)新高!真實(shí)用戶(hù)反饋揭秘
- 新勢(shì)力造車(chē)年度KPI大比拼:小鵬領(lǐng)先,蔚來(lái)理想緊隨其后
- 極氪高管調(diào)整:壓力之下求變,銷(xiāo)量承壓如何破?
- 印度“芯夢(mèng)碎”:兩大半導(dǎo)體項(xiàng)目折戟,造芯雄心成空談
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。