超盟數據李健豪——硅谷極客如何挖掘國內零售大數據“金礦”

超盟數據CTO李健豪

在校創(chuàng)業(yè)被收購,進入亞馬遜和IBM研究數據挖掘

從澳門高中畢業(yè)后,李健豪來到美國UIUC(伊利諾伊大學厄巴納-香檳分校)攻讀CS專業(yè)。大學期間,一位在保險公司實習的朋友向他抱怨,手動填寫保單費時費力還難以保證準確性。2010年還未畢業(yè)的李健豪創(chuàng)辦Synchronize,通過實現保單簽名電子化來改進傳統的保險行業(yè)。在拿下美國三家最大保險公司后,公司進入快速發(fā)展期,并成功被收購。

隨后,抱有更遠大志向的李健豪進入亞馬遜,在支付部門處理數據流。一年多的時間里,李健豪對數據挖掘產生了濃厚的興趣,便決定重返校園,師從全球大數據專家被譽為“數據挖掘第一人”的韓家煒教授專門研究數據挖掘,而具體的研究方向,便是通過數據挖掘來研究用戶的購買行為。

當時,李健豪所在的實驗室和IBM合作拿到了顆粒度很細的數據,也通過研究順利拿到和購買行為相關的專利。但對于李健豪來說,他想要做的不僅是學術科研,更想把研究應用起來。

一直以來,李健豪對零售都有很濃厚的興趣:為什么一款產品換了新的包裝就會有新的購買群體?人們選擇購買或者不購買背后的邏輯是什么?

2015年,李健豪創(chuàng)立StylePuzzle,通過數據挖掘解決新產品的市場定價問題,并成功拿到真格基金百萬美元投資。

有意思的是,李健豪發(fā)現StylePuzzle的大部分客戶來自北京,為了一探究竟,2015年李健豪第一次來到北京,到了年底便搭建了StylePuzzle的技術團隊。

邂逅另一位創(chuàng)業(yè)者,零售與數據碰撞出火花

經過真格基金徐小平介紹,李健豪認識了超盟數據CEO李思賢,當時的李思賢想要做的就是通過采集零售商業(yè)數據后為商家提供數據營銷解決方案,于是兩個跳躍的因子碰撞在一起。

當時,國內的新零售熱潮還未興起,而在國外,尤其是美國和日本,對于商品的信息化使用程度已經成熟,“國內對于商品的信息化一定是有需求的,只是遲早的問題,所以我們決定先進入這個市場?!?/p>

2016年4月,李健豪正式加入超盟數據擔任CTO,專注于提供線下通路零售渠道的大數據分析及人工智能產品。

在硅谷時,李健豪就曾贏過6次全美黑客馬拉松冠軍,在24小時內把一個想法實現出來,證明自己算法的可行性。這種“小團體作戰(zhàn)”的經驗李健豪快速組建起超盟數據的技術團隊。

“當時李思賢給我看了一張便利店的小票,上面的數據更加真實且顆粒度更細,研究起來也挺有意思?!币婚_始,李健豪負責數據的清洗、處理非結構化數據。

由于每個便利店的小票格式都不一樣,超盟數據會先把數據格式標準化,然后進行清洗, 之后再進行Named-entity recognition(NER),最后通過匹配超盟內部的商品數據庫, 對每個商品進行維度擴充并打上標簽。比如說一個商品名稱進入系統,我們會把商品品牌、外包裝顏色、規(guī)格、成分等50多個維度附加到這個商品上,因此合作一家新的便利店時,便能對產品進行快速的匹配,當需要用到數據時就可以快速提取出來。

“傳統的數據公司可能需要花6個小時來處理,我們能夠把時間縮短到2-3分鐘?!崩罱『勒f。

在超盟數據有更多數據可以被挖掘

超盟數據有數據化運營、品類管理、消費者洞察三類產品,可以服務連鎖便利店、社區(qū)超市等多個線下零售業(yè)態(tài)。

在數據化運營方面,主要是基于全量交易的大數據分析,精準定位促銷受眾、同時通過算法全自動實現異常數據的實時反饋,提高銷售機會和關聯消費。因為對于當下的便利店主來說,他們所能掌握的便是“一瓶紅茶以多少錢賣出,一天賣出多少瓶”這樣的基礎信息,不容易發(fā)現背后的銷售邏輯。要想看到更加具體的信息,便利店只能通過自己的ERP系統調取數據,通過人工處理制作成表格,從數據生成到拿到報告一般會耗時多個工作日。超盟數據通過技術分析幫助便利店實時生成數據報告,讓店主能夠同時看到銷售業(yè)績、門店、庫存等不同維度的信息。

品類管理則是幫助企業(yè)提高庫存周轉率,有效提升前臺毛利。一般來說,2/7/1 或者 3/6/1比例來進行行商品劃分,再對其從銷售量和毛利兩個維度來細分,又可以分成AB、BA、AC等多種不同的組合。比如一件商品的評級為AA則意味著它銷量高、毛利高,評級為CA則意味著銷量低毛利高。超盟數據會在商品的評級中引進新的維度來進行評估,例如商品連帶購物籃系統,連帶毛利等,重新計算商品評級,防止一些不該被淘汰的商品被淘汰掉。

當連鎖便利店數量越來越大時,靠以往的數據手段很難得到如此精準的分析,但是超盟數據可以通過分析店面周圍的商業(yè)及交通環(huán)境情況、周邊顧客人均工資、房租水平、GDP水平等做出精準的畫像,推薦合適的商品上架。李健豪認為多維度的門店相似度模型同時也是機器不斷調優(yōu)相關參數的權重的結果。精細化多維度的門店相似度算法可以更好地將門店進行分類,更甚于傳統的商圈劃分方法,更精準洞察消費者畫像。多維度的門店相似度模型同時也是機器不斷調優(yōu)相關參數的權重的結果。

零售+人工智能在中國將更有想象空間

“目前很多傳統連鎖便利店尚未全面信息化,所以超盟數據的任務就是為它們配備上信息化的武器?!痹诶罱『揽磥恚闶?人工智能在中國將更有想象空間。

超盟數據的科技壁壘主要體現在三個方面:一是提高數據清洗的效率,將用時從6小時縮短到2-3分鐘,目前超盟數據每天處理的數據在百萬億級別;第二是在大量的數據基礎上,算法可以越來越精準;第三則是在團隊的組合上,CEO李思賢出身于華東區(qū)TOP3蜂蜜零售家族企業(yè),對于快消品零售有深厚積累,李健豪長于數據挖掘,快消零售和數據科學高度融合。

目前,超盟數據已經覆蓋超過1萬家門店,包括北京、廣東、河北、內蒙古、陜西等連鎖便利店品牌,市場占有率在18%左右。

今年11月,超盟數據已完成由襄禾資本和遠鏡創(chuàng)投投資的數百萬美金A輪融資,此前還曾獲得真格基金和力合清源數百萬人民幣的天使輪投資和山行資本千萬級人民幣的Pre-A輪投資。

免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。

2017-12-19
超盟數據李健豪——硅谷極客如何挖掘國內零售大數據“金礦”
超盟數據CTO李健豪在校創(chuàng)業(yè)被收購,進入亞馬遜和IBM研究數據挖掘從澳門高中畢業(yè)后,李健豪來到美國UIUC(伊利諾伊大學厄巴納-香檳分校)攻讀CS專業(yè)。大學期間,一位在保險公司實習的朋友向他抱怨,手動填寫保單費時費力還難以保證準確性。2010年還未畢業(yè)的李健豪創(chuàng)辦Synchronize,通

長按掃碼 閱讀全文