安然事件(the Enron Incident),是指2001年發(fā)生在美國的安然(Enron)公司破產(chǎn)案。安然公司曾經(jīng)是世界上最大的能源、商品和服務(wù)公司之一,名列《財富》雜志“美國500強(qiáng)”的第七名。然而,2001年12月2日,安然公司突然向紐約破產(chǎn)法院申請破產(chǎn)保護(hù),該案成為美國歷史上第二大企業(yè)破產(chǎn)案。
美國聯(lián)邦調(diào)查局對此展開了美國歷史上最大的白領(lǐng)犯罪調(diào)查,包括約3000箱文件和4TB數(shù)據(jù)。數(shù)據(jù)中包括了大約60萬封安然公司高管之間交流的電子郵件。調(diào)查人員希望能從中發(fā)現(xiàn)這起復(fù)雜財務(wù)欺詐犯罪的有效線索,比如:安然公司內(nèi)部誰是決策者、誰能訪問大量公司內(nèi)部信息、以及對郵件內(nèi)容的非結(jié)構(gòu)化分析。
安然電子郵件數(shù)據(jù)集是由CALO項目組收集和準(zhǔn)備的。它包含大約150位用戶的數(shù)據(jù),大部分是安然公司的高級管理層。該數(shù)據(jù)集大約包含約50萬條消息。這些數(shù)據(jù)最初由聯(lián)邦能源監(jiān)管委員會在調(diào)查期間公布并發(fā)布到網(wǎng)絡(luò)上。該電子郵件數(shù)據(jù)集后來由麻省理工學(xué)院的Leslie Kaelbling購買,結(jié)果發(fā)現(xiàn)它存在一些完整性問題。SRI的一些研究者,特別是Melinda Gervasio,努力糾正這些存在的問題,正是由于他們的不懈努力,數(shù)據(jù)集才可用于有效的分析。這些公開的數(shù)據(jù)集不包括附件,并且某些敏感消息已被刪除,“因為受相關(guān)員工的請求,作為編輯整理工作的一部分”。(來自網(wǎng)絡(luò))
電子郵件數(shù)據(jù),屬于“半結(jié)構(gòu)化”數(shù)據(jù)。它有結(jié)構(gòu),但是內(nèi)容又是非結(jié)構(gòu)化的文本。本文僅限于對結(jié)構(gòu)化部分進(jìn)行分析。非結(jié)構(gòu)化內(nèi)容分析可以使用智器云的火圖軟件,以后再分享。
最簡單的建模思路就是人-人模型,A給B發(fā)了一封電子郵件。因為電子郵件有它的特殊性,它有收件人、抄送人、密送人等區(qū)別。如果要把這些關(guān)系表現(xiàn)出來,則可以使用智器云火眼金睛專業(yè)版的自有建模功能,如下圖所示:
為了盡可能把全部數(shù)據(jù)的關(guān)聯(lián)關(guān)系看清楚,快速了解宏觀態(tài)勢、發(fā)現(xiàn)異常情況、發(fā)現(xiàn)規(guī)律和模式,我們將數(shù)據(jù)導(dǎo)入智器云火眼金睛。由于數(shù)據(jù)集較大,我們選取了大約7000個高管的5萬條記錄。導(dǎo)入數(shù)據(jù)加后臺計算,總耗時約20秒。(筆記本配置:CPU i7 1.6GHZ, 16G內(nèi)存,Win10專業(yè)版)
記錄導(dǎo)入后,經(jīng)過合并,有7009個對象,11381條鏈接。圖形如下:
初步觀察,我們發(fā)現(xiàn):
·孤立點和自回路
有3對郵件和其他人都沒有交集。在這起白領(lǐng)欺詐案里,可能屬于無用信息;但在其它場景中,有可能就是一個需要多加關(guān)注的異常情況。比如這里面有個企業(yè)外部郵箱rjbaker@ttu.edu,值得關(guān)注。
有部分人自己給自己發(fā)郵件,也是屬于比較常見的。智器云火眼金睛中有專門應(yīng)對這種場景的特有功能,叫做自回路。
·收發(fā)郵件最多的人
使用F11功能,找到收發(fā)郵件最多的人。這里把超過500的選中。(F11是火眼金睛的核心功能之一,建議大家多花點精力,把F11里面的功能了解清楚。)
很明顯,這幾個人屬于安然公司的核心人員或高管,因為大部分的事情都要告知他們或者請他們安排下去。
·社會網(wǎng)絡(luò)分析(SNA)
社會網(wǎng)絡(luò)分析(Social Network Analysis,SNA)是用于研究行動者及其之間的關(guān)系的一套規(guī)范和方法,是一種定量的群體交互行為研究方法。它以數(shù)據(jù)挖掘為基礎(chǔ),采用可視化的圖以及社會網(wǎng)絡(luò)結(jié)構(gòu)的形式表示。運用這種研究方法可以建立社會關(guān)系模型、發(fā)現(xiàn)社群內(nèi)部行動者之間的各種社會關(guān)系。
經(jīng)過火眼的計算可以得到如下結(jié)果:
(1)活躍程度
與上一節(jié)的總關(guān)聯(lián)數(shù)排序相同。
(2)重要程度
不完全與總關(guān)聯(lián)數(shù)一致了。但可以看出,Sally Beck,Vince Kaminski依然很重要。
(3)中心地位
也不完全與總關(guān)聯(lián)數(shù)一致??梢钥闯觯琒ally Beck,Vince Kaminski的中心地位也很重要。
根據(jù)我們分析的角度,可以選取不同的排序來進(jìn)行分析。
·專題分析
隨著調(diào)查的深入,主要操縱者鋃鐺入獄,安然帝國轟然崩盤。2002年,安然西海岸首席能源交易官Timothy Belden承認(rèn),當(dāng)時安然通過欺詐操縱了加州電力市場,從中牟利超過10億美元。他也承認(rèn),安然在其他電力市場亦有操縱行為,包括德州2001年售電側(cè)開放前的試點項目。
我們通過F5功能搜索Belden,然后把他的第一層鏈接關(guān)系復(fù)制出來,如下圖:
由圖可見,幾位高管都和Timothy Belden有直接聯(lián)系。另外,有M.Belden屬于外部公司的郵件地址,具有深入挖掘的潛力。
將關(guān)聯(lián)關(guān)系圖,在火眼中直接轉(zhuǎn)為時序圖,非常方便。
在時序圖中,可以直接追蹤,某一封郵件隨時間的轉(zhuǎn)發(fā)路徑。
今年是安然事件20周年。用新的工具、新的思路、新的方法,把安然的電子郵件數(shù)據(jù)重新分析一遍,或許對當(dāng)下的工作更有一些指導(dǎo)意義;尤其在企業(yè)內(nèi)控、反舞弊、白領(lǐng)反欺詐等方面,更加有實際意義。作者:菩提
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )