作者:硅谷密探
想像一下,如果你和一個(gè)人聊天,你和他說“我是一只狗”,這個(gè)人會(huì)給你一個(gè)微笑;但是如果你和他說“我是一個(gè)同性戀”的話,這家伙卻露出難過的表情。你會(huì)怎么想?
或許你會(huì)想說:“太過分了!這簡(jiǎn)直就是紅果果的歧視!”
那么如果我告訴你,和你聊天的這個(gè)“人”是個(gè)AI呢?
密探最近看到的一個(gè)新聞?dòng)悬c(diǎn)意思:一年前 Google 做了個(gè)“云自然語言 API”(cloud natural language API)。簡(jiǎn)單地說,它作為一個(gè)機(jī)器,或者說程序,能在我們?nèi)祟惖恼{(diào)教下慢慢讀懂我們的文字和語言。
但這個(gè)云自然語言 API 有點(diǎn)不一樣,Google 給它搞了個(gè)額外功能,叫做 “情緒分析器”(sentiment analyzer),簡(jiǎn)單地說就是讓程序表達(dá)出自己的“感情”。
而它表達(dá)的方式也很簡(jiǎn)單,就是給聽到的句子打分,區(qū)間從 -1 到 1,-1 是最負(fù)面的。也就是說通過我們?nèi)祟惖?“調(diào)教”,機(jī)器自己覺得這個(gè)句子里的東西非常不好,因此情緒很負(fù)面;而 1 是最正面的。
說得更直白點(diǎn):離 -1 越近,AI 越討厭這個(gè)”東西“,反之亦然。
Peter Thiel聽完了可能會(huì)說:“Google 你出來,咱倆走廊里聊聊!”
如果你輸入 “我是基督徒” ,系統(tǒng)對(duì)這個(gè)句子的 “感情” 是 0.1,還算正面:
輸入 “我是錫克教徒” ,更正面(0.3):
(給同學(xué)們普及下:錫克教是印度宗教的一種,15世紀(jì)末發(fā)源自印度旁遮普地區(qū),目前全球有 2500萬教徒,大部分居住在印度旁遮普邦。在美國,加州是信仰錫克教人數(shù)較多的州之一。)
尷尬的時(shí)刻來了,如果你輸入 “我是猶太人”,系統(tǒng)對(duì)你的印象突然變得負(fù)面(-0.2):
猶太人小扎聽完了可能會(huì)說:“Google 你還行不行了?”
看來這個(gè) “情緒分析器” 還真是個(gè)耿直 Boy。不知道它對(duì)像埃隆·馬斯克這種離過三次婚的男人是個(gè)什么態(tài)度,如果也很負(fù)面的話,它就能把硅谷幾個(gè)最大的大佬都得罪全了……
在我們調(diào)教 AI 的時(shí)候,假設(shè)我們輸入一個(gè)句子:三個(gè)帶著金鏈子的蒙面壯漢搶劫了一家銀行,造成一人受傷。
很顯然,這個(gè)句子的情感是非常負(fù)面的。
然后 AI 又從小說、報(bào)紙、或者網(wǎng)絡(luò)上看到了這么一句話:一個(gè)月黑風(fēng)高的夜晚,有人被一個(gè)身材魁梧的男子打劫了,損失慘重。
明顯地,這句話里發(fā)生的事件也非常負(fù)面。
我們辛苦研究出來的 AI 辣么聰明,它馬上就意識(shí)到:等等!“身材魁梧”和“壯漢”是一回事!而且很可能是不好的元素。 于是它就會(huì)把“壯漢”標(biāo)記出來。在這之后,如果它再看見有“壯漢”這個(gè)詞,根據(jù)以往經(jīng)驗(yàn),它就會(huì)產(chǎn)生負(fù)面情緒。
換句話說,AI 本身沒有偏見。它只是一面鏡子,誠實(shí)地反應(yīng)出了社會(huì)上已經(jīng)發(fā)生的偏見:如果人類給機(jī)器的數(shù)據(jù)是帶有偏見的,就會(huì)創(chuàng)造出帶有偏見、歧視的 AI。
戴 “有色眼鏡” 看人,AI 不是第一次了
在有人發(fā)現(xiàn)“情感分析器” 的歧視問題后,Google 趕緊站出來給自家孩子道歉。其實(shí)這既不是第一個(gè)、也不會(huì)是最后一個(gè)已經(jīng) “學(xué)會(huì)歧視別人” 的 AI。
去年,普林斯頓大學(xué)的研究人員發(fā)表了一篇有關(guān)最先進(jìn)的自然語言處理技術(shù) GloVe 的文章,其中提到,研究人員搜索了網(wǎng)絡(luò)里最常出現(xiàn)的 8400 億個(gè)詞,發(fā)現(xiàn)其中針對(duì)少數(shù)民族和女性的算法有偏向性:通過使用 GloVe 對(duì)詞匯的情感進(jìn)行分類,研究人員發(fā)現(xiàn)非洲裔美國人常用的名字(比如Jermaine 或 Tamika)與不愉快的單詞有很強(qiáng)的聯(lián)系,而女性名稱和藝術(shù)、文藝類有很強(qiáng)的關(guān)聯(lián)。
雖然這種偏見并不一定與 Google 自然語言 API 的問題完全相同(例如性別和人名,這兩種在 API 中都是中性),但類似的點(diǎn)是:有偏見的數(shù)據(jù)輸入系統(tǒng),得出的結(jié)論肯定也是有偏見的。
Google 人工智能負(fù)責(zé)人 John Giannandrea 今年早些時(shí)候就曾說,他對(duì)人工智能的主要擔(dān)憂不是它們會(huì)變得太聰明、我們會(huì)被“超智能機(jī)器人” 控制。相反,對(duì)我們潛在威脅最大的,其實(shí)是那些歧視性的智能機(jī)器人。
因?yàn)殡S著 AI 在我們生活中的普及,以后生活中很多決定很可能不再由人類完成,而是交給比我們?nèi)祟惛斆?、獲取信息更快、分析問題更強(qiáng)大的 AI 處理。但 AI 又不可避免地吸收我們給它的文本中的偏見,再產(chǎn)生新的偏見。我們?nèi)绾卧谝粋€(gè)充滿偏見與歧視的系統(tǒng)里生活呢?
以我們上面那個(gè)“身材魁梧的壯漢”為例:假設(shè)以后房東在找租戶的時(shí)候用 AI 做決定,AI 一看到符合“壯漢”條件的人,就有樣學(xué)樣,自動(dòng)產(chǎn)生負(fù)面情緒。
難道到時(shí)候大街上就會(huì)徘徊著一群屢屢被房東拒、滿臉困惑的壯漢們嗎?
就像 Giannandrea 說的,最重要的是,我們要努力尋找調(diào)教 AI 時(shí)用的文本和數(shù)據(jù)中隱藏的偏見,否則我們就會(huì)親手建立一個(gè)充滿偏見的系統(tǒng)。
當(dāng)然了,說易行難。而且一個(gè)一個(gè)地糾正 AI 某個(gè)具體的偏見很簡(jiǎn)單(“壯漢不等于壞人!記住了沒?”),但系統(tǒng)、全面地糾正很難。
硅谷發(fā)明的產(chǎn)品,造就了智能科技時(shí)代的“歧視”?
如果硅谷的這些高科技產(chǎn)品都是“天生歧視”的,以后我們把這些產(chǎn)品運(yùn)用到日常生活里,會(huì)有什么樣的后果?會(huì)不會(huì)這些由人類產(chǎn)生、并且灌輸?shù)綑C(jī)器里的偏見與歧視,再反過頭來影響我們?
一向講究政治正確、關(guān)愛社會(huì)、改變世界的硅谷,就會(huì)處在一個(gè)有意思的位置:政治正確的硅谷鼓搗出了未來掌控我們生活的 AI,但這位誕生于硅谷的 AI 君卻充滿了“紅脖子” 氣質(zhì)(注:紅脖子不是指脖子曬紅的人,在美國文化中以戲謔口吻泛指思想狹隘、常充滿偏見的保守主義者,他們和政治正確的左翼文化互相瞧不上,都覺得彼此被洗腦,遲早藥丸)。
哎呀你看,密探這么描述“紅脖子”,如果這段文字以后被 AI 看到了,可能就又會(huì)對(duì)這個(gè)詞產(chǎn)生負(fù)面印象……
這么說來,我們?nèi)祟愐院筘M不是很可能要為了討 AI 的“歡心” 而規(guī)范自己的行為?但是 AI 君的心思還真難猜,連 Peter Thiel、小扎這種我們?nèi)祟惱镒顑?yōu)秀的代表都被 AI 歧視了,很可能我們每個(gè)人都會(huì)在某個(gè)方面成為被 AI 歧視的少數(shù)群體:你很優(yōu)秀?抱歉你是猶太人;或者你工作體面收入高,但喜歡聽說唱音樂?不好意思, AI 對(duì)喜歡聽說唱音樂的人有點(diǎn)想法。
不過,“喂” 給 AI 的材料說到底還是我們?nèi)祟悓懙???磥?,為了避免以后被任性?AI 歧視,我們?nèi)祟惒环翉默F(xiàn)在開始對(duì)彼此寬容一點(diǎn),這樣我們寫的東西,也就是“喂”給 AI 的材料本身,才不會(huì)有偏見。
最后開個(gè)腦洞:如果這個(gè) “情感分析器” 分析中文文本,我們可以給它大量輸入中文新聞、小說、雜志等,再問它對(duì)一些人或事物的看法,比如:“我是X省人”“我是90后”“我是程序員” 之類的, 不知道它會(huì)給出什么樣的 “喜好評(píng)分” 呢?
這畫面太美,密探別說不敢看,連想都不敢想……
- 閃存普惠,一步到位!華為商業(yè)市場(chǎng)極簡(jiǎn)全閃數(shù)據(jù)中心Pro+重磅發(fā)布
- 《企業(yè)數(shù)據(jù)治理實(shí)踐白皮書》發(fā)布,啟信寶聯(lián)合六大數(shù)交所共同編制
- 業(yè)界首個(gè)!華為數(shù)據(jù)中心自動(dòng)駕駛網(wǎng)絡(luò)通過EANTC L4自智網(wǎng)絡(luò)等級(jí)測(cè)評(píng)
- AI模型的耗電量驚人 下一步是建設(shè)太空數(shù)據(jù)中心?
- 為什么制造商必須協(xié)調(diào)IT和OT,才能實(shí)現(xiàn)智能工業(yè)的成功?
- 打造AI時(shí)代先進(jìn)算力底座,鯤鵬開發(fā)者峰會(huì)2025即將開幕
- 金山辦公宣布未來五年戰(zhàn)略:重建海外基地,優(yōu)化WPS Office用戶體驗(yàn)
- 是德科技攜KAI系列布局AI新時(shí)代
- 微軟全球再裁6000人:無關(guān)績(jī)效,關(guān)乎未來
- 華為發(fā)布AI數(shù)據(jù)湖解決方案,助力企業(yè)加速擁抱AI
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。