行業(yè)動態(tài)

人工智能犯罪細節(jié)首次披露:你的個人信息是這樣被破解的

來源:聚銘網(wǎng)絡(luò)    發(fā)布時間:2017-11-07    瀏覽次數(shù):
 

信息來源:secdoctor


一起個人信息罪案中,人工智能技術(shù)參與到數(shù)據(jù)泄露的核心環(huán)節(jié),從而助長“徐玉玉案”式精準詐騙,且非法獲取個人信息的成本大幅降低。

(2016年8月19日,山東省臨沂市羅莊區(qū)高考錄取新生徐玉玉被犯罪嫌疑人以發(fā)放助學(xué)金的名義,實施電信詐騙騙走9900元。案發(fā)后,徐玉玉與父親到公安機關(guān)報案,回家途中心臟驟停,送醫(yī)院搶救無效死亡。2017年7月19日,山東臨沂,徐玉玉的父親相信法律的公平。圖/視覺中國)

人類圍棋界“最強大腦”敗于人工智能Alphago時,另一人工智能已經(jīng)進入違法犯罪的黑色領(lǐng)域。

一起普通的網(wǎng)絡(luò)代付詐騙,牽出一個利用人工智能技術(shù)、一秒鐘盜取2000組公民信息數(shù)據(jù)的犯罪團伙。通過深挖公民個人信息賬號密碼買賣這條線索,浙江紹興警方發(fā)現(xiàn)一條涉及利用黑客技術(shù)非法獲取網(wǎng)站后臺用戶注冊數(shù)據(jù)、數(shù)據(jù)撞庫、繞開互聯(lián)網(wǎng)公司安全策略的打碼平臺、網(wǎng)絡(luò)詐騙、非法信息推廣的互聯(lián)網(wǎng)黑色產(chǎn)業(yè)鏈。

這一黑產(chǎn)鏈條中,參與到數(shù)據(jù)泄露環(huán)節(jié)的人工智能技術(shù)頗為關(guān)鍵,使得非法獲取個人信息的成本大幅降低。

量販個人信息

2017年2月9日晚,紹興市公安局越城區(qū)分局城南派出所接到公民虞玉華報案稱,虞當晚收到好友王甜的一條信息,王甜購買一件價值1922元的商品,因手機支付不成功,請虞幫忙代付。虞玉華通過手機為好友支付貨款后,對方再次要求付款,她疑心被騙因而報案。結(jié)果證明,王甜的賬號被盜,有人冒充王甜對其好友實施詐騙。

接到虞玉華報警后,越城警方在哈爾濱抓獲這個利用社交軟件冒充好友實施代付詐騙的犯罪團伙。團伙成員十余人,均為同學(xué)關(guān)系。

他們在哈爾濱一個居民小區(qū)里租了一套兩居室,客廳被改造成工作室,碼放8臺電腦作為作案工具,吃住、詐騙都在這套出租屋內(nèi)進行。團伙分工明確,頭目鄭前負責(zé)招募人員、培訓(xùn)和購買作案工具,其他成員登錄不同種類的社交軟件實施詐騙。

在這個團伙的電腦中,紹興警方發(fā)現(xiàn)大量公民個人信息?!靶畔⒆疃嗟囊慌_電腦中有300多GB的個人信息,包括多個郵箱、社交軟件的賬號和密碼,而且都很準確?!痹匠菂^(qū)公安分局網(wǎng)警大隊大隊長錢立鋒向《財經(jīng)》記者介紹。

這些信息從何而來?鄭前稱,這些信息是他以一組2元左右的價格,共花40多萬元從吳杰等人手中買來的。而吳杰手中的信息則來自一個黑客犯罪團伙,該團伙利用超級SQL注入工具、網(wǎng)站漏洞掃描軟件,批量掃描網(wǎng)站程序漏洞,非法獲取網(wǎng)站后臺用戶注冊數(shù)據(jù),這被稱為“脫庫”。

這些數(shù)據(jù)大多是郵箱賬號和密碼。獲取網(wǎng)站后臺數(shù)據(jù)后,黑客團伙將包含各類郵箱和密碼的數(shù)據(jù)分門別類進行銷售,以每10萬條數(shù)據(jù)50元到100元的價格賣給吳杰等人。

獲取數(shù)據(jù)后,吳杰等人用“撞庫”軟件進行批量撞庫、匹配,進而將各類賬號與密碼匹配成功的賬戶以1.2元到2元一個的價格,販賣給網(wǎng)絡(luò)詐騙犯罪團伙。

“撞庫”是黑客通過收集互聯(lián)網(wǎng)已泄露的用戶賬戶和密碼信息,生成對應(yīng)的字典表,嘗試批量登錄其他網(wǎng)站后,得到一系列可以登錄的賬號。

“脫庫”竊取到的郵箱、社交軟件等賬號密碼信息大多是單一的、無效的,需要將這些信息進行“清洗”。

錢立鋒告訴《財經(jīng)》記者,很多用戶習(xí)慣在不同網(wǎng)站使用相同的郵箱賬號登錄,甚至登錄賬號密碼也和郵箱一樣。黑客可以通過獲取用戶在A網(wǎng)站的賬戶從而嘗試登錄B網(wǎng)址,這就完成一次“撞庫”嘗試。

經(jīng)過“撞庫”清洗后,一些賬號關(guān)聯(lián)的其他平臺賬號被順利登錄,完成“清洗”后的數(shù)據(jù)更為豐富,可以精準獲知該用戶的許多平臺注冊信息,這在犯罪分子眼中極有價值,價格也隨之漲高。

去年山東女大學(xué)生徐玉玉被詐騙分子以發(fā)放助學(xué)金的名義,騙走全部學(xué)費9900元,在報警回家的路上猝死,就是由于騙子掌握了徐玉玉準確的錄取信息、手機號碼等個人信息,精準實施詐騙。

“碼奴”產(chǎn)業(yè)

為了防止黑客批量測試賬戶密碼,各網(wǎng)站和平臺動了不少腦筋,“驗證碼”是常用防范手段之一。

網(wǎng)絡(luò)用戶在各大網(wǎng)站或者平臺注冊、登錄賬號時,經(jīng)??梢砸姷桨ㄗ址?、數(shù)字、字符+點選式、滑塊拼圖式、圖片人工答題式等驗證碼,其中字符型驗證碼形式是互聯(lián)網(wǎng)行業(yè)普遍采用的驗證碼形式。

驗證碼的防范機制是:提出的問題要容易被人類解答,而讓機器無法解答。

當賬號登錄存在異常的時候,為了保護賬號安全,系統(tǒng)會提示輸入驗證碼。其目的是防止黑產(chǎn)人員批量惡意登錄——他們可以利用機器大量輸入賬號和密碼,但是機器無法識別驗證碼。由此,對于想要獲取精準個人賬戶信息的犯罪團伙,在“撞庫”環(huán)節(jié)中,如何進行批量驗證就成為關(guān)鍵。

由于無法規(guī)避驗證碼,黑客們?nèi)粢嚦鲇行艽a,需要人工逐條輸入信息和識別驗證碼,比對、驗證并成功匹配個人信息的賬號密碼,確認信息準確可以使用,再交給數(shù)據(jù)商——這些人在圈內(nèi)被稱為“碼奴”,這一環(huán)節(jié)也被稱為“打碼”。

一位“碼奴”向《財經(jīng)》記者透露,根據(jù)驗證碼的復(fù)雜程度和輸入的準確率,打1000個驗證碼會掙取1元至25元不等,每天工作12小時,最多可以輸入2萬個驗證碼,掙到300多元。

最熟練的“碼奴”輸入一個驗證碼也需要一秒鐘時間。在傳統(tǒng)的信息泄露相關(guān)犯罪中,因高昂的人力資本和較為漫長的工作周期,被“清洗”的數(shù)據(jù)相對有限。

因此在查獲巨量個人信息后,越城警方意識到,這一系列案件中的“打碼”絕非人工識別完成。隨后警方調(diào)查發(fā)現(xiàn),該案中,拿到原始數(shù)據(jù)的數(shù)據(jù)商,通過一個名為“快啊”的打碼平臺進一步進行深加工。

工商信息顯示,“快啊”平臺是沈陽納信科技有限公司旗下產(chǎn)品,該公司經(jīng)營范圍為計算機科學(xué)技術(shù)研究、計算機軟件開發(fā)、網(wǎng)絡(luò)技術(shù)研究、網(wǎng)絡(luò)工程設(shè)計、計算機軟件銷售等。警方在調(diào)查中發(fā)現(xiàn),該平臺專為網(wǎng)絡(luò)黑產(chǎn)和灰產(chǎn)識別破解字符型驗證碼提供技術(shù)幫助。

打碼平臺上有多種針對不同互聯(lián)網(wǎng)產(chǎn)品進行“撞庫”的軟件,數(shù)據(jù)商將驗證碼傳給“快啊”打碼平臺的某一“撞庫”軟件識別接口,打碼平臺將驗證碼發(fā)給后端的“碼奴”進行識別,并獲取識別結(jié)果。

越城警方對“快啊”平臺數(shù)據(jù)分析獲知,接入該平臺提供驗證碼識別服務(wù)的“撞庫”軟件有100多款,接入平臺的用戶達1.1萬余人,從2016年6月到2017年3月,平臺資金進賬累計達1650萬元,為國內(nèi)最大的“打碼”平臺。

錢立鋒介紹說,“打碼”平臺目前游走在法律邊緣,界定并不清晰。“什么樣的人需要批量識別驗證碼?往往都是從事網(wǎng)絡(luò)黑產(chǎn)和灰產(chǎn)的人員。”

(犯罪嫌疑人使用的部分作案工具)

除黑色產(chǎn)業(yè)的詐騙人員,打碼平臺的通常使用者是“羊毛黨”、搶票的“黃?!奔罢搲⑻八姟薄?

以“羊毛黨”為例,一些網(wǎng)貸平臺為吸引投資者常推出一些收益豐厚的活動,如注冊認證獎勵、充值返現(xiàn)、投標返利等,催生了以此寄生的投機群體“羊毛黨”。“羊毛黨”去某網(wǎng)站刷活動優(yōu)惠券,但該網(wǎng)站有較復(fù)雜的驗證碼,通?!把蛎h”會在打碼平臺注冊賬號并充值,并通過打碼平臺提供的接口,提交驗證碼識別。打碼平臺將驗證碼分發(fā)到各個“碼奴”客戶端里,獲取識別結(jié)果,并最終反饋給“羊毛黨”。

據(jù)辦案民警介紹,“快啊”平臺被查的前三個月,已提供驗證碼識別服務(wù)259億次。

(犯罪嫌疑人與贓款)

在人力資源有限的情況下,“快啊”平臺如何做到可以提供巨量的驗證碼識別服務(wù)?越城警方在其背后發(fā)現(xiàn)一個無需“碼奴”的高級“打碼”技術(shù)。

AI“打碼”

隨著偵查深入,越城警方發(fā)現(xiàn),為“快啊”平臺提供驗證碼識別服務(wù)的一個重要軟件系統(tǒng)名為NID,這一人工智能程序由廈門人楊柯設(shè)計。

楊柯現(xiàn)年33歲,家境優(yōu)越,父親是當?shù)胤康禺a(chǎn)開發(fā)商,他和妻兒住在廈門一處140多平方米的住宅里,每平方米售價近5萬元。

畢業(yè)于廈門某大學(xué)計算機專業(yè)的楊柯研究人工智能已有十余年。楊柯稱,他使用伯克利大學(xué)開發(fā)的caffe框架作為深度學(xué)習(xí)框架,并且使用VGG16結(jié)構(gòu)創(chuàng)建了一個神經(jīng)網(wǎng)絡(luò),之后從網(wǎng)絡(luò)上下載了幾乎全世界所有字體,對神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練,使它具有圖文轉(zhuǎn)換的能力,再將這個神經(jīng)網(wǎng)絡(luò)與具有圖像接受和處理結(jié)果返回功能的服務(wù)端進行網(wǎng)絡(luò)連接,構(gòu)成一個系統(tǒng),命名為NID。

每天,像教兒童一樣,楊柯要培訓(xùn)NID學(xué)習(xí)識別各種驗證碼。在他的“培養(yǎng)”下,NID破解驗證碼的能力越來越強。

(楊柯制作的驗證碼樣本庫)

錢立鋒告訴《財經(jīng)》記者,通過運用人工智能機器深度學(xué)習(xí)技術(shù)訓(xùn)練機器,楊柯讓NID如AlphaGo一樣自主操作識別,有效識別圖片驗證碼,輕松繞過互聯(lián)網(wǎng)公司設(shè)置的賬戶登錄安全策略——驗證碼。

由于人工智能的幫助,NID“打碼”速度很快,平均一秒可以識別出2000個驗證碼,是人工“打碼”的2000倍;且正確率很高,可以識別出98%以上的驗證碼。

楊柯稱,NID程序剛編寫完成,正確率就高達95%,基本能正確識別所有清晰圖片中的文本,楊柯還不斷充實樣本庫,給NID程序輸入大量的圖片文件讓其進行識別,NID程序本身就具備很高的識別應(yīng)對能力;此外,NID系統(tǒng)也會自動學(xué)習(xí),它每秒鐘會從用戶反饋的識別錯誤樣本庫中抽取一張比對正確答案進行學(xué)習(xí),這個學(xué)習(xí)過程從編寫出程序到案發(fā)前,時刻進行。

驗證碼被NID系統(tǒng)識別出后,黑客竊取的半成品信息,相當于完成了深加工。數(shù)據(jù)商拿到這些精準信息,打包組合,出售給個人信息產(chǎn)業(yè)鏈下游的詐騙集團、廣告商,一條精準的個人信息,甚至可以賣到幾百元。

“快啊”打碼平臺收取信息處理費用,收入的50%給了撞庫軟件作者,50%由平臺開發(fā)商李奇和楊柯平分。短短一年內(nèi),平臺牟利1300多萬元,楊柯分得300多萬元。利用NID程序,多的時候,楊柯一個月可以掙六七十萬元。

2017年3月23日,“快啊”平臺涉案被越城警方偵查。由于該案犯罪手法新穎、社會危害大,越城公安分局成立由網(wǎng)警牽頭,刑偵、特警、派出所等多部門配合組成的專案組。

圍繞該產(chǎn)業(yè)鏈的上下游,專案組輾轉(zhuǎn)福建、廣東、江西、黑龍江、遼寧、山東等13個省展開偵查、抓捕,抓獲利用黑客技術(shù)非法獲取網(wǎng)站后臺數(shù)據(jù)的嫌疑人4人,使用撞庫軟件獲取賬戶密碼的嫌疑人19人,提供圖片驗證服務(wù)的“快啊”打碼平臺嫌疑人2人,制作“撞庫”軟件的9人,利用公民個人信息實施網(wǎng)絡(luò)犯罪的團伙28個,共159人。

防范難題

一位數(shù)據(jù)安全專家介紹,“快啊”打碼平臺利用NID程序?qū)ψ址万炞C碼的破解,是基于人工智能的深度學(xué)習(xí)框架,使用相關(guān)的網(wǎng)絡(luò)模型訓(xùn)練學(xué)習(xí),來實現(xiàn)對字符型驗證碼的海量快速識別破解。由于字符型驗證碼是互聯(lián)網(wǎng)通用的安全策略,一旦被破解攻陷,將會給包括政企網(wǎng)站在內(nèi)的互聯(lián)網(wǎng)行業(yè)用戶數(shù)據(jù)安全帶來風(fēng)險。

基于深度學(xué)習(xí)原理,只要樣本庫足夠豐富,這一智能程序可以識別的東西會越來越多——即使復(fù)雜如鐵路訂票平臺12306的驗證碼,也只是物品種類多、形態(tài)多樣的圖片識別,假以時日,NID程序一樣可以破解。

騰訊安全專家周正認為,互聯(lián)網(wǎng)行業(yè)的安全防范主要是對抗有規(guī)律、有特點的惡意行為,對抗這種有深度學(xué)習(xí)能力的人工智能犯罪,有必要提升防范等級,增加多維度的安全驗證環(huán)節(jié)。

比如,登錄時使用字符型驗證碼,二次登錄用短信或郵件驗證,輔助以滑塊解鎖等方式,“對抗不斷升級的入侵攻擊,提高犯罪門檻,強化動態(tài)機制,是互聯(lián)網(wǎng)安全行業(yè)一直在做的事情”。

人工智能(Artificial Intelligence),英文縮寫為AI,是研究、開發(fā)用于模擬、延伸和擴展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門新的技術(shù)科學(xué)。

隨著科技發(fā)展,近幾年,“人工智能”這一概念通常指的是谷歌等公司開源的一些基于神經(jīng)網(wǎng)絡(luò)進行深度學(xué)習(xí)、可以不斷訓(xùn)練強化神經(jīng)網(wǎng)絡(luò)的人工智能。楊柯開發(fā)的NID程序即屬于這一人工智能范疇。

基于“深度學(xué)習(xí)”的新型人工智能,極大降低了網(wǎng)絡(luò)黑產(chǎn)犯罪成本。如NID程序?qū)ψ址万炞C碼的識別破解已快到毫秒級,“打碼”平臺的效率和業(yè)務(wù)量借此呈指數(shù)級別增長。而作為“驗證”這一重要的網(wǎng)絡(luò)安全環(huán)節(jié),被攻陷后可被不法分子用于多個不同場景作惡,如撞庫、竊取信息、惡意灌水發(fā)帖、刷單、刷點擊量等,危害互聯(lián)網(wǎng)生態(tài)。

錢立鋒感慨,以往的黑客攻擊針對網(wǎng)站漏洞入侵,相當于“開鎖式進入”,而借助于人工智能,進攻方式變成了“硬闖”。

值得關(guān)注的是,這一案例是否意味著人工智能犯罪時代已經(jīng)到來?

北京交通大學(xué)計算機與信息技術(shù)學(xué)院副教授王偉介紹,目前人類已經(jīng)掌握了“弱人工智能”,即能制造出真正推理和解決問題的智能機器,這些機器并不真正擁有智能,也不會有自主意識,同在各方面能和人類比肩的“強人工智能”和比人類大腦聰明許多的“超人工智能”相比,“弱人工智能”只是人工智能的初級階段,NID系統(tǒng)屬于此列。

基于此,上海財經(jīng)大學(xué)法學(xué)院副院長胡凌認為,上述案件中,“人工智能”只是輔助犯罪嫌疑人實施犯罪的工具和手段,犯罪主體仍然是人而非機器,尚在中國刑法規(guī)制范圍內(nèi)。

不過,錢立鋒認為,在打擊互聯(lián)網(wǎng)技術(shù)類犯罪面前,《刑法》在適用上還有很多待商榷之處,譬如如何理解主觀明知、證據(jù)標準如何把握、宣告刑普遍偏輕等問題,在適用上應(yīng)統(tǒng)一認識。

另外,電信詐騙等犯罪的辦案主體往往是縣一級公安機關(guān)。雖然電信詐騙辦案難度不大,但為打掉整個黑色產(chǎn)業(yè)鏈,需要辦案人員向上追溯到信息泄露、“打碼”等技術(shù)環(huán)節(jié)。但實際中,證據(jù)固定難度通常很大——數(shù)據(jù)會被犯罪分子刪除,數(shù)據(jù)經(jīng)網(wǎng)絡(luò)流轉(zhuǎn)后,調(diào)取比較困難,縣級公安的技術(shù)能力往往有限。

錢立鋒以上述案件舉例,該案技術(shù)門檻高,復(fù)雜程度也很大,辦案機關(guān)扣留涉案設(shè)備后需要將“撞庫”軟件、“打碼”平臺程序、神經(jīng)網(wǎng)絡(luò)圖片驗證碼識別程序三個不同功能的軟件重新搭建,模擬現(xiàn)實環(huán)境,全程錄像取證,協(xié)同作業(yè)后,才能認定為一個能完整實現(xiàn)破解識別字符型驗證碼、“撞庫”、“洗庫”的軟件系統(tǒng)。

今年10月16日,在最高檢察院召開的新聞發(fā)布會上,最高檢公訴廳副廳長張相軍表達了類似觀點。他指出,與傳統(tǒng)的刑事犯罪相比,網(wǎng)絡(luò)犯罪具有主體的智能性、行為的隱蔽性、手段的多樣性、傳播的廣域性等突出特點。

與這些特點緊密相連,檢察機關(guān)懲治計算機網(wǎng)絡(luò)犯罪方面遇到的難點主要有取證和證明難——網(wǎng)絡(luò)空間所有行為通過數(shù)字化的形式完成,沒有目擊證人,網(wǎng)絡(luò)犯罪證據(jù)多以電子數(shù)據(jù)為主要形態(tài),偵查取證主要依賴技術(shù)手段完成;此外,網(wǎng)絡(luò)犯罪的取證、鑒定、定性等都需要很強的專業(yè)知識,檢察機關(guān)辦理此類案件需要大量專業(yè)人才。但從目前的實際情況看,檢察機關(guān)網(wǎng)絡(luò)技術(shù)人才十分缺乏,既精通法律業(yè)務(wù)又熟悉網(wǎng)絡(luò)技術(shù)的復(fù)合型檢察人才更是匱乏。

周正對未來表示擔(dān)憂。他認為,上述案件雖然僅是個案,有一定的技術(shù)門檻。但可以看出,網(wǎng)絡(luò)黑產(chǎn)犯罪分子對技術(shù)應(yīng)用到如此程度,已極盡所能。“人工智能本身是一種技術(shù),但隨著高速發(fā)展,已成為雙刃劍,如何用好這項技術(shù),值得更加深入地研究和實踐?!?

整體而言,技術(shù)犯罪數(shù)量在不斷上升。最高檢新聞發(fā)言人王松苗在前述新聞發(fā)布會上表示,2016年以來,全國因涉嫌計算機犯罪被檢方提起公訴的共1568人,僅今年1月至9月就有710人,同比上升80.7%。41169人因涉嫌網(wǎng)絡(luò)電信侵財犯罪被公訴,今年前九個月就有22268人,同比上升118.6%。

最高檢會同最高法正在共同研究起草《關(guān)于辦理網(wǎng)絡(luò)犯罪案件適用法律若干問題的解釋》,將針對《刑法修正案(九)》增設(shè)的拒不履行信息網(wǎng)絡(luò)安全管理義務(wù)罪、非法利用信息網(wǎng)絡(luò)罪、幫助信息網(wǎng)絡(luò)犯罪活動罪,明確定罪量刑標準和有關(guān)法律適用問題。

(文中受害人、犯罪嫌疑人均使用化名)


 
 

上一篇:2017年11月05日 聚銘安全速遞

下一篇:刷臉時代,你的“臉”還安全嗎?黑客演示攻破人臉識別系統(tǒng)