本文作者:無名漁夫

冷門行業(yè),不用AI搞仙人跳的黑產(chǎn)沒有夢想

無名漁夫 2020-06-22 4812
冷門行業(yè),不用AI搞仙人跳的黑產(chǎn)沒有夢想摘要: 1鄰近年關(guān),各家商家公司都最先搞大促,羊毛黨和黑產(chǎn)們的狂歡日也要來了。究竟年終獎是個好東西,人人都想要。科技在提高,羊毛黨和黑灰產(chǎn)也在提高。很不幸的是,大多數(shù)做黑灰產(chǎn)的都要比做防御...

1

鄰近年關(guān),各家商家公司都最先搞大促,羊毛黨和黑產(chǎn)們的狂歡日也要來了。

究竟年終獎是個好東西,人人都想要。

科技在提高,羊毛黨和黑灰產(chǎn)也在提高。

很不幸的是,大多數(shù)做黑灰產(chǎn)的都要比做防御的加倍起勁,種種最新的手藝,最前沿的科技實現(xiàn)方式,他們都市在第一時間去拿來搞錢。

究竟在款項的驅(qū)動下,不是人才,也是人才。


(黑產(chǎn)的起勁,你想象不到。泉源:騰訊云2019年DDoS威脅攻擊講述)

說真心話,做防御這一行,很蛋疼,也挺反人性的。

由于若是不出問題的話,實在做防御很難看出價值的;

若是出了問題的話,那就更沒什么價值了,除了被丟出來背鍋。

有時刻我甚至以為搞風(fēng)控平安拿的不是人為,而是精神損失費。

尤其從難度上,損壞永遠是比建設(shè)要容易的,修一座城要幾十年,損壞只需要一把火,防御系統(tǒng)也是這樣,做防守永遠是要比做進攻要難。

而且對大多數(shù)人而言,做進攻比做防御好玩,不用思量營業(yè)個感受,想怎么攻擊都可以,而且賺錢真的多許多,以是看著許多老同事成了新對手,我也以為挺魔幻的。

現(xiàn)在整個行業(yè)面臨的風(fēng)險情形,也在逐漸加大。


(騰訊靈鯤大數(shù)據(jù)平臺,實時反映風(fēng)險營業(yè)匹敵)

2

現(xiàn)在是大數(shù)據(jù)和云的年月,云服務(wù)已經(jīng)是無可置疑的趨勢,大量企業(yè)的所有營業(yè)和數(shù)據(jù)都市上云,這一方面代表了效率的提高,另一方面,代表的就是一旦泛起問題,風(fēng)險的影響是更大的。

已往黑產(chǎn)去搞企業(yè),撐死也就是幾個后臺頁面,能獲益有限。

現(xiàn)在黑產(chǎn)去搞企業(yè),一旦拿到云的權(quán)限,基本上想怎么玩兒就怎么玩兒,而且風(fēng)險還低。

人人在看到云的高效率的時刻,也得意識到,平安的挑戰(zhàn)更大了。

效率自己沒有善惡,做好事的效率高,那么一定壞事的效率更高。

講幾個故事吧,和黑產(chǎn)攻防有關(guān),現(xiàn)在黑產(chǎn)也喜歡搞仙人跳了。


(黑產(chǎn)現(xiàn)狀規(guī)模統(tǒng)計)

某著名的大型阛阓,在自己的超市里搞了一堆免費WIFI,主顧過來就可以毗鄰,然則需要手機注冊會員。

用免費WIFI換超市會員,實在是一筆劃算的生意,這個營銷增進思緒也是OK的。

但很快就被黑產(chǎn)盯上。

黑產(chǎn)進入阛阓去部署自己的WIFI,使用的名字和阛阓是完全一致的,同樣是要你的賬號密碼來登錄,登錄事后,可以聯(lián)網(wǎng)。

固然,不管你輸入什么,實在都是可以登錄的,由于黑產(chǎn)并不知道你的會員賬號密碼。

與此同時,黑產(chǎn)部署了一個假基站。

只要你在這個范圍內(nèi),毗鄰了這個假的WIFI,填寫了你的手機號,就會有劇本自動去登錄阛阓的會員系統(tǒng),同時這個假基站就會對你的GSM短信舉行挾制,獲取你的短信驗證碼。

登錄之后會自動替你領(lǐng)券,然后用券來套取優(yōu)惠的利差。

我們都知道阛阓拉新是會發(fā)很大額的新手券的,支出了大量的補助成本,黑產(chǎn)就是要賺這個福利。

這是很大一筆收益。

而作為用戶,你被仙人跳了。

更有趣的是,假基站裝備和假WIFI裝備是放在書包里的,被他們直接背著在阛阓里逛來逛去,賺夠了之后出門打車就走了,下次換個阛阓。

厥后這個方式被發(fā)現(xiàn),是由于阛阓上云之后,被系統(tǒng)自動識別出問題,由于泛起了大量的異常WIFI裝備登錄(正常WIFI是在白名單的),阛阓支出的價值是天文數(shù)字。

收獲的是一群虛偽的注冊用戶,而真實的用戶在注冊的時刻反而會被提醒已經(jīng)注冊。

大額補助打水漂,還冒犯了用戶,雞飛蛋打。

3

第二個故事泛起在內(nèi)容行業(yè)。

在現(xiàn)在這個年月,異常內(nèi)容風(fēng)險始終是最大的風(fēng)險。

對于一切支持用戶公布內(nèi)容的,實在內(nèi)容失控的風(fēng)險都是存在的。

話題廣場,論壇,談?wù)搮^(qū),用戶昵稱,甚至私人對話,語音連麥,只要可以錄入文字,圖片,語音和視頻的地方,就存在著失控的風(fēng)險。

除了垃圾信息外,社區(qū)的異常談話,直播里的敏感內(nèi)容,音頻里的隱匿色情,視頻中的問題素材,甚至電商質(zhì)料詳情頁的產(chǎn)物先容,全都是風(fēng)險。

以是換一個角度,若是你想進攻你的對手,有沒有加倍隱秘的方式呢?

對競爭對手做內(nèi)容攻擊就好了。


(御見平安運營中央(SOC))

使用機械錄入的方式,在對方平臺中灌入大量異常內(nèi)容(文字圖片音頻視頻),導(dǎo)致對方產(chǎn)物下架或者用戶負面,屬于借刀殺人的新玩法。

某著名種草社區(qū),就面臨了這樣的進攻,下架了良久。

針對垃圾信息進攻,第一重防御是在文本階段。

現(xiàn)在搞垃圾進攻的,全都是變體字+中英夾雜的,傳統(tǒng)的詞庫審核是攔不住這個的,你怎么可能窮舉呢?


(騰訊內(nèi)容風(fēng)控手藝剖析)

業(yè)內(nèi)經(jīng)典的文本分類算法,也許三種。

TextCNN、RNN、FastText。

其中文本攻擊的特點是,短時間高頻錄入,使用順序調(diào)整(漢字的序順并不定一能影閱響讀,你仔細看看),以及使用大量的異型符號來曲線轉(zhuǎn)達垃圾信息。

在這種場景下,最適合的是方案TextCNN,由于對順序不敏感,抗滋擾強,且結(jié)構(gòu)簡樸,推理速度快,你不能讓用戶守候幾個小時才發(fā)內(nèi)容,這樣營業(yè)也不用做了。

但與此同時,還要做針對性訓(xùn)練。

1.基于字符、拼音的Word2Vec來解決同音字問題,漢字窮舉不可能,然則拼音窮舉照樣簡樸的。

2.提升抗滋擾能力使用高頻字做拆字,例如【威信】中的2個字,拆成2個單一字作為變量來做核驗。

例如只要泛起【信】這個字的內(nèi)容,都要走二級計謀。

3.模子訓(xùn)練增添分外的場景變量,同樣一個詞,【死鬼】,我媽說我是死鬼和我媽說我爸是死鬼就是完全差別的場景。

以是在設(shè)計模子計謀的時刻,一定要有場景這個觀點。

許多模子欠好使的要害節(jié)點就是沒有場景觀點,導(dǎo)致許多數(shù)據(jù)效果實在是過擬合的。


(騰訊天御內(nèi)容風(fēng)控文本平安的襲擊原理,作為海內(nèi)最大的內(nèi)容平臺,騰訊天天都在面臨高強度的攻防)

4

講完文本講圖片。

圖片面臨戰(zhàn)主要襲擊場景是色情低俗類。

由于圖片是存在表示的,而且圖片的要素是要遠遠多于文字的,而且圖片自己的敏感點也是隱藏的,單純使用簡樸的過濾方式是不行的。

很簡樸的原理,你要過濾胸部,只用白,圓等特征,可能饅頭也完犢子了。

現(xiàn)在針對圖片,應(yīng)用最廣的照樣圖像分類/目的檢測算法+要害要素識別。


(騰訊云,圖片風(fēng)險內(nèi)容識別手藝原理)

想想看,人是怎么熟悉貓的?

實在就通過貓的臉部特征,例如鼻子到眼睛的距離,雙眼的距離,尾巴的長度,耳朵的形狀,皮膚的顏色等等等等一系列方式,人知道,這種形態(tài)的生物,叫做貓。

同理,人腦是怎么識別色情圖片的?

就是色情圖片上有大量的要害要素,這些要素,才是焦點,其他內(nèi)容都是無關(guān)緊要的。

例如下圖,一個穿白色衣服的性感照,顏色,靠山都不主要,主要的是焦點露出的要素。


(人類真的是很會找重點的生物)

你會本能性的關(guān)注亮點,這個亮點,就是要害要素。

在模子上,就是要用Attention讓模子加倍關(guān)注特定要素,例如上圖的熱力區(qū)域,就是所謂【漏溝】要素。


(騰訊云,圖片風(fēng)險提防手藝原理)

固然,要讓機械熟悉到這種要素,最主要的就是教給機械作甚【漏溝】。

就和人熟悉貓一樣,機械熟悉【漏溝】這個觀點,也是需要比對大量的要素,例如衣服和皮膚的色差,裂縫和皮膚的距離,顏色漫衍和靠山的比對,這些要素需要打上標(biāo)簽,讓機械分辨。

最前沿的做法是,設(shè)置ignore label抑制高頻標(biāo)簽,降Loss反向流傳權(quán)值,可以有用提升低頻標(biāo)簽召回率提升,進而提升整體的識別效果。


(騰訊天御模子效果,黃圖克星)

5

講完圖片講視頻和音頻。

視頻判別實在主要難度在于效率。

視頻可以簡樸理解為是大量高速閃動的圖片,一個1分鐘的視頻,若是是24幀尺度影戲畫質(zhì),可以拆解為60(秒)X24=1440張圖片。

若是是60幀畫質(zhì),可以拆解為60秒X60=3600張圖片。

以是視頻核驗本質(zhì)上就是高效率的圖片核驗。

那么問題來了,一個1分鐘的視頻,就要核驗這么多的圖片,那么若是要核驗許多視頻,基本上所有的服務(wù)器什么事情都不用做了,尤其是直播領(lǐng)域,都是實時的。

以是視頻檢測的焦點點就是交給機械若何合理的偷懶。

3600張照片,不需要每張都看,現(xiàn)實上人的眼睛也看不出每張的區(qū)別,只要做算法抽幀就可以了,3600張照片里,只需要抽100到200張匹配就可以了。

至于選取哪200張,這就是模子的藝術(shù)了。


2019土地市場十宗“最”!【年度盤點丨土地市場】


(騰訊云:天御內(nèi)容風(fēng)控)

音頻同理。

若是說視頻是動態(tài)的圖片,那么音頻本質(zhì)上就是動態(tài)的文字。

人的大腦處置音頻的方式實在就是把聲音轉(zhuǎn)化成文字,然后大腦識別文字,然后再通過文字腦補畫面。

固然,講騷話實在不是音頻處置的真正場景,真的場景是嬌喘等色情應(yīng)用。

處置色情音頻也是這樣的。

1.VAD 做靜音檢測,去掉靜音內(nèi)容,給長度減肥,同時將音頻分段。

2.然后檢測音頻特征,提取音頻特征 MFCC/Fbank,往往嬌喘是有特定頻段,特定內(nèi)容的,由于人的大腦能吸收到的頻段和頻率是有限的,啊啊啊啊啊和來大兄弟你愁啥,顯著會有差別的效果。

3.然后做特征工程,把監(jiān)測到的素材天生標(biāo)簽,基于GMM或者TDNN。

4.然后把特征和色情樣板舉行比對,輸出一堆效果字段。

5.最后把效果字段通過算法來輸出可疑分數(shù),和文字內(nèi)容

6.文字內(nèi)容做模子比對,可疑分數(shù)依據(jù)計謀來cut off。


(騰訊云-色情音頻識別效果,嬌喘黨哭暈在茅廁嚶嚶嚶)

現(xiàn)在主流的社區(qū)和音視頻平臺,若是還沒有接入內(nèi)容風(fēng)控的話,基本上算是裸奔,可以等著由于你的平臺上有人裸奔而倒霉了。

別笑,這種事情天天都在發(fā)生。

6

第三個故事和羊毛黨有關(guān)系。

只要電商搞促銷,就一定有羊毛黨群集。


(黑產(chǎn)全鏈路防御模子)

然則你們知道么,羊毛產(chǎn)業(yè)鏈里雖然有無數(shù)的水軍和線報群,然則群里種種的羊毛信息的源頭是那里漏出來的?

不否認,確實是有內(nèi)鬼這個征象,但許多時刻,破綻和規(guī)則是用AI來挖掘的。

羊毛黨最上游的那些大佬,基本都是專業(yè)風(fēng)控平安和手藝身世的,他們的進攻才是最恐怖的。

曾經(jīng)某家電商做了促銷,有優(yōu)惠券,滿100-20。

然則系統(tǒng)設(shè)置存在破綻,若是你用了這張券,然則退貨了,則會彌補你20元的無門檻券,這時刻你可以買一個21元的商品,只需要花1元就能買到。

再例如,某著名連鎖餐廳,曾經(jīng)泛起過一個BUG,使用了他們的某個代碼的優(yōu)惠券之后,購置特定金額的產(chǎn)物,優(yōu)惠券數(shù)字會轉(zhuǎn)變,可以只花很少的錢喂飽6小我私家。

再例如,某著名生鮮電商,曾經(jīng)泛起過拉新BUG,允許相同地址的人來頻頻刷新人優(yōu)惠。

再例如,某著名互聯(lián)網(wǎng)公司做拉新流動,1人只能抽1次獎,多抽需要分享到朋友圈,然則實測在某個H5頁面舉行退回操作,可以不分享也能分外獲取機遇,有人一天抽了幾十萬次。

這些規(guī)則,單靠人腦去挖掘是異常浪費時間的。


(騰訊云-電商風(fēng)險解決計謀)

而且AI的特點是什么?是善于大規(guī)模高頻盤算,只要你制訂好要素和想要的效果,AI就會無限次的實驗種種方式,直到越來越靠近你要的效果,最終輸出方案。

這天生就是為破綻挖掘而生。

人腦對于破綻的認知以及特點是有限的,或者說是缺乏想象力的,但人知道自己想要什么,以是把資料和效果給到AI時,AI就會去窮舉所有的可能性,許多細小的,人意識不到的破綻,就這么被挖掘出來了。

例如圍棋,AI是若何暴打人類的?就是由于AI在每一步都市舉行一次盤算,然后選取可能性最大的模式來操作,只管這個操作是不符合常理的,但最終的勝利說明晰一切。

進攻也是云云,手段再怎么奇葩都不主要,主要的是,效果。

進攻,往往就需要這種突破頭腦。

7

云時代,若何阻擋掌握了AI手藝的羊毛黨?

在我看來,一共3重方案。

第一重解決方案很簡樸,拔電源。

別笑,這是一個很嚴肅的解決方式,當(dāng)你在軟件層面阻擋不了對方的時刻,拔電源屬于硬件解決方案。

只要你的服務(wù)器設(shè)計是支持異地多活和斷點數(shù)據(jù)珍愛的,斷電是異常好的模式,就像數(shù)據(jù)庫遷徙最快最平安的方式是什么?

把硬盤拆下來,用貨車運走。

進攻方都是無所不用其極,防守方應(yīng)該加倍天真。

第二重方案,不把自己當(dāng)人。

簡樸來說,既然對方的進攻使用AI,那么防守也要使用AI。

羊毛黨的破綻挖掘手藝說真的防不了,也不用防,只要在執(zhí)行階段舉行阻擋就可以。

羊毛黨再怎么找破綻,找到了破綻總歸要執(zhí)行。

執(zhí)行只有2種方式,機刷和肉刷。

機刷實在稀奇容易阻擋,不說裝備號,IP,這樣的批量相似點,就說操作頻次,營業(yè)路徑,進入鏈接,訂單信息,都可以用AI來舉行阻擋。

同時比對統(tǒng)一個時間節(jié)點所有下單用戶的信息,然后聚類把可疑訂單群集起來,然后提取訂單中的特征,然后再依據(jù)特征抓第二批用戶。

接下來阻擋發(fā)貨,守候阻擋用戶的后續(xù)操作,再依據(jù)后續(xù)操作提取新的特征,進一步阻擋。

這內(nèi)里大量的盤算,都是AI來完成的。

肉刷相對龐大,由于用戶都是真人,操作特征和機械有典型的差別,若是說提防機刷只需要比對統(tǒng)一時間內(nèi)所有用戶的特征,算是橫向。

那么提防肉刷,除了在這個基礎(chǔ)上,還要再比對統(tǒng)一小我私家,在差別的時間線內(nèi),舉行操作的異常。

舉個例子,一個用戶下了100單,其中20單是有刷單嫌疑的,那么這實在是個好人,雖然愛占廉價,封號是不合理的。

然則當(dāng)這人的第101單,通過和已往的特征比對(例如特定地址,特定收貨人,特定跳轉(zhuǎn)路徑等等等等),判斷也許率為刷單,于此同時,泛起了大量和他一樣的可疑用戶(包羅用戶自己和自己的比對以及橫向用戶和用戶的比對),那么這一單,就要阻擋。

這恐怖的盤算量,同樣要靠AI來實現(xiàn)。


(騰訊云AI平安矩陣)

第三重方案,放羊,吃肉。

這是我常干的事情。

羊毛黨要刷,就讓他刷好了,干嘛費勁兒不讓人刷呢。

只要踩死掉他們的贏利渠道,讓他們支出價值就可以了。

例如特定的流動里,專門設(shè)置發(fā)貨規(guī)則,而且在規(guī)則中中設(shè)置大量的異常判斷,有問題的,所有阻擋,資金N天后再到賬。

例如某些存在現(xiàn)金收益的產(chǎn)物,設(shè)計套利規(guī)則為需要先付錢再套利,例如滿100減80,有問題的票據(jù)全都阻擋提現(xiàn),想提現(xiàn)帶著實人認證來,經(jīng)常可以套一大筆錢沉淀在賬戶,這錢也不能動,然則足夠惡心人。

例如提現(xiàn)中,克制多賬號提現(xiàn)到統(tǒng)一個金融類賬號中,而且要求賬號必須和本人實名一一對應(yīng),然后再控制拉新的獎勵成本,可以有用讓羊毛黨一通操作除了締造廉價日活沒有任何其他意義。

例如規(guī)則設(shè)置中,對同樣的壞用戶,接納完全差別的處置計謀,讓他們也吃不準(zhǔn)是哪個節(jié)點出了問題,滋擾他們對于規(guī)則的試探,許多時刻和履歷老道的黑產(chǎn)交鋒,只用傳統(tǒng)計謀沒有意義的,人家比你懂的多了。

實在我也憎惡防守,防守必須要做,不想著反撲羊毛黨的風(fēng)控,顯然更有趣一些。

8

真正的重點在第四重。

進攻,進攻,照樣進攻。

從進攻者的角度找問題。

我始終堅持以為,不明白進攻的平安從業(yè)者,是做不出真正的防守的。

防守自己就足夠被動了,還干巴巴在家里坐著等人打上門來,異常愚蠢。

每一個平安從業(yè)者,都應(yīng)該先去進攻,自己來進攻自己的系統(tǒng),做攻防演練,以攻破為目的,一針見血,只有在這樣的過程中,才氣有著更強的防守。

給人人看看真正的黑產(chǎn)可以做到什么境界。

現(xiàn)在的黑產(chǎn)入侵已經(jīng)可以做到組織一段包羅隨便下令的條碼,并將其編碼到激光中,條碼閱讀器吸收激光后,會誤以為掃到條形碼,同時執(zhí)行隱藏在其中的隨便下令,從而攻入系統(tǒng)。合適的激光發(fā)射裝置甚至可以在很遠的地方提議這種攻擊。

騰訊玄武實驗室已樂成實現(xiàn)這種進攻模式。


當(dāng)今盛行的屏下指紋,現(xiàn)實存在【殘跡重用】的破綻,玄武實驗室首次破解并完成命名。

這一破綻源頭并非手機廠商,而是屏下指紋芯片廠商,是屏下指紋手藝設(shè)計層面的問題,會險些無差別地影響所有使用屏下指紋手藝的裝備。行使該破綻,攻擊者只需一秒鐘就可解鎖手機。

黑客行使反射體誘騙的方式,通過殘存指紋痕跡作案。


(騰訊平安玄武實驗室破解并命名殘跡重用破綻)

只有對進攻了如指掌,才氣做好防守。

沒有進攻履歷的防御,都是紙上談兵。

9

適才我提到了硬件提防,云時代的風(fēng)控平安,是軟硬連系的產(chǎn)物。

我提到的故事里,第一個故事顯著就是黑產(chǎn)使用硬件來舉行的進攻,其中的軟件難度極低。

真正的平安,應(yīng)該是從硬件階段,就盡可能杜絕風(fēng)險泛起的可能性。

我舉幾個例子,你做內(nèi)容平安風(fēng)控,再NB的AI手藝,再猛的規(guī)則詞庫,都是軟功夫,如果不能把APP的外露接口加密,黑產(chǎn)隨時寫劇本改內(nèi)容,累死風(fēng)控你也干欠好,你改規(guī)則永遠沒有人家進攻方用接口來往里灌快。

再例如如果有全套的決議引擎,無敵的規(guī)則設(shè)置,然則服務(wù)器上有后門,人家走流程直接不需要走你的營業(yè)流,你還怎么防守?

一個上半身無比壯碩的大個子,吃了一個掃堂腿,長得越高,摔的越慘。

再例如如果有全套的數(shù)據(jù)監(jiān)控系統(tǒng),然則數(shù)據(jù)庫跳板機存在問題,被人入侵后你的數(shù)據(jù)監(jiān)控系統(tǒng)就成了對方的競爭對手監(jiān)控報表,許多互聯(lián)網(wǎng)公司對于競爭對手的數(shù)據(jù)都是精準(zhǔn)到秒級別的。

以是要做平安,就是軟硬一起做。

硬件是身體,軟件是精神。

腦子欠好,再強壯的身體也過欠好。

身體欠好,再伶俐的腦子也活不久。

全棧平安系統(tǒng),是云時代必須要做的,騰訊云就是一個典型。


最后,說了這么多,實在也照樣看老板的價值觀。

究竟風(fēng)控本質(zhì)上是為營業(yè)服務(wù),而且要投入大量的成本。

我是無名漁夫(微信/QQ:181628402)無名漁夫網(wǎng)站創(chuàng)始人,全職網(wǎng)賺創(chuàng)業(yè)11年,知名實戰(zhàn)派互聯(lián)網(wǎng)項目培訓(xùn)者,為草根提供網(wǎng)上賺錢項目交流技術(shù)方法及最新互聯(lián)網(wǎng)項目分享!感謝您一直以來對軒鼎創(chuàng)業(yè)的大力支持!更多干貨可訪問創(chuàng)業(yè)課堂https://www.chuangyeketang.com
文章版權(quán)及轉(zhuǎn)載聲明

作者:無名漁夫本文地址:http://m.procarseats.com/blog/11247.html發(fā)布于 2020-06-22
文章轉(zhuǎn)載或復(fù)制請以超鏈接形式并注明出處無名漁夫

贊(12)
閱讀
分享