AI應(yīng)用落地再起高潮，高智商AI反殺詐騙犯

浪潮信息

2022-12-21 11:46 7226

北京, 2022年12月21日 /美通社/ -- 近日，B站一位開(kāi)發(fā)者UP主基于開(kāi)源大模型"源1.0"，開(kāi)發(fā)了一個(gè)能夠無(wú)障礙進(jìn)行微信聊天的人工智能"小源"，并在與騙子的真實(shí)對(duì)話場(chǎng)景中進(jìn)行測(cè)試，破解"殺豬盤"詐騙套路，識(shí)破詐騙話術(shù)，進(jìn)而加深公眾對(duì)詐騙套路的認(rèn)識(shí)，增強(qiáng)公眾的反詐騙意識(shí)，減少網(wǎng)絡(luò)詐騙受害者。

"殺豬盤"是當(dāng)下一種交友婚戀類網(wǎng)絡(luò)詐騙：詐騙分子利用網(wǎng)絡(luò)交友，誘導(dǎo)受害人投資賭博的電信詐騙方式。

詐騙分子準(zhǔn)備好人設(shè)、交友套路等，通過(guò)建立戀愛(ài)關(guān)系，最后騙取錢財(cái)，而他們的目標(biāo)女性一旦被鎖定，無(wú)論最終結(jié)果如何，都將"渡劫"。從此類詐騙手段的名稱——"殺豬盤"就能看出，在這場(chǎng)圈套中，目標(biāo)女性已不再被詐騙分子視為"人"，而是渾身洋溢著金錢味道、等待被用感情裝飾的大刀揮下的"豬"，目的極其惡劣。

以"殺豬盤"為代表的情感詐騙，不僅給受害者帶來(lái)巨大金錢損失，更帶來(lái)嚴(yán)重感情傷害，甚至屢屢導(dǎo)致自殺事件發(fā)生。

詐騙團(tuán)伙一般身處境外，偽造身份信息并通過(guò)各種社交平臺(tái)尋找對(duì)象，若要根除這些團(tuán)伙仍需時(shí)間，因此自身防范與識(shí)破套路的防御能力就變得尤為重要。

然而"以身試險(xiǎn)"代價(jià)太大，在這個(gè)高科技發(fā)達(dá)的時(shí)代，能用魔法打敗魔法嗎？

情感詐騙毒瘤"殺豬盤"，用黑科技打敗黑魔法

先看下這幾張聊天截圖：

小源是一線城市獨(dú)生女，房車雙全，工作體面穩(wěn)定，唯獨(dú)愛(ài)情還未開(kāi)花結(jié)果，但她在賽博世界遇上了一份緣。

而對(duì)面正是一位從事金融行業(yè)的北京男孩，不僅性格爽朗體貼，經(jīng)濟(jì)上更是獨(dú)立，隨便一個(gè)項(xiàng)目就能小賺幾百萬(wàn)，對(duì)她還很熱情。

但都說(shuō)談錢傷感情，小源也未能幸免，面對(duì)投入資金進(jìn)行共同投資的要求，我拒絕了對(duì)方，他因此認(rèn)為小源沒(méi)有和他走下去的心意，后來(lái)甚至惡語(yǔ)相加。

很明顯，小源成為了這次殺豬盤的目標(biāo)，但也不要太為"她"捏把汗。

因?yàn)閲?yán)格來(lái)講，上述聊天截圖真假參半，真的是：確實(shí)在與懷有別樣目的性的男士在文字聊天，假的是：這位女生并非真實(shí)人類，而是人工智能。

這是一位開(kāi)發(fā)者B站up主@圖靈的貓基于開(kāi)源預(yù)訓(xùn)練中文模型"源1.0"，開(kāi)發(fā)了一個(gè)能夠無(wú)障礙進(jìn)行微信聊天的人工智能"小源"，并在與騙子的真實(shí)對(duì)話場(chǎng)景中進(jìn)行測(cè)試，試著觀察AI如何與騙子斗智斗勇。

為了讓騙子上鉤，@圖靈的貓在多個(gè)社交平臺(tái)注冊(cè)了賬號(hào)，然后根據(jù)反詐中心發(fā)布的受害者畫像，為賬號(hào)定位了單身、多金、高學(xué)歷乖乖女等身份標(biāo)簽。果不其然私信爆炸。

AI通過(guò)大量學(xué)習(xí)，能更好地掌握對(duì)話規(guī)則，反套路詐騙犯，破解"殺豬盤"詐騙套路，識(shí)破詐騙話術(shù)，進(jìn)而加深公眾對(duì)詐騙套路的認(rèn)識(shí)，增強(qiáng)公眾的反詐騙意識(shí)，減少網(wǎng)絡(luò)詐騙受害者。

目前@圖靈的貓已將這一AI反詐項(xiàng)目已在Github上開(kāi)源：

https://github.com/Turing-Project/AntiFraudChatBot

"殺豬盤"往往是有套路的，AI在對(duì)話中，又是如何見(jiàn)招拆招的呢？

當(dāng)詐騙份子遇上AI：一場(chǎng)各懷心思的文字交鋒

這是一場(chǎng)文字上的交鋒，哪怕是AI上場(chǎng)，所謂的"見(jiàn)招拆招"需要有豐富的語(yǔ)料作為儲(chǔ)備。

本次項(xiàng)目基于的NLP大模型浪潮"源1.0"是浪潮人工智能研究院研發(fā)成功的大規(guī)模中文語(yǔ)言模型，參數(shù)量高達(dá)2457億，于2021年9月發(fā)布時(shí)即超越此前由美國(guó)OpenAI組織研發(fā)的1750億參數(shù)量的英文語(yǔ)言模型GPT-3，成為全球最大規(guī)模的人工智能語(yǔ)言模型。

有了"源1.0"作為智能基礎(chǔ)，開(kāi)發(fā)者還在對(duì)話機(jī)制上進(jìn)行了一些設(shè)計(jì)，讓AI對(duì)話起來(lái)更加自然，比如：設(shè)定每條信息的回復(fù)間隔，模擬真實(shí)打字速度（total_len / 10 * 2s)。

萬(wàn)事具備，就開(kāi)始交鋒吧。另外，作為一名潛在受害者，小源也并非事先知道哪位找她來(lái)聊天的是詐騙犯，"她"將和我們一起在溝通中發(fā)現(xiàn)蛛絲馬跡并進(jìn)行防御，"她"發(fā)現(xiàn)蛛絲馬跡的過(guò)程正是為公眾識(shí)別詐騙做出的示范。

當(dāng)然為了避免誤傷，開(kāi)發(fā)者設(shè)定了一些嚴(yán)格的篩選條件，例如人設(shè)背景完美但關(guān)鍵信息模糊、照片確認(rèn)為網(wǎng)圖、從事如私募、證券或投行等高端行業(yè)等，滿足這些條件的人才會(huì)讓小源接管對(duì)話。

之前就提到"殺豬盤"有一套嚴(yán)格的詐騙套路，規(guī)范的話術(shù)流程，詐騙犯把受害者叫做"豬"：

第一步，"找豬"指私加好友。面對(duì)小源，詐騙犯也一上來(lái)就通過(guò)旁敲側(cè)擊來(lái)打聽(tīng)女生的現(xiàn)實(shí)情況，小源也會(huì)根據(jù)對(duì)方提供的信息做出反應(yīng)，一些俏皮玩笑語(yǔ)句輸出，讓對(duì)話有來(lái)有回。

第二步，"喂豬"指盜用他人優(yōu)質(zhì)資料包裝自己，灌輸自己很成功、很優(yōu)秀等信息，獲取受害者的信任。

開(kāi)始了開(kāi)始了，他開(kāi)始裝了。沒(méi)關(guān)系，根據(jù)他給的信息，小源也會(huì)給他舞臺(tái)，還給對(duì)方起了"富哥"作為昵稱，拉進(jìn)彼此距離。

第三步，"養(yǎng)豬"指戀愛(ài)過(guò)程，這也是往往受害者放下警惕，交出信任的過(guò)程，詐騙犯在這一步都表現(xiàn)得深情款款，試圖讓對(duì)話氛圍蜜里調(diào)油，并且說(shuō)一些套路騷話來(lái)確認(rèn)"戀愛(ài)關(guān)系"。

到了這一步，小源已經(jīng)識(shí)別出他是詐騙犯了，那么為了反套路詐騙犯，小源裝作上套，也表示喜歡詐騙犯。

"殺豬盤"其實(shí)就是一種規(guī)則化、模式化的對(duì)話博弈，詐騙犯本就毫無(wú)真心真情，只求在一來(lái)一回的對(duì)話中讓受害者放低心理防御。在開(kāi)發(fā)過(guò)程中，傳統(tǒng)的無(wú)目標(biāo)導(dǎo)向的"開(kāi)放域?qū)υ?quot;或"詞槽式目的域?qū)υ?quot;方案都表現(xiàn)不佳。

與GPT-3不同的是，"源1.0"更加擅長(zhǎng)的是零樣本（Zero-Shot）和小樣本（Few-Shot）學(xué)習(xí)，而非目前更多模型所擅長(zhǎng)的微調(diào)試學(xué)習(xí)（finetune）。在中文語(yǔ)言理解評(píng)測(cè)基準(zhǔn)CLUE榜單的零樣本學(xué)習(xí)（zero-shot）和小樣本學(xué)習(xí)（few-shot）均取得過(guò)總榜第一的成績(jī)。

從實(shí)際應(yīng)用效果來(lái)看也確實(shí)如此，在1~ 3個(gè)，甚至只有1個(gè)合適example的示范下，模型就可以實(shí)現(xiàn)開(kāi)發(fā)者希望達(dá)到的"對(duì)話策略"，比如反套路、用語(yǔ)料拋梗等等，讓AI看起來(lái)能夠?qū)︱_子具備識(shí)別能力，本質(zhì)上這也是一種query->value的查詢匹配。

而開(kāi)發(fā)者在本次項(xiàng)目中，example語(yǔ)料主要抽取自B站和貼吧的熱門評(píng)論，一來(lái)因?yàn)樵u(píng)論是天然的對(duì)話形式，有顯式的回復(fù)與被回復(fù)關(guān)系；二來(lái)自古評(píng)論出人才，一些金句和梗可以把人機(jī)對(duì)話變得不那么生硬，就像"富哥V5"、"小黑子，露出雞腳了吧"，以及"喵"、"捏"都是頗具網(wǎng)感的語(yǔ)句和語(yǔ)氣助詞。

具體語(yǔ)料經(jīng)過(guò)人工篩選，過(guò)濾不當(dāng)言論，再處理成prompt格式。以下是Prompt Example的生成樣例：

第四步，"殺豬"指欺詐過(guò)程。這是詐騙犯的終極目標(biāo)，于他們而講，能不能成就這一哆嗦了，而對(duì)受害者來(lái)說(shuō)，這也是涉及財(cái)產(chǎn)有無(wú)損失的關(guān)鍵一步。

在這個(gè)項(xiàng)目里，詐騙犯在循序漸進(jìn)、有意無(wú)意地總是提到一個(gè)利潤(rùn)率很高的項(xiàng)目，試圖給對(duì)方留下高回報(bào)率的印象。

這是一個(gè)連環(huán)計(jì)，這時(shí)候就要考驗(yàn)到AI的記憶力了。由于微信聊天是多輪對(duì)話，AI有時(shí)并不記得自己或?qū)Ψ缴弦痪湔f(shuō)過(guò)什么。

"源1.0"具備記憶能力，開(kāi)發(fā)者同時(shí)參考了LSTM的思想，為系統(tǒng)增加了記憶機(jī)制，具體機(jī)制如下：

聊天記錄放入記憶區(qū)，在每次回復(fù)時(shí)計(jì)算相似度，超過(guò)相似度閾值的歷史對(duì)話將被AI讀取使用；并且設(shè)定遺忘窗口M，超過(guò)M/2輪次的對(duì)話將被pop() 這樣，AI就能夠?qū)崿F(xiàn)簡(jiǎn)單的長(zhǎng)短期對(duì)話記憶，比如昨天聊過(guò)的內(nèi)容或上一輪對(duì)話內(nèi)容。

帶著這樣的記憶，當(dāng)過(guò)了兩天當(dāng)詐騙犯再試圖和小源聊天時(shí)。小源也順著對(duì)方問(wèn)出了"在哪里可以買到"的話：

當(dāng)然，聊歸聊，開(kāi)發(fā)在進(jìn)行開(kāi)發(fā)時(shí)就給小源加上了"思想鋼印"——凡是涉及投資理財(cái)、引導(dǎo)資金投入的都是詐騙。

哪怕是面對(duì)詐騙犯的威逼利誘，小源依然不為所動(dòng)，堅(jiān)持聲稱自己沒(méi)有錢，并提出向詐騙犯借錢。

到了后來(lái)，AI直接金蟬脫殼來(lái)一波反殺，面對(duì)PUA話術(shù)和挑釁行為，直接點(diǎn)出對(duì)方違法要求和"她"去警局自首，反將一軍。

AI向善，感性與創(chuàng)新引導(dǎo)下的理性應(yīng)用

據(jù)開(kāi)發(fā)者@圖靈的貓介紹，對(duì)話中的這位Henry騙子哥，只是主動(dòng)找上"小源"的其中一位聊天對(duì)象，還有13位"嫌疑詐騙分子"，這個(gè)數(shù)字還是在開(kāi)發(fā)者已經(jīng)進(jìn)行了一波篩選之后。

小源完美的待嫁單身女生形象，吸引了無(wú)數(shù)人，私信爆炸。可以想象，同樣條件的人類女生在社交網(wǎng)站上是多么危機(jī)四伏，隨時(shí)都可能成為受害對(duì)象。

人類和AI的最大不同在于，多數(shù)時(shí)候人類的感性是占據(jù)上風(fēng)的，做不到AI那樣的絕對(duì)理性，所以才會(huì)不知不覺(jué)間落入圈套。

但正是這樣感性的驅(qū)動(dòng)下，AI在我們?nèi)粘Ｉa(chǎn)生活所發(fā)揮的空間才無(wú)窮，因?yàn)槿斯ぶ悄艿认冗M(jìn)技術(shù)的本質(zhì)仍是工具，而工具所謂的善惡傾向則取決于人類的出發(fā)點(diǎn)。

就如同@圖靈的貓這樣的開(kāi)發(fā)者因?yàn)樯磉呌杏龅竭^(guò)殺豬盤的朋友們，進(jìn)而義憤填膺基于"源1.0"大模型開(kāi)發(fā)出AI反詐"工具人"小源，提醒廣大女性提高警惕性，注意防范網(wǎng)絡(luò)上的陌生人。

人類善用AI的智慧定會(huì)勝過(guò)日益強(qiáng)大的AI技術(shù)。

如今，人工智能已經(jīng)從點(diǎn)到面滲透到更多行業(yè)、更多領(lǐng)域的各類場(chǎng)景，創(chuàng)新不斷。作為通用的巨量中文AI模型，"源1.0"具備優(yōu)秀的自然語(yǔ)言理解和自然語(yǔ)言生成的能力，可以作為新一代認(rèn)知智能的引擎，適應(yīng)廣泛的下游AI任務(wù)，自開(kāi)源問(wèn)世以來(lái)，不少開(kāi)發(fā)者和相關(guān)機(jī)構(gòu)都基于此進(jìn)行了諸多創(chuàng)新應(yīng)用。

"源1.0"可以完成各種風(fēng)格、類型文本的生成，如新聞資訊、金融行研、辦公公文、法律文書、廣告營(yíng)銷、網(wǎng)絡(luò)文學(xué)、詩(shī)詞歌賦、食譜菜譜等。

超1000家用戶，采用"源1.0"提供的數(shù)據(jù)和API顯著提升了金融、互聯(lián)網(wǎng)、醫(yī)療和自動(dòng)駕駛等行業(yè)應(yīng)用的精度；

源1.0已經(jīng)與多個(gè)行業(yè)用戶開(kāi)展深度合作，支持手機(jī)智能語(yǔ)音助手、大型互聯(lián)網(wǎng)翻譯平臺(tái)等應(yīng)用的AI智能化升級(jí)……

除了這些相對(duì)"常規(guī)"的操作，不少開(kāi)源社區(qū)的開(kāi)發(fā)者們通過(guò)源1.0的開(kāi)放開(kāi)源平臺(tái)進(jìn)行了創(chuàng)意實(shí)現(xiàn)。

在文娛方面，一群來(lái)自上海學(xué)生開(kāi)發(fā)者創(chuàng)作的"AI劇本殺"就是其中代表，曾在GitHub引發(fā)熱烈討論。

Github鏈接：https://github.com/bigbrother666sh/shezhangbujianle

在心理輔導(dǎo)方面，自香港浸會(huì)大學(xué)社會(huì)工作系副教授陳智達(dá)教授負(fù)責(zé)的運(yùn)用AI模擬求助者支援社會(huì)服務(wù)工作者培訓(xùn)項(xiàng)目。

在上述案例中，AI在不同領(lǐng)域以意想不到的方式發(fā)揮著自己的潛力，也幫助著訴求不同的開(kāi)發(fā)者們拓寬創(chuàng)新的邊界。這些創(chuàng)新想法或許早就出現(xiàn)在他們富有想象力的腦海中，而將"靈光乍現(xiàn)"變成可實(shí)現(xiàn)、可落地的應(yīng)用，很大程度上需歸功于外部技術(shù)環(huán)境的變化，例如，如今以"源1.0"為代表的大模型已經(jīng)成為人工智能算法基礎(chǔ)設(shè)施，正在普惠千行百業(yè)。

事實(shí)上，創(chuàng)新往往并非無(wú)中生有的頓悟，而是某一領(lǐng)域發(fā)展到一定階段、厚積薄發(fā)的涌現(xiàn)，技術(shù)是向善的工具，亦是創(chuàng)新萌發(fā)的沃土。

消息來(lái)源：浪潮信息