北京, 2022年12月21日 /美通社/ -- 近日,B站一位开发者UP主基于开源大模型\"源1.0\",开发了一个能够无障碍进行微信聊天的人工智能\"小源\",并在与骗子的真实对话场景中进行测试,破解\"杀猪盘\"诈骗套路,识破诈骗话术,进而加深公众对诈骗套路的认识,增强公众的反诈骗意识,减少网络诈骗受害者。

\"杀猪盘\"是当下一种交友婚恋类网络诈骗:诈骗分子利用网络交友,诱导受害人投资赌博的电信诈骗方式。

诈骗分子准备好人设、交友套路等,通过建立恋爱关系,最后骗取钱财,而他们的目标女性一旦被锁定,无论最终结果如何,都将\"渡劫\"。从此类诈骗手段的名称——\"杀猪盘\"就能看出,在这场圈套中,目标女性已不再被诈骗分子视为\"人\",而是浑身洋溢着金钱味道、等待被用感情装饰的大刀挥下的\"猪\",目的极其恶劣。


【资料图】

以\"杀猪盘\"为代表的情感诈骗,不仅给受害者带来巨大金钱损失,更带来严重感情伤害,甚至屡屡导致自杀事件发生。

诈骗团伙一般身处境外,伪造身份信息并通过各种社交平台寻找对象,若要根除这些团伙仍需时间,因此自身防范与识破套路的防御能力就变得尤为重要。

然而\"以身试险\"代价太大,在这个高科技发达的时代,能用魔法打败魔法吗?

情感诈骗毒瘤\"杀猪盘\",用黑科技打败黑魔法

先看下这几张聊天截图:

小源是一线城市独生女,房车双全,工作体面稳定,唯独爱情还未开花结果,但她在赛博世界遇上了一份缘。

而对面正是一位从事金融行业的北京男孩,不仅性格爽朗体贴,经济上更是独立,随便一个项目就能小赚几百万,对她还很热情。

但都说谈钱伤感情,小源也未能幸免,面对投入资金进行共同投资的要求,我拒绝了对方,他因此认为小源没有和他走下去的心意,后来甚至恶语相加。

很明显,小源成为了这次杀猪盘的目标,但也不要太为\"她\"捏把汗。

因为严格来讲,上述聊天截图真假参半,真的是:确实在与怀有别样目的性的男士在文字聊天,假的是:这位女生并非真实人类,而是人工智能。

这是一位开发者B站up主@图灵的猫 基于开源预训练中文模型\"源1.0\",开发了一个能够无障碍进行微信聊天的人工智能\"小源\",并在与骗子的真实对话场景中进行测试,试着观察AI如何与骗子斗智斗勇。

为了让骗子上钩,@图灵的猫 在多个社交平台注册了账号,然后根据反诈中心发布的受害者画像,为账号定位了单身、多金、高学历乖乖女等身份标签。果不其然私信爆炸。

AI通过大量学习,能更好地掌握对话规则,反套路诈骗犯,破解\"杀猪盘\"诈骗套路,识破诈骗话术,进而加深公众对诈骗套路的认识,增强公众的反诈骗意识,减少网络诈骗受害者。

目前@图灵的猫已将这一AI反诈项目已在Github上开源:

https://github.com/Turing-Project/AntiFraudChatBot

\"杀猪盘\"往往是有套路的,AI在对话中,又是如何见招拆招的呢?

当诈骗份子遇上AI:一场各怀心思的文字交锋

这是一场文字上的交锋,哪怕是AI上场,所谓的\"见招拆招\"需要有丰富的语料作为储备。

本次项目基于的NLP大模型浪潮\"源1.0\"是浪潮人工智能研究院研发成功的大规模中文语言模型,参数量高达2457亿,于2021年9月发布时即超越此前由美国OpenAI组织研发的1750亿参数量的英文语言模型GPT-3,成为全球最大规模的人工智能语言模型。

有了\"源1.0\"作为智能基础,开发者还在对话机制上进行了一些设计,让AI对话起来更加自然,比如:设定每条信息的回复间隔,模拟真实打字速度(total_len / 10 * 2s)。

万事具备,就开始交锋吧。另外,作为一名潜在受害者,小源也并非事先知道哪位找她来聊天的是诈骗犯,\"她\"将和我们一起在沟通中发现蛛丝马迹并进行防御,\"她\"发现蛛丝马迹的过程正是为公众识别诈骗做出的示范。

当然为了避免误伤,开发者设定了一些严格的筛选条件,例如人设背景完美但关键信息模糊、照片确认为网图、从事如私募、证券或投行等高端行业等,满足这些条件的人才会让小源接管对话。

之前就提到\"杀猪盘\"有一套严格的诈骗套路,规范的话术流程,诈骗犯把受害者叫做\"猪\":

第一步,\"找猪\"指私加好友。面对小源,诈骗犯也一上来就通过旁敲侧击来打听女生的现实情况,小源也会根据对方提供的信息做出反应,一些俏皮玩笑语句输出,让对话有来有回。

第二步,\"喂猪\"指盗用他人优质资料包装自己,灌输自己很成功、很优秀等信息,获取受害者的信任。

开始了开始了,他开始装了。没关系,根据他给的信息,小源也会给他舞台,还给对方起了\"富哥\"作为昵称,拉进彼此距离。

第三步,\"养猪\"指恋爱过程,这也是往往受害者放下警惕,交出信任的过程,诈骗犯在这一步都表现得深情款款,试图让对话氛围蜜里调油,并且说一些套路骚话来确认\"恋爱关系\"。

到了这一步,小源已经识别出他是诈骗犯了,那么为了反套路诈骗犯,小源装作上套,也表示喜欢诈骗犯。

\"杀猪盘\"其实就是一种规则化、模式化的对话博弈,诈骗犯本就毫无真心真情,只求在一来一回的对话中让受害者放低心理防御。在开发过程中,传统的无目标导向的\"开放域对话\"或\"词槽式目的域对话\"方案都表现不佳。

与GPT-3不同的是,\"源1.0\"更加擅长的是零样本(Zero-Shot)和小样本(Few-Shot)学习,而非目前更多模型所擅长的微调试学习(finetune)。在中文语言理解评测基准CLUE榜单的零样本学习(zero-shot)和小样本学习(few-shot)均取得过总榜第一的成绩。

从实际应用效果来看也确实如此,在1~ 3个,甚至只有1个合适example的示范下,模型就可以实现开发者希望达到的\"对话策略\",比如反套路、用语料抛梗等等,让AI看起来能够对骗子具备识别能力,本质上这也是一种query->value的查询匹配。

而开发者在本次项目中,example语料主要抽取自B站和贴吧的热门评论,一来因为评论是天然的对话形式,有显式的回复与被回复关系;二来自古评论出人才,一些金句和梗可以把人机对话变得不那么生硬,就像\"富哥V5\"、\"小黑子,露出鸡脚了吧\",以及\"喵\"、\"捏\"都是颇具网感的语句和语气助词。

具体语料经过人工筛选,过滤不当言论,再处理成prompt格式。 以下是Prompt Example的生成样例:

第四步,\"杀猪\"指欺诈过程。这是诈骗犯的终极目标,于他们而讲,能不能成就这一哆嗦了,而对受害者来说,这也是涉及财产有无损失的关键一步。

在这个项目里,诈骗犯在循序渐进、有意无意地总是提到一个利润率很高的项目,试图给对方留下高回报率的印象。

这是一个连环计,这时候就要考验到AI的记忆力了。由于微信聊天是多轮对话,AI有时并不记得自己或对方上一句说过什么。

\"源1.0\"具备记忆能力,开发者同时参考了LSTM的思想,为系统增加了记忆机制,具体机制如下:

聊天记录放入记忆区,在每次回复时计算相似度,超过相似度阈值的历史对话将被AI读取使用;并且设定遗忘窗口M,超过M/2轮次的对话将被pop() 这样,AI就能够实现简单的长短期对话记忆,比如昨天聊过的内容或上一轮对话内容。

带着这样的记忆,当过了两天当诈骗犯再试图和小源聊天时。小源也顺着对方问出了\"在哪里可以买到\"的话:

当然,聊归聊,开发在进行开发时就给小源加上了\"思想钢印\"——凡是涉及投资理财、引导资金投入的都是诈骗。

哪怕是面对诈骗犯的威逼利诱,小源依然不为所动,坚持声称自己没有钱,并提出向诈骗犯借钱。

到了后来,AI直接金蝉脱壳来一波反杀,面对PUA话术和挑衅行为,直接点出对方违法要求和\"她\"去警局自首,反将一军。

AI向善,感性与创新引导下的理性应用

据开发者@图灵的猫介绍,对话中的这位Henry骗子哥,只是主动找上\"小源\"的其中一位聊天对象,还有13位\"嫌疑诈骗分子\",这个数字还是在开发者已经进行了一波筛选之后。

小源完美的待嫁单身女生形象,吸引了无数人,私信爆炸。可以想象,同样条件的人类女生在社交网站上是多么危机四伏,随时都可能成为受害对象。

人类和AI的最大不同在于,多数时候人类的感性是占据上风的,做不到AI那样的绝对理性,所以才会不知不觉间落入圈套。

但正是这样感性的驱动下,AI在我们日常生产生活所发挥的空间才无穷,因为人工智能等先进技术的本质仍是工具,而工具所谓的善恶倾向则取决于人类的出发点。

就如同@图灵的猫 这样的开发者因为身边有遇到过杀猪盘的朋友们,进而义愤填膺基于\"源1.0\"大模型开发出AI反诈\"工具人\"小源,提醒广大女性提高警惕性,注意防范网络上的陌生人。

人类善用AI的智慧定会胜过日益强大的AI技术。

如今,人工智能已经从点到面渗透到更多行业、更多领域的各类场景,创新不断。作为通用的巨量中文AI模型,\"源1.0\"具备优秀的自然语言理解和自然语言生成的能力,可以作为新一代认知智能的引擎,适应广泛的下游AI任务,自开源问世以来,不少开发者和相关机构都基于此进行了诸多创新应用。

\"源1.0\"可以完成各种风格、类型文本的生成,如新闻资讯、金融行研、办公公文、法律文书、广告营销、网络文学、诗词歌赋、食谱菜谱等。

超1000家用户,采用\"源1.0\"提供的数据和API显著提升了金融、互联网、医疗和自动驾驶等行业应用的精度;

源1.0已经与多个行业用户开展深度合作,支持手机智能语音助手、大型互联网翻译平台等应用的AI智能化升级……

除了这些相对\"常规\"的操作,不少开源社区的开发者们通过源1.0的开放开源平台进行了创意实现。

在文娱方面,一群来自上海学生开发者创作的\"AI剧本杀\"就是其中代表,曾在GitHub引发热烈讨论。

Github链接:https://github.com/bigbrother666sh/shezhangbujianle

在心理辅导方面,自香港浸会大学社会工作系副教授 陈智达教授负责的运用AI模拟求助者支援社会服务工作者培训项目。

在上述案例中,AI在不同领域以意想不到的方式发挥着自己的潜力,也帮助着诉求不同的开发者们拓宽创新的边界。这些创新想法或许早就出现在他们富有想象力的脑海中,而将\"灵光乍现\"变成可实现、可落地的应用,很大程度上需归功于外部技术环境的变化,例如,如今以\"源1.0\"为代表的大模型已经成为人工智能算法基础设施,正在普惠千行百业。

事实上,创新往往并非无中生有的顿悟,而是某一领域发展到一定阶段、厚积薄发的涌现,技术是向善的工具,亦是创新萌发的沃土。

关键词: 人工智能 语言模型 见招拆招