文|阿尔法工场
最近,关于AI换脸诈骗的新闻火了。4月20日,福州市某科技公司法人代表郭先生,突然接到好友的微信视频,好友告诉郭先生,自己的朋友在外地投标,需要430万元保证金。
由于在视频中看到了好友的样貌,听到了声音,于是郭先生就放心地将钱转了过去。
可后来他却发现,自己竟然遇上了“高端”骗局,对方通过智能AI换脸技术,佯装成好友对他实施了诈骗……
这类消息,着实引起人们心中一阵恐慌。
因为身为凡胎肉体的你我,仅凭肉眼是很难看出这些伪造视频的破绽的。
那岂不是意味着,遇到这样的“AI骗术”,普通人受骗的几率近乎100%了?
且慢,话说魔高一尺,道高一丈,既然AI换脸都发展到这地步了,那与之针锋相对的“AI鉴伪”技术,又发展得怎样了?
01 造假VS鉴伪
谈到这个问题,身为“防守方”的AI鉴伪技术团队,似乎有一种难以言说的艰辛。
因为在这场造假与鉴伪的“猫鼠游戏”中,AI换脸这类造假技术的成本,相比AI鉴伪技术的研发成本要低得多。
这就导致了许多研发AI鉴伪技术的企业、机构,从决定和造假者们死磕的那天起,就注定了要打一场十分艰难的战争。
就目前来看,AI换脸技术的成本主要包括以下几个方面:
数据采集和处理的成本:AI换脸技术需要大量的人脸图像或视频作为训练数据,但这些数据大部分都可以从互联网上免费获取,也可以通过付费购买或定制。
甚至有时候,定制一个AI换脸视频几乎是“九块九包邮”。
算法开发和优化的成本:AI换脸技术主要基于深度学习和计算机视觉的算法,虽然这个过程需要一定的专业知识和技能,但是并不是特别高。
一方面,有很多开源平台,如Faceswap、DeepFaceLab等,本身就提供了现成的算法代码,用户只需要下载使用即可,无需自行开发或改进。另一方面,即使用户需要自行开发或改进算法,也可以借鉴已有的算法框架和思路,无需从零开始。
硬件设备和运行环境的成本:一般来说,一台配置稍好的个人电脑就可以满足需求,不需要特别昂贵的专业设备。举例来说,一种比较流行的AI换脸软件DeepFaceLab,仅需要一张NVIDIA RTX系列或GTX系列的独立显卡,且显存为6GB就可运行。
这样的一台个人电脑,其成本大约在数千元左右。
与AI鉴伪技术所需的各种成本相比,这些伪造技术的成本简直低得如同儿戏。
具体来说,AI鉴伪的成本大致包括了以下部分:
数据标注和筛选的成本:AI鉴伪技术需要大量的图像或视频作为训练数据,这些数据需要经过人工标注和筛选。
然而,这一过程的难度可能超出了很多人的想象。
举个例子,如果要对一小时的视频进行人脸识别的标注,需要先将视频分割成帧,然后对每一帧中的人脸进行定位、标识、分类等操作,还要考虑人脸的遮挡、模糊、光照等影响因素,以及人脸的姿态、表情、年龄等属性信息。这样一来,一小时的视频可能需要几十个小时甚至几百个小时才能完成标注。
其次,数据标注不仅仅是简单地给图像或视频打上标签,不同的任务和场景需要不同的标注规则和方法,标注人员需要掌握相关的领域知识和技术能力,才能保证数据的质量和有效性。
算法设计和测试的成本:AI鉴伪技术主要基于深度学习和计算机视觉的算法,这些算法需要根据不同类型和质量的伪造内容进行设计和测试,以提高检测的覆盖率和鲁棒性。
算法设计和测试是一个复杂且持续更新的过程,需要专业的团队和资源。算法设计和测试的成本取决于算法的复杂度、性能、效率等因素,但一般来说,每个算法项目的研发成本至少在几十万到几百万美元之间。
硬件设备和系统的成本:但凡了解过大模型训练成本的朋友,都知道这一过程对硬件的高昂要求,即使今天的机器视觉技术经过了层层优化,但一个完整的机器视觉系统的价格至少在几万到十几万元之间,包括硬件成本、软件成本、计算成本以及存储成本。
综上所述,由于AI造假技术天然所具备的成本优势,使得目前这场造假VS鉴伪的战争,呈现出了一种“正规军围剿游击队”的态势。
在这样的较量中,受害最多的“灾区”,往往是高成本AI鉴伪技术难以覆盖的地方。
02 鉴伪技术的软肋
回顾这些年见诸于各大媒体的AI诈骗事件,我们不难发现,这类事件中最常见的受害者,往往是作为个体的普通民众,而非企业、政府或金融机构。
例如,5月22日,安徽安庆的何先生接到熟人视频电话,让他帮忙转一笔账。“因为打了视频电话,又是熟人,我就没多想,就转账了”。事发时,何先生放松了警惕,向对方转了245万元。
同样地,2023年3月,陕西的一名女子被骗子利用AI换脸技术冒充其女儿,通过视频通话诈骗了不少钱。骗子先是通过微信添加了女子为好友,并自称是其女儿的同学。
之后,骗子再通过AI换脸技术,将自己的面部替换成女子女儿的面部,并以女儿出车祸为由,又骗走了一笔钱。
其实,出现这类现象的原因不难理解,由于目前AI鉴伪技术的研发成本较为高昂,因此大部分拥有此类技术的公司,都只将这些技术向企业、政府或金融类客户开放,而无法覆盖到普通个人用户。
以百度为例,虽然其在自身的AI开放平台上,推出了人脸深度鉴伪接口,用于准确鉴别Al换脸技术生成的人脸图像,但是这一接口却存在着一定的使用门槛。
使用者需要在百度AI开放平台注册账号,并申请使用该接口。其次,该接口是收费的,根据调用次数和服务质量的不同,有不同的收费标准。
而同样地,百度旗下的产品度小满,虽然也推出了自身的防深伪技术,但这一技术主要覆盖的群体,是金融领域的客户,其涉及的场景主要是借贷、投资、理财等业务。
虽然各大企业,基于微表情分析、图卷积(GCN)技术以及基于重建的自监督预训练方法,对目前的AI鉴伪技术进行了大幅升级,但在大模型愈发普及的当下,AI诈骗的技术,也开始呈现出一种更加低廉化、普遍化的趋势。
除非这些严密而高效的鉴伪技术,能够普及到每个个人用户的微信上,并且调用起来跟小程序一样毫无门槛和难度,否则,那类通过“微信好友”的方式进行诈骗的AI技术,就永远有机可乘。
事情发展到这一步,AI技术与伦理、法律之间的纠葛,似乎到了某个比较关键的转折点。
倘若这些低成本,针对个人的AI诈骗事件屡禁不止,甚至借着这波大模型的“东风”,进一步席卷全国,那么就会有更多不法分子肆无忌惮,如法炮制,进而引起民众的进一步恐慌。
而在AI鉴伪技术得不到下沉的情况下,监管部门为了防范此类事件的频发,只能进一步收紧对AI技术使用的审核机制,而严格的审核机制,则会间接降低AI生态的活跃度和市场的繁荣度。
很多原本能制造奇迹的创意或项目,也许还没开始,就被卡死在了繁杂的审核阶段。
但除了这类悲观的前景外,现实还存在着另一种可能,那就是更多企业和机构,在这类AI诈骗的压力下,开始寻求突破和创新,形成一种创新驱动的机制。
03 魔高一丈,道高一尺
尽管AI鉴伪技术,面临着成本高企,难以下沉的局面,但破局之道其实并非不存在,因为一种技术的升级,所带来的影响可能不是垂直和单一的,而往往有可能是多维和广阔的。
例如AI鉴伪所涉及的计算机视觉、图像识别等底层技术,就有着十分广阔的应用范围,和巨大的发展空间。
例如,在智能驾驶方面,目前的计算机视觉、图像识别等技术还不能完全替代人类的驾驶,还需要结合其他传感器、雷达、地图等信息,提高感知的准确性和鲁棒性,同时还需要解决道路复杂多变的情况,提高决策的智能性和安全性。
在智慧农业领域,通过提高图像识别的覆盖率和及时性,可以实现对农作物、土壤、病虫害等的更全面和更实时的监测和诊断,从而提高农业生产的质量和效率。
类似受益的领域,还有交通、医疗、文娱等等。
从更长远的角度来看,这一下沉过程造成的技术外溢,将会使得更多的经济主体能够获取和使用先进技术,从而促进创新活动的多元化和活跃化。
同时,技术门槛的降低,也必然会导致生产成本和价格的下降,使得企业能够进一步扩大市场规模,促进了经济增长。
从这样的角度来看,目前的AI诈骗事件,只是大模型在走向下沉过程中,所必然要遭受的一种劫难或磨砺。
唯有经过了这样的考验,AI所带来的各种技术,才能真正地在法律、伦理上,被社会大众广泛地接纳。