如何识别电话里的声音是诈骗分子克隆伪造?
声音克隆技术通过利用AI和算法复制一个人的声音,使其听起来与原始声音几乎一样。这项技术不仅能够应用于电影配音和语音合成,还在医疗、教育和虚拟助手等领域展现了广泛的应用前景。例如帮助失去声音的人重获语音能力,制作有声读物,创建个性化的数字助理和提供自然的文本转语音及语音翻译服务。
声音克隆的三种主要方式:基于声音重播的克隆、基于声音合成的克隆和基于声音模仿的克隆。
1、基于声音的重播
这种方式涉及复制对话者的声音录音,然后利用回放和深度学习算法来模拟和复制说话者的声音。主要有两种类型:远场检测和剪切粘贴检测。远场检测使用免提电话播放受害者的录音,而剪切粘贴则是从文本依赖系统中伪造请求的句子。
2、基于声音的合成
基于语音合成的声音克隆使用软件或硬件系统将文本实时转换为自然语音。这种系统通常由文本分析模型、声学模型和声码器三个模块组成。首先,需要收集清晰且结构良好的原始音频和对应的文本转录。然后,利用这些数据训练文本转语音模型,构建合成音频生成模型。文本分析模块将输入文本转换为语言特征,声学模块根据这些特征提取目标说话人的参数,最后声码器根据这些参数创建人声波形,生成最终的音频文件。
3、基于声音的模仿
基于模仿的声音克隆,也称为语音转换,是将原始语音从一个说话者转换为听起来像另一个说话者的方法。这种技术通过改变语音信号的风格、语调或韵律,试图在不改变语言信息的情况下模仿目标声音。这种技术通常使用生成对抗网络(GAN)的模仿生成,灵活性好且质量高,能够保持输入文本不变的情况下,改变语音的风格、语调或韵律。
声音克隆成为诈骗分子的新手段
声音克隆技术的发展为语音合成、个性化服务等领域带来了革命性的变化。然而,技术的双刃剑特性也使得基于声音克隆的诈骗活动日益增多。声音克隆也被不法分子用于实施诈骗,手法多样,日益猖獗。
社交媒体诈骗。诈骗者利用克隆声音在社交媒体上冒充公众人物或受害者亲友,进行诈骗活动。
社交工具或电话诈骗。通过社交工具发送伪造的语音,或直接拨打电话,诈骗者诱使受害者透露敏感信息或直接转账。
远程会议攻击。在远程会议中,诈骗者通过克隆参会者的声音进行干扰或误导,窃取商业机密或个人数据。
伪造新闻资讯。诈骗者在伪造新闻资讯中使用克隆声音,以增加信息的可信度,诱导受害者上当。
公众如何防范声音克隆欺诈
利用伪造的声音,攻击者利用社交媒体、电子邮件、远程会议、网络招聘、新闻资讯等一系列媒介,对目标人群进行各类攻击。要防范打击声音克隆欺诈,一方面需要有效识别检测出伪造的声音,另一方面防范声音克隆的利用和扩散。因此,个人减少敏感信息分享、做好多重防范。而被攻击者利用的媒介平台,需要加强声音克隆的识别,通过对使用者的行为和身份分析验证,降低攻击者的欺诈行为。同时,AI工具进行声音防伪,为声音交流提供安全保障。
个体防范策略
1、减少敏感信息分享。避免在社交媒体上分享个人照片、声音和视频等敏感信息,减少公开个人账户、家庭、工作等私密信息,以降低身份被伪造的风险。一旦发现“深度伪造”的虚假内容,应立即向社交媒体管理员和执法部门报告,采取措施删除并追踪来源。
2、声音被克隆者的主动防范。设定一个只有亲朋好友和同事知道的“安全词”或“挑战问题”,用于在接到可疑电话或信息时验证对方身份。如果对方无法提供正确的“安全词”或回避问题,应立即挂断并使用已知的安全联系方式进行确认。
3.接受者的警觉性。当接到可疑的视频或电话时,保持冷静,可以借口信号不好挂断,并立即通过其他方式回拨确认,避免直接回应可能的诈骗内容。
平台与技术的防范措施
1、加强声音克隆识别技术。社交媒体和通讯平台需加强声音克隆的识别能力,利用先进的AI技术对声音进行真伪鉴定,及时发现并拦截可疑内容。开发和应用AI工具进行声音防伪,如通过声纹识别技术确认声音的真实性,为声音交流提供安全保障。
2、基于用户行为和身份识别攻击者。平台应通过分析用户的行为模式和身份信息,建立安全预警机制,对于异常登录、高频发送信息等可疑行为进行监控和限制。同时,分析鼠标移动模式、打字风格等用户行为模式并识别异常情况,标记偏离正常使用的可疑活动。并通过额外的身份和设备验证,以及大模型可以快速筛选海量数据,并识别出通常无法被人类检测到的细微不一致之处,发现攻击者的异常操作。
顶象设备指纹能对每个设备生成统一且唯一设备指纹。并搭建基于设备、环境、行为的多维度识别策略模型,识别出虚拟机、代理服务器、模拟器等被恶意操控等风险设备,分析设备是否存在多账号登录、是否频繁更换IP地址、频是否繁更换设备属性等出现异常或不符合用户习惯的行为,追踪和识别欺诈者的活动,帮助企业实现全场景各渠道下同一ID的运营,助力跨渠道的风险识别与管控。
顶象无感验证基于AIGC技术,能够防止AI的暴力破解、自动化攻击和钓鱼攻击等威胁,有效防止未经授权的访问、账户被盗用和恶意操作,从而保护系统的稳定性。它集成了13种验证方式和多种防控策略,汇集了4380条风险策略、112类风险情报、覆盖24个行业和118种风险类型。其防控精准度高达99.9%,并能快速实现从风险到情报的转化。同时支持安全用户无感通过,实时对抗处置能力也缩减至60s内,进一步提高了数字登录服务体验的便捷性和效率。
顶象Dinsight实时风控引擎帮助企业进行风险评估、反欺诈分析和实时监控,提高风控的效率和准确性。Dinsight的日常风控策略的平均处理速度在100毫秒以内,支持多方数据的配置化接入与沉淀,能够基于成熟指标、策略、模型的经验储备,以及深度学习技术,实现风控自我性能监控与自迭代的机制。与Dinsight搭配的Xintell智能模型平台,能够对已知风险进行安全策略自动优化,基于风控日志和数据挖掘潜在风险,一键配置不同场景支持风控策略。其基于关联网络和深度学习技术,将复杂的数据处理、挖掘、机器学习过程标准化,提供从数据处理、特征衍生、模型构建到最终模型上线的一站式建模服务。
AI工具的声音防伪应用
AI语音融合工具也可以内置不可抹除的水印。例如,微小的扰动、杂乱无章的噪音、固定的某个背景节奏等,使听到的人能够辨别出来。此外,AI语音融合工具录制音频的硬件增加内置传感器,用于检测和测量人体在说话时发出的生物信号,例如心跳、肺运动、声带振动以及嘴唇、下巴和舌头的运动,录制的声音能够附加到音频上,并为听众提供可验证的信息,以分别语音是自然录制还是AI伪造。