专利名称:身份验证系统及方法
技术领域:
本发明涉及安全验证领域,更具体地说,涉及一种结合人体生理特性进行 身份验证的系统及方法。
背景技术:
随着信息时代的到来,数字化越来越多地影响了人们的日常生活,例如使 用互联网浏览或收发信息、通过互联网进行网上购物、通过网上银行实现货币 支付等。为了保证数字化生活中个人信息的安全,必须准确鉴别数字化生活中 的个人身份。
目前最常用的个人身份验证方式为密码。在该身份验证方式中,使用者必 须牢记密码,例如使用者的银行帐号密码、信用卡密码、网络登录帐号密码等。 由于不同应用中对密码的要求不同,使用者必须熟记多个不同的密码,极为不 便。并且, 一旦密码被盗,将给用户造成极大损失。
生物特征辨识技术的发展,使得身份验证方式获得了极大的进步,例如指 纹识别、人脸识别等。其中声纹识别是这些技术中较为常用的方式,即通过将 输入的声音信息与存储的声纹特征进行比对,从而确认使用者身份的验证方 式。该声纹验证方式利用说话人之间发音器官上的个性差异、发音声道之间的 个性差异、发音习惯间的个性差异等不同级别上的差异等不同级别上的差异, 结合计算机数字信号处理技术实现使用者身份的识别。
由于采用声纹识别进行身份验证时,使用者不需记忆密码,且操作简单, 外设增加也不多(仅需增加一个声音输入设备),因此发展较快。然而,声纹 识别却存在一个致命的弱点,即无法区分输入的语音是录音还是现场输入。从 而,如果使用者的声音被录音,他人就可使用该录音轻易进行相关操作,带来 安全隐患。
发明内容
本发明要解决的技术问题在于,针对上述声纹识别无法辨识录音输入声音 的问题,提供一种结合人体生理特性进行身份验证的系统及方法。
本发明解决其技术问题所采用的技术方案是构造一种身份验证系统,包
括
声纹特征库,用于存储一个或多个声纹特征,每一声纹特征对应一个帐号; 收发单元,用于发送一个或多个字符到终端,并从所述终端接收输入的帐 号和语音信号;
语义验证单元,用于在所述收发单元接收的语音信号与所述发送到终端的 字符的读音不匹配时确认身份验证失败;
声纹验证单元,用于在所述收发单元接收的语音信号与所述声纹特征库中 所述帐号对应的声纹特征不匹配时确认身份验证失败。
在本发明所述的身份验证系统中,还包括用于存储一组或多组语音模型的 语音模型库,其中每一组语音模型对应一个帐号;所述收发单元发送的一个或
多个字符为从创建语音模型的字符中抽取的字符;所述语义验证单元根据所述 帐号对应的语音模型判断所述语音信号是否匹配。 在本发明所述的身份验证系统中,还包括
字符图片库,用于存储图片,所述图片上的图案为一个或多个字符; 图片选择单元,用于从所述字符图片库中选择图片; 所述收发单元发送到终端显示的字符为图片选择单元选择的图片。 在本发明所述的身份验证系统中,所述发送单元以语音方式发送一个或多 个字符到终端。
在本发明所述的身份验证系统中,还包括语音训练模块,用于根据输入的 一个或多个字符的读音生成语音模型。
本发明还提供一种身份验证方法,包括以下步骤
(a) 发送一个或多个字符到终端,并接收在终端输入的帐号及语音信号;
(b) 判断所述语音信号是否与所述帐号对应的声纹特征匹配,并判断所述语音信号是否与所述字符的读音匹配;
(c)在所述语音信号与所述帐号对应的声纹特征匹配且与所述字符的读 音匹配时,确认身份验证成功。
在本发明所述的身份验证方法中,还包括建立声纹特征库的步骤,所述声 纹特征库中包括帐号和对应的声纹特征,所述步骤(b)进一步包括检索声 纹特征库获取与所述帐号对应的声纹特征。
在本发明所述的身份验证方法中,还包括创建语音模型库的步骤,所述语 音模型库中包括帐号和对应的语音模型,所述步骤(b)进一步包括检索语
音模型库获取与所述帐号对应的语音模型,并使用所述语音模型判断语音信号 是否与所述字符的读音匹配。
在本发明所述的身份验证方法中,所述字符为图片上的图案,所述步骤(a) 中发送一个或多个字符到终端显示的步骤包括随机抽取图片发送到终端显 示,所述图片上的图案为一个或多个字符。
在本发明所述的身份验证方法中,所述步骤(a)中以语音方式发送字符 到终端播放。
本发明的身份验证系统及方法,通过将声纹验证结合语义验证,实现了安 全的身份验证,且方便使用者操作。
下面将结合附图及实施例对本发明作进一步说明,附图中
图1是本发明身份验证的系统实施例的示意图2是本发明身份验证的方法实施例的流程示意图。
具体实施例方式
本发明提供一种基于声纹识别的身份验证系统及方法,其将使用者在终端 输入的语音信息进行声纹验证和语义验证,从而确认使用者的身份。通过本发 明,使用者无需再记忆任何密码或问题答案,不仅操作方便,而且可有效避免 现有声纹验证系统中使用录音破解的问题。
6如图1所示,是本发明身份验证的系统第一实施例的示意图。该系统包括
收发单元12、语义验证单元14、声纹验证单元15以及声纹特征库16。
声纹特征库16用于存储一个或多个声纹特征,其中每一声纹特征对应一 个使用者。在存储时,每一声纹特征对应一个使用者的帐号。该声纹特征可使 用特定的专业设备根据采集的使用者的声音生成。其在不同的应用中,声纹特 征的创建可采用不同的方式。例如在电子银行的身份验证的应用中,可在使用 者在银行开户时采集使用者的声音信号并创建使用者的声纹特征;在普通登录 的身份验证的应用中,可在注册时使用终端上传的声音信息创建声纹特征。
收发单元12用于将一个或多个字符发送到终端(例如电话终端、互联网 终端、增加语音输入设备的ATM机等),并从该终端接收输入的帐号和语音信 号。该收发单元12在具体实现时,可采用加密方式收发数据。上述收发单元 12接收的语音信号为使用者根据显示于终端的字符(可视形式)或播放的音 频输入终端的字符读音。在实际应用中,收发单元12可在接收到终端的身份 验证请求后发送字符到终端。
收发单元12在向终端发送一个或多个字符时,可以图文方式发送,或者 以音频方式发送,从而终端以图文显示或音频播放方式展现上述字符给使用 者。在终端展示上述字符后,使用者可通过语音输入设备以朗读上述字符的方 式输入语音信号,并通过键盘、语音或其它方式(例如在ATM上刷银行卡等) 输入帐号。收发单元12通过网络接收帐号以及上述通过语音输入设备输入的 语音信号。
语义验证单元14用于在收发单元12接收的语音信号与所述收发单元发送 的字符的读音不匹配时确认身份验证失败。
声纹验证单元15用于在收发单元12接收的语音信号与声纹特征库16中 上述帐号对应的声纹特征不匹配时确认身份验证失败。
通过上述验证系统,使用者无需记忆任何密码,而只需读取收发单元12 发送的字符即可进行身份验证。并且上述系统可以避免普通声纹验证中使用录 音破解的问题。
为了进一步确保语义验证单元14的准确率,提高系统的安全性,可在上述系统中增加语音模型库(图中未示出)。该语音模型库可包括一组或多组语 音模型,每一组语音模型对应一个使用者的帐号。上述语音模型可通过语音训 练模块创建,该语音训练模块在使用者进行注册时,根据使用者读取的特定字
符的语音生成该使用者的语音模型。相应地,在收发单元12发送字符到终端 时,从创建语音模型的字符中选择一个或多个字符发送;语义验证单元14在 对来自终端的语音信号进行语义验证时,从语音模型库中提取对应帐户的语音 模型进行比对。由于语义验证单元14在语义验证时使用了同一使用者的相同 字符的读音,其辨识的精度大大提高。
此外,为确保发送字符的安全性,可在上述系统中增加字符图片库和字符 选择单元(图中未示出)。其中字符图片库用于存储图片,每一图片中的图案 组成一个或多个字符,例如汉字等。在具体实现时, 一个图片上的图案可仅包 括一个字符(汉字),也可包括多个字符(汉字),各个图片上的字符互相独立。 图片选择单元用于从字符图片库中选择图片。在选择时,图片选择单元随机选 择字符图片库中的一个或多个图片(可根据需要设定),而发送单元12则将图 片选择单元选择的图片发送到终端显示。特别地,字符图片库中图片上的图案 与建立语音模型库的字符对应。
如图2所示,是本发明一种身份验证方法实施例的流程示意图,该方法包 括以下步骤
步骤S21:服务器端发送一个或多个字符到终端。从而使用者可通过语音 输入设备以朗读上述字符的方式输入语音信号,并通过键盘、语音或其它方式 (例如在ATM上刷银行卡等)输入帐号。
步骤S22:服务器端接收在终端输入的帐号及语音信号。若终端以语音方 式输入帐号,则服务器端在接收到语音帐号后需进行语音识别。在具体应用中, 帐号和语音信号可同时发送到服务器端,也可间隔发送到服务器端。此外,在 进行帐号和语音信号的收发时,可对传输的信号进行加密。
步骤S23:判断上述接收的语音信号是否与上述接收的帐号对应的声纹特 征匹配,在该语音信号与帐号对应的声纹特征不匹配时执行步骤S25,否则执 行步骤S24。
8步骤S24:服务器端判断语音信号是否与步骤S21中发送的字符的读音匹 配,在语音信号与字符的读音不匹配时执行步骤S25,否则执行步骤S26。
步骤S25:确认身份验证失败。
步骤S26:确认身份验证成功。
在上述方法中,步骤S23和步骤S24的顺序可调换。
在上述身份验证方法中,还可包括建立声纹特征库的步骤,该声纹特征库 中包括一个或多个帐号以及对应的声纹特征,上述的步骤S23进一步包括检 索声纹特征库获取与帐号对应的声纹特征。
在上述身份验证方法中,还可包括创建语音模型库的步骤,该语音模型库 中包括一个或多个帐号和对应的语音模型,上述的步骤S24进一步包括检索 语音模型库获取与所述帐号对应的语音模型,并使用语音模型判断语音信号是
否与字符的读音匹配。
在上述身份验证方法中,发送到终端的字符为图片上的图案,步骤S21 中发送一个或多个字符到终端显示的步骤包括随机抽取图片发送到终端显
示,该图片上的图案为一个或多个字符。此时,本发明的方法可应用于互联网
应用系统或ATM设备的身份验证。
此外,步骤S21中还可以以语音方式发送字符到终端播放。此时,本发明 的方法可应用于电话银行中的身份验证。
以上所述,仅为本发明较佳的具体实施方式
,但本发明的保护范围并不局 限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易 想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护 范围应该以权利要求的保护范围为准。
9
权利要求
1、一种身份验证系统,其特征在于,包括声纹特征库,用于存储一个或多个声纹特征,每一声纹特征对应一个帐号;收发单元,用于发送一个或多个字符到终端,并从所述终端接收输入的帐号和语音信号;语义验证单元,用于在所述收发单元接收的语音信号与所述发送到终端的字符的读音不匹配时确认身份验证失败;声纹验证单元,用于在所述收发单元接收的语音信号与所述声纹特征库中所述帐号对应的声纹特征不匹配时确认身份验证失败。
2、 根据权利要求1所述的身份验证系统,其特征在于,还包括用于存储 一组或多组语音模型的语音模型库,其中每一组语音模型对应一个帐号;所述 收发单元发送的一个或多个字符为从创建语音模型的字符中抽取的字符;所述 语义验证单元根据所述帐号对应的语音模型判断所述语音信号是否匹配。
3、 根据权利要求1或2所述的身份验证系统,其特征在于,还包括 字符图片库,用于存储图片,所述图片上的图案为一个或多个字符; 图片选择单元,用于从所述字符图片库中选择图片; 所述收发单元发送到终端显示的字符为图片选择单元选择的图片。
4、 根据权利要求1或2所述的身份验证系统,其特征在于,所述发送单 元以语音方式发送一个或多个字符到终端。
5、 根据权利要求2所述的身份验证系统,其特征在于,还包括语音训练 模块,用于根据输入的一个或多个字符的读音生成语音模型。
6、 一种身份验证方法,其特征在于,包括以下步骤(a) 发送一个或多个字符到终端,并接收在终端输入的帐号及语音信号;(b) 判断所述语音信号是否与所述帐号对应的声纹特征匹配,并判断所 述语音信号是否与所述字符的读音匹配;(c) 在所述语音信号与所述帐号对应的声纹特征匹配且与所述字符的读 音匹配时,确认身份验证成功。
7、 根据权利要求6所述的身份验证方法,其特征在于,还包括建立声纹 特征库的步骤,所述声纹特征库中包括帐号和对应的声纹特征,所述步骤(b)进一步包括检索声纹特征库获取与所述帐号对应的声纹特征。
8、 根据权利要求6所述的身份验证方法,其特征在于,还包括创建语音 模型库的步骤,所述语音模型库中包括帐号和对应的语音模型,所述步骤(b)进一步包括检索语音模型库获取与所述帐号对应的语音模型,并使用所述语音模型判断语音信号是否与所述字符的读音匹配。
9、 根据权利要求6所述的身份验证方法,其特征在于,所述字符为图片 上的图案,所述步骤(a)中发送一个或多个字符到终端显示的步骤包括随 机抽取图片发送到终端显示,所述图片上的图案为一个或多个字符。
10、 根据权利要求6所述的身份验证方法,其特征在于,所述步骤(a) 中以语音方式发送字符到终端播放。
全文摘要
本发明涉及一种身份验证系统,包括声纹特征库,用于存储一个或多个声纹特征,每一声纹特征对应一个帐号;收发单元,用于发送一个或多个字符到终端,并从所述终端接收输入的帐号和语音信号;语义验证单元,用于在所述收发单元接收的语音信号与所述发送到终端的字符的读音不匹配时确认身份验证失败;声纹验证单元,用于在所述收发单元接收的语音信号与所述声纹特征库中所述帐号对应的声纹特征不匹配时确认身份验证失败。本发明还提供一种对应的方法。本发明通过将声纹验证结合语义验证,实现了安全的身份验证,且方便使用者操作。
文档编号G10L17/00GK101685635SQ200810216338
公开日2010年3月31日 申请日期2008年9月23日 优先权日2008年9月23日
发明者吕共欣, 程利剑 申请人:吕共欣