<progress id="rrzp7"></progress>
        <big id="rrzp7"><meter id="rrzp7"></meter></big>
          <progress id="rrzp7"><menuitem id="rrzp7"></menuitem></progress>

            <big id="rrzp7"><menuitem id="rrzp7"></menuitem></big>

            <progress id="rrzp7"></progress>

              • / 17
              • 下載費用:20 金幣  

              聲紋密碼認證方法及系統.pdf

              摘要
              申請專利號:

              CN201410005651.X

              申請日:

              2014.01.06

              公開號:

              CN104765996A

              公開日:

              2015.07.08

              當前法律狀態:

              實審

              有效性:

              審中

              法律詳情: 著錄事項變更IPC(主分類):G06F 21/32變更事項:發明人變更前:殷兵 魏思 胡國平 胡郁變更后:殷兵 魏思 柳林 劉俊華 張程風 王建社 劉海波 胡國平 胡郁 金鑫|||實質審查的生效IPC(主分類):G06F 21/32申請日:20140106|||公開
              IPC分類號: G06F21/32(2013.01)I; G10L17/04(2013.01)I; G10L17/02(2013.01)I 主分類號: G06F21/32
              申請人: 訊飛智元信息科技有限公司
              發明人: 殷兵; 魏思; 胡國平; 胡郁
              地址: 230088安徽省合肥市高新開發區望江西路666號訊飛大廈8層
              優先權:
              專利代理機構: 北京維澳專利代理有限公司11252 代理人: 王立民; 吉海蓮
              PDF完整版下載: PDF下載
              法律狀態
              申請(專利)號:

              CN201410005651.X

              授權公告號:

              ||||||

              法律狀態公告日:

              2017.06.13|||2015.08.05|||2015.07.08

              法律狀態類型:

              著錄事項變更|||實質審查的生效|||公開

              摘要

              本發明公開了一種聲紋密碼認證方法及系統,屬于密碼認證技術領域。該方法包括:接收用戶輸入的語音信號;對所述語音信號進行語音識別,獲得密碼文本;確定是否存在所述密碼文本對應的背景模型;如果是,則獲取所述背景模型;如果否,則根據所述密碼文本對預先訓練得到的發音單元模型進行擴展,獲得所述密碼文本對應的背景模型;利用所述語音信號中的聲紋特征序列、所述背景模型和所述用戶的聲紋密碼模型對所述用戶進行認證。利用該方法及系統,可以滿足用戶自定義密碼及頻繁更改密碼的需求。

              權利要求書

              1.  一種聲紋密碼認證方法,其特征在于,包括:
              接收用戶輸入的語音信號;
              對所述語音信號進行語音識別,獲得密碼文本;
              確定是否存在所述密碼文本對應的背景模型;
              如果是,則獲取所述背景模型;如果否,則根據所述密碼文本對預先訓練得到的發音單元模型進行擴展,獲得所述密碼文本對應的背景模型;
              利用所述語音信號中的聲紋特征序列、所述背景模型和所述用戶的聲紋密碼模型對所述用戶進行認證。

              2.
                根據權利要求1所述的方法,其特征在于,按照以下方式預先訓練得到發音單元模型:
              獲取訓練語音數據;
              根據所述訓練語音數據確定發音單元;
              確定所述發音單元的聲學模型的拓撲結構;
              對所述聲學模型進行參數訓練,得到發音單元模型。

              3.
                根據權利要求2所述的方法,其特征在于,所述聲學模型為GMM模型;
              所述根據所述密碼文本對預先訓練得到的發音單元模型進行擴展,獲得所述密碼文本對應的背景模型包括:
              獲取所述密碼文本中各發音單元對應的GMM模型,得到GMM模型集合;
              對所述GMM模型集合中的模型單元,采用等權重拼接,得到新的組合GMM模型;
              對所述組合GMM模型的高斯權重進行更新,使得所述組合GMM模型的高斯權重之和為1,獲得所述密碼文本對應的背景模型。

              4.
                根據權利要求2所述的方法,其特征在于,所述聲學模型為GMM模型;
              所述根據所述密碼文本對預先訓練得到的發音單元模型進行擴展,獲得所述密碼文本對應的背景模型包括:
              獲取所述密碼文本中各發音單元對應的GMM模型,得到GMM模型序列;
              對所述GMM模型序列中的至少兩個模型單元依次拼接后,采用預設的自跳轉概率和外跳轉概率進行跳轉轉移,獲得所述密碼文本對應的背景模型,其中,所述自跳轉概率和外跳轉概率之和為1。

              5.
                根據權利要求2所述的方法,其特征在于,所述聲學模型為HMM模型;
              所述根據所述密碼文本對預先訓練得到的發音單元模型進行擴展,獲得所述密碼文本對應的背景模型包括:
              獲取所述密碼文本中各發音單元對應的HMM模型序列;
              對所述HMM模型序列中的模型單元依次拼接后,獲得所述密碼文本對應的背景模型。

              6.
                根據權利要求1所述的方法,其特征在于,所述利用所述語音信號中的聲紋特征序列、所述背景模型和所述用戶的聲紋密碼模型對所述用戶進行認證包括:
              分別計算所述聲紋特征序列相對于所述聲紋密碼模型的第一似然度,以及所述聲紋特征序列相對于所述背景模型的第二似然度;
              根據所述第一似然度與所述第二似然度的比值以及預設閾值,確定用戶是否為合法用戶。

              7.
                根據權利要求1至6任一項所述的方法,其特征在于,所述方法還包括:
              在對所述語音信號進行語音識別之前或者在獲得所述密碼文本對應的背景模型之后,提取所述語音信號中的聲紋特征序列。

              8.
                根據權利要求1至6任一項所述的方法,其特征在于,所述方法還包括:
              在對所述語音信號進行語音識別之前或者在獲得所述密碼文本對應的背景模型之后,獲取所述用戶的聲紋密碼模型。

              9.
                根據權利要求8所述的方法,其特征在于,所述方法還包括:
              在獲取所述用戶的聲紋密碼模型之前,判斷當前是否存在用戶的聲紋密碼模型;
              如果不存在,則根據用戶的注冊語音信號及所述背景模型構建用戶的聲紋密碼模型。

              10.
                一種聲紋密碼認證系統,其特征在于,包括:
              接收模塊,用于接收用戶輸入的語音信號;
              識別模塊,用于對所述語音信號進行語音識別,獲得密碼文本;
              確定模塊,用于確定是否存在所述密碼文本對應的背景模型;
              背景模型獲取模塊,用于在所述確定模塊確定存在所述密碼文本對應的背景模型后,獲取所述背景模型,在所述確定模塊確定不存在所述密碼文本對應的背景模型后,根據所述密碼文本對預先訓練得到的發音單元模型進行擴展,獲得所述密碼文本對應的背景模型;
              認證模塊,用于利用所述語音信號中的聲紋特征序列、所述背景模型和所述用戶的聲紋密碼模型對所述用戶進行認證。

              11.
                根據權利要求10所述的系統,其特征在于,所述系統還包括:訓練模塊,用于預先訓練得到發音單元模型;所述訓練模塊包括:
              語音數據獲取單元,用于獲取訓練語音數據;
              第一確定單元,用于根據所述訓練語音數據確定發音單元;
              第二確定單元,用于確定所述發音單元的聲學模型的拓撲結構;
              參數訓練單元,用于對所述聲學模型進行參數訓練,得到發音單元模型。

              12.
                根據權利要求11所述的系統,其特征在于,所述聲學模型為GMM模型,所述背景模型獲取模塊包括:
              GMM模型獲取單元,用于獲取所述密碼文本中各發音單元對應的GMM模型,得到GMM模型集合;
              第一拼接單元,用于對所述GMM模型集合中的模型單元,采用等權重拼接,得到新的組合GMM模型;
              權重更新單元,用于對所述組合GMM模型的高斯權重進行更新,使得所述組合GMM模型的高斯權重之和為1,獲得所述密碼文本對應的背景模型。

              13.
                根據權利要求11所述的系統,其特征在于,所述聲學模型為GMM模型,所述背景模型獲取模塊包括:
              GMM模型獲取單元,用于獲取所述密碼文本中各發音單元對應的GMM 模型,得到GMM模型序列;
              第二拼接單元,用于對所述GMM模型序列中的至少兩個模型單元依次拼接后,采用預設的自跳轉概率和外跳轉概率進行跳轉轉移,獲得所述密碼文本對應的背景模型,其中,所述自跳轉概率和外跳轉概率之和為1。

              14.
                根據權利要求11所述的系統,其特征在于,所述聲學模型為HMM模型,所述背景模型獲取模塊包括:
              HMM模型序列獲取單元,用于獲取所述密碼文本中各發音單元對應的HMM模型序列;
              第三拼接單元,用于對所述HMM模型序列中的模型單元依次拼接后,獲得所述密碼文本對應的背景模型。

              15.
                根據權利要求10所述的系統,其特征在于,所述認證模塊包括:
              計算單元,用于分別計算所述聲紋特征序列相對于所述聲紋密碼模型的第一似然度,以及所述聲紋特征序列相對于所述背景模型的第二似然度;
              確定單元,用于根據所述第一似然度與所述第二似然度的比值以及預設閾值,確定用戶是否為合法用戶。

              16.
                根據權利要求10至15任一項所述的系統,其特征在于,所述系統還包括:
              聲紋特征序列提取模塊,用于在對所述語音信號進行語音識別之前或者在獲得所述密碼文本對應的背景模型之后,提取所述語音信號中的聲紋特征序列。

              17.
                根據權利要求10至15任一項所述的系統,其特征在于,所述系統還包括:
              聲紋密碼模型獲取模塊,用于在對所述語音信號進行語音識別之前或者在獲得所述密碼文本對應的背景模型之后,獲取所述用戶的聲紋密碼模型。

              18.
                根據權利要求17所述的系統,其特征在于,所述系統還包括:
              判斷模塊,用于在獲取所述用戶的聲紋密碼模型之前,判斷當前是否存在用戶的聲紋密碼模型;
              聲紋密碼模型構建模塊,用于在所述判斷模塊判斷當前不存在聲紋密碼模型后,根據用戶的注冊語音信號及所述背景模型構建用戶的聲紋密碼模型。

              說明書

              聲紋密碼認證方法及系統
              技術領域
              本發明涉及密碼認證技術領域,特別涉及一種聲紋密碼認證方法及系統。
              背景技術
              聲紋認證,即根據用戶輸入語音信號中反映的說話人生理特征和行為特征的聲紋信息,自動確認說話人身份的技術。相比于其他生物認證技術,聲紋認證具有更簡便、準確、經濟及良好擴展性等眾多優勢,可廣泛應用于安全驗證、控制等各方面。
              聲紋密碼認證,是一種文本相關(Text-Dependent)的聲紋認證技術,該技術要求用戶語音輸入確定密碼文本,并根據聲紋特點確認說話人身份。在聲紋密碼認證中,用戶注冊及身份認證時均需要輸入確定密碼文本相關的語音信號,因而聲紋信息較為一致,相應的可取得相比與文本無關的聲紋認證更好的認證效果,在門禁系統、開機密碼、銀行支付密碼等應用環境下發揮著積極的作用。
              在現有技術中,聲紋密碼認證需要預先離線采集大量的與密碼文本相關的語音數據訓練得到背景模型。在實際中,往往要求用戶統一文本密碼,且不能隨意更改密碼,才能滿足要求。
              由于用戶統一設定一個密碼的方式容易導致設置的正確答案或密碼文本泄露,進而會導致大量冒認者語音會被誤識別為目標說話人,從而無法提供有效的安全保障。因此,為了提高安全性并滿足用戶個性化設置需求,允許不同用戶使用自定義密碼或者經常更換密碼就非常有必要。而現有技術對背景模型的訓練往往要求采集大量的與密碼文本相關的語音數據,顯然無法適用于用戶自定義的聲紋密碼認證系統,且不利于聲紋密碼認證系統的密碼更新。
              發明內容
              本發明實施例提供了一種聲紋密碼認證方法及系統,以滿足用戶自定義密碼及頻繁更改密碼的應用需求。
              本發明實施例提供的技術方案如下:
              一方面,提供了一種聲紋密碼認證方法,包括:
              接收用戶輸入的語音信號;
              對所述語音信號進行語音識別,獲得密碼文本;
              確定是否存在所述密碼文本對應的背景模型;
              如果是,則獲取所述背景模型;如果否,則根據所述密碼文本對預先訓練得到的發音單元模型進行擴展,獲得所述密碼文本對應的背景模型;
              利用所述語音信號中的聲紋特征序列、所述背景模型和所述用戶的聲紋密碼模型對所述用戶進行認證。
              優選地,按照以下方式預先訓練得到發音單元模型:
              獲取訓練語音數據;
              根據所述訓練語音數據確定發音單元;
              確定所述發音單元的聲學模型的拓撲結構;
              對所述聲學模型進行參數訓練,得到發音單元模型。
              優選地,所述聲學模型為GMM模型;
              所述根據所述密碼文本對預先訓練得到的發音單元模型進行擴展,獲得所述密碼文本對應的背景模型包括:
              獲取所述密碼文本中各發音單元對應的GMM模型,得到GMM模型集合;
              對所述GMM模型集合中的模型單元,采用等權重拼接,得到新的組合GMM模型;
              對所述組合GMM模型的高斯權重進行更新,使得所述組合GMM模型的高斯權重之和為1,獲得所述密碼文本對應的背景模型。
              優選地,所述聲學模型為GMM模型;
              所述根據所述密碼文本對預先訓練得到的發音單元模型進行擴展,獲得所述密碼文本對應的背景模型包括:
              獲取所述密碼文本中各發音單元對應的GMM模型,得到GMM模型序列;
              對所述GMM模型序列中的至少兩個模型單元依次拼接后,采用預設的自 跳轉概率和外跳轉概率進行跳轉轉移,獲得所述密碼文本對應的背景模型,其中,所述自跳轉概率和外跳轉概率之和為1。
              優選地,所述聲學模型為HMM模型;
              所述根據所述密碼文本對預先訓練得到的發音單元模型進行擴展,獲得所述密碼文本對應的背景模型包括:
              獲取所述密碼文本中各發音單元對應的HMM模型序列;
              對所述HMM模型序列中的模型單元依次拼接后,獲得所述密碼文本對應的背景模型。
              優選地,所述利用所述語音信號中的聲紋特征序列、所述背景模型和所述用戶的聲紋密碼模型對所述用戶進行認證包括:
              分別計算所述聲紋特征序列相對于所述聲紋密碼模型的第一似然度,以及所述聲紋特征序列相對于所述背景模型的第二似然度;
              根據所述第一似然度與所述第二似然度的比值以及預設閾值,確定用戶是否為合法用戶。
              優選地,所述方法還包括:在對所述語音信號進行語音識別之前或者在獲得所述密碼文本對應的背景模型之后,提取所述語音信號中的聲紋特征序列。
              優選地,所述方法還包括:在對所述語音信號進行語音識別之前或者在獲得所述密碼文本對應的背景模型之后,獲取所述用戶的聲紋密碼模型。
              優選地,所述方法還包括:在獲取所述用戶的聲紋密碼模型之前,判斷當前是否存在用戶的聲紋密碼模型;
              如果不存在,則根據用戶的注冊語音信號及所述背景模型構建用戶的聲紋密碼模型。
              另一方面,提供了一種聲紋密碼認證系統,包括:
              接收模塊,用于接收用戶輸入的語音信號;
              識別模塊,用于對所述語音信號進行語音識別,獲得密碼文本;
              確定模塊,用于確定是否存在所述密碼文本對應的背景模型;
              背景模型獲取模塊,用于在所述確定模塊確定存在所述密碼文本對應的背景模型后,獲取所述背景模型,在所述確定模塊確定不存在所述密碼文本對應的背景模型后,根據所述密碼文本對預先訓練得到的發音單元模型進行擴展, 獲得所述密碼文本對應的背景模型;
              認證模塊,用于利用所述語音信號中的聲紋特征序列、所述背景模型和所述用戶的聲紋密碼模型對所述用戶進行認證。
              優選地,所述系統還包括:訓練模塊,用于預先訓練得到發音單元模型;所述訓練模塊包括:
              語音數據獲取單元,用于獲取訓練語音數據;
              第一確定單元,用于根據所述訓練語音數據確定發音單元;
              第二確定單元,用于確定所述發音單元的聲學模型的拓撲結構;
              參數訓練單元,用于對所述聲學模型進行參數訓練,得到發音單元模型。
              優選地,所述聲學模型為GMM模型,所述背景模型獲取模塊包括:
              GMM模型獲取單元,用于獲取所述密碼文本中各發音單元對應的GMM模型,得到GMM模型集合;
              第一拼接單元,用于對所述GMM模型集合中的模型單元,采用等權重拼接,得到新的組合GMM模型;
              權重更新單元,用于對所述組合GMM模型的高斯權重進行更新,使得所述組合GMM模型的高斯權重之和為1,獲得所述密碼文本對應的背景模型。
              優選地,所述聲學模型為GMM模型,所述背景模型獲取模塊包括:
              GMM模型獲取單元,用于獲取所述密碼文本中各發音單元對應的GMM模型,得到GMM模型序列;
              第二拼接單元,用于對所述GMM模型序列中的至少兩個模型單元依次拼接后,采用預設的自跳轉概率和外跳轉概率進行跳轉轉移,獲得所述密碼文本對應的背景模型,其中,所述自跳轉概率和外跳轉概率之和為1。
              優選地,所述聲學模型為HMM模型,所述背景模型獲取模塊包括:
              HMM模型序列獲取單元,用于獲取所述密碼文本中各發音單元對應的HMM模型序列;
              第三拼接單元,用于對所述HMM模型序列中的模型單元依次拼接后,獲得所述密碼文本對應的背景模型。
              優選地,所述認證模塊包括:
              計算單元,用于分別計算所述聲紋特征序列相對于所述聲紋密碼模型的第 一似然度,以及所述聲紋特征序列相對于所述背景模型的第二似然度;
              確定單元,用于根據所述第一似然度與所述第二似然度的比值以及預設閾值,確定用戶是否為合法用戶。
              優選地,所述系統還包括:聲紋特征序列提取模塊,用于在對所述語音信號進行語音識別之前或者在獲得所述密碼文本對應的背景模型之后,提取所述語音信號中的聲紋特征序列。
              優選地,所述系統還包括:聲紋密碼模型獲取模塊,用于在對所述語音信號進行語音識別之前或者在獲得所述密碼文本對應的背景模型之后,獲取所述用戶的聲紋密碼模型。
              優選地,所述系統還包括:判斷模塊,用于在獲取所述用戶的聲紋密碼模型之前,判斷當前是否存在用戶的聲紋密碼模型;
              聲紋密碼模型構建模塊,用于在所述判斷模塊判斷當前不存在聲紋密碼模型后,根據用戶的注冊語音信號及所述背景模型構建用戶的聲紋密碼模型。
              本發明實施例提供的聲紋密碼認證方法及系統,利用語音信號中的聲紋特征序列、背景模型和用戶的聲紋密碼模型對用戶進行認證。如果不存在密碼文本對應的背景模型,則根據密碼文本對預先訓練得到的發音單元模型進行擴展,獲得密碼文本對應的背景模型。由于背景模型是通過將預先訓練得到的發音單元模型進行擴展得到的,可以便捷地實時在線生成,能夠滿足用戶自定義密碼及密碼頻繁更改的需求。
              附圖說明
              為了更清楚地說明本發明實施例或現有技術中的技術方案,下面將對實施例中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發明中記載的一些實施例,對于本領域普通技術人員來講,還可以根據這些附圖獲得其他的附圖。
              圖1是現有技術中的聲紋密碼認證過程示意圖;
              圖2是本發明實施例提供的聲紋密碼認證方法的流程圖;
              圖3是本發明實施例提供的聲紋密碼認證系統的結構示意圖。
              具體實施方式
              為了使本領域技術人員更好地理解本發明實施例的方案,下面結合附圖和實施方式對本發明實施例作進一步的詳細說明。
              下面首先對現有技術中的聲紋密碼認證過程作簡單介紹。
              如圖1所示,是現有技術中聲紋密碼認證過程示意圖,包括以下步驟:
              步驟101:接收用戶輸入的語音信號;
              步驟102:提取語音信號中的聲紋特征序列;
              步驟103:對語音信號進行語音識別,獲得密碼文本;
              步驟104:獲取預先訓練得到的密碼文本對應的背景模型;
              步驟105:根據用戶的注冊語音信號及背景模型構建用戶的聲紋密碼模型;
              步驟106:利用聲紋特征序列、背景模型和聲紋密碼模型對用戶進行認證。
              現有技術中的聲紋密碼認證,主要采用基于假設檢驗的框架,即分別計算用戶測試語音相對于背景模型和聲紋密碼模型的似然度,來進行用戶認證。
              由于密碼文本對應的背景模型和聲紋密碼模型的準確度,直接影響到聲紋密碼認證效果。在數據驅動的統計模型設定下,訓練數據量越大則模型效果越好。現有技術中,背景模型往往通過離線采集大量的密碼語音數據,預先通過數據訓練才能得到。由于離線采集大量密碼語音數據進行數據訓練,較為麻煩,可操作性較差。在實際中,往往通過采用單一的通用密碼,且不能隨意更改密碼的方法得以實現。
              在主流GMM-UBM算法框架下,分別采用混合高斯模型(Gaussian Mixture Model,簡稱GMM)模擬通用密碼背景模型(Universal Background Model,簡稱UBM)和聲紋密碼模型。
              由于聲紋密碼語音通常較短,用于描述用戶對通用密碼文本發音的聲紋共性的背景模型通常選擇高斯數為256或更大高斯數的GMM模型。
              通用密碼背景模型通過如下方法訓練得到:
              (1)從預先存儲的大量密碼訓練語音中提取聲紋特征序列,得到聲紋特征矢量庫;
              (2)利用聚類算法例如傳統的LBG聚類算法,對提取的聲紋特征矢量進行聚類,得到K個高斯的初始化均值,其中K為系統預先設置的模型規模參 數。
              (3)通過最大期望算法(Expectation-Maximization algorithm,EM算法)迭代更新GMM模型的均值、方差及各高斯對應的加權系數,得到新的UBM模型:
              p(O|UBM)=Σt=1TΣm=1McmN(ot;μm,Σm)]]>
              其中,T表示該句話的總幀數,ot表示第t幀觀測數據,cm是第m個高斯的權重,滿足μmm分別是第m個高斯的均值和方差,其中,N(.)滿足正態分布:
              N(ot;μm,Σm)=1(2π)n|Σm|exp(-12(ot-μm)Σm-1(ot-μm))]]>
              聲紋密碼模型是根據用戶的注冊語音在線訓練得到的。由于注冊語音樣本數量有限,直接據此訓練復雜模型容易導致數據稀疏等問題。現有技術中的聲紋密碼模型是以背景模型為初始模型,通過自適應算法調整模型部分參數得到的。自適應算法可以根據少量說話人數據將用戶聲紋共性自適應為當前說話人個性。目前常用的自適應算法有基于最大后驗概率(Maximum a Posteriori,簡稱MAP)的自適應算法。
              采用自適應算法訓練聲紋密碼模型的具體訓練過程如下:
              (1)從用戶注冊語音中提取聲紋特征序列,形成訓練特征矢量庫;
              (2)利用訓練特征矢量庫,采用自適應算法更新通用背景模型混合高斯的均值,得到聲紋密碼模型的高斯均值μm;其中,聲紋密碼模型高斯均值μm為樣本統計量和通用背景模型高斯均值的加權平均:
              μm^=Σt=1Tγm(xt)xt+τμmΣt=1Tγm(xt)+τ]]>
              其中,xt表示觀測向量,即聲紋特征序列;μm表示第m個高斯的均值;γm(xt)表示第t幀聲紋特征落于第m個高斯的概率,τ是遺忘因子,用于平衡歷史均值以及樣本統計量對聲紋密碼模型高斯均值的更新力度。一般來說,τ值較大,則聲紋密碼模型高斯均值主要受原始均值制約;τ值較小,則聲紋密碼模型高斯均值主要由樣本統計量決定,更多體現了新樣本分布的特點。
              (3)復制背景模型方差,作為聲紋密碼模型方差。
              得到通用密碼背景模型以及聲紋密碼模型后,可以根據用戶輸入的語音信號進行用戶認證。具體地,根據用戶輸入的語音信號的聲紋特征序列,分別計算聲紋特征序列相對于聲紋密碼模型的第一似然度,聲紋特征序列相對于通用密碼背景模型的第二似然度,然后計算第一似然度和第二似然度的比值,通過該比值以及預設閾值判斷用戶是否為合法用戶。如果第一似然度和第二似然度的比值大于預設閾值,則判斷用戶為合法用戶;否則,判斷用戶為非法用戶。
              現有技術中的聲紋密碼認證,在單一密碼的情況下,由于可以獲得充分的訓練數據,訓練得到的背景模型及聲紋密碼模型較好,能夠滿足認證需求。然而,在用戶自定義聲紋密碼的應用環境下,由于使用次數有限等原因,難以獲取大量的訓練數據,導致無法預先訓練得到相應的背景模型,使得傳統的聲紋密碼認證在需要用戶自定義密碼或頻繁更改密碼的情況下,無法得到應用。
              為此,本發明實施例提出了一種聲紋密碼認證方法及系統,能夠支持用戶自定義密碼及頻繁更換密碼的應用需求。
              如圖2所示,是本發明實施例提供的聲紋密碼認證方法的流程圖,可以包括以下步驟:
              步驟201:接收用戶輸入的語音信號;
              步驟202:對語音信號進行語音識別,獲得密碼文本;
              步驟203:確定是否存在密碼文本對應的背景模型;
              步驟204:如果存在密碼文本對應的背景模型,則獲取背景模型;
              步驟205:如果不存在密碼文本對應的背景模型,則根據密碼文本對預先訓練得到的發音單元模型進行擴展,獲得密碼文本對應的背景模型;
              步驟206:利用語音信號中的聲紋特征序列、背景模型和用戶的聲紋密碼模型對用戶進行認證。
              在本發明實施例中,對用戶進行認證所需要的聲紋特征序列、背景模型和用戶的聲紋密碼模型,可以通過以下方式獲取:可以從用戶輸入的語音信號中提取聲紋特征序列,具體地,可以在對語音信號進行語音識別之前,當然也可以在獲得密碼文本對應的背景模型之后,進行語音信號的聲紋特征序列的提取。關于背景模型的獲取,可以先判斷是否存在密碼文本對應的背景模型,如果已經存在,則可以直接獲取;如果不存在,可以根據密碼文本對預先訓練得到的發音單元模型進行擴展,獲得密碼文本對應的背景模型;關于聲紋密碼模型,可以先判斷是否存在用戶的聲紋密碼模型,如果存在,可以直接獲取;如果不存在,可以根據用戶的注冊語音信號及步驟204或步驟205獲得的背景模型構建用戶的聲紋密碼模型。
              可以通過以上方式獲取的語音信號中的聲紋特征序列、背景模型和用戶的聲紋密碼模型對用戶進行認證,具體地,可以分別計算聲紋特征序列相對于聲紋密碼模型的第一似然度,以及聲紋特征序列相對于背景模型的第二似然度;根據第一似然度與第二似然度的比值以及預設閾值,確定用戶是否為合法用戶。如果第一似然度與第二似然度的比值大于預設閾值,則確定用戶為合法用戶;否則,確定用戶為非法用戶。
              在本發明實施例中,密碼文本對應的背景模型可以是通過對預先訓練得到的發音單元模型進行擴展得到的。發音單元模型的訓練過程具體可以包括:先獲取訓練語音數據,然后根據訓練語音數據確定發音單元,再確定發音單元的聲學模型的拓撲結構,再對聲學模型進行參數訓練,得到發音單元模型。其中,發音單元例如可以是音素單元或音節單元。例如,“我的生日”對應的音素單元為“w,o,d,e,sh,eng,r,i”,在對音素單元進行確定之后,可以對其中的每個音素單元分別建立聲學模型,從而得到音素單元的聲學模型的拓撲結構,再對聲學模型進行參數訓練,從而得到發音單元模型。其中,對聲學模型的參數訓練可以采用現有技術中的一些訓練方式,對此本發明實施例不做限定。
              需要說明的是,在本發明實施例中,上述聲學模型可以采用GMM模型,也可以采用HMM模型(Hidden Markov Model,隱馬爾可夫模型)。
              在上述聲學模型采用GMM模型時,根據密碼文本對預先訓練得到的發音單元模型進行擴展,獲得密碼文本對應的背景模型可以包括:獲取密碼文本中 各發音單元對應的GMM模型,得到GMM模型集合;對GMM模型集合中的模型單元,采用等權重拼接,得到新的組合GMM模型;對組合GMM模型的高斯權重進行更新,使得組合GMM模型的高斯權重之和為1,獲得密碼文本對應的背景模型。
              上述各模型單元的高斯權重更新過程可以如下:在對各模型單元進行等權重拼接過程中,高斯權重設置為wn,n=1:N,N為模型單元個數;對各模型單元的高斯權重更新為wni為原模型單元中每個高斯的權重,并且滿足wni=1;從上式中可以看出,拼接后的GMM模型在對各模型單元的高斯權重更新后,仍然能夠滿足
              在上述聲學模型采用GMM模型時,根據密碼文本對預先訓練得到的發音單元模型進行擴展,獲得密碼文本對應的背景模型可以包括:獲取密碼文本中各發音單元對應的GMM模型,得到GMM模型序列;對GMM模型序列中的至少兩個模型單元依次拼接后,采用預設的自跳轉概率和外跳轉概率進行跳轉轉移,獲得密碼文本對應的背景模型,其中,自跳轉概率和外跳轉概率之和為1。
              在上述聲學模型采用HMM模型時,根據密碼文本對預先訓練得到的發音單元模型進行擴展,獲得密碼文本對應的背景模型包括:獲取密碼文本對應的HMM模型序列;對HMM模型序列中的至少兩個模型單元拼接后,采用預設的自跳轉概率和外跳轉概率進行跳轉轉移,獲得密碼文本對應的背景模型,其中,自跳轉概率和外跳轉概率之和為1。
              在本發明實施例中,自跳轉和外跳轉可以是以字為單位進行的,因此,需要對兩個或兩個以上模型單元進行拼接,以便得到某個字的GMM模型或HMM模型,之后再以字為單位設定其跳轉轉移概率。其中,自跳轉概率和外跳轉概率可以根據經驗預先進行設定,例如,可以將自跳轉概率設置為0.9,可以將外跳轉概率設置為0.1。
              由于發音具有一定的時延性,采用HMM模型可以更好地模擬聲紋動態信 息及密碼文本的時序信息,以有效解決文本亂序、錯字、多字及少字現象。
              本發明實施例提供的聲紋密碼認證方法,利用語音信號中的聲紋特征序列、背景模型和用戶的聲紋密碼模型對用戶進行認證。如果不存在密碼文本對應的背景模型,則根據密碼文本對預先訓練得到的發音單元模型進行擴展,獲得密碼文本對應的背景模型。由于背景模型是通過將預先訓練得到的發音單元模型進行擴展得到的,可以便捷地實時在線生成,能夠滿足用戶自定義密碼及密碼頻繁更改的需求。
              相應地,本發明實施例還提供一種聲紋密碼認證系統,如圖3所示,為本發明實施例提供的聲紋密碼認證系統的結構示意圖。
              在該實施例中,所述聲紋密碼認證系統可以包括:
              接收模塊301,用于接收用戶輸入的語音信號;
              識別模塊302,用于對語音信號進行語音識別,獲得密碼文本;
              確定模塊303,用于確定是否存在密碼文本對應的背景模型;
              背景模型獲取模塊304,用于在確定模塊303確定存在密碼文本對應的背景模型后,獲取背景模型,在確定模塊303確定不存在密碼文本對應的背景模型后,根據密碼文本對預先訓練得到的發音單元模型進行擴展,獲得密碼文本對應的背景模型;
              認證模塊305,用于利用語音信號中的聲紋特征序列、背景模型和用戶的聲紋密碼模型對用戶進行認證。
              在本發明實施例中,密碼文本對應的背景模型可以是根據密碼文本對預先訓練得到的發音單元模型進行擴展得到的,而發音單元模型可以是預先訓練得到的。為此,本發明實施例的系統還可進一步包括:訓練模塊(未圖示),用于預先訓練得到發音單元模型。該訓練模塊可以包括:
              語音數據獲取單元,用于獲取訓練語音數據;
              第一確定單元,用于根據訓練語音數據確定發音單元;
              第二確定單元,用于確定發音單元的聲學模型的拓撲結構;
              參數訓練單元,用于對聲學模型進行參數訓練,得到發音單元模型。
              需要說明的是,在本發明實施例中,上述聲學模型可以采用GMM模型,也可以采用HMM模型。
              上述聲學模型采用GMM模型,上述背景模型獲取模塊304的一種具體實現結構可以包括:
              GMM模型獲取單元,用于獲取密碼文本中各發音單元對應的GMM模型,得到GMM模型集合;
              第一拼接單元,用于對GMM模型集合中的模型單元,采用等權重拼接,得到新的組合GMM模型;
              權重更新單元,用于對組合GMM模型的高斯權重進行更新,使得組合GMM模型的高斯權重之和為1,獲得密碼文本對應的背景模型。
              上述聲學模型采用GMM模型,上述背景模型獲取模塊304的另外一種具體實現結構可以包括:
              GMM模型獲取單元,用于獲取所述密碼文本中各發音單元對應的GMM模型,得到GMM模型序列;
              第二拼接單元,用于對所述GMM模型序列中的至少兩個模型單元依次拼接后,采用預設的自跳轉概率和外跳轉概率進行跳轉轉移,獲得所述密碼文本對應的背景模型,其中,所述自跳轉概率和外跳轉概率之和為1。
              上述聲學模型采用HMM模型,上述背景模型獲取模塊304的一種具體實現結構可以包括:
              HMM模型序列獲取單元,用于獲取所述密碼文本中各發音單元對應的HMM模型序列;
              第三拼接單元,用于對所述HMM模型序列中的模型單元依次拼接后,獲得密碼文本對應的背景模型。
              在本發明實施例中,認證模塊305的一種具體結構可以包括:
              計算單元,用于分別計算聲紋特征序列相對于聲紋密碼模型的第一似然度,以及聲紋特征序列相對于背景模型的第二似然度;
              確定單元,用于根據第一似然度與第二似然度的比值以及預設閾值,確定用戶是否為合法用戶。
              本發明實施例提供的聲紋密碼認證系統,還可以進一步包括:
              聲紋特征序列提取模塊,用于在對語音信號進行語音識別之前或者在獲得密碼文本對應的背景模型之后,提取語音信號中的聲紋特征序列。
              進一步地,上述系統還可以包括:
              聲紋密碼模型獲取模塊,用于在對語音信號進行語音識別之前或者在獲得密碼文本對應的背景模型之后,獲取用戶的聲紋密碼模型。
              進一步地,上述系統還可以包括:
              判斷模塊,用于在獲取用戶的聲紋密碼模型之前,判斷當前是否存在用戶的聲紋密碼模型;
              聲紋密碼模型構建模塊,用于在判斷模塊判斷當前不存在聲紋密碼模型后,根據用戶的注冊語音信號及背景模型構建用戶的聲紋密碼模型。
              本發明實施例提供的聲紋密碼認證系統,利用語音信號中的聲紋特征序列、背景模型和用戶的聲紋密碼模型對用戶進行認證。如果不存在密碼文本對應的背景模型,則根據密碼文本對預先訓練得到的發音單元模型進行擴展,獲得密碼文本對應的背景模型。由于背景模型是通過將預先訓練得到的發音單元模型進行擴展得到的,可以便捷地實時在線生成,能夠滿足用戶自定義密碼及密碼頻繁更改的需求。
              上述實施例提供的聲紋密碼認證方法和系統屬于同一發明構思,系統中各模塊、單元的功能及實現過程可參照方法實施例中的描述,這里不再贅述。
              本說明書中的各個實施例均采用遞進的方式描述,各個實施例之間相同相似的部分互相參見即可,每個實施例重點說明的都是與其他實施例的不同之處。尤其,對于系統實施例而言,由于其基本相似于方法實施例,所以描述得比較簡單,相關之處參見方法實施例的部分說明即可。以上所描述的系統實施例僅僅是示意性的,其中所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個地方,或者也可以分布到多個網絡單元上。可以根據實際的需要選擇其中的部分或者全部模塊來實現本實施例方案的目的。本領域普通技術人員在不付出創造性勞動的情況下,即可以理解并實施。
              以上所述僅為本發明的較佳實施例,并不用以限制本發明,凡在本發明的精神和原則之內,所作的任何修改、等同替換、改進等,均應包含在本發明的保護范圍之內。

              關 鍵 詞:
              聲紋 密碼 認證 方法 系統
                專利查詢網所有資源均是用戶自行上傳分享,僅供網友學習交流,未經上傳用戶書面授權,請勿作他用。
              0條評論

              還可以輸入200字符

              暫無評論,趕快搶占沙發吧。

              關于本文
              本文標題:聲紋密碼認證方法及系統.pdf
              鏈接地址:http://www.039244.fun/p-20918.html
              關于我們 - 網站聲明 - 網站地圖 - 資源地圖 - 友情鏈接 - 網站客服客服 - 聯系我們

              [email protected] 2017-2018 zhuanlichaxun.net網站版權所有
              經營許可證編號:粵ICP備17046363號-1 
               


              收起
              展開
              大连码头渔歌酒楼

                  <progress id="rrzp7"></progress>
                    <big id="rrzp7"><meter id="rrzp7"></meter></big>
                      <progress id="rrzp7"><menuitem id="rrzp7"></menuitem></progress>

                        <big id="rrzp7"><menuitem id="rrzp7"></menuitem></big>

                        <progress id="rrzp7"></progress>

                              <progress id="rrzp7"></progress>
                                <big id="rrzp7"><meter id="rrzp7"></meter></big>
                                  <progress id="rrzp7"><menuitem id="rrzp7"></menuitem></progress>

                                    <big id="rrzp7"><menuitem id="rrzp7"></menuitem></big>

                                    <progress id="rrzp7"></progress>