一种自适应的鼾声信号检测方法
【专利摘要】本发明提供了一种自适应的鼾声信号检测方法,步骤如下:步骤1,对获得的睡眠音频信号进行端点检测得到声音事件;步骤2,对步骤1获得的声音事件进行特征提取,得到Mel频率倒谱系数;步骤3,对步骤2所提取的特征进行聚类,确定鼾声和非鼾声信号。本发明可以有效检测出睡眠音频信号中的鼾声信号,检测结果准确,性能优良。
【专利说明】
_种自适应的声信号检测方法
技术领域
[0001] 本发明属于音频信号处理领域,特别设计一种自适应的鼾声信号检测算法。
【背景技术】
[0002] 鼾声是入睡后发出的粗重鼻息声。打鼾是一种十分普遍的现象,大约有20 %~ 40%的人群患有打鼾症状。睡眠时上气道咽腔肌肉张力相对降低,上气道塌陷。当气流通过 上气道的狭窄部位时,气流变得湍急并引起组织振动,从而出现鼾声。更具体地,打鼾可以 表征为软腭、咽壁、会厌和舌头的振动。打鼾不仅困扰患者、影响同伴,还会对患者健康造成 威胁。响亮的呼噜声可能会吵得旁人整夜不得安睡,使得同伴睡眠质量大大降低,甚至可能 患上继发性睡眠障碍,造成工作生活的不和谐。打鼾还是睡眠呼吸障碍最常见的症状。阻塞 性睡眠呼吸暂停综合症也是一种伴有打鼾的呼吸疾病,它会导致患者白天的嗜睡和疲劳, 也是心血管疾病的一个诱因。目前诊断和评估打鼾的主要技术手段是多导睡眠图,但是它 需要患者整夜待在睡眠实验室中并连接大量的生理电极。由于具有非侵入式、廉价易用的 特点,鼾声信号的声学分析方法已引起广泛关注和研究,并表现出极大的潜力。
[0003] Duckitt等人[20]提出一种基于隐马尔可夫模型(Hidden Markov Model,ΗΜΜ)和 Mel频率倒谱系数特征(Mel-Frequency Cepstral Coefficients,MFCCs)的方案,将音频信 号分成鼾声、呼吸、羽绒被噪声、其他噪声和无声五个类别,但是鼾声判别的准确度仅有 82%-89%<Xa VuS〇glu等人[21]利用信号能量和过零率进行声音事件的检测,并提出声音 事件的500Hz子带能量分布特征,经过主成分分析(Principal ComponentAnalysis,PCA)发 现二维特征上鼾声非鼾声的分布存在明显差异,因此利用稳健线性回归(Robust Linear Regression,RLR)分析将声音事件分成鼾声非鼾声两个类别,取得了较好的鼾声检测性能。 Dafna等人[22]则提出一种基于高斯混合模型(Gaussian Mixture Model,GMM)的方法,并 提取声音事件在时间域、能量域和频域上的声学特征进行分析,其鼾声判别的准确度达到 96.02%。以上介绍的方法都是监督的,需要训练数据,也有无监督的检测算法。Azarbarzin 等人[23],[24]提出了一种无监督的鼾声检测算法,利用PCA分析了声音事件的500Hz子带 能量分布特征,并采用K-均值(K-means,KM)或模糊C-均值(Fuzzy C-means,FCM)聚类算法 将声音事件分成鼾声、呼吸和噪声三个类别。值得注意的是500Hz子带能量分布特征并不能 表征人耳听觉特性,这可能会导致较差的阳性预测值(Positive Predictive Value,PPV)。
[0004] 总之,监督的鼾声检测方法通常需要比较大的训练数据,而且其鼾声检测的性能 也受制于训练数据的选择。相比较而言,目前无监督的方法虽然不需要训练数据,但是其检 测性能还不够优越。
【发明内容】
[0005] 本发明的目的在于提供一种高效、可靠的自适应的鼾声信号检测方法,从睡眠音 频信号中检测出鼾声信号。
[0006] 实现本发明的技术解决方案为:一种自适应的鼾声信号检测方法,步骤如下:
[0007] 步骤I,对获得的睡眠音频信号进行端点检测得到声音事件;
[0008] 步骤2,对步骤1获得的声音事件进行特征提取,得到Mel频率倒谱系数;
[0009]步骤3,对步骤2所提取的特征进行聚类,确定鼾声和非鼾声信号。
[0010] 进一步地,步骤1所述对获得的睡眠音频信号进行端点检测得到声音事件,具体如 下:
[0011] (1.1)对睡眠音频信号进行预处理,包括带通滤波和归一化,得到信号Y;
[0012] (1.2)初始化声音事件检测时间点,n = L+1;定义时间预设值Γ;
[0013] (1.3)在当前时间点η,定义一个如下形式的矩形盒子:
[0014] B(L,H,n,Yn) = [n-L,n]X[Yn-H,Yn+H]
[0015]其中,Yn是信号Y在时间点n时的采样值;L>1,表示矩形盒子的宽度;2H>0,表示 矩形盒子的高度;其中矩形盒子的参数H设置如下:
[0016] 计算Ns内每M ms的信号采样点绝对值之和,并选取其中的最小值作为H值设置的 参考值,设选取的N s内的信号为Y(n),每Mms的S个采样点看作一帧,第i帧记为Yi(n),共有 fn帧,则右-
[0017]
[0018] 其中,a为与采样频率相关的系数;
[0019] (1.4)在当前时间点11,对落入矩形盒子8仏,!1,11,¥11)中的采样点进行计数,并用1^ (η)表示如下:
[0020]
[0021 ] 其中,Yn-定会在矩形盒子B(L,H,n,Yn)中,Yn不计入bui(n);
[0022] (1.5)如果满足如下关系就给出标记,否则不给出标记,关系式如下:
[0023] bLH(nKLX0
[0024] 其中,0<θ<1;
[0025] (1.6)如果时间点已到达数据末尾,则转到步骤(1.7);否则,矩形盒子右移固定数 量的采样点,也就是η自增固定数值,转到步骤(1.3);
[0026] (1.7)对于所有给出标记的矩形盒子,该矩形盒子所在时间就是声音事件所在时 间;对于相隔时间Sr的矩形盒子进行合并,认为是同一个声音事件;判别出的声音事件如 果持续时长 < 预设值r则丢弃,认为不可能是鼾声信号。
[0027] 进一步地,步骤2所述对步骤1获得的声音事件进行特征提取,得到Mel频率倒谱系 数,具体如下:
[0028] (2.1)将声音信号进行Nl点傅里叶变换,公式如下:
[0029]
[0030]其中,此处j为虚数单位,OSKNl-I,y[m]是输入的声音事件音频信号,w[m]是 Hamming窗函数;
[0031] (2.2)计算通过Mel滤波器的输出能量Ε(σ),
[0032]
[0033] 其中1彡〇彡M,M是Mel尺度下滤波组的数目,|Y(1) I2是Mel频率带中第1条谱线信 号的能量,Wc3(I)则是与|Y(1) I2相应的第1条谱线的频率响应函数;
[0034] (2.3)进行对数计算和离散余弦变换DCT得到Mel频率倒谱系数Cm:
[0035]
[0036]其中,m(〇-0.5)是求DCT变换的公式,Cm是Mel频率倒谱系数。
[0037] 进一步地,步骤3所述对步骤2所提取的特征进行聚类,确定鼾声和非鼾声信号,具 体如下:
[0038] (3.1)初始化算法,从η个声音事件的d维特征集X= Ix1,…,χη}中选取k个作为聚类 中心C={ci,···,ck};
[0039] (3.2)对于每个声音事件的特征X1,计算其隶属函数m(Cj I Xl)和权重函数w(Xl);其 中^#父,乂={11,一,1 11}表示11个声音事件的(1维特征集,1]1((^|1〇表示声音事件的特征11属 于聚类中心Cj的比重,W(X 1)表示声音事件的特征^在重新计算聚类中心时的影响程度;
[0040] (3.3)对于每个聚类中心根据声音事件特征X1的隶属函数和权重函数重新计算 位置,
[0041]
[0042] (3.4)重复步骤(3.2)和步骤(3.3)直至收敛,收敛判断方法是目标函数不再发生 变化即图形曲线上目标函数值趋于稳定,或达到指定迭代次数。
[0043]本发明与现有技术相比,其显著优点为:(1)可以自适应地进行睡眠音频信号中的 鼾声信号检测;(2)检测结果准确,性能优良;(3)能够及时准确地分析整夜的音频信号,检 测出其中的鼾声信号,具有非侵入式、廉价易用的优点。
[0044]下面结合说明书附图对本发明做进一步说明。
【附图说明】
[0045] 图1为本发明自适应的鼾声信号检测方法的流程图。
[0046] 图2为本发明的一段待处理的睡眠音频信号图。
[0047] 图3为本发明的声音事件的端点检测的结果图。
[0048] 图4为本发明的鼾声信号检测的结果图。
【具体实施方式】
[0049] 结合图1,本发明自适应的鼾声信号检测算法,方法步骤如下:
[0050] 步骤1,对获得的睡眠音频信号进行端点检测得到声音事件,具体如下:
[0051] (1.1)对睡眠音频信号进行预处理,包括带通滤波和归一化,得到信号Y;
[0052] (1.2)初始化声音事件检测时间点,n = L+1;定义时间预设值r为200ms;
[0053] (1.3)在当前时间点n,定义一个如下形式的矩形盒子:
[0054] B(L,H,n,Yn) = [n-L,n]X[ Yn-H,Υη+Η ]
[0055] 其中,Yn是信号Y在时间点η时的采样值;L> I,表示矩形盒子的宽度;2H>0,表示 矩形盒子的高度;其中矩形盒子的参数H设置如下:
[0056] 计算Ns内每M ms的信号采样点绝对值之和,并选取其中的最小值作为H值设置的 参考值,设选取的N s内的信号为Y(n),每Mms的S个采样点看作一帧,第i帧记为Yi(n),共有 fn帧,则有,
[0057]
[0058] 其中,a为与采样频率相关的系数;对于本文而言,考虑到信号的采样频率为8KHZ, a设置为525时可以取得较好的端点检测性能。
[0059] (1.4)在当前时间点11,对落入矩形盒子8仏,!1,11,¥11)中的采样点进行计数,并用1^ (η)表示如下:
[0060]
[0061 ] 其中,Yn-定会在矩形盒子B(L,H,n,Yn)中,Y n不计入bui(n);
[0062] (1.5)如果满足如下关系就给出标记,否则不给出标记,关系式如下:
[0063] bLH(nKLX0
[0064] 其中,0<θ<1;
[0065] (1.6)如果时间点已到达数据末尾,则转到步骤(1.7);否则,矩形盒子右移固定数 量的采样点,也就是η自增固定数值,使采样点重叠80%,转到步骤(1.3);
[0066] (1.7)对于所有给出标记的矩形盒子,该矩形盒子所在时间就是声音事件所在时 间;对于相隔时间Sr的矩形盒子进行合并,认为是同一个声音事件;判别出的声音事件如 果持续时长 < 预设值r则丢弃,认为不可能是鼾声信号。
[0067] 步骤2,对步骤1获得的声音事件进行特征提取,得到Mel频率倒谱系数,具体如下:
[0068] (2.1)将声音信号进行Nl点傅里叶变换,公式如下:
[0069]
[0070]其中,此处j为虚数单位,OSKNl-I,y[m]是输入的声音事件音频信号,w[m]是 Hamming窗函数;
[0071] (2.2)计算通过Mel滤波器的输出能量Ε(σ),
[0072]
[0073]其中1彡〇彡M,M是Mel尺度下滤波组(Mel窗)的数目,I Y(I) 12是Mel频率带中第1条 谱线信号的能量,w。⑴则是与|γ(ι) I2相应的第1条谱线的频率响应函数;
[0074] (2.3)进行对数计算和离散余弦变换DCT得到Mel频率倒谱系数(MFCC) Cm:
[0075]
[0076]其中,m(〇-0.5)是求DCT变换的公式,Cm是Mel频率倒谱系数。
[0077]步骤3,对步骤2所提取的特征进行聚类,确定鼾声和非鼾声信号,具体如下:
[0078] (3.1)初始化算法,从η个声音事件的d维特征集X= Ix1,…,χη}中选取k个作为聚类 中心C={ci,···,ck};
[0079] (3.2)对于每个声音事件的特征X1,计算其隶属函数m(Cj I Xl)和权重函数w(Xl);其 中^#父,乂={11,一,1 11}表示11个声音事件的(1维特征集,1]1((^|1〇表示声音事件的特征11属 于聚类中心Cj的比重,W(X 1)表示声音事件的特征^在重新计算聚类中心时的影响程度;
[0080] (3.3)对于每个聚类中心根据声音事件特征X1的隶属函数和权重函数重新计算 位置,
[0081:
[0082] (3.4)重复步骤(3.2)和步骤(3.3)直至收敛,收敛判断方法是目标函数不再发生 变化即图形曲线上目标函数值趋于稳定,或达到指定迭代次数。
[0083] 实施例1
[0084] 步骤1中声音事件的端点检测的具体方法为:
[0085] 步骤1.1,对睡眠音频信号进行预处理,包括滤波(50~4000Hz带通)和归一化,得 到信号Y;
[0086] 步骤1.2,初始化声音事件检测时间点,n = L+1。定义时间预设值r;
[0087] 步骤1.3,在当前时间点η,定义一个如下形式的矩形盒子,
[0088] B(L,H,n,Yn) = [n-L,n] Χ[Υη-Η,Υη+Η]
[0089] 其中,Yn是信号Y在时间点η时的采样值;L> I,表示矩形盒子的宽度;2Η>0,表示 矩形盒子的高度。
[0090 ]步骤1.4,在当前时间点η,对落入矩形盒子B (L,H,η,Yn)中的采样点进行计数, [0091:
[0092] 可以注意到的是,Yn-定会在矩形盒子B(L,H,n,Yn)中,它不计入Im(η)。
[0093] 步骤1.5,如果满足如下关系就给出标记(否则不给出标记),
[0094] bLH(n)^LX0
[0095] 其中,0<θ<1。
[0096] 步骤1.6,如果时间点已到达数据末尾,则转到步骤1.7;否则,矩形盒子右移一定 数量的采样点,也就是η自增一定数值,转到步骤1.3;
[0097] 步骤1.7,对于所有给出标记的矩形盒子,认为该矩形盒子所在时间就是声音事件 所在时间。对于相隔不高于200ms的矩形盒子,进行合并,认为是同一个声音事件。判别出的 声音事件如果时长低于200ms,则丢弃,认为不可能是鼾声信号。
[0098] 步骤1中所述矩形盒子的参数H的设置如下:
[0099]计算IOs内每500ms的信号采样点绝对值之和,并选取其中的最小值作为H值设置 的参考值。设选取的IOs内的信号为x(n),每500ms(N个采样点)看作一帧,第i帧记为Xi(n), 共有fn帧,则有,
[0100]
[0101] 其中,a为系数。
[0102] 步骤2中声音事件的Mel频率倒谱系数获取步骤如下:
[0103] 步骤2.1,将声音信号进行Nl点傅里叶变换,公式如下:
[0104]
[0105] 其中,此处j为虚数单位,OSKNl-I,y[m]是输入的声音事件音频信号,w[m]是 Hamming窗函数;
[0106] 步骤2.2,计算通过Mel滤波器的输出能量E(〇),
[0107]
[0108] 其中1彡σ彡M,M是Mel尺度下滤波组的数目,|Y(1) I2是Mel频率带中第1条谱线信 号的能量,Wc3(I)则是与|Y(1) I2相应的第1条谱线的频率响应函数;
[0109] 步骤2.3,进行对数计算和离散余弦变换DCT得到Mel频率倒谱系数Cm:
[0110]
[0111]其中,m(〇-0.5)是求DCT变换的公式,Cm是Mel频率倒谱系数。
[0112] 步骤3中聚类算法以K-调和均值(k-harmonic means,KHM)聚类为例,步骤如下:
[0113] 步骤3.1,算法初始化,初始化算法,从η个声音事件的d维特征集X= {XI,…,Xn}中 选取k个作为聚类中心C={C1,-_,ck}。如果只需要将信号分为鼾声和非鼾声两类,则取值为 k = 2〇
[0114] 步骤3.2,计算目标函数,
[0115]
[0116] 其中,Xi e X,X ={X1,…,χη}表示η个声音事件的d维特征数据点集;P是输入参数, 通常P彡2,可以取值为p = 3.5。
[0117] 步骤3.3,对于每个声音事件的特征Xi,计算其在每个中心Cj的隶属函数m(Cj I Xi) 和权重函数W(Xi),
[0118]
[0119]
[0120] 其中,隶属函数m(Cj I Xl)表示声音事件的特征xj于中心的比重,权重函数W(X1) 表示声音事件的特征Xi在重新计算中心时的影响程度;
[0121] 步骤3.4,对于每个中心根据所有声音事件的特征^的隶属函数和权重函数,重 新计算其位置,
[0122]
[0123] 步骤3.5,重复步骤3.2~3.4直到满足给定的迭代次数或者目标函数KHM(X,C)不 再产生明显变化;
[0124] 步骤3.6,根据最大的隶属函数m(Cj I Xi),将各声音事件的特征Xi分到中心Cj中。
[0125] 通过以上步骤最后就能从睡眠音频信号中检测出鼾声信号。
[0126] 结合图2~4,首先需要采集到睡眠时的音频信号,为了方便处理,对音频信号进行 分割,图2是一段分割后的睡眠音频信号;对该信号做相应的预处理和端点检测,识别出其 中的声音事件,图3给出了声音事件的端点检测结果,红线标记就是检测出的声音事件;然 后提取声音事件的Mel频率倒谱系数特征;最后根据KHM算法对其进行聚类,从而区分出鼾 声信号,如图4所示,绿线标记就是检测出的鼾声信号。综上所述,本发明可以自适应地进行 睡眠音频信号中的鼾声信号检测,检测结果准确、性能优良。
【主权项】
1. 一种自适应的韩声信号检测方法,其特征在于,步骤如下: 步骤1,对获得的睡眠音频信号进行端点检测得到声音事件; 步骤2,对步骤1获得的声音事件进行特征提取,得到Mel频率倒谱系数; 步骤3,对步骤2所提取的特征进行聚类,确定韩声和非韩声信号。2. 根据权利要求书1所述的自适应的韩声信号检测方法,其特征在于,步骤1所述对获 得的睡眠音频信号进行端点检测得到声音事件,具体如下: (1.1) 对睡眠音频信号进行预处理,包括带通滤波和归一化,得到信号Y; (1.2) 初始化声音事件检测时间点,η = L+1;定义时间预设值Γ; (1.3) 在当前时间点η,定义一个如下形式的矩形盒子: B(L,H,n,Yn) = [n-L,n]X[Yn-H,Yn+H] 其中,Υη是信号Y在时间点η时的采样值;L> 1,表示矩形盒子的宽度;2H>0,表示矩形盒 子的高度;其中矩形盒子的参数Η设置如下: 计算Ns内每Mms的信号采样点绝对值之和,并选取其中的最小值作为Η值设置的参考 值,设选取的化内的信号为Υ(η),每Mms的S个采样点看作一帖,第i帖记为Υι(η),共有fn帖, 则有,其中,a为与采样频率相关的系数; (1.4) 在当前时间点n,对落入矩形盒子B(L,H,n,Yn)中的采样点进行计数,并用bLH(n) 表示如下:其中,Υη-定会在矩形盒子Β?Χ,Η,η,Υη)中,Υη不计入bLH(n); (1.5) 如果满足如下关系就给出标记,否则不给出标记,关系式如下: bLH(n)《LX 白 其中,0<θ<1; (1.6) 如果时间点已到达数据末尾,则转到步骤(1.7);否则,矩形盒子右移固定数量的 采样点,也就是η自增固定数值,转到步骤(1.3); (1.7) 对于所有给出标记的矩形盒子,该矩形盒子所在时间就是声音事件所在时间;对 于相隔时间的矩形盒子进行合并,认为是同一个声音事件;判别出的声音事件如果持续 时长《预设值Γ则丢弃,认为不可能是韩声信号。3. 根据权利要求书1所述的自适应的韩声信号检测方法,其特征在于,步骤2所述对步 骤1获得的声音事件进行特征提取,得到Mel频率倒谱系数,具体如下: (2.1)将声音信号进行N1点傅里叶变换,公式如下:其中,此处j为虚数单位,〇《1《^-1,7[111]是输入的声音事件音频信号,*[111]是 Hamming窗函数; (2.2) 计算通过Me 1滤波器的输出能量E (曰),其中是Mel尺度下滤波组的数目,|Υ(1) I2是Mel频率带中第1条谱线信号的能 量,胖。(1)则是与|Υ(1) I2相应的第1条谱线的频率响应函数; (2.3) 进行对数计算和离散余弦变换DCT得到Mel频率倒谱系数Cm:其中,m( σ-0.5)是求DCT变换的公式,Cm是Mel频率倒谱系数。4.根据权利要求书1所述的自适应的韩声信号检测方法,其特征在于,步骤3所述对步 骤2所提取的特征进行聚类,确定韩声和非韩声信号,具体如下: (3.1) 初始化算法,从η个声音事件的d维特征集X= 1x1,…,xn}中选取k个作为聚类中屯、 C=ki,...,ck}; (3.2) 对于每个声音事件的特征xi,计算其隶属函数m(cj|xi)和权重函数w(xi);其中,xi eX,X= {xi,…,χη}表示η个声音事件的d维特征集,m(cj |xi)表示声音事件的特征xi属于聚 类中屯、C北勺比重,W(Xi)表示声音事件的特征XI在重新计算聚类中屯、时的影响程度; (3.3) 对于每个聚类中屯、cj,根据声音事件特征XI的隶属函数和权重函数重新计算位 置,(3.4) 重复步骤(3.2)和步骤(3.3)直至收敛,收敛判断方法是目标函数不再发生变化 即图形曲线上目标函数值趋于稳定,或达到指定迭代次数。
【文档编号】A61B5/00GK105962897SQ201610271099
【公开日】2016年9月28日
【申请日】2016年4月27日
【发明人】洪弘, 顾李萍, 马干军, 杨宇鑫, 顾陈, 李彧晟, 朱晓华
【申请人】南京理工大学