立体声相位参数的编码方法及装置的制造方法
【技术领域】
[0001] 本发明涉及信息技术领域,特别涉及一种立体声相位参数的编码方法及装置。
【背景技术】
[0002] 随着人们物质生活水平的不断提高,人们对音频效果的要求越来越高。与单声道 音频相比,立体声音频具有各声源的方位感和分布感,能够提高音频信息的清晰度,因此立 体声音频可以更好地满足人们对音频效果的需求。
[0003] 目前,获取立体声音频信号时,通过提取Global(全局)参数,根据Global参数恢复 立体声相位信息。其中,Global 参数包括6_110(61<^&1 Inter-Channel Time Difference, 群时延)&G_IPD (Global Inter-Channel Phase Difference,群相位)。
[0004] 然而,通过提取Global参数直接恢复立体声相位信息,提取的G_ITD及G_iro准 确度较低,无法根据G_ITD及G_iro恢复原始立体声相位信息,从而导致立体声音频信息的 效果较差。
【发明内容】
[0005] 本发明实施例提供一种立体声相位参数的编码方法及装置,可以提高立体声音频 信息的效果。
[0006] 本发明实施例采用的技术方案为:
[0007] 第一方面,本发明提实施例供一种立体声相位参数的编码方法,包括:
[0008] 获取当前帧的立体声全局相位参数;
[0009] 确定所述当前帧的立体声全局相位参数的值;
[0010] 根据所述当前帧的立体声全局相位参数的值的确定结果,对所述当前帧的立体声 全局相位参数的值进行调整;
[0011] 对调整后的当前帧的立体声全局相位参数的值进行编码。
[0012] 在第一方面的第一种实现方式中,所述根据所述当前帧的立体声全局相位参数的 值的确定结果,对所述当前帧的立体声全局相位参数的值进行调整具体包括:
[0013] 获取所述当前帧的各个子带的声道间时间差;
[0014] 根据所述当前帧的各个子带的声道间时间差,计算所述当前帧的各个子带的声道 间时间差的绝对值均值;
[0015] 根据所述当前帧的立体声全局相位参数的值的确定结果以及所述当前帧的各个 子带的声道间时间差的绝对值均值,对所述当前帧的立体声全局相位参数的值进行调整。
[0016] 结合第一方面或者第一方面的第一种实现方式,在第一方面的第二种实现方式 中,在所述当前帧不是数据流的第一个数据帧时,所述根据所述当前帧的立体声全局相位 参数的值的确定结果以及所述当前帧的各个子带的声道间时间差的绝对值均值,对所述当 前中贞的立体声全局相位参数的值进行调整前进一步包括:
[0017] 对所述当前帧的各个子带的声道间时间差的绝对值均值进行帧间平滑处理,获取 所述当前帧的各个子带的平滑处理后的声道间时间差的绝对值均值;
[0018] 所述根据所述当前帧的立体声全局相位参数的值的确定结果以及所述当前帧的 各个子带的声道间时间差的绝对值均值,对所述当前帧的立体声全局相位参数的值进行调 整具体包括:
[0019] 根据所述当前帧的立体声全局相位参数的值的确定结果以及所述当前帧的各个 子带的平滑处理后的声道间时间差的绝对值均值,对所述当前帧的立体声全局相位参数的 值进行调整。
[0020] 结合第一方面或者第一方面的第一种实现方式,或者第一方面的第二种实现方 式,在第一方面的第三种实现方式中,所述立体声全局相位参数包括群时延G_ITD参数;
[0021] 所述根据所述当前帧的立体声全局相位参数的值的确定结果以及所述当前帧的 各个子带的平滑处理后的声道间时间差的绝对值均值,对所述当前帧的立体声全局相位参 数的值进行调整包括:
[0022] 在所述当前帧的立体声全局相位参数的值的确定结果为所述G_ITD参数的值不 为〇时,根据所述当前帧的各个子带的平滑处理后的声道间时间差的绝对值均值,对所述 当前帧的G_ITD参数的值进行调整。
[0023] 结合第一方面或者第一方面的第一种实现方式,或者第一方面的第二种实现方 式,或者第一方面的第三种实现方式,在第一方面的第四种实现方式中,所述根据所述当前 帧的各个子带的平滑处理后的声道间时间差的绝对值均值,对所述当前帧的G_ITD参数的 值进行调整具体为:
[0024] 根据公式|6_打0'|=€&(:1\|6_打0|+€&〇2\打0_8111,对所述当前帧的6_几0参数 的值的绝对值进行调整,其中,|G_ITD' I为调整之后的G_ITD参数的值的绝对值,|G_ITD 为G_ITD参数的值的绝对值,ITD_sm为所述当前帧的各个子带的平滑处理后的声道间时间 差的绝对值均值,facl与fac2为平滑因子,并且facl>0, fac2>0, facl+fac2=l。
[0025] 结合第一方面或者第一方面的第一种实现方式,或者第一方面的第二种实现方 式,或者第一方面的第三种实现方式,或者第一方面的第四种实现方式,在第一方面的第五 种实现方式中,fac 1=0. 5。
[0026] 结合第一方面或者第一方面的第一种实现方式,或者第一方面的第二种实现方 式,或者第一方面的第三种实现方式,或者第一方面的第四种实现方式,或者第一方面的第 五种实现方式,在第一方面的第六种实现方式中,所述立体声全局相位参数包括群时延G_ ITD参数和群相位G_IH)参数;
[0027] 所述根据所述当前帧的立体声全局相位参数的值的确定结果以及所述当前帧的 各个子带的平滑处理后的声道间时间差的绝对值均值,对所述当前帧的立体声全局相位参 数的值进行调整包括:
[0028] 在所述当前帧的立体声全局相位参数的值的确定结果为所述G_ITD参数的值为0 时,根据所述当前帧的各个子带的平滑处理后的声道间时间差的绝对值均值,对所述当前 帧的G_IH)参数的值进行调整。
[0029] 结合第一方面或者第一方面的第一种实现方式,或者第一方面的第二种实现方 式,或者第一方面的第三种实现方式,或者第一方面的第四种实现方式,或者第一方面的第 五种实现方式,或者第一方面的第六种实现方式,在第一方面的第七种实现方式中,在所述 当前帧的立体声全局相位参数的值的确定结果为所述G_ITD参数的值为0,且所述当前帧 的G_iro参数的值不为〇时,所述根据所述当前帧的各个子带的平滑处理后的声道间时间 差的绝对值均值,对所述当前帧的G_iro参数的值进行调整具体包括:
[0030] 根据公式 I G_IPD' I =fac3 X I G_IPD I +fac4 X IPD_sm,对所述 G_IPD 参数的值的 绝对值进行调整,其中,|G_IPD' I为调整之后的G_iro参数的值的绝对值,|G_IPD|为6_ Iro参数的值的绝对值,fac3与fac4为平滑因子,并且fac3>0, fac4>0, fac3+fac4=l, 2πΚ χ ITD sm IPD sm=吓丁匕四,FFT_LEN为变换长度,K为频点值,ITD_sm为所述当前帧的各 个子带的平滑处理后的声道间时间差的绝对值均值,IPD_sm为所述当前帧的各个子带的平 滑处理后的声道间相位差的绝对值均值。
[0031] 结合第一方面或者第一方面的第一种实现方式,或者第一方面的第二种实现方 式,或者第一方面的第三种实现方式,或者第一方面的第四种实现方式,或者第一方面的第 五种实现方式,或者第一方面的第六种实现方式,或者第一方面的第七种实现方式,在第一 方面的第八种实现方式中,fac3=0. 75。
[0032] 结合第一方面或者第一方面的第一种实现方式,或者第一方面的第二种实现方 式,或者第一方面的第三种实现方式,或者第一方面的第四种实现方式,或者第一方面的第 五种实现方式,或者第一方面的第六种实现方式,或者第一方面的第七种实现方式,或者第 一方面的第八种实现方式,在第一方面的第九种实现方式中,在所述当前帧的立体声全局 相位参数的值的确定结果为所述G_ITD参数的值为0,且所述当前帧的G_IH)参数的值为 〇时,所述根据所述当前帧的各个子带的平滑处理后的声道间时间差的绝对值均值,对所述 当前帧的G_IH)参数的值进行调整具体包括:
[0033] 将所述当前帧的各个子带的平滑处理后的声道间相位差的绝对值均值作为所述 当前帧的G_iro参数的绝对值,将所述当前帧的前一帧的G_iro参数的符号作为所述当前 帧的G_iro参数的符号。
[0034] 结合第一方面或者第一方面的第一种实现方式,或者第一方面的第二种实现方 式,或者第一方面的第三种实现方式,或者第一方面的第四种实现方式,或者第一方面的第 五种实现方式,或者第一方面的第六种实现方式,或者第一方面的第七种实现方式,或者第 一方面的第八种实现方式,或者第一方面的第九种实现方式,在第一方面的第十种实现方 式中,所述对所述当前帧的各个子带的声道间时间差的绝对值均值进行帧间平滑处理,获 取所述当前帧的各个子带的平滑处理后的声道间时间差的绝对值均值包括:
[0035] 根据公式 ITD_sm (k) =f ac5 X ITD_sm (k-1) +f ac6 X ITD 进行帧间平滑处理,其中, ITD_sm(k)为所述当前帧的各个子带的平滑处理后的声道间时间差的绝对值均值,ITD_ sm(k-l)为所述当前帧的前一帧的各个子带的平滑处理后的声道间时间差的绝对值均值, fac5 与 fac6 为平滑因子,并且 fac5>0, fac6>0, fac5+fac6=l。
[0036] 结合第一方面或者第一方面的第一种实现方式,或者第一方面的第二种实现方 式,或者第一方面的第三种实现方式,或者第一方面的第四种实现方式,或者第一方面的第 五种实现方式,或者第一方面的第六种实现方式,或者第一方面的第七种实现方式,或者第 一方面的第八种实现方式,或者第一方面的第九种实现方式,或者第一方面的第十种实现 方式,在第一方面的第i 种实现方式中,fac5=0. 9844。
[0037] 第二方面,本发明实施例提供一种立体声相位参数的编码装置,包括:
[0038] 获取单元,用于获取当前帧的立体声全局相位参数;
[0039] 确定单元,用于确定所述获取单元获取的所述当前帧的立体声全局相位参数的 值;
[0040] 调整单元,用于根据所述确定单元确定的所述当前帧的立体声全局相位参数的值 的确定结果,对所述当前帧的立体声全局相位参数的值进行调整;
[0041] 编码单元,用于对所述调整单元调整后的当前帧的立体声全局相位参数的值进行 编码。
[0042] 在第二方面的第一种实现方式中,所述调整单元包括:
[0043] 获取模块,用于获取所述当前帧的各个子带的声道间时间差;
[0044] 计算模块,用于根据所述获取模块获取的所述当前帧的各个子带的声道间时间 差,计算所述当前帧的各个子带的声道间时间差的绝对值均值;
[0045] 调整模块,用于根据所述当前帧的立体声全局相位参数的值的确定结果以及所述 计算模块计算的所述当前帧的各个子带的声道间时间差的绝对值均值,对所述当前帧的立 体声全局相位参数的值进行调整。
[0046] 结合第二方面或者第二方面的第一种实现方式,在第二方面的第二种实现方式 中,所述调整单元还包括:
[0047] 处理模块,用于对所述计算模块计算的所述当前帧的各个子带的声