图像处理的方法和装置的制造方法
【技术领域】
[0001]本公开涉及图像处理领域,尤其涉及一种图像处理的方法和装置。
【背景技术】
[0002]人脸识别是基于人的脸部特征信息进行身份识别的一种生物识别技术。利用人脸识别技术,能够识别照片中的人物身份,并根据照片中的人物身份将属于同一个人的照片归类到一个簇中。
[0003]在人脸识别的过程中,可以采用层次聚类算法判断两个人脸是否属于同一个人:计算两个人脸图像对应的人脸特征向量之间的距离;比较计算出的距离与距离阈值的大小;若计算出的阈值不大于距离阈值,则判定两个人脸图像属于同一个人;若计算出的阈值大于距离阈值,则判定两个人脸图像不属于同一个人。
[0004]但是,当出现照片中的人脸姿态、表情、光照等条件不同的情况时,同一个人的人脸特征向量之间相似度较低(即距离较远),层次聚类算法很容易判定两个人脸不属于同一个人,从而将属于同一个人的两张照片归类到不同的簇中,导致聚类的召回率(归类到一个簇中的照片数量/属于同一个人的照片数量)和压缩率(I/属于同一个人的照片归类到的簇数)较低。
【发明内容】
[0005]为克服相关技术中存在聚类的召回率和压缩率较低的问题,本公开提供一种图像处理的方法和装置。
[0006]根据本公开实施例的第一方面,提供一种图像处理的方法,包括:
[0007]获取至少两个聚类集合,所述至少两个聚类集合包括第一聚类集合和第二聚类集合,所述第一聚类集合为具有标识信息的所述聚类集合,所述第二聚类集合为不具有所述标识信息的所述聚类集合,每个所述聚类集合均包括至少一幅人脸图像,且同一个所述聚类集合中的各幅人脸图像之间的距离不大于第一设定阈值;
[0008]确定所述第二聚类集合与所述第一聚类集合之间的距离;
[0009]将距离不大于第二设定阈值的所述第二聚类集合和所述第一聚类集合合并,所述第二设定阈值大于所述第一设定阈值。
[0010]通过将具有标识信息的聚类集合中的各幅人脸图像之间的距离从第一设定阈值增大到第二设定阈值,利用用户关注的人的人脸图像在所有人脸图像中所占比例高的特点,使用户关注的人的聚类集合具有标识信息,在对聚类的准确率影响较小的情况下,增大归类为具有标识信息的聚类集合的概率,避免由于人脸姿态、表情、光照等条件不同造成将属于同一个人的两张照片归类到不同的簇中,提高了聚类的召回率(归类到一个簇中的照片数量/属于同一个人的照片数量)和压缩率(I/属于同一个人的照片归类到的簇数)。
[0011]在第一方面一种可能的实现方式中,所述确定所述第二聚类集合与所述第一聚类集合之间的距离,包括:
[0012]计算所述第一聚类集合中的各幅人脸图像与所述第二聚类集合中的各幅人脸图像之间的距离;
[0013]根据计算出的所有距离,确定所述第一聚类集合与所述第二聚类集合之间的距离。
[0014]通过计算第一聚类集合中的各幅人脸图像与第二聚类集合中的各幅人脸图像之间的距离,实现确定第一聚类集合与第二聚类集合之间的距离。
[0015]可选地,所述计算所述第一聚类集合中的各幅人脸图像与所述第二聚类集合中的各幅人脸图像之间的距离,包括:
[0016]分别提取所述第一聚类集合中的一幅人脸图像的纹理特征值、以及所述第二聚类集合中的一幅人脸图像的纹理特征值;
[0017]根据提取的所述纹理特征值,计算所述第一聚类集合中的一幅人脸图像与所述第二聚类集合中的一幅人脸图像之间的距离。
[0018]通过目前常用的纹理特征值确定人脸图像之间的距离,实现算法成熟,准确率高。
[0019]可选地,所述根据计算出的所有距离,确定所述第一聚类集合与所述第二聚类集合之间的距离,包括:
[0020]选择计算出的所有距离中的最小值,作为所述第一聚类集合与所述第二聚类集合之间的距离;
[0021]或者,
[0022]选择计算出的所有距离的平均值,作为所述第一聚类集合与所述第二聚类集合之间的距离;
[0023]或者,
[0024]选择计算出的所有距离中的最大值,作为所述第一聚类集合与所述第二聚类集合之间的距离。
[0025]根据实际情况,选择不同的距离作为第一聚类集合与第二聚类集合之间的距离。
[0026]在第一方面另一种可能的实现方式中,当所述至少两个聚类集合包括至少两个所述第一聚类集合时,所述将距离不大于第二设定阈值的所述第二聚类集合和所述第一聚类集合合并,包括:
[0027]当所述第二聚类集合与第三聚类集合之间的距离不大于所述第二设定阈值,且所述第二聚类集合与第四聚类集合之间的距离大于所述第二设定阈值时,将所述第二聚类集合与所述第三聚类集合合并,所述第三聚类集合为所述至少两个所述第一聚类集合中的任意一个,所述第四聚类集合包括所述至少两个所述第一聚类集合中,除所述第三聚类集合之外的所有所述聚类集合。
[0028]将判断两个聚类集合是否合并的标准从第一设定阈值增加到第二设定阈值,可能会造成将不是同一个人的两个聚类集合合并为一个聚类集合的问题,虽然利用用户关注的人的人脸图像在所有人脸图像中所占比例高的特点,使用户关注的人的聚类集合成为第一聚类集合(具有标识信息),仅对第一聚类集合将合并标准增加到第二设定阈值,可以降低将不是同一个人的两个聚类集合合并为一个聚类集合的可能性,但还是可能会造成聚类的准确性降低。上述实现方式通过进一步将条件限定为一个所述第二聚类集合与一个所述第一聚类集合之间的距离不大于所述第二设定阈值,且与其它所述第一聚类集合之间的距离大于所述第二设定阈值,可以进一步降低将不是同一个人的两个聚类集合合并为一个聚类集合的可能性。而且一个第二聚类集合只与一个第一聚类集合之间的距离不大于第二设定阈值,说明这个第一聚类集合跟其中一个第一聚类集合的相似度是比较高的,很可能是由于人脸姿态、表情、光照等条件不同造成两者的距离大于第一设定阈值,此时将两者合并,既提高了聚类的召回率和压缩率,还可以将降低聚类的准确率的可能性降到最低。
[0029]在第一方面又一种可能的实现方式中,所述方法还包括:
[0030]输出若干所述聚类集合;
[0031 ]接收对应所述聚类集合输入的所述标识信息,输入所述标识信息的所述聚类集合成为所述第一聚类集合。
[0032]通过输出聚类集合供用户选择,并接收用户对应聚类集合输入的标识信息,使用户关注的人的聚类集合具有标识信息,即成为第一聚类集合。
[0033]可选地,所述输出若干所述聚类集合,包括:
[0034]获取至少两个所述聚类集合;
[0035]计算各个所述聚类集合之间的距离;
[0036]当两个所述聚类集合之间的距离不大于所述第一设定阈值时,将两个所述聚类集合合并,并判断合并后的所述聚类集合是否需要再次合并;
[0037]当各个所述聚类集合两两之间的距离均大于所述第一设定阈值时,将当前的若干所述聚类集合输出。
[0038]先对人脸图像以第一设定阈值为判断标准进行聚类,提高聚类的准确性。
[0039]根据本公开实施例的第二方面,提供一种图像处理的装置,包括:
[0040]获取模块,用于获取至少两个聚类集合,所述至少两个聚类集合包括第一聚类集合和第二聚类集合,所述第一聚类集合为具有标识信息的所述聚类集合,所述第二聚类集合为不具有所述标识信息的所述聚类集合,每个所述聚类集合均包括至少一幅人脸图像,且同一个所述聚类集合中的各幅人脸图像之间的距离不大于第一设定阈值;
[0041]确定模块,用于确定所述第二聚类集合与所述第一聚类集合之间的距离;
[0042]合并模块,用于将距离不大于第二设定阈值的所述第二聚类集合和所述第一聚类集合合并,所述第二设定阈值大于所述第一设定阈值。
[0043]在第二方面一种可能的实现方式中,所述确定模块包括:
[0044]第一计算子模块,用于计算所述第一聚类集合中的各幅人脸图像与所述第二聚类集合中的各幅人脸图像之间的距离;
[0045]确定子模块,用于根据计算出的所有距离,确定所述第一聚类集合与所述第二聚类集合之间的距离。
[0046]可选地,所述第一计算子模块用于,
[0047]分别提取所述第一聚类集合中的一幅人脸图像的纹理特征值、以及所述第二聚类集合中的一幅人脸图像的纹理特征值;
[0048]根据提取的所述纹理特征值,计算所述第一聚类集合中的一幅人脸图像与所述第二聚类集合中的一幅人脸图像之间的距离。
[0049]可选地,所述确定子模块用于,
[0050]选择计算出的所有距离中的最小值,作为所述第一聚类集合与所述第二聚类集合之间的距离;
[0051]或者,
[0052]选择计算出的所有距离的平均值,作为所述第一聚类集合与所述第二聚类集合之间的距离;
[0053]或者,
[0054]选择计算出的所有距离中的最大值,作为所述第一聚类集合与所述第二聚类集合之间的距离。
[0055]在第二方面另一种可能的实现方式中,所述合并模块用于,
[0056]当所述至少两个聚类集合包括至少两个所述第一聚类集合时,若所述第二聚类集合与第三聚类集合之间的距离不大于所述第二设定阈值,且所述第二聚类集合与第四聚类集合之间的距离大于所述第二设定阈值,则将所述第二聚类集合与所述第三聚类集合合并,所述第三聚类集合为所述至少两个所述第一聚类集合中的任意一个,所述第四聚类集合包括所述至少两个所述第一聚类集合中,除所述第三聚类集合之外的所有所述聚类集入口 ο
[0057]在第二方面又一种可能的实现方式中,所述装置还包括:
[0058]输出模块,用于输出若干所述聚类集合;
[0059]接收模块,用于接收对应所述聚类集合输入的所述标识信息,输入所述标识信息的所述聚类集合成为所述第一聚类集合。
[0060]可选地,所述输出模块包括:
[0061 ]获取子模块,用于获取至少两个所述聚类集合;
[0062]第二计算子模块,用于计算各个所述聚类集合之间的距离;
[0063]合并子模块,用于当两个所述聚类集合之间的距离不大于所述第一设定阈值时,将两个所述聚类集合合并,并判断合并后的所述聚类集合是否需要再次合并;
[0064]输出子模块,用于当各个所述聚类集合两两之间的距离均大于所述第一设定阈值时,将当前的若干所述聚类集合输出。
[0065]根据本公开实施例的第三方面,提供一种图像处理的装置,包括:
[0066]处理器;
[0067]用于存储处理器可执行指令的存储器;
[0068]其中,所述处理器被配置为:
[0069]获取至少两个聚类集合,所