优先权约束的彩色图像稀疏表示修复方法
【专利摘要】本发明公开了一种优先权约束的彩色图像稀疏表示修复方法,按如下步骤进行:第一步:将彩色图像由RGB颜色空间映射到YUV颜色空间,对三层分量分别进行修复;第二步:利用Fast?ICA算法训练获得过完备字典;第三步:计算待修复图像破损区域的边缘所有点的优先权,确定修复的优先顺序;第四步:结合SL0算法对破损块进行稀疏重构;第五步:更新边缘并重复第三步、第四步,直至图像完成修复。本发明方法修复图像质量高,修复图像的边缘结构具有较好的连续性,又能保持图像的整体性。
【专利说明】
优先权约束的彩色图像稀疏表示修复方法
技术领域
[0001] 本发明属于数字图像修复技术领域,具体涉及图像修复技术中的优先权约束的彩 色图像稀疏表示修复方法。
【背景技术】
[0002] 目前彩色图像的修复主要基于将灰度图像的修复方法直接扩展到彩色图像的RGB 三个分量中分别修复。传统的灰度图像修复方法分为两类:一类是基于偏微分方程的方法。 该方法本质上根据等照度线方向进行信息的扩散,修复效果贴近人的视觉感受,但是该方 法只能修复破损块较小的图像。另一类是基于纹理合成的方法。该方法是在未破损区域寻 找最佳匹配块替换待修复块,当找不到匹配块时就会产生错误匹配。虽然目前对该方法进 行了较多的改进,但还是会出现错误的匹配和加权图像块过多带来的模糊。最近,一种新的 图像稀疏表示方法在图像处理领域得到重视,许多学者将稀疏理论运用到图像修复的方法 中。
【发明内容】
[0003] 在研究中发现,RGB颜色模型三通道间的相关性以及其结构复杂性导致修复效果 的不理想。图像修复过程中较少考虑修复块的优先顺序会使得结构边缘修复效果不理想。 为了较好地修复彩色图像,本发明将彩色图像从RGB空间映射到YUV空间进行修复,并且利 用优先权函数来决定破损块的修复顺序。结合Fast-ICA算法训练字典和稀疏表示的优点, 本发明提供了一种优先权约束的彩色图像稀疏表示修复技术。
[0004] 本发明采取以下技术方案:优先权约束的彩色图像稀疏表示修复方法,将彩色图 像从RGB颜色空间映射到YUV颜色空间分层进行修复;利用Fast-ICA算法训练过完备字典; 通过重新定义梯度的表达式,优化了优先权的计算,使得结构部分优先被修复,并采用平滑 1〇范数(SL0)算法来进行稀疏重构,以此保证结构边缘修复的连续性;按如下步骤进行:
[0005] 第一步:将彩色图像由RGB颜色空间映射到YUV颜色空间,对三层分量分别进行修 复;
[0006] 第二步:利用Fast-ICA算法训练获得过完备字典;
[0007] 第三步:计算待修复图像破损区域的边缘所有点的优先权,确定修复的优先顺序;
[0008] 第四步:结合已有的SL0算法对破损块进行稀疏重构,具体实现过程如下:
[0009] (1)设置初始值全〇 初始余量r〇 = 0,函数的初始参数〇 = 1;其中DT为 字典D的转置,Y为待重构信号。
[0010] (2)计算最优值搜索方向
;其 中函数
,^是父的分量。74(1)是函 数Fa(X)在各个分量上的偏导,_\_ =尤.!,〖=1,2,3? S
[0011] (3)阻尼牛顿法X=X+wl,ii为步长因子,在本发明中y = l;
[0012] ⑷利用投影梯度可得X=X-DT(DDT)-1(DX-Y),同时计算余量r = Y-DX;
[0013] (5)当相邻2次迭代的余量满足I Ir-rol |2<e时,执行下一步,取e = 0.01;否则,令 r〇 = r,继续执行步骤(2)到(4)。
[0014] (6)进一步减小参数〇的值。当〇>10-2时,令〇 =伽(〇<0<1,一般0取0.7),r〇 = 0, 返回步骤(2);否则,停止迭代,得到最优值f i。
[0015]第五步:更新边缘并重复第三步、第四步,直至图像完成修复。
[0016] 优选的,第一步:先利用RGB颜色模型与YUV颜色模型之间的转化公式,将图像从 RGB空间映射到YUV空间。为了克服RGB颜色模型三通道间的相关性以及其结构复杂性导致 修复效果的不理想,本发明在YUV颜色空间对破损图像进行修复。YUV模型是用亮度和色度 来表示颜色信息,其中,Y表示亮度,U和V表示色度,三分量之间彼此相互独立。YUV模型中的 亮度Y与RGB模型中的R、G、B三个颜色分量的转换关系可以表示为:
[0017] Y = 0.3R+0.59G+0.11B (1)
[0018] 色度信息U和V是由B-Y、R_Y按照不同的比例混合而成的,Ga_a校准之后其模型之 间的转化公式为: ~rl [0.299 0.587 0.114 JR
[0019] U = -0J47 -0*2:89 0.436 G (2) r」1_0,6:1.5 0.51.5 -0,100 知
[0020] 优选的,第二步:利用Fast-ICA算法训练字典。为了提高重构精度,降低字典训练 计算的复杂度,保证训练字典的过完备性,便于扩展完备字典使其具体灵活性,同时还能改 善因字典原子间的互相干性导致边界稀疏修复的不理想现象。本发明采用Fast-ICA算法来 实现字典训练:假设一组信号父={幻#,"1}为另外一组信号3={> 1,82,'"~}的观测值。 设信号X中的第i个值可以由信号的S中的n个独立分量线性混合而成:
[0021] xi = aiisi+ai2S2+."+ainsn i = l,2,…,j (3)
[0022]其中,m,a2, "_an为混合矩阵A的元素。因此,式⑶可改写成:
[0023] X=AS (4)
[0024] 其中,混合矩阵A和源信号S都是未知的,Fast-ICA方法的目的就是估计出混合矩 阵S,通过混合矩阵A的逆矩阵,得到一个分解矩阵W,使得Y = WX。由此得到的信号Y就是源信 号S的估计值。
[0025]算法具体实现步骤:
[0026] (a)提取的图像块组成一个nXn观测矩阵x,并进行去中心化处理,
[0027] (b)利用已有的Fast-ICA方法,计算观测矩阵x在mXm维度下的特征向量E和特征 值对角矩阵D,其中n>m;
[0028] (c)利用特征值向量E和特征值对角矩阵D,对观测矩阵5白化处理,^ ^
[0029 ] (d)选择一个单位范数的初始化向量Wi;
[0030] (6)更新%<-£!处令.;幻丨-£-丨公?:^:,并进行标准化化-化/||界 1||;其中£ { ? }表示求均值,向量wf为向量Wi的转置,I |wi| I表示求模值,g( ?)为非二次函数。
[0031] (f)若尚未收敛返回步骤(e);
[0032] (g)当i小于需要估计分量的个数m,重复步骤(d)-(f),得到一个mXm的分离矩阵 I
[0033] 在本发明中,非二次函数为奸= ve #,y为函数变量。
[0034]优选的,第三步:为了使结构边缘的修复更具有连贯性,采用优先权函数来决定待 修复区域的修复顺序,为了保证边缘能够优先修复,提高其可靠性。通过改进梯度表示方 式,使其能得到更多的边缘信息,增大数据项D(p)的权重,使得边缘信息更加容易被优先修 复。优先权的计算:待修复图像1,〇为图像未破损区域,Q为图像破损区域,%是修复边界 以点P为中心的待修复块。其优先权定义如下:
[0035] P(p)=C(p) ? D(p) (5)
[0036] 其中,C(p)为置信项;D(p)为数据项,分别按式(6)和式(8)定义。
(6)
[0038]初始时,函数C(p)定义为: v [0 V/?eO
[0039] C(办= (7)
[1 V/; e I - Q
[0040] 其中,|%|是待修复块的面积,q是待修复块中已知像素的点。
(8)
[0042]其中,是p点梯度方向的垂直方向,也就是等照线方向,nP是p点的法向量,0为 归一化因子。
[0043]若设p点处的梯度表示为:
[0044] VI = [/.,,/,.] (9)
[0045] 其中,Ix,Iy分别为x,y方向的偏导。在传统方法中,梯度都是基于欧式距离来进行 表不:
[0046] |vi| = (/: + /:): (1〇)
[0047] 在本发明采用式(11)所示的改进的表示方式:
[0048] |¥1| = |4| + |^| (11)
[0049] 优选的,第四步:由于平滑1〇范数(SL0)算法具有不需要事先估计信号的稀疏度, 重构精度高等优点。因此,采用已有的SL0算法来完成稀疏重构。具体实现过程如下:
[0051] (2)计算最优值搜索方向 :其
[0050] (1)设置初始值;〇二zy ) 1 .,初始余量r〇 = 〇,函数的初始参数〇 = 1;其中DT 为字典D的转置,Y为待重构信号。
中函数
,Xl是X的分量。▽&(%}是函 数Fa⑴在各个分量上的偏导,,/ = 1,2,3…S。
[0052] (3)阻尼牛顿法X=X+wl,ii为步长因子,在本发明中y = l;
[0053] (4)利用投影梯度可得X=X = DT(DDT)-HDX-Y),同时计算余量r = Y_DX;
[0054] (5)当相邻2次迭代的余量满足I |r-r〇| |2<£时,执行下一步,取e = 0.01;否则,令 r〇 = r,继续执行步骤(2)到(4)。
[0055] (6)进一步减小参数〇的值。当〇>10-2时,令〇 =伽(〇<0<1,一般0取0.7),r〇 = 0, 返回步骤(2);否则,停止迭代,得到最优值
[0056]本发明从考虑结构整体连续性的角度,公开了一种利用YUV颜色空间模型,结合优 先权约束和块稀疏表示的图像修复方法。该修复方法按如下步骤:第一步:将破损的彩色图 像由RGB颜色空间映射到YUV颜色空间,对三层分量分别进行修复;第二步:利用Fast-ICA算 法训练获得过完备字典;第三步:计算待修复图像破损区域的边缘所有点的优先权,确定修 复的优先顺序;第四步:结合平滑1〇范数(SL0)算法对破损块进行稀疏重构;第五步:更新边 缘并重复三四步骤直至图像完成修复。本发明与传统彩色图像修复算法相比,具有如下优 点:本发明方法修复图像质量高,修复图像的边缘结构具有较好的连续性,又能保持图像的 整体性。
【附图说明】
[0057]图1为本发明的流程框图。
[0058]图2为Lena彩色图像的YUV空间分量图。
[0059]图3为Y、U、V分量的训练字典。
[0060]图4为修复优先权的原理框图。
[0061]图5为图像的梯度图。
[0062 ]图6为本发明对破损s tone图像的修复效果的比较。
[0063]图7为本发明对彩色Lena破损图像修复效果的比较。
[0064]图8为本发明对彩色baboon破损图像修复效果的比较。
[0065]图9为本发明文字移除效果比较。
【具体实施方式】
[0066]下面结合附图对本发明优选实施例作详细说明。
[0067]在本实施例中,图1给出了本发明的流程图。
[0068]第一步:先利用RGB颜色模型与YUV颜色模型之间的转化公式,将图像从RGB空间映 射到YUV空间。YUV模型是用亮度和色度来表示颜色信息,其中,Y表示亮度,U和V表示色度, 三分量之间彼此相互独立。YUV模型中的亮度Y与RGB模型中的R,G,B三个颜色分量的转换关 系可以表示为:
[0069] Y = 0.3R+0.59G+0.11B (1)
[0070] 色度信息U和V是由B-Y、R-Y按照不同的比例混合而成的,Ga_a校准之后其模型之 间的转化公式为: ~Y~ [0.299 0.587 0.114 JR
[0071] U = -0J47 - 0.289 0,436 G (2) v\ L〇.615 0.515 -0.100 j_B
[0072]图1给出Lena彩色图像的YUV三分量图。
[0073] 第二步:利用Fast-ICA算法训练字典。为了提高重构精度,降低字典训练计算的复 杂度,保证训练字典的过完备性,便于扩展完备字典使其具体灵活性,同时还能改善因字典 原子间的互相干性导致边界稀疏修复的不理想现象。本发明采用Fast-ICA算法来实现字典 训练:假设一组信号父=& 1^,~&}为另外一组信号5={81,82^ 11}的观测值。设信号父中 的第i个值可以由信号的S中的n个独立分量线性混合而成:
[0074] xi = aiisi+ai2S2+---+ainSn i = l -, j (3)
[0075]其中,m,a2, "_an为混合矩阵A的元素。因此,式(3)可改写成:
[0076] X=AS (4)
[0077] 其中,混合矩阵A和源信号S都是未知的,Fast-ICA方法的目的就是估计出混合矩 阵S,通过混合矩阵A的逆矩阵,得到一个分解矩阵W,使得Y = WX。由此得到的信号Y就是源信 号S的估计值。
[0078]算法具体实现步骤:
[0079] (a)提取的图像块组成一个nXn观测矩阵x,并进行去中心化处理x;
[0080] (b)利用已有的Fast-ICA方法,计算观测矩阵$在mXm维度下的特征向量E和特征 值对角矩阵D,其中n>m;
[0081] (c)利用特征值向量E和特征值对角矩阵D,对观测矩阵^白化处理J ;
[0082 ] (d)选择一个单位范数的初始化向量Wi;
[0083] (e)更新$ f £{々(d)丨'-五,并进行标准化Wi-Wi/| | Wi | | ;其中E { ? }表示求均值,向量<为向量wi的转置,| |wi| |表示求模值,g( ?)为非二次函数。
[0084] (f)若尚未收敛返回步骤(e);
[0085] (g)当i小于需要估计分量的个数m,重复步骤(d)-(f),得到一个mXm的分离矩阵 I
[0086] 在本发明中,非二次函数为容⑴=_v,e-々.,y为函数变量。图3为Y,U,V分量的字典。
[0087] 第三步:为了使结构边缘的修复更具有连贯性,采用优先权函数来决定待修复区 域的修复顺序,为了保证边缘能够优先修复,提高其可靠性。通过改进梯度表示方式,使其 能得到更多的边缘信息,增大数据项D(p)的权重,使得边缘信息更加容易被优先修复。优先 权的计算:待修复图像1,〇为图像未破损区域,Q为图像破损区域,%是修复边界以点p为 中心的待修复块。其优先权定义如下:
[0088] P(p)=C(p) ? D(p) (5)
[0089] 其中,C(p)为置信项;D(p)为数据项,分别按式(6)和式(8)定义。
(6)
[0091] 初始时,函数C(p)定义为: f〇 Vp e Q 心
[0092] C(p) = \ J (7)
[1 vp g / - Q
[0093]其中,|%|是待修复块的面积,q是待修复块中已知像素的点。
(8)
[0095]其中,是p点梯度方向的垂直方向,也就是等照线方向,nP是p点的法向量,0为 归一化因子。
[0096]若设p点处的梯度表示为:
[0097] V! =[/,,/,] (9)
[0098]其中,Ix,Iy分别为x,y方向的偏导。在传统方法中,梯度都是基于欧式距离来进行 表不:
[0099] |vi| = (/v2+ /,;)- (10)
[0100] 在本发明采用式(11)所示的改进的表示方式:
[0101] !vi| = |/v|+|/r| (11)
[0102] 图5为图像的梯度图。可以看出,本发明的梯度表示方法相比于传统方法可以得到 更多的结构信息。由于光照线强度决定了数据项D(p)的大小,从图5中可以看出图像线性结 构部分的光照线强度明显比传统方法的强。因此,采用此种表达式提高了数据项D(p)的权 重,使结构部分比较容易优先得到修复,从而提高图像纹理细节部分修复效果。
[0103] 第四步:由于平滑1〇范数(SL0)算法具有不需要事先估计信号的稀疏度,重构精度 高等优点。因此,采用已有的SL0算法来完成稀疏重构。具体实现过程如下:
[0104] (1)设置初始值.Y? = /y ;) 7 .,:初始余量r〇 = 〇,函数的初始参数0 = 1;其中DT
为字典D的转置,Y为待重构信号。
[0105] (2)计算最优值搜索方向 ;:其 中函数
x^X的分量。W;(Z)是函 数Fa(X)在各个分量上的偏导,I =免.,,/ = 1,2,3…S c
[0106] (3)阻尼牛顿法X=X+iid,ii为步长因子,在本发明中ii = l;
[0107] (4)利用投影梯度可得同时计算余量r = Y_DX;
[0108] (5)当相邻2次迭代的余量满足I |r-r〇| |2<£时,执行下一步,取e = 0.01;否则,令 r〇 = r,继续执行步骤(2)到(4)。
[0109] (6)进一步减小参数〇的值。当〇>10-2时,令〇 =伽(〇<0<1,一般0取0.7),r〇 = 0, 返回步骤(2);否则,停止迭代,得到最优值| = x。
[0110] 第五步:更新边缘并重复第三、四步骤直至图像完成修复。
[0111] 为了检验本发明算法的修复效果,对图像进行了模拟仿真,并与其它相关修复算 法进行了对比实验。仿真实验在MATLAB环境下进行。在对图像修复效果评时,除了采用主观 评价外,同时也采用峰值信噪比(PSNR)进行客观评价。
[0112] 图6为本发明对破损stone图像的修复效果的比较。四种算法对stone线条破损图 像的修复效果以及各算法的中间修复结果。由图中可以看出,四种算法都能完成对线条破 损的修复。但结构张量填充修复法 [1]和Fast-ICA训练掩膜法[2]在修复区域的中间部分出现 了颜色断层的现象。其原因是由于结构张量填充修复法 [1]和Fast-ICA训练掩膜法[2]在修复 过程直接利用掩膜方式确定修复块,未考虑图像的结构信息,导致纹理上缺少连续性。在 YUV空间中,其U、V分量主要是色度信息,其中的结构信息较少。因此,在U、V层分量的修复 上,修复效果较好,使得整体的修复效果有了较大的提高,但在Y分量上的修复效果仍然不 理想。不完整信号稀疏重建法 [3]引入优先权约束图像块的修复顺序,但其优先级函数不能 确保结构部分优先得到修复,导致边缘出现断裂的现象。本发明算法改进优先级函数,从图 6可以看出,本发明算法修复的图像更加自然和谐。
[0113] 图7为本发明算法对彩色Lena破损图像修复效果的比较。四种算法对平滑区域的 修复,都可以满足人眼的视觉要求。但在纹理细节方面,结构张量填充修复法 [1]和Fast-ICA 训练掩膜法[2]的修复都有待改进,在右上角破损区域的修复,都出现了颜色的延伸情况;在 肩膀的部分的修复,结构张量填充修复法 [1]和Fast-ICA训练掩膜法[2]的修复出现了边缘的 断裂,在帽子部分也出现了边缘不连接的情况;在眉毛的修复部分,结构张量填充修复法 [1] 和Fast-ICA训练掩膜法[2]的修复使延伸段的眉毛产生了模糊。不完整信号稀疏重建法[3]在 帽子部分修复较好,但在右上角部分和肩膀部分出现了结构不连续的现象。从图7(f)可以 看出,本发明算法在修复肩膀、眉毛、帽子的边缘有较好的修复效果。
[0114] 图8为本发明对彩色baboon破损图像修复效果的比较。从修复结果可以看出,结构 张量填充修复法[1]、? &^-扣4训练掩膜法[2]和不完整信号稀疏重建法[3]在鼻子平滑部分的 修复效果较好。但在修复鼻子边缘时,结构张量填充修复法 [1]出现了不连贯,结构的连续性 被破坏;Fast-ICA训练掩膜法[2]出现了颜色的延伸现象,在一些边缘部分出现了边缘断裂 的情况,修复痕迹较为明显。不完整信号稀疏重建法 [3]在脸颊线条修复时产生了边缘断裂 的现象,在毛发修复上修复痕迹较为明显。由于眼睛具有复杂的纹理和较强的边缘,结构张 量填充修复法[1]、Fast_ICA训练掩膜法[2]和不完整信号稀疏重建法[3]修复效果较差。本发 明不论在平滑部分和边缘部分都有较好的修复效果,在眼睛部分的修复也能基本符合人眼 的视觉效果。
[0115] 图9为本发明文字移除效果比较。四种算法对于文字移除都有较好的修复效果。但 结构张量填充修复法[1]和Fast-ICA训练掩膜法 [2]在边界修复上会有颜色延伸的现象,有明 显的修复痕迹,不完整信号稀疏重建法[3]在修复的边缘部分出现了不连续的现象,而本发 明在边界上有较好的修复效果。
[0116] 注释:
[0117] [1]结构张量填充修复法是指文献Filip〇vi6M,Kopriva I,Cichocki A.Inpainting color images in learned dictionary[C]//SignalProcessing Conference(EUSIPCO),2012Proceedings of the 20th European.IEEE,2012:66-70.
[0118] [2]Fast_ICA 训练掩膜法是指文献 Filip〇\'i6V[,Kopriva I .A comparison of dictionary based approaches to inpainting and denoising with an emphasis to independent component analysis learned dictionaries[J].Inverse Probl.Imaging, 2011,5(4):815-841.
[0119] [3]不完整信号稀疏重建法是指文献是指文献Xu Z,Sun J. Image inpainting by patch propagation using patch sparsity[J].Image Processing,IEEE Transactions on,2010,19(5):1153-1165.
[0120]以上对本发明的优选实施例及原理进行了详细说明,对本领域的普通技术人员而 言,依据本发明提供的思想,在【具体实施方式】上会有改变之处,而这些改变也应视为本发明 的保护范围。
【主权项】
1. 优先权约束的彩色图像稀疏表示修复方法,其特征是按如下步骤进行: 第一步:将彩色图像由RGB颜色空间映射到YUV颜色空间,对S层分量分别进行修复; 第二步:利用化St-ICA算法训练获得过完备字典; 第=步:计算待修复图像破损区域的边缘所有点的优先权,确定修复的优先顺序; 第四步:结合化O算法对破损块进行稀疏重构; 第五步:更新边缘并重复第=步、第四步,直至图像完成修复。2. 如权利要求1所述优先权约束的彩色图像稀疏表示修复方法,其特征是: 第一步:先利用RGB颜色模型与YUV颜色模型之间的转化公式,将图像从RGB空间映射到 YUV空间;YUV颜色模型是用亮度和色度来表示颜色信息,其中,Y表示亮度,U和V表示色度, S分量之间彼此相互独立;YUV模型中的亮度Y与RGB模型中的R、G、BS个颜色分量的转换关 系表不为: Y = 0.3R+0.59G+0.11B (1) 色度信息U和V是由B-Y、R-Y按照不同的比例混合而成的,Gamma校准之后模型之间的转 化公式为:(2)c3. 如权利要求2所述优先权约束的彩色图像稀疏表示修复方法,其特征是:第二步:假 设一组信号X={xl,X2,…Xm}为另外一组信号S={sl,S2,…Sn}的观测值,设信号X中的第i个 值可W由信号的S中的n个独立分量线性混合而成: Xi =日 ilSl+日 i2S2+...+日 inSn i = j (3) 其中,al,a2,…an为混合矩阵A的元素;因此,式(3)可改写成: X=AS (4) 其中,混合矩阵A和源信号S都是未知的,Fast-ICA方法的目的是估计出混合矩阵S,通 过混合矩阵A的逆矩阵,得到一个分解矩阵W,使得Y = WX,由此得到的信号Y就是源信号S的 估计值。4. 如权利要求3所述优先权约束的彩色图像稀疏表示修复方法,其特征是:得到分解矩 阵W具体实现步骤: (a) 提取的图像块组成一个〇 X 11观测矩阵义,并进行去中屯、化处理,X ^之; (b) 利用主成分分析方法计算观测矩阵:之在mXm维度下的特征向量E和特征值对角矩阵 D,其中n>m; ((3)利用特征值向量£和特征值对角矩阵0,对观测矩阵^白化处理,之-?^; (d) 选择一个单位范数的初始化向量Wi; (e) 更新,并进行标准化Wi户Wi/I I Wi I I ;其中,g = yexp(-y^2); (f) 若尚未收敛返回步骤(e); (g) 当i小于需要估计分量的个数m,重复步骤(d)-(f),得到一个mXm的分离矩阵W。5. 如权利要求4所述优先权约束的彩色图像稀疏表示修复方法,其特征是:第=步:优 先权的计算:O为图像未破损区域,是修复边界W点P为中屯、的待修复块,优先权定义如 下: P(P)=C(P)-D(P) (5) 其中,C(P)为置信项;D(P)为数据项,分别定义为:(6) (V) 其中,I '巧^是P点梯度方向的垂直方向,也就是等照线方向,np 是P点的法[ 若设P,与 (8) 其中,I 采用式 ;: (10)。
【文档编号】G06T5/00GK105913388SQ201610208041
【公开日】2016年8月31日
【申请日】2016年4月5日
【发明人】唐向宏, 张少鹏, 李齐良
【申请人】杭州电子科技大学