多媒体数据挖掘
"什么是多媒体数据库?"多媒体数据库是指存储和管理大量多媒体对象的数据库,如音频数据,图象数据,视频数据,序列数据,以及超文本数据,包含文本,文本标记(text markup),和链接(linkage)。
?
由于音频视频设备,CD-ROMs,和因特网的流行和普及,多媒体数据库系统变的日益常见。典型的多媒体数据库系统包括NASA's EOS(地球观测系统),各种图象和音频视频数据库,人类基因数据库,和因特网数据库。
?
"在多媒体数据库中搜索相似数据,既可以基于数据描述,也可以基于数据内容?"此言不错。
对多媒体数据相似搜索,主要考虑两种多媒体标引和检索系统:(1)基于描述的检索系统,主要是在图象描述之上建立标引和执行对象检索,如关键字,标题,尺寸,创建时间等;(2)基于内容的检索系统,它支持基于图象内容的检索,如颜色构成,质地,形状,对象,和小波变换等。基于描述的检索若手工完成是很费力的。若自动完成,检索结果质量通常较差;例如,对图象赋予关键字可以是很灵活随意的事情。基于内容的检索使用视觉的特征标引图象并基于特征相似检索对象,这在很多应用中都是需要的。
?
在基于内容的检索系统中,通常有两种查询:基于图象样本的查询(image sample-based queries)
和图象特征描述查询(image feature specification queries)。图象样本查询是指找出所有与给定图象样本相似的图象。其做法是把从样本中提取的特征向量(feature vector)(或特征标识(signature))与已经提取出并在图象数据库中已经索引过的图象特征向量相比较。基于这一比较结果,可以得到与样本图象近似的图象。图象特征描述查询是指给出图象的特征描述或概括,如颜色,结构,或形状,把其转换为特征向量,与数据库中已有的图象特征向量匹配。基于内容的检索的有广泛的用途,包括医疗诊断,气象预报,TV 制作,针对图象的Web 搜索引擎,以及电子商务等。一些系统如QBIC(Query By Image Content,按图象内容查询),同时支持样本查询和图象特征描述查询。也有系统同时支持基于内容和基于描述的检索。
?
人们已经提出了几种在图象数据库中基于图象特征标识的相似检索方法:
<基于颜色直方图的特征标识(color histogram-based signature):此方法中,图象的特征标识包括了基于的图象颜色构成的颜色直方图,这其中忽略的图象的尺度(scale)或方位(orientation)。由于此方法中并不包含任何有关形状,位置,或质地的信息,因此具有相似颜色构成的两幅图象可以包含极为不同的形状或质地,这样在语义上可以是完全不相关的。
<多特征构成的特征标识(multifeature composed signature):此方法中,图象的特征标识由多个特征的组成:颜色直方图,形状,位置,和结构。通常,可以对每一个特征定义其距离函数,然后将各结果综合导出总的结果。多维的基于内容的检索通常使用一个或几个探测特征,来搜索包含同样特征的图象。因此它可用于相似图象的搜索。
<基于小波的特征标识(wavelet-based signature):本方法使用了图象的小波系数作为起特征标识。小波可以在一个唯一统一的框架内27表示形状,结构和位置等信息。这将改进效率并减少对多个特征搜索的需要(与第二种方法不同)。然而,由于此方法对整个图象只计算一个特征标识,它可能无法识别出虽包含相同对象但对象位置或尺寸不同的图象。
<带有区域粒度的小波特征标识(wavelet-based signature with region-based granularity):此方法中,特征标识的计算和比较是在区域粒度上进行,而不是在整个图象上。这是基于如下的结论:相同的图象可能包含相同的区域,但一幅图象中一个区域可以是另一幅图象中的匹配区域的变换或伸缩的结果。因此,查询图象Q 和目标图象T 之间的相似计算可定义在由Q 和T 相匹配的区域所覆盖的两幅图象的面积碎片上进行。这种基于区域相似的搜索可以找出这样的图象,它们包含相似对象,但这些对象可以是经过变换