融合空间信息LDA的视觉对象识别研究(4)

时间:2013-09-25 11:13 来源:发表吧 作者:李阳等 点击:

  3实验

  本文使用VOC(2007)图像数据库的训练集合和测试集合,分别进行模型的训练和测试。该图像库共有20个类别的图像。使用融合空间信息的LDA模型训练得到该模型的参数,这里设置主题数为100,并且对4952幅进行测试,得到每幅图像的主题分布矩阵,该矩阵作为SVM输入参数,使用SVM分类器对不同类别的图像进行分类。在使用SVM分类器进行分类时,将当前需要识别的图像设置为正例,将其他所有类别的图像设置为反例,形成多个2分类问题。本文采用precision、recall和accuracy这三个量化标准评价图像识别率的好坏:

  最后通过precision和recall得到Aero-plane,Bottle,Bus,Cat这四类图像的AP曲线,并且与LDA模型与SVM分类器得到的识别率的AP曲线进行比较,对比结果如图4、图5、图6、图7所示。可以看出,本模型相比LDA模型,AP曲线较稳定,没有出现LDA模型AP曲线的不稳定性情况。

  4讨论

  通过将二维图像空间信息融合进LDA模型,构建条件随机场LDA模型,使得每次视觉词汇主题的产生不再条件独立,而与其相邻区域视觉词汇的主题存在一定的依赖关系,这更加符合图像特性,并且文档所对应的主题的产生不再来自于狄利克雷分布,而是高斯分布,那么高斯分布的协方差矩阵就可以反映主题间的共现关系,即一个主题的出现也表现了其他主题出现的概率,可用于场景识别的应用。融合空间信息的LDA模型,可以提高图像视觉词汇主题分配的准确率,从而达到提高视觉对象识别率的目的。

  参考文献:

  ?基金项目:国家自然科学基金(61171185,61271346,60932008);高等学校博士学科点专项科研基金(20112302110040)。

  作者简介:李阳(1987-)女,辽宁朝阳人,硕士研究生,主要研究方向:机器学习,计算机视觉;

  刘扬(1976-)男,吉林怀德人,博士,副教授,主要研究方向:机器学习,计算机视觉;

  郭茂祖(1966-)男,山东夏津人,博士,教授,博士生导师,主要研究方向:机器学习,计算生物学,生物信息学,图像理解。

  [1]BOSCHA,ZISSERMANA,MUNOZX.Sceneclassificationusingahybridgenerative/discriminativeapproach[J].IEEETransactionsonPatternAnalysisandMachineIntelligence.PatternAnalysisandMachineIntelligence,2008,30(4):712-727.

  [2]VIJAYANARASIMHANS,GRAUMANK.Keywordstovisualcategories:Multiple-instancelearningforweaklysupervisedobjectcategorization[C]//IEEEConferenceonComputerVisionandPatternRecognition,2008.6:1-8.

  [3]CANINIKR,SHASHKOVMM,GRIFFITHSTL.ModelingtransferlearninginhumancategorizationwiththehierarchicalDirichletprocess[C]//Proceedingsofthe27thInternationalConferenceonMachineLearning,2010-06.

  [4]BERGAMOA,TORRESANIL.Exploitingweakly-labeledWebimagestoimproveobjectclassification:adomainadaptationapproach[C]//NeuralInformationProcessingSystems,2010.

  [5]LOWEDG.?Distinctiveimagefeaturesfromscale-invariantkeypoints[J].?InternationalJournalofComputerVision,?200460(2):91-110.

  [6]JURIEF,TRIGGSB.Creatingefficientcodebooksforvisualrecognition[C]//ProceedingsoftheIEEEInternationalConferenceonComputerVision,2005,10(1):604-610.

  [7]STEYVERSM,GRIFFITHST.Probabilistictopicmodels[M].HandbookofLatentSemanticAnalysis,2007.?

  [8]BLEIDM,NGAY,JORDANMI.LatentDirichletallocation[J].JournalofMachineLearningResearch3,2003:993–1022.

  [9]李志欣,施智平,刘曦,史忠植.建模连续视觉特征的图像语义标注方法[J].计算机辅助设计与图形学学报,2010,22(8):1412-1420.

  [10]吴飞,韩亚洪,庄越挺,邵健.图像-文本相关性挖掘的Web图像聚类方法[J].软件学报,2010,21(7):1561-1575.

  [11]FERGUSR,LFeifeiPERONAP,etal.LearningobjectcategoriesfromGoogleimagesearch[C]//ICCV2005.TenthIEEEinternationalconference,2005,2:1816-1823.

  [12]ZHAOBin,LIFeifei,XINGEP.Imagesegmentationwithtopicrandomfield[C]//EuropeanConferenceonComputerVision,2010,6315:785-798.

  [13]VERBEEKJ,TRIGGSB.RegionclassificationwithMarkovfieldaspectmodels[C]//ComputerVisionandPatternRecognition,2007:1-8.

  [14]CAOLiangliang,LIFeifei.Spatiallycoherentlatenttopicmodelforconcurrentsegmentationandclassificationofobjectandscenes[C]//PatternAnalysisandMachineIntelligence,IEEETransaction,2010,32(9):1627-1645.

  [15]LAFFERTYJ,MCCALLUMA,PEREIRAF.Conditionalrandomfields:probabilisticmodelsforsegmentingandlabelingsequencedata[C]//ICML,2001.

  [16]WAINWRIGHTM,JORDANM.Avariationalprincipleforgraphicalmodels[C]//NewDirectionsinStatisticalSignalProcessing,MITPress,2005.

  [17]BLEID.LAFFERTYJ.Correlatedtopicmodels[C]//NIPS,2006.


www.fabiaoba.com),是一个专门从事期刊推广期刊发表、投稿辅导、发表期刊的网站。
  本站提供如何投稿辅导、发表期刊,寻求论文刊登合作,快速投稿辅导,投稿辅导格式指导等解决方案:省级论文刊登/国家级论文刊登/ CSSCI核心/医学投稿辅导/职称投稿辅导。

投稿邮箱:fabiaoba365@126.com
 在线咨询: 投稿辅导275774677投稿辅导1003180928
 在线咨询: 投稿辅导610071587投稿辅导1003160816
 联系电话:18796993035

联系方式
李老师QQ:发表吧客服610071587 陈老师QQ:发表吧客服275774677 刘老师QQ:发表吧客服1003160816 张老师QQ:发表吧客服1003180928 联系电话:18796993035 投稿邮箱:fabiaoba365@126.com
期刊鉴别
  • 刊物名称:
  • 检索网站:
热门期刊
发表吧友情提醒

近来发现有些作者论文投稿存在大量剽窃、抄袭行为,“发表吧”对此类存在大量剽窃、抄袭的论文已经停止编辑、推荐。同时我们也提醒您,当您向“发表吧”投稿时请您一定要保证论文的原创性、唯一性,这既是对您自己负责,更是对他人的尊敬。

此类投稿的论文如果发表之后,对您今后的人生和事业将造成很大的麻烦,后果不堪设想,请您一定要慎重,三思而后行。

如因版权问题引起争议或任何其他原因,“发表吧”不承担任何法律责任,侵权法律责任概由剽窃、抄袭者本人承担。

 
QQ在线咨询
论文刊登热线:
137-7525-9981
微信号咨询:
fabiaoba-com

友情链接

申请链接