摘要:针对现有社区发现算法挖掘结果精确度不高以及Web服务资源智能推荐质量较低的问题,在传统协同过滤算法的基础上,提出了基于节点相似性的动态社区发现算法。首先以连接节点最多的中心节点为起始网络社区,以社区贡献度为衡量指标不断形成多个全局贡献度饱和的社区;再使用重叠度计算将相似度高的社区进行合并,最后通过计算目标用户与社区中其他用户之间的动态相似度,将计算结果降序排列后构成邻近用户集,获得社区化推荐对象。实验结果表明,提出的社区发现算法对用户社会网络的社区分类与实际社区分类结果吻合,提高了社区挖掘的精确度,有助于实现高质量的社区化推荐。
关键词:Web服务资源;协同过滤;社会网络;重叠社区;社区挖掘;节点相似性
中图分类号:TP393.094
文献标志码:A
0引言
社会网络是人与人之间为达到某种特定目的而实现信息沟通的复杂网络。Web服务社区发现是为了将社会网络划分为若干个互相分离的社区,通过挖掘用户社会网络结构、分析用户之间的连接关系来发现用户社区,寻求用户社区中与目标用户相近的用户集合。它是一种解决用户需求个性化问题的可行方法,近年来成为了研究者所关注的焦点。
目前,网络社区发现的算法主要有谱平分法、KernighanLin算法、层次聚类算法和GN(GivernNewman)算法。但谱平分法在每次实施网络分割时只能对其进行平分,使得复杂网络在进行社区分割时的效率大大降低;KernighanLin算法只能在知晓所分割社区大小的前提下才能进行网络分割;层次聚类算法中的单连接法难以控制和掌握算法的起始,无法确定最终划分得到的网络社区数量,完全连接法由于时间复杂度高,操作十分困难;GN算法因为其没有有效定义网络拓扑结构,且需要进行重复计算,不适用于大规模的社会网络。总的来说,上述社区发现算法都只把社区发现问题简单地描述为普通聚类,且大都通过构建静态模型进行相似度度量,没有考虑其动态性。
针对静态社区算法中把社区发现简单描述为普通聚类的问题,国内外众多学者在考虑网络节点多样性的基础上将研究重心放在重叠社区动态发现算法上,纷纷在上述经典算法的基础上提出了新的社区发现算法。例如团渗算法(CliquePercolationMethod,CPM)[1]、基于局部扩展的重叠社区挖掘算法(LFM)[2]、UEOC(UnfoldandExtractOverlappingCommunities)算法[3]、基于连边相似度的重叠社区发现算法(EGN)[4]、基于信息熵的社区发现(CommunityDetectionBasedonEntropy,CDBE)算法[5]、贪婪的团扩张(GreedyCliqueExpansion,GCE)算法[6]等。然而,这些算法都没有从用户兴趣相似性的角度实现Web服务社区发现,且对于社区规模不同的网络呈现出的有效性各不相同;
另外,随着混合参数数值的增加,部分算法的挖掘精确度迅速下降。因此,这些算法在挖掘的社区质量上仍存在不完善之处。
协同过滤算法是通过分析用户之间的兴趣相似性来进行项目推荐,其基本思想是通过评分来反映用户对项目的兴趣,利用与用户兴趣相似的若干最近邻用户的评分来推导该用户对未知项目的评分[7]。它主要是基于其他用户的偏好完成商品推荐,因此,只需要计算用户之间的相似性[8]。目前协同过滤算法在Web服务上的应用非常广泛,例如预测Web服务的服务质量(QualityofService,QoS)值[9-10]、建立基于协同过滤的个性化推荐系统[11-12]和识别与优先大软件项目中的需求[13]等。
本文提出了基于节点相似性的动态社区发现算法,并使用对社会网络中用户节点的动态描述来计算目标用户和其他用户间的相似度。该算法结合了Web服务的特点以及用户社会网络中节点的多样性,将协同过滤和社会网络应用于Web服务选择领域以解决目前Web服务选择算法的不足。
1用户社会网络构建
对于Web服务推荐系统来说,挖掘用户社区能够帮助目标用户找到兴趣相投、习性相近的消费用户,同时通过适当的推荐方法对社区中的成员进行有类别的有效推荐。本文考虑将协同推荐算法中的“用户—项目评级矩阵”投射到用户社会网络中,利用“用户—项目评级矩阵”计算出各用户之间的相关性,并以此为基础得到用户的关系矩阵,如图1所示。
(www.fabiaoba.com),是一个专门从事期刊推广期刊发表、投稿辅导、发表期刊的网站。
本站提供如何投稿辅导、发表期刊,寻求论文刊登合作,快速投稿辅导,投稿辅导格式指导等解决方案:省级论文刊登/国家级论文刊登/
CSSCI核心/医学投稿辅导/职称投稿辅导。
投稿邮箱:fabiaoba365@126.com
在线咨询:
275774677、
1003180928
在线咨询:
610071587、
1003160816
联系电话:18796993035
期刊简介: 主管单位:中国出版集团 主办单位:中国美术出版总社 国际标准刊号:ISSN1...
主管单位:中国人民银行昆明中心支行 主办单位:中国《时代金融》杂志社 出版地:云南...
期刊简介: 《中国药事》(月刊)1987年创刊,是国家药品监督管理局主管,中国药品生...
期刊简介: 《当代医学》是由国家卫生部主管,中国医疗保健国际交流促进会主办的国家...
期刊简介: 《经济论坛》杂志创刊于1987年10月,是经国家新闻出版总署批准,面向国内...
期刊简介: 《营养学报》(双月刊)是中国营养学会主办的营养专业学术性期刊,1956年3...
近来发现有些作者论文投稿存在大量剽窃、抄袭行为,“发表吧”对此类存在大量剽窃、抄袭的论文已经停止编辑、推荐。同时我们也提醒您,当您向“发表吧”投稿时请您一定要保证论文的原创性、唯一性,这既是对您自己负责,更是对他人的尊敬。
此类投稿的论文如果发表之后,对您今后的人生和事业将造成很大的麻烦,后果不堪设想,请您一定要慎重,三思而后行。
如因版权问题引起争议或任何其他原因,“发表吧”不承担任何法律责任,侵权法律责任概由剽窃、抄袭者本人承担。