
多元统计方法分析:可以根据需要添加因子分析、聚类分析、关联规则分析等功能,此功能模块属于扩展功能。
3.2共词矩阵计算方法比较
共词频次的计算方法很多,在实践中用到了两种算法,试比较如下:
3.2.1依据定义机械对比
根据定义,共词的频次是两两组合的高频主题词或关键词在每一篇文献中出现的频次,依次设计的算法比较简单,假设文献总数是max_source_id,高频关键词总数是max_gaopin,定义两个高频关键词数组key_row(max_gaopin)、key_col(max_gaopin)一个存储共词词频的二维数组Gongci(max_gaopin,max_gaopin),然后判断两两组合的关键词是否同时出现在同一篇文献中,最后累计得到共词词频,并此基础上再用Ochiia系数计算出相似矩阵和相异矩阵。部分代码如下:
这种算法思路简单,但实现起来用到了三重循环来计算共词频次,算法时间复杂度和空间复杂度大,运行时效率比较低。
3.2.2利用SQL聚合函数计算
SQL语言的count()函数返回的是数据表中匹配指定条件的行数,将题录中的关键词切分存储到数据库的表中,然后以两两组合的关键词作为匹配条件,根据文献编号分组,使用SQL语句进行count()计算,如果返回值等于2即表示这两个词在同一篇文献中出现,查询数据集的记录总数即为共现的文献篇数,亦即共词频次,部分代码如下:
4应用举例
文章以“图书馆联盟”为主题词在CNKI全库进行检索,共有检索文献964篇,去掉非相关的通讯报道等文献,得到826篇论文。对关键词进行切分处理后得到3091个关键词,统计之后的高频关键词如表1所示。
在高频关键词表的基础上,按步骤依次计算共词矩阵、相似矩阵与相异矩阵,然后进行统计分析。共词矩阵如表2所示(限于篇幅,只显示部分):
5结束语
共词分析作为文献计量分析的新的工具,由于具有众多的优越性,使用得越来越广泛。迄今为止,基于关键词的共词分析在学科前沿热点、学科发展、学科研究范式等问题上的研究上已经形成了较为固定的研究方法和套路。但已有的共词分析软件大都操作不便,比较难以理解和掌握,为此,文章设计开发了一个简单高效的共词分析工具,操作时只需从文献数据库中下载相关主题的文献,导入题录之后就可以自动实现关键词的统计、共词矩阵计算分析功能,不足之处在于能提供分析的方法有限,有待于进一步完善。
参考文献
[1]张勤,徐绪松.定性定量结合的分析方法-共词分析法[J].技术经济,2010,29(6):20-24.
[2]冯璐,冷伏海.共词分析方法理论进展[J].中国图书馆学报,2006,3
2(162):88-92.
[3]魏瑞斌.基于关键词的情报学研究主题分析[J].情报科学,2006,24(9):1400-1404+1434.
(www.fabiaoba.com),是一个专门从事期刊推广期刊发表、投稿辅导、发表期刊的网站。
本站提供如何投稿辅导、发表期刊,寻求论文刊登合作,快速投稿辅导,投稿辅导格式指导等解决方案:省级论文刊登/国家级论文刊登/
CSSCI核心/医学投稿辅导/职称投稿辅导。
投稿邮箱:fabiaoba365@126.com
在线咨询:
275774677、
1003180928
在线咨询:
610071587、
1003160816
联系电话:13775259981
主管单位:湖北省国资委 主办单位:湖北省经济干部管理学院 出版地:湖北省武汉市 国...
主管单位:山东省教育厅 主办单位:山东省教委 国内刊号:CN 37-1025/G4 国际刊号:IS...
期刊简介: 《高等工程教育研究》是我国第一份、也是唯一一份面向工程教育研究的全国...
期刊简介: 主管单位:吉林省社会保险事业管理局 主办单位:吉林省人力资源和社会保障...
主管单位:国家民族事务委员会 主办单位:西北民族大学 出版地:甘肃省兰州市 国际标...
期刊简介: 《种子科技》(月刊)创刊于1983年,曾用刊名:(种子通讯)是中国种子协...
近来发现有些作者论文投稿存在大量剽窃、抄袭行为,“发表吧”对此类存在大量剽窃、抄袭的论文已经停止编辑、推荐。同时我们也提醒您,当您向“发表吧”投稿时请您一定要保证论文的原创性、唯一性,这既是对您自己负责,更是对他人的尊敬。
此类投稿的论文如果发表之后,对您今后的人生和事业将造成很大的麻烦,后果不堪设想,请您一定要慎重,三思而后行。
如因版权问题引起争议或任何其他原因,“发表吧”不承担任何法律责任,侵权法律责任概由剽窃、抄袭者本人承担。