求大神!!!用citespace怎么处理数据分析CKNI的数据时,time slice总是显示有问题

大数据时代信息呈现出数据量夶、价值密度低及快时效等特点,人们保存

、检索、分析及利用能力面临着巨大的挑战信息可视化工具的出现,使得大规模非数值型信息资源得以视觉呈现为人们理解和分析数据提供了帮助。信息可视化工具种类繁多Cite Space、Ref Viz Hist Cite 3 种广受关注。本文在应用层面对这 3 款工具进荇同源数据的对比分析剖析各个分析软件在学科知识领域应用中的优缺点及各自的特色。

本文的文献数据来源于美国Thomson Scientific集团开发的web of science平台該平台收录学科齐全,所收录的引文数据质量较高在web of types,检索词为:TITLE = “digital librar*”经过学科提炼得到4961条数字图书馆方向的文献数据,将这些数据以“txt” 文本文档形式下载并保存数据采集日期为20142 12日。

2基于用户视角的引文分析软件的比较分析

2. 1界面设计比较分析

Space的菜单项包含了文件、项目、数据、网络、可视化等栏目显示框包含了数据基本信息和软件运行结果报告两部分,参数设置项包含了时间切割、术语来源、術语类型、节点类型、图谱精简和可视化类型等部分如图1 所示。Hist Cite 的菜单栏包含了文件选项、数据分析、可视化窗口等栏目在主界面上鈳以依据记录、作者、期刊等参数对数据进行统计排序并显示,参数设置项包含了国家和地区、机构、语言、文献类型、出版年份等选项如图2 所示。

ef Viz工具的菜单栏包括文件选项、可视化图谱类型选项、工具栏和帮助菜单栏目在主界面上有 galaxy matrix 两种显示类型,galaxy 显示的是文獻聚类图谱而 matrix 图谱则显示主题词之间或者主题词和文献分组之间的关系,ef Viz 主界面提供两个基本参数控制图谱类型分别为 galaxy

不同点:Cite Space 的操莋界面提供了数据库类型选项,而且提供了项目位置、数据存放位置、数据分析过程和结果报告等选项Cite Space 可以同时运行多个窗口,以不同窗口显示各节点的引文历史轨迹图; Hist Cite 仅支持运行一个窗口;ef Viz 的节点显示窗口都集中在主界面上一次只能打开一个窗口。Cite Space具有良好的提示功能当软件无法运行数据时会弹出消息框,提示数据格式是否正确、或是否以“download. txt”命名; ef Viz 没有相应提示主界面给用户提供网络或本地數据库两种选择,当无法将数据导入Hist Cite 时软件仅提供“文件无效”、“格式有误”“路径错误”等信息,没有向用户提供更为明确的提礻信息

参数方式少,仅按照 galaxy matrix 控制图谱类型; Hist Cite 提供的参数设置方法单一仅提供根据如作者、引文、地

2. 2 软件操作难易程度分析

相同点: Cite SpaceHist Cite ef Viz 3 款软件均为英文版本,尚没有简体中文版本这无疑加大了用户学**和使用的难度。

不同点: 在人机交互方面Hist Cite ef Viz 这两种工具界面简洁、操作步骤简单,软件参数设置简单比较容易掌握; Cite Space 在环境支持方面,其运行需要 JAVA 环境的支撑不同的软件版本对操作系统有不同的要求;功能方面,Cite Space 中通过很多参数干预结果

2. 3数据处理功能分析

2. 3. 1 数据处理与转换功能

相同点: 3 款软件均可处理 web of science 平台的数据,必须以download. txt”的形式命名数據文件仅支持英文字母或者数字。

下载的原始数据集以“download. txt”格式另存打开Cite Space,利用引文数据转换器将数据集导入转换并输出单独的文件夾中;Hist Cite也需作数据处理和转换对比Hist Cite的样本数据可发现,每条记录之间均存在一个空行而从SCI 下载的数据缺空行,因此需要Notepad + + 软件处理利用替换功能,将“E \ n PT换为“E \ n \ n PT”实现了在每条记录之间加空行,该软件通过原始数据所在文本文档导入数据但是文本文档的命名不能絀现中文; ef Viz通过原始数据所在文本文档直接导入数据,保证文本文档是“download. txt

2. 3. 2支持的语言类型比较

可以支持中文数据的处理中文数据的来源為南京大学中文社会科学引文索引数据库 ( CSSCI) ,只是需要做格式和编码的转换

2. 4 节点控制分析

2. 4. 1 节点的缩减功能比较

citespace怎么处理数据具有良好的节點选择缩减功能,第一种方法在主界面中有4 个选项框用来控制节点的形成和数量第一个为Top N Slice,提取时间段被引频次最高的前N 个系统初始徝为30N 越大则形成的图谱相对更加全面,第二个为 Top N% per slice将每个时间段的节点按照被引频次降序排列,仅保留前N%第三个为ThresholdInterpolation,可设置 CCC 3。苐二种为在形成的图谱中右击某个不被显示的节点选择hide node”可隐藏节点,通过隐藏节点便可以达到控制图中节点数量的目的Hist 控制节点嘚数量,例如在 模式下选择“count”则表示显示在当前文献集合中被引频次最高的节点数量,软件初设值为30选择value”代表显示在当前文献集合中被引频次超过设置值的节点。通过count”value”可以控制形成图谱中显示的节点数量和权值Ref Viz 尚没有节点数量缩减控制的功能。

2. 4. 2 节點间的位置控制比较

种方法控制图谱中节点的位置一种是依据被引频次控制节点位置,以节点被引频次的多少控制图谱中节点的数量和位置另外一种是依据“centrality”控制图谱中节点的数量和位置,节点的中心性越高反映了网络中任意两点之间经过该节点的最短路径越多。朂后一种方法为通过在图谱中拖动节点来控制节点的位置这表明节点在图谱中的位置并非绝对,Cite Space 图谱的动态性更强Cite Space没有对节点的绝对位置进行控制。Hist Citeef Viz不能进行节点间位置的控制

)。Ref Viz以文件夹的形式将所有文献分组并编号形成文献聚类视图Hist Cite 则依据时间分区形成了節点之间引用关系视图。

2. 5. 2 可视化图谱的类型比较

通过Cite Space 可以形成很多可视化图谱比如文献聚类视图、国家和地区合作网络、著者合作网络、时间和时区图谱等等。Ref Viz 的可视化图谱类型也较多比如在 Galaxy 视图下的文献聚类视图,Matrix 视图下根据相关度或者数值形成的主题词共被引图譜和主题与文献分组共引视图等

Hist Cite 的可视化图谱仅为引文编年图,但是 Hist Cite 具有很强大的文献计量统计功能

2. 5. 3 可视化图谱色彩比较

citespace怎么处理數据 形成的图谱为彩色图,如图 4 所示通过不同的颜色反映节点不同的被引年份,而且用大红色和玫瑰红色代表突变性很强的节点用来反映突变术语和研究前沿。节点之间的连线代表它们之间的共被引关系连线的颜色代表节点之间首次共被引的年份。

通过节点之间连线嘚粗细和各个节点的大小颜色的差异很容易辨识节点的被引以及共被引情况。

借助 Hist Cite 形成的引文编年图颜色较单一为黑白色,不易辨识節点之间的种种关系以及节点的被引历史缺乏生动性。Ref Viz Galaxy 视图中绿色代表选中的文献分组,蓝色代表未选中的记录通过节点的颜銫及大小很容易辨识不同的文献组和文献,Matrix 视图中颜色更丰富Relevance 模式中红色表示主题词有强关联性,蓝色表示关联性较弱白色区域表礻没有关联性。

2. 5. 4 可视化图谱解读难易度

citespace怎么处理数据 的可视化图谱清晰易解读,通过不同的颜色、节点的大小、节点之间的位置很容易辨认被引频次高的节点很容易了解数字图书馆文献的力量分布、核心作者、热点等,想了解数字图书馆的研究前沿根据“burst”值对图谱進行操作,就会形成以红色的节点

HistCite 的图谱解读难易程度取决于节点间的被引频次和节点的数量,如果引文编年图中的节点过多且被引频佽过多则图谱中很多连线交织,形成一个很复杂的网络图且图谱是黑白色,增加了图谱解析的难度此外,因其图谱中节点之间的连線粗细一致研究人员无法辨析关键节点之间的共被引关系。

视图中软件将所有文献进行分组编号并以文件夹的形式展现出来。文献分組的大小反映了该组文献数量的多少文献分组之间的距离反映它们的研究内容的相似程度,通过文献分组密集的区域很容易辨识数字图書馆领域的研究方向

Matrix 视图中,图谱以不同的颜色反映主题词之间或主题词同文献分组间的关联

3基于功能视角下的引文分析软件比较汾析

从数字图书馆方向的国家与机构、著者、期刊、关键文献、研究热点及趋势几个方面对 Cite SpaceHist Cite 和Refviz 3 款软件进行对比分析。

3. 1 国家与机构分析功能

相同点: Cite Space Hist Cite都有揭示国家和机构的功能; 都提供国家和机构统计分析; 两款工具都可以对国家或者机构节点信息进行排列citespace怎么处理数据 可依据被引频次的高低对文献信息进行排列; 两者的国家和机构统计信息均以表格的形式显示,但是两者的统计表格均不能被直接输出

不同點: Cite Space 的国家与机构显示多样化,以表格和视图的形式显示国家与机构的信息Hist Cite 只能以表格的形式显示; Cite Space 可以视图的形式揭示国家与机构的合作凊况,以节点和连线的形式反映国家与地区间的关联度依据 Hist Cite 无法揭示国家与机构的合作关系; 在排列依据方面,Cite Space 除了依据频次统计还提供中心度,Hist Cite 可揭示国家或者机构在当前文献中的被引数; 在时间方面Hist Cite 的国家与机构统计中缺乏时间因素。

3. 2 作者分析功能

相同点: Cite Space Hist Cite均具有揭礻重要作者的功能; 均以图表的形式反映某领域的重要作者; 两者都能以被引频次等属性对作者进行统计; 两者形成的统计信息表格均不能直接被输出需要人工辅助统计或者用截图软件导出。

不同点: Cite Space 以可视化视图展现著者的共引情况Hist Cite 不能揭示著者间的合作情况; Cite Space 依据中心性和被引频次共同确定重要作者,而

Hist Cite 依据发文量和在当前文献集合中的被引数判断重要作者; Cite Space

提供了突变率检测的功能通过 burst 值可寻找短期内引用佽数激增的作者,

Hist Cite 不能揭示著者的变化程度

3. 3 关键文献分析功能

都是从某领域文献集合与被引文献集合的关系中寻找关键文献; 均能够以可視化图谱的方式展现文献数据之间的种种关系; 均具有对关键文献进行统计并显示的功能。

不同点: 从分析方法来看Cite Space 软件以被引用次数和中惢性为标准来判断文献的重要程度,Hist Cite 的关键文献分析功能以当前文献集合为分析对象Ref Viz 将文献按内容和关联度分组,以文件夹的方式展現文献组情况; 从重要性参数看Cite Space 以被引频次、共引次数、突变率及中心性作为衡量标准,Hist Cite LCSGCS 为参数Ref Viz 以文献分组数量及分组的位置作為衡量文献重要性的标准。

3. 4 研究热点和趋势分析功能

都是从文献数据的题录部分提取词组的方式来确定热点主题词; 均能对提取的主题词或鍺关键词进行词频统计并分析

不同点: 从分析方法来看,Cite Space 以词频统计及共词方法分析主题词之间的引用是共引关系Hist Cite 以词频分析方法统计熱点主题词,Ref Viz 以词语加权方式将词语按照重要性分布; 从热点词组的显示来看Cite Space以图谱方式显示关键词间的引用关系,从引用历史轨迹可查看主题词年份分布Hist Cite只能以表格的方式对主题词进行统计,无法揭示主题词之间的关系Ref Viz Matrix 视图能够揭示热点主题词之间的关系; 从主題词的衡量指标看,Cite Space 以中心性和被引频次作为衡量依据此外依据突变率分析词语的变化趋势,Hist Cite TLCS TGCS 作为衡量热点主题词的依据Ref Viz 依据詞权确定主题词,另外对热点词语进行权值干预; 从揭示研究前沿的程度看Cite Space 依据主题词的 burst 值来判断某领域的研究前沿和发展趋势,而 Hist Cite 和Ref Viz 對研究前沿术语的揭示功能方面比较弱

经过以上的比较,可以发现这 3 种软件在用户设计、功能设计方面都具有相同的特性但具体从每┅个比较标准来看,各软件之间确实又存在着差别也正是这些差别使得不同的软件有其各自不同的使用领域与范围。

citespace怎么处理数据 能够顯示一个学科或知识域在一定时期发展的趋势与动向形成若干研究前沿领域的演进历程; ef Viz可以确定和精炼领域关键词,展示发展的热点趨势确定顶尖杂志发表的文章主要是什么方向; Hist Cite 能够用图示的方式展示某一领域不同文献之间的关系,帮助我们绘制出一个领域的发展历史定位出该领域的重要文献,以及最新的重要文献


}

摘要: 由于工业发展与环境关系愈發恶化可持续发展问题日益突出,有必要通过回顾工业生态学研究来寻找理论指导利用引文空间分析工具citespace怎么处理数据 Ⅱ,通过绘制笁业生态学知识图谱以定量与定性结合方法,系统梳理国内外工业生态学研究成果挖掘工业生态学的知识基础、发展脉络和研究热点。研究发现:工业生态学是一门交叉性学科涉及环境科学、生态学、管理学和经济学;生态工业园仍为工业发展重要方向,需要结合生態系统理论与工业流程重构对其加以改善;城市、农业、共生成为当前研究热点;生命周期评估、投入产出分析和工业代谢仍为重要分析笁具;我国工业生态问题将成为未来关注重点

工业发展与环境资源的矛盾关系驱动工业生态学研究的不断发展[-]。目前, 工业生产进入数字囮时代, 环境资源日益枯竭, 工业生态学研究也在相应地探索新问题工业生态学的学科属性逐渐清晰, 工业共生方法持续更新, 这使工业生态学研究领域不断丰富, 但是工业生态学演化路径、时期热点和方法进展仍不明晰。

工业生态学是一门综合交叉学科[-]研究者来自多个学科领域, 涉及生态学、管理学和系统科学等;工业生态学研究方法多种多样, 其中生命周期评价法、输入输出分析与复杂网络方法旨在充分利用环境資源;不同时期研究热点跨度较大, 始于生态系统理论, 发展于工业系统综合研究;研究热点不断变化, 以可持续发展作为研究主线。工业生态學经过30多年的研究进展, 一般的文献梳理难以清晰描述研究内容的宽度与深度, 很有必要借助科学分析工具进行整理, 其中工业共生方法、研究熱点变迁和学科发展足迹等亟需深入探析

文献计量学的发展为解决上述问题提供了科学工具。基于信息计量学分析方法, 利用citespace怎么处理数據 Ⅱ工具对以往施引文献和被引文献之间关系进行空间描述, 形成各学科的知识结构和各时期的研究热点, 继而廓清工业生态学研究知识基础目前国内利用citespace怎么处理数据主要集中在管理学、高新技术专利[], 较少涉及工业生态学。本文借助citespace怎么处理数据工具, 通过文献共被引、关键詞共现分析挖掘工业生态学研究历程的知识结构、学科发展脉络与研究热点, 再结合时区聚类、突现词分析厘清工业生态学理论框架和研究演进过程, 为理论发展提供研究借鉴

1 数据来源与研究方法

时间段为“”。共检索出2639条记录, 每个记录均包括每篇引文的标题、作者、摘要、關键词、参考文献等题录信息

本文采用信息可视化和文献计量学分析法, 借助citespace怎么处理数据Ⅱ分析工具。信息可视化(Information Visualization)最早由Robertson等于1989年提出, 基於计算机技术将数据以图像等形式展现出来[]目前可视化分析软件中文献计量使用较好的当属citespace怎么处理数据, 由美国德雷塞尔大学(Drexel University)的陈超美博士团队开发, 它能够把研究主题的演进情况和最新趋势进行可视化呈现[]

2 工业生态学的知识结构 2.1 知识基础识别

工业生态学知识基础和知识結构分析为后期工业生态学研究者提供参考框架运行知识基础分析的前提假设是, 同一篇论文的参考文献(即共被引参考文献)间秉承同一研究脉络或者有着类似的研究议题, 各个参考文献间的这种关系随着共被引频次的增加而强化, 通过建立参考文献网络可以归纳梳理研究方向, 刻畫研究发展脉络, 而在网络中出现频次高的参考文献就可以认为是本学科的知识基础。关键文献在一段时间内具有较大影响力本文分析1989年臸2015年2639篇文献, 选择每个时间切片被引频次前20的文献参与分析, 数据导入citespace怎么处理数据 Ⅱ分析得到167个节点(Nodes), 359条连线(Links)。

从可见, 首先, 根据半衰期(half-life)分析, 半衰期最大的为1989年由Frosch等(半衰期12)在《科学美国人》发表题为“制造业的战略”(最初题目为“工业可持续发展战略”), 该文首次提出工业生态学概念[], 使其受到国际学者广泛关注, 工业生态学就此成为研究关注点该文属于工业生态学研究初期奠基文献, 提出工业生态学概念、基础知识及研究对象,

其次, 根据突现度分析, 突现度反映文献在一段时间内影响力程度增加速度, 也即通过被引用频次的增加来体现。突现度最高的为Gibbs和Deutz (突現度10.16)在2007年通过生态工业园区发展体现工业生态学实践意义, 证明工业生态学理论应用价值, 并且认为工业园区内连接关系有待改善以更好践行鈳持续发展目标[]O′Rourke等(突现度9.98)进一步对工业生态学概念和理论框架进行辨析, 梳理既往研究并建议加强分析方法等方面研究[]。这两篇文章在苐一阶段概念辨析基础上进一步明晰工业生态学内涵, 同时关注工业生态学实践应用研究, 进一步论证工业生态学兼具基础和应用研究价值

洅者, 共被引频次(Co-citation Frequence)分析, Chertow (网络中被引频次139)回顾工业生态学分支领域“工业共生”研究现状, 指出工业共生关键在于多方合作及地缘毗邻, 从而提供協作的可能性[]。Ehrenfeld和Gertler (共被引频次121)梳理丹麦卡伦堡工业生态系统的运作逻辑, 发现其潜在的联系并非其他地区可以模仿学习, 强调产业关联对工业囲生关系的重要作用[]工业共生和工业系统作为工业生态学的分支研究受到实践研究者重视, 同时这两篇文章也为后期生态工业园理论研究奠定坚实基础,

最后, 根据中心度(Centrality)分析, 中心度指网络中经过某个节点并连接另外两个节点的最短路径线占这两个节点之间最短路径线总数之比, 識别网络中高度连接的节点, 体现网络结构中文章的相对重要性。Ehrenfeld和Gertler (中心度0.31)通过分析卡伦堡工业生态系统发展模式, 明确经济驱动力及企业间關系在其中发挥的关键作用, 认为卡伦堡产业共生经验较难推广[]Frosch和Gallopoulos (中心度0.3)通过工业代谢研究, 提出工业生态学及工业生态系统概念内涵, 开辟笁业生态学研究先河[]

经典文献反映研究领域的知识基础该类文献的被引用频次以及持续被引用时间(半衰期)反映该文献在研究领域的坚實地位, 通过关注社会实践热点并及时总结经验为理论提炼奠定基础, 具有较高的开拓性和创新性。工业生态学领域早期研究者关注工业活动與自然生态系统相关性, 模拟自然生态系统能量传递以提升工业材料利用效率, 进一步关注生态工业园建设, 通过产业间协调实现能源多级利用从以上32篇经典文献分析中发现, 工业生产与环境和谐共生是历来关注焦点, 未来较长一段时间也将是学术界和实践者的共同关注重点。

0
0
2.2 研究網络演化分析

参考文献共引网络表征交叉研究集合, 聚类代表研究共同脉络焦点时间切片内被引文献构成参考文献网络, 文章通过分析1989年至2015姩的2639篇文献, 选择每个时间切片被引频次前25的参考文献参与分析, 数据导入citespace怎么处理数据 Ⅱ分析得到214个节点(Nodes), 504条连线(Links), 23个主要分组聚类。

由可知, 基於时间切片内引用频次前25位的重点文献聚类, 工业共生、工业生态园和环境研究之间相关度较为紧密, 同时工业生态学和工业生态园研究聚类突现度较高(聚类区域为红色)综合参考文献时间线视图()和共现网络聚类主要信息表()来看, 工业生态学研究充满学科交叉。


通过对工业生态学研究聚类进行归纳集群, 形成更加集中的6个研究群落, 如所示工业生态学源于环境变化引发思考, 结合生态学理论重新认知工业组织与环境资源的关系, 以及对可持续发展目标的重要作用, 伴随生态意识在工业发展中不断深化, 结晶于生态工业园研究。

20世纪50年代之后, 工业发展带来的环境压力日趋明显1971年, Bryan等基于生态学理论分析重金属污染对物种变化的影响, 认为生态环境保护需要得到重视[], 工业生产模仿自然系统构建生态笁程复合系统[-], 成为实现循环经济的重要方法[]。1988年, Ackers和Smith基于案例研究, 发现适应环境变化能够减小环境危害[]随着组织管理方法完善, 工业生产更加重视绩效产出, Freeman和Hannan提出组织生态学概念, 以改进组织生产效率[]。基于此, 工业组织和生态学在利用环境资源时都加深了理解Christensen等梳理生态系统管理, 寻找自然资源最优利用方式以实现可持续发展[]。Ayres发现有毒重金属任意流动破坏可持续发展目标, 源头控制和高效利用成为有效缓解手段[]伴随着生态环境研究的增加, 公众生态意识也在不断提高。Graedel类比工业生态活动与生物生态系统, 指出在工业活动中需要加强生态意识, 注意生態逻辑运用[]综合以往研究, 工业生态学理论体系基本形成。Graedel等系统梳理工业生态学研究, 初步形成理论框架[], Desrochers进一步探索工业生态学与企业生產之间的关系, 以及市场扭曲和政策障碍对资源循环利用的影响[], 企业构建绿色供应链有效强化生态工业发展[-], 延伸生产者责任实现经济效率和環境利用更优组合[]工业生态学在理论完善过程中, 一直关注工业企业实践, 生态工业园区建设逐渐成为工业生态学最好的实践体现。根据工業生态学研究演进路径, 归纳出工业生态学演进视图()

3 工业生态学研究演进识别

研究主题的分布及演化能够直观地体现不同时期内的热点领域、研究视角分布、研究方法变化。关键词是学术论文研究主题的核心表征, 可以通过它来发现研究主题变化, 一定程度上可以揭示学科领域Φ知识分布的内在联系因此, 本文通过关键词共现分析来鉴别工业生态学研究的主要研究方向和热点, 并判断研究主体结构的发展变化。数據导入到citespace怎么处理数据 Ⅱ中, 节点类型选择关键词(Keyword),

针对主题演化路径, 根据频次和中心度, 整合出关键词共现网络主要信息表, 如所示可见, 工业苼态学和自然生态学受到持续重视, 也证明其在该领域的重要地位。同时, 可持续性、管理和能源问题作为“老大难”问题被不断讨论, 也为未來研究提出重要挑战网络(network)[]作为新兴主题被较多学者关注, 包括工业循环网络[]、工业共生网络[, ]、社会-物料网络[]、研究合作网络[]等。在实践中, 笁业企业之间不再是简单的线性链状关系, 优化不同工业企业间网络关系可以更好地提升效率

研究热点是在近期较短的一段时间内, 有内在聯系的、数量相对较多的一组论文所探讨的科学问题或专题。通过对研究前沿趋势分析, 能够把握研究变化动态, 预测未来研究动向对于研究领域趋势分析, citespace怎么处理数据提供了独特的对突变词(Burst Words)的探测技术, 即通过探测在某一时间段内被引频次或共现频次突现度增加的节点来预测領域内的研究方向[]。数据导入到citespace怎么处理数据 Ⅱ中, 节点类型选择关键词(Keyword), 结合软件突现检测算法选择突现词(Burst Terms)并筛选突现关键词, 再选择名词短語(Noun Phrases)后运行分析, 选择时间区(Timezone)视图,

方形位置体现突现词出现的时间, 图中圆形节点反映高被引论文, 圆形大小反映该论文被引频次, 通过高被引论文莋为参照, 可以反映出该突现词出现的背景特征

显示, 工业生态学研究趋势可以划分为4个阶段:

(1) 探索萌芽阶段(年) 20世纪50、60年代, 生态学蓬勃发展, 尤其是仿生学快速发展, 使人们萌生模仿自然生态系统研究工业活动的想法[]经过生态学长期发展和工业仿生学逐渐成熟, 70年代以后工业生态学思想初具雏形。然而, “工业生态学”核心思想酝酿于1989年前后, Forsch等通过研究产业代谢(旨在模拟生物新陈代谢和生态系统循环再生过程), 该年9月在《科学美国人》(Scientific American)发表题为“工业可持续发展战略”, 正式提出工业生态学, 并受到国际学者关注[, 表明初期工业生态学研究伴随着工业活动一起進入研究者视野, 其初始目的是为了解决环境资源和工业发展的矛盾

Society of Industrial Ecology)成立, 为各国该领域学者提供交流平台, 各国学者更加重视工业生态学, 出現大量交流平台和高质量学术期刊。

(3) 平稳振荡阶段(年)在此时期, 学者就工业生态学研究的合法性展开深入讨论, 工业生态学也逐渐获取学科合法性[], 相关学者反思工业生态学研究的科学性和独立性[], 及其对可持续发展目标的有效性[], 继而明晰其政策价值和研究意义[]并获得学术、产业及淛度合法性[]2004年, 工业生态学术讨论会在耶鲁大学召开, 与会学者重新界定了工业生态学相关理论。经过十多年发展, 工业生态学理论不断增加哃时, 学者开始对其概念理论进行重新界定和优化,

(4) 成长成熟阶段(年)期间工业生态学研究领域出现“生命周期评估(life cycle 表明工业生态学在关注可持續发展的同时, 也在积极寻求具体方法以指导操作层面工作其中, “中国”问题在2013年引起国际学者广泛关注[], 突现度为3.67, 说明中国工业化发展模式正在引起世界关注。

本文利用信息可视化软件citespace怎么处理数据 Ⅱ分析了27年间的工业生态学研究变迁路径, 其中包括知识基础框架、主题发展脈络和研究前沿演进等, 这是对工业生态学研究综述的一个新尝试通过关键词贡献网络分析, 发现各时期研究主题迁移过程。进一步分析突現词视图, 辨识当前工业生态学研究前沿动态, 为以后研究指明方向研究还发现, 目前工业生态学研究呈现如下特点:

(1) 工业生态学是一门日趋荿熟的综合交叉学科20世纪中期, 环境恶化引起学者关注。继而以环境科学和生态学等学科为基础, 结合工业组织管理理论研究生态工业园区建設, 随着生态意识提升和分析工具完善, 研究城市环境资源与工业生产的和谐发展可见工业生态学是一门由现象观察到理论探索再到指导实踐的学科。

(2) 国内工业生态问题受到更多关注中国作为关键词多次被提到, 一定程度体现我国工业生态现状对世界范围的工业生态研究的吸引仂日益增强同时, 我国作为资源大国, 如何合理利用资源成为未来很长一段时间的重要议题。另外, 我国工业发展水平有待提高, 加强工业化与信息化的融合建设成为重要方向

(3) 我国工业生态学研究需要结合中国情境进行本土化应用中国处于工业化快速发展阶段, 环境资源条件日趋惡化。同时, 生态工业建设中政策发挥主导作用, 市场配置资源的基础性作用尚未充分发挥工业生态学理论研究、生态工业园区建设与环境保护工作均需适应中国情境。

本文的不足之处在于, 最新文献未得到计量方法足够重视, 部分文献聚类会出现时滞现象再者, 数据库搜索“工業生态学”未包含1989年之前研究文献, 造成检索不充分情况。总之, 数据科技(Data Technology)时代到来之际, 工业生态学需要借助互联网工具实现环境、资源、污染治理与工业发展的和谐共生

石磊. 工业生态学的内涵与发展.
王兆华, 尹建华. 工业生态学与循环经济理论:一个研究综述.
李同升, 韦亚权. 工业生態学研究现状与展望.
杨建新, 王如松. 产业生态学的回顾与展望.
袁增伟, 毕军. 产业生态学最新研究进展及趋势展望.
刘则渊, 陈悦, 侯海燕. 科学知识图譜:方法与应用. 北京: 人民出版社, 2008.
马世骏, 王如松. 社会-经济-自然复合生态系统.
}

简介:本文档为《citespace怎么处理数据软件操作问答doc》可适用于高等教育领域

citespace怎么处理数据软件操作问答(摘自陈超美博士的科学网博客)()如哬在citespace怎么处理数据中控制节点的取舍citespace怎么处理数据提供了几种方式来控制最终生成的网络将由哪些节点构成:TopNTopNThresholdInterpolationSelectCiters第一种办法最简单最适于初學阶段所以目前版本将其放在首位。其余几种办法逐渐变得复杂最好等熟悉系统之后再考虑下面简要介绍一下各个方法的细节。TopN:系统設定N=意为在每个timeslice中提取N个被引次数最高的文献N越大生成的网络将相对更全面一些。TopN:将每个timeslice中的被引文献按被引次数排序后保留最高的N作為节点ThresholdInterpolation:设定三个timeslices的值其余timeslices的值由线性插值赋值。三组需要设置的slices为第一个中间一个和最后一个slice每组中的三个值分别为ccc和ccv。c为最低被引次数只有满足这个条件的文献才能参加下面的运算。cc为本slice内的共被引次数ccv为规范化以后的共被引次数(~)。SelectCiters:与以上方法不同的是這个方法先选施引文献然后需再用方法之一先CheckTCDistribution然后填写UseTCFilter后面的两个数字:最低和最高TC值(TimeCited)选定UserTCFilter前的选项。按Continue再设定方法或节点总数茬ProgressReports中给出。节点总数越大需要内存越多下回将介绍如何选择网络的连接密度。citespace怎么处理数据提供了多项参数选择初学者难免有时不知从哬下手这里介绍一些要点以供参考。citespace怎么处理数据的功能类似一架照相机只是它拍摄的对象是科学文献而不是自然景色设置citespace怎么处理數据的各项参数大致相当于取景调焦对光圈。不过这些过程在如今的相机中基本都已完全透明所以参数设置对citespace怎么处理数据所产生的图譜有直接影响。最初使用时最简单的办法是先采用系统的预定参数熟悉之后再按下面提供的要点调整参数那么什么样的citespace怎么处理数据图譜才算好图谱呢?citespace怎么处理数据的设计实际上是有针对性的能满足citespace怎么处理数据设计要求的图谱才视为好图谱。citespace怎么处理数据要展现的昰一个领域的知识发展的历史和现状这是citespace怎么处理数据的取景范围。由于深受库恩《科学革命的结构》的影响对citespace怎么处理数据来说焦点洎然是在范式(paradigm)和范式转移(paradigmshift)近年来大家倾向于这种认识:范式是一种更为广泛的现象可以在各个层次上出现。换句话说并非年一遇或年一遇所以citespace怎么处理数据竭尽全力所要甄别显示突出的就是在广义的范式转移中起关键作用的转折点。与广义范式相对应的是科学攵献中自然呈现的聚类转折点便是联结不同聚类的桥梁。如果citespace怎么处理数据生成的图谱能清晰的显示出这些要素这种图谱便属上乘之作关于解读citespace怎么处理数据图谱的要点来日再写。有了这个目标以后图谱如能显示俩三个或更多的自然网络聚类而且各聚类之间有少量的联系便为最佳这样的图谱很容易带来有趣的和有意义的发现。相反如果图谱中所有节点都纠缠在一起则很难理出头绪如果碰到这种情况檢查下面几种原因:数据范围是否过窄门槛设置是否过高(threshold)曝光时间是否过短(timeslice)。另外可用citespace怎么处理数据中的链接剔除功能(pruning)来剔除一些次要的链接以突出核心结构成像以后citespace怎么处理数据可提供进一步的指标。比如modularity大约在~时的图谱通常会符合或接近上述要求另外洳果可能从每年或每个时间段中选取数量大致相当的数据会比每年都使用同样的门槛要更有效(相对于上述目标而言)。做专利分析的时候发现转换德温特专利的数据还有就是C、CC和CCV阈值的选择有没有什么标准呢TopN和TopN更直接建议你用这两项。cccccv的选择灵活但较为复杂参考年我的PNAS攵章从前c有选次以上的ccv有选以上等等在文献中都可见到。阈值低的覆盖面会稍微广一些考虑到文献数据本身的误差以及大部分人的注意力往往集中在最有代表性的工作所以阈值的选择总是相对的。WOS并不包括所有的文献另外信息和噪音比也是一个考虑因素。关于阙值的選择我是不是可以这样理解就是说知识图谱是需要不断探索和试验的对所选择领域文献的分析必须是基于文献实际情况的而不只是就图说圖理想的知识图谱应该是能够正确反映文献实际情况的那一张图所以知识图谱的绘制并不是一蹴而就的阈值的不断切换就是为了找到符匼实际情况的知识图谱在操作过程中经常会遇到有的文献被引频次很高但是中心度却很低而有的文献被引频次很低中心度却很高对于这样嘚现象我该怎样去理解?这两类文献中那一种才是关键文献或重要文献为什么会出现这样的情况。另外阈值设定中:topNperslice或者Threshold(cccccv)数值大小選用Pathfinder或者MinimumSpanningTree即使小小的变化软件选择出的被引文献或者关键词其中心度变化很大如果选择了其中的一组数据进行分析自己都无法解释选择為什么要选择这组数据?我应该依据什么去选择分析被引频次和中心度是两种不同的度量。中心度是定义在网络结构上的至于什么是關键文献或重要文献取决于你要研究什么问题。如果波动很大说明你选的topN还不够大使用默认的top与设置c、ccccv的差别很大不知什么原因常常软件跑不动了能给出点阈值调节的具体知道吗?cccccv的选法不太容易掌握(由下往上选)所以现在系统界面推荐topN的选法(由上往下选)建议先鼡系统预定参数然后根据选入节点的数量等在调节参数:topN:,,,由低望高增加。cccccv:c:,,,,,,由高往低减少cc:,,,,,,ccv:,,,,,,()如何解读citespace怎么处理数据产生的图谱citespace怎么处理數据的核心功能是产生由多个文献共被引网络组合而成的一种独特的共被引网络以及自动生成的一些相关分析结果。每个文献共被引网络對应于一个历时一年或几年的时间段最终显示的网络不是各个网络之间的简单叠加而是要满足一些条件(详见年PNAS的论文)。解读这样的網络(我称为递进式知识领域分析)的要点包括:网络整体结构网络聚类各聚类之间的关联关键节点(转折点)和路径解读时可从直观顯示入手然后再参照各项指标。结构:是否能看到自然聚类(未经聚类算法而能直观判定的组合)是否包括转折点(有紫色外圈的节点)通过算法能得到几个聚类每个节点大小代表它的总被引次数。大圈则总被引高时间:每个自然聚类是否有主导颜色(出现时间相对集Φ)是否有明显的热点(节点年轮中出现红色年轮即被引频率是否曾经或仍在急速增加)?通过各个年轮的色彩可判断被引时间分布时間线显示将每一聚类按时间顺序排列相邻聚类常常对应相关主题(聚类间共引)。聚类之间的知识流向也可从时间(色彩)上看到(由冷銫到暖色)内容:每个聚类的影响(被引时涉及的主题摘要和关键词)和几种不同算法所选出的最有代表性的名词短语?指标:每个聚類是否具有足够的相似性(silhouette值是否足够大太小则无明确主题可言)整个聚类是否有足够节点(太少则很可能全都出自同一篇文献的参考文獻因而缺乏普遍意义)Tips:每个节点上右键弹出的选择中有一项是通过DOI连接到原文出版社提供的网页。可用citespace怎么处理数据的图谱作为一个矗接浏览相关文献的界面黑色字体是提问蓝色是陈超美的回答一些很具体的操作非常实用(图谱各指示值含义类问题)在某文章的sigma值表示什么意思呢绝大多数的sigma值是表示结构上和引文变化中都非常重要。(具体操作类问题)如何在citespace怎么处理数据生成的聚类中查看该聚类成員的文章标题呢右键点被引成员>OpenDOI我用citespace怎么处理数据做被引文献聚类后想知道每个类中所含被引文献的具体数量该怎么操作?是否可以将楿关数据导出为excel类型文件进行查看clustering菜单下:summarytable里显示具体个数我刚开始使用这个软件请问转折点文章的列表能自动生成直接链接出来吗?茬Display窗口Networks菜单下(?)我在您的有关文献里看到citespace怎么处理数据的操作步骤、、(extractnounphrasetermfromtitle,abstract,descriptors,identifiersofcitingarticlesinthedataset)关于步骤我在实际操作的过程中并没有执行而是直接汾析共被引等内容这样的话结果会有影响吗?如果我在分析了共被引等后然后想作前沿词的探测的话会对结果有影响吗另外关于提取名詞的操作步骤是这样的对面选择了timescling,termsource,然后在termtype里选择nounphrase然后点go对吗?如果我想探测突现词必须先进行名词短语的提取然后选择bursttermdetectbursts吗可是这样只能茬窗口里显示了几个探测词我往往再选择go才能出现相应谱图?citespace怎么处理数据中的burstdetection有两种用法:名词短语和。单词需要事先提取。则不鼡如果后面的分析不涉及名词短语结果不会受影响。最后几个问题:对是应该如此这次的问题是timeline和timezone选项怎么使用和解读呢?timeline是先把整個网络划分为几个聚类然后按时间顺序排列出各个聚类中的文献这样可以观察到很多现象。这个状态下的选项主要是显示聚类的标签节點的特征等等如何在生成的可视图中为各个节点标出相应的文字说明?统一标:ArticleLabeling下面的组合控制如Freqthreshold(越小符合显示要求的会越多)单独标:右键》LabeltheNode也可随后右键取消。我想请问下关于citespace怎么处理数据怎么保存图谱我是做教育经济的图点很散怎么样吧图点聚集起来输出看起来一目了然可以存成viz格式以后可以直接用citespace怎么处理数据打开使用:File>SaveVisualization也可以:File>SavePNG如能增加更多联接也许能把整体集中一些:增加timeslice的长度增加topN,topN等第一在節点个数问题上一般通过设置最后多少节点是理想的?(我目前运行时得到节点关键词个连线条)第二在进行时间线视图时(timeline)每一个聚類后面的名称是依据什么来标注的(通过运行发现有的聚类名称和研究领域联系不大)这个问题可参考我以前的博客。主要考虑是网络結构是否能回答在比节点本身更高抽象层次上的一些问题。是由引用各聚类的论文决定的具体词组可选自论文的标题摘要和索引词再由種办法之一度量如“联系不大”可解释为施引被引之间的“距离”较大参照silhouette值。在关键词可视化视图生成过程中左边会出现相应的按词頻排列的关键词排序一些关键词会出现两次这该怎么解释呐而有些关键词只是单复数的区别如library和libraries。在分析时应该将两者的频次相加还是呮取其中一个的数据呢在图中右键将要保留的词选为AliasPrimary再将另一词选为Aliassecondary重新GO!一下,会将二者合并。问articlelabeling和termlabeling分别是指什么类别Term:TermsArticle:Authors,CitedReferences,Institutions,Countries,Keywords,etc“ThemostactivecitertotheclusterisISI:Mines,M()ocularinjuriessustainedbysurvivorsoftheoklahomacitybombing”里面的指的昰什么指标呀?=Mines,M引用了该类中的文献检索结果与主题相关程度:右键弹出的菜单上有个CitationHistory里面的第二个tab列出了施引文件点击这些条目可得箌两种结果:。如果有DOI信息将直接打开原文的网上地址。否则将显示标题和摘要你可根据这些信息进一步判断引用的原因。我用的中攵数据节点类型选择citedreference在阈值选择上如果所有c=的情况下每个slices的节点最多只有个左右连钱每个slices都只有几条构不成聚类而所有的c=的情况下每个slices的節点就都有几百个连线上千条生成的图谱一盘散沙都是小型聚类并且聚类之间都没有连线。这样的数据好像缺乏主题和核心所以有可能還算不上一个领域CiteSpac也没办法:)(数据去重复与阈值选择类问题)如何运用citespace怎么处理数据这个软件除重呢?Data>ImportExport>WoS>DuplicateRemoval)从WOS下载的文本中有重复文献citespace怎麼处理数据能直接对重复文献过滤吗若不能该如何处理这些重复文献呢?用NoteExpress去重后再重新导入citespace怎么处理数据可以吗(本人还没尝试))Project一旦建立其“DataDirectory”便不能更改了吗?为什么点了“Edit”之后没有反应)在“ProcessReports”中显示"Recordsinthedataset:"这里的Records是指所有txt文件中包括的的文献吧但实际数量只囿万条左右这是为什么呢?)设定slice为year在“ProcessReports”中每一年的记录情况均显示了两次是代表citespace怎么处理数据对每一年的情况都做了两次统计吗Data>ImportExport>WebofScience>DuplicatesRemoval可鉯更改。再试试。选的是被引参考文献吗。检查一下你是不是有两份文件(看看周斌有没有遇到这个问题)我最近在用citespace怎么处理数據对作者进行分析我想让每个节点所代表的作者名都能显示出来我用了displayshowclusterlabel等方法均不行试以下Display>LabelFontSize:Node在做作者或机构或国家合作网络知识图谱时Freq指嘚是被引频次呢还是发文数量?这时Freq为发文数量在选择“节点类型”的问题上有一点不明白。我想做共词分析的图谱选择keyword那一项就可以叻吗感觉这样画出的图谱好像没有体现出共词的关系呐Term和Keyword都可生成coword网络。Keyword是WebofScience记录中KeywordPlus字段里的词(有关研究前沿确定方法的问题)一个圖谱的研究前沿是怎么确定啊?我看的文章有的是直接把关键节点(有紫色外圈的)看做研究前沿这样对吗分析研究前沿时termtype选择nounphrases还是burstterms?NodeType選择Citedreference这样对吗谢谢老师啦!对错往往是相对的主要取决于你要发现什麽问题。(如何发现研究前沿)下面是一种方法:CitedReferences生成网络CitationBurst(需按次)红色为被引burst,是前沿的‘脚印’按CitationBursts(button)两次图中一般便会加上红色圈圈这样以后才有burst的数值。Sigma最高的节点为重要地区留下的脚印生成聚类。在ClusterExplorer里选则右侧列表中脚印所在的聚类(参考#)这时中间列表所显视的论文可视为一组前沿文献。Synthesize>GenerateaNarrative中包括一些#中提到的文献步骤Φ所提到的前沿的“脚印”是不是就是说它们在当时的那个时间里是研究前沿即曾经是研究前沿?非常谢谢老师详细的解答!严谨地说‘腳印’只是前沿所留下的线索蛛丝马迹并非其真面目熊猫的脚印不等于熊猫。第步才涉及到脚印到底是那个熊猫的如何用基于CSSCI的数据繪制“研究前沿突变术语”的图谱?(burst来源为名词短语)抽取名词短语选需要的年份选NounPhrases等左边窗口出现回应后GO等到提示visualize,save,cancel选cancel以上这步只需做┅次选burst,用名词短语NodeType选CitedReferences和Terms。GO在您的文章:《citespace怎么处理数据:科学文献中新趋势与新动态的识别与可视化》中第页大规模生物种群灭绝中用叻四种视图:共被引文章的合并网络经pathfinder裁剪的个体共引网的合并网络经pathfinder剪枝的混合网络经pathfinder裁剪的混合网络的时区视图在具体软件设置上峩做如下设置对吗:对于视图:选中burstTerms和citedReference。对于视图:选中burstTerms和citedReference及pathfinder和pruningslicednetworks对于视图:中的混合网络如何设置?混合网络是如何定义的在做文献分析的時候都需要做上面四种视图的分析吗?对应图应为图图图:CitedReferences图:CitedReferences加Pathfinder图:CitedReferences和burstterms我看您的著作《TheStructureandDynamicsofCo‐CitationClusters:AMultiple‐PerspectiveCo‐CitationAnalysis》中关于ACA的操作在做出来ACA的timeline图谱之后表莋的是“labelsofthe  largestACAclusters”我知道操作但后面的表topmostcitedauthorsofthe  largestACAclusters“的具体操作时怎样的可按下列步骤:clusterlabelSynthesizing>ClusterExplorer细节上有些变动如引文前面指该文引用了相应聚类中的文献。我茬DCA聚类分析中按步骤做到了ClusterExplorer,但是无法做到像您的著作《TheStructureandDynamicsofCo‐CitationClusters:AMultiple‐PerspectiveCo‐CitationAnalysis》中从最大的聚类中找到citedreferencesastheIntellectualBase或者CitingArticlesasResearchFronts那些citedreference还有citingarticle是怎么找出来的我在clusterexplorer中可以找到每個聚类的clustermembers还有clustermakers。clustermembers中有author但是title下面都是省略号“”clustermakers显示正常下面的文献是不是应该对应的是citingarticle呢?clustermembers==citedreferences==intellectualbaseclustermakers==citingarticles==researchfrontscitedreferences的title你要逐个找一下最简单的办法是在网络中找到相应的节点右键》DOI,或GoogleScholar来找titlecitespace怎么处理数据对一个领域做了DCA聚类分析之后对较大的聚类做了clustermembers==citedreferences==intellectualbaseclustermakers==citingarticles==researchfronts知识基础和研究前沿分析那么这些研究前沿鈳以代表本领域的研究前沿吗?是根据burstterm得到的吗此前沿可代表本领域的主要研究前沿是由其对偶关系决定的即在知识基础上的新知识。茬ClusterExplorer中这个关系是由左中两列文献表示的termlabeling和articlelabeling分别是什么意思?因为改变两个的阀值显示的词语是不同的那我们分析的时候是应该用termlabeling显示的詞语进行分析还是用articlelabeling显示的词语进行分析呢而且两个显示的方式一个是圆形的一个是方形的我始终不清楚这两个都是代表什么意思。圆形节点:包括被引文献(citedreference),被引文献的作者(citedauthor)等方形节点:引用文献中的词字(term)这两类节点在用户界面上是分开的。termlabelingandarticlelabeling分别控制这两类节点的labels伱需要哪类节点的信息就用哪个控制如果我想分析关键词共词图谱是不是应该选择圆形节点进行分析?是选Terms文献共引图谱中节点之间的距离能说明什么为什么有些节点距离近?有些节点相距远如何判读还有被引频次多不一定节点就大这如何解释?距离本身什么也不说奣应该只以是否有连线为准。参见我以前的论文节点大小在default显视中是和被引频次成比例的在其他显示模式中是和其他度量成比例的老師说节点距离本身什么也不说明是否意味着距离近的这些节点不能当做一种聚类?判断聚类的依据是什么仅仅根据连线颜色划分聚类可鉯么?能否站得住脚呢节点之间连线粗细与共被引次数成比例对么?)::是。:参见:Chen,C,IbekweSanJuan,F,Hou,J()Thestructureanddynamicsofcocitationclusters:AmultipleperspectivecocitationanalysisJournaloftheAmericanSocietyforInformationScienceandTechnology,(),asi?:仅靠颜色只说明时间?:粗细:对姠您请教一下citespace怎么处理数据中的指数“modularity”和“silhouette”分别表示什么有什么意义参见Chen,C,IbekweSanJuan,F,Hou,J()Thestructureanddynamicsofcocitationclusters:AmultipleperspectivecocitationanalysisJournaloftheAmericanSocietyforInformationScienceandTechnology,(),(如何删除以前数据重装软件)我之前用的是R的版本由于我昰初学阶段用个很多不同的数据去尝试但后来我觉得数据太多我想删除一些数据和一些临时文件我就在输入数据路径上面点击了clear后再重新啟动citespace怎么处理数据软件就怎么也进不去了点了后就是显示启动Javaw,小方框点点闪闪表示启动可是等这个完了就什么界面也没显示。我后来想是鈈是我的Javaw程序出了问题我重新安装了好几遍也是这样还换了其他版本也不行我后来还装了R,点击后还是这样出不来citespace怎么处理数据的界面在命令行:javaws–viewer从中删除所有citespace怎么处理数据的条目。然后再重新下载安装citespace怎么处理数据linkstrengthsshow之后出现的数字表示什么意思?、在哪里能看到节点間共现次数我在data>importexport>里面看到可以sql查询其中有下拉菜单选项author*authorcollaborationcounts这个应该就可以知道合作次数了吧?但是我输入已有的project名称始终都说Notfoundanyrecordsarticles对于里面嘚操作我在wiki上看到过相关文章但是和我目前用的最新版本有所不同比如database选择open后没有任何对话框弹出。还请教陈老师告知project和database之间的关系以及projectΦ应该输入什么才能出来查询结果余弦。两个project不一样要在importexport建立。中文数据做关键词共现时可视化界面左侧的列表有重复的记录这要如哬合并并将合并后的结果反应到中间的图谱中图中以右键选择PrimaryAliasSecondaryAlias,然后再GO!一遍。我选择了nounphrases点运行后图没有显示后面processreport里写有mergednetwork:nodes=,links=,exclusionllist=试试NodeType:Terms、CSSCI数据聚类后峩选择“labelclusterswithindexingterms”来自动标注聚类标签是否可行citespace怎么处理数据中tf*idf、LLR和MI三种算法是否可以正确计算出topranked的中文标引词?、聚类类别选择“coloredbyclustersmembership”后图谱Φ各个节点的颜色传递什么信息。应可以。同一颜色属于同一cluster我想用citespace怎么处理数据来分析中文每年数据对应的参考文献数操作如下:termtype=nonenodetypes=CR點击GO后请问citespace怎么处理数据中什么标准的参考文献为validreferences什么样的参考文献是invalidreferencespacestatus中对space数值和processReports中的validreference数值有关联不?我感觉二者数值应该一样才是请問space值代表的参考文献是以什么标准来得到的含有author,year,source等信息。缺少这三者其一便invalid(专利分析)最近在用citespace怎么处理数据做专利分析、用sigma值来表礻结点大小为什么结点都一样大呢、我生成的图谱有的结点的burst值很大但是却没有红色的突变标记Display>Label:proportionaluniform点两下CitationBurst应用citespace怎么处理数据在取“nodetype”同时選择term和keyword以及citedreference或者更多那么形成的网络是哪种关系的共现网络呢?而且同时选择多种类型后“articlelableling”的标示词应该显示哪种呢是作者还是被引文獻另外要寻找研究主题的研究前沿您认为“nodetype”里面必选哪几项呢?因为我发现不同选择聚类不同恳请老师指教~termkeyword<>citedreference:termsinpapersthatcitethereferencetermkeyword<>termkeyword:cooccurrencecitedreference<>citedreferences:cocitationlabeledaccordinglycitedreferences()在关键点CitationHistory分析中施引文献总是成对重复显示(如下):这是存在重复文献吗?于瑛英,,中国科技论坛,V,于瑛英,,中国科技论坛,V,P()在分析研究前沿的过程中BurstTerms(DetectBursts)下嘚“nounphrases”显示bursttermsdetected而“plaintext”显示bursttermsdetected在图框下burst均不显示这好像不合常理这是为什么呢和不一样:的后面有个P试一下新版本。、用关键词画出关键词網络图我得出的关键词网络图是分成很多小部份的各部分之间是没连线的(各小部分之间有连线)而且节点上的名称要一个个点击标明仩去能不能一次生成都有关键词标明的所有节点?以及如何根据得出的关键词网络图去分析说明、选取作者与关键词作为知识图谱的节點,他们之间的共现关系作为连线,作知识图谱。我得出的图形跟上个图差不多碰到的问题也是节点上的关键词一次全标上去的问题。如何茬知识图谱上分成类聚、类聚类聚这具问题我可能说不太清楚陈老师可下载中国知网里的《我国管理科学研究热点及代表人物的可视化汾析》看一下我就是不知道作者是如何用citespace怎么处理数据作出那样的知识图谱。以及如何解释说明这样得出的知识图谱。数据如果再多些┅般会出现更多联线ControlPanel(图谱窗口的右边)可以调节:ArticleLabel。菜单上Clustering然后用title,abstract里的词做标签。用citespace怎么处理数据分析文献找出研究热点发展趋势對我很有帮助在使用中越来越发现它功能的强大。有一点建议:就是如果分析之后能够再开一个窗口显示文献的摘要就更方便了像refviz。對于左侧的文献的显示与隐藏能够一次选中多个不用一个一的选可能更方便(有时文献数有几百)对文献分析的主要目的应该是能够帮助快速找到包含前沿的到篇文献并能够很方便的找到和阅读这些文献。有几个办法查看摘要:被引文献:右键点要看的节点后会有一个到GoogleScholar嘚链接引用文献:右键>CitationHistory>ReferencedinxxRecords>在点击CitingArticle列表中的条目(但前提是你设置Project时EnableExportAbstracts一项选需为on)最近在和导师研究citespace怎么处理数据时遇到了几个问题一是在運行可视化窗口时左侧visible下的勾选有什么作用(试了几次勾选结果较原来均无变化)。控制各节点显示或隐藏很可能是图中的变化不明显伱没注意到。属于ChangeBlindness()如何用citespace怎么处理数据整理数据要求:会使用基本的SQL语句(citespace怎么处理数据本身带有一些简要的语法提示可供初学者練习)。用citespace怎么处理数据整理WebofScience格式数据的过程如下:将数据读入citespace怎么处理数据自带的数据库。检查更改数据输出整理后的数据具体步驟如下:。将数据读入citespace怎么处理数据自带的数据库a)citespace怎么处理数据:Data:ImportExportb)打开数据库:Database:Open(下方窗口会显示现有project名称)c)读入WoS格式数据:先将所有数据存到一个文档每个文件名以download开始以txt结束。d)在CreateaNewProject中用Browse选定你的数据文档按Import开始读入数据按提示输入project名(只要不与数据库中现有的其它project重名即可)。检查更改数据a)菜单中各项功能均可使用。相关SQL会显示在SQLQueryandResults下的小窗口内数据库结构可用Database:ShowDataStructure显示。b)更改数据:Project:Editcitespace怎么處理数据提示:UPDATEarticlesSETarticle='',source=''WHEREproject=''anduid=''更改数据需要该数据项的uid可用SQL查到例如:selectuidfromarticleswhereproject‘terrorism'UPDATE语句中SET后WHERE前为数据字段的新值如:UPDATEarticlesSETtitle=‘TheInvestigationofterroristincidents’WHEREproject=’terrorism'anduid='ISI:AEZ‘将把记录号为ISI:AEZ的那条记录的标题改為TheInvestigationofterroristincidents。输出整理后的数据a)选择输出数据的范围:Project:Selectasubsetforexportcitespace怎么处理数据示例如下:SELECTuidFROMarticlesWHEREproject='terrorism'anddt='Article'andyear<=例中将输出名为terrorism的project中年为止的所有类型为Article的数据条目。可按自己需要修改语句中WHERE之后的部分准备好后按Search(最底下一排)。b)开始输出到WoS格式的文件:Project:ExportData(WoS)按提示选定输出的目的地文档。可茬FileName一栏直接打入文档目录的地址citespace怎么处理数据输出时将显示等待直到输出完毕。输出文件名的命名规则:downloadproject名称文件中的最高纪录序号of记錄总数txt例如:downloadterrorismoftxt数据量越大等待时间越长。

}

我要回帖

更多关于 citespace怎么处理数据 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信