今天给某大学查询CSSCI几年来的收录数据,好几百条,CSSCI下载速度那个慢,另外下载时也没有想要的字段可以选择权(也许有,我没找到?),总之我是累够呛,我真不知道应该如何讲。

下载了几百条数据,问题出现了,许多字段都不是自己想要的,打印多费纸,委托单位也不需要,如“【英文篇名】、【学科分类】、【中图类号】、【标引词】、参考文献”等,有什么好的办法可以处理这些半有规律半没规律的数据吗?

同室的几位一起研究,得以解决,方法如下:

第一步:先将不需要的字段及参考文献替换为某一特殊符号,如将“【英文篇名】”替换为“#【英文篇名】”,其他同理;

第二步:在word中,选择“表格”-“转换”-“文本转换为表格”,选择转换为两列,以特殊符号“#”作为文字分隔,进行转换;

第三步:在转换的表格中,自然形成两列,其中一列就是不需要的字段,删除列就不用教了!

第四步:再将表格转换为文本;

第五步,进行回车符的替换,形成最后的报告。

附:以自己的一篇文章作为案本吧,看看CSSCI的字段情况

【文件序号】31G0252007100006
【来源篇名】虚拟参考咨询2.0全景扫描
【英文篇名】Landscape Scan of Virtual Reference 2.0
【来源作者】刘青华
【文章类型】论文
【基金】国家社科基金项目(青年05CTQ003)/东北师范大学人文社会科学校内青年基金项目(06QN033)
【期刊】图书馆杂志
【第一机构】东北师范大学
【机构名称】东北师范大学图书馆,130024
【学科分类】图书馆、情报与文献学
【第一作者】刘青华
【中图类号】G25
【年代卷期】2007,26(10):20-26
【标引词】虚拟参考咨询2.0/全景图/Web2.0
参考文献:
1.潘卫.……
2.张智雄.……
3.王博.……
4.…………以下略

Tags: ,,. 2 views
首页

No Comments Now!

Be the first to comment on this entry.

留下评论

名称(必需)
Mail (必需),(will not be published)
网站(recommended)

Fields in bold are required. Email addresses are never published or distributed.

Some HTML code is allowed:
<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>
URLs must be fully qualified (eg: http://cunfu.info),and all tags must be properly closed.

Line breaks and paragraphs are automatically converted.

Please keep comments relevant. Off-topic, offensive or inappropriate comments may be edited or removed.