2009年SCI来源期刊列表应该处理了,已经好几年的都搜集整理了,当数据积累的年数久了,自然就有意义。
在SCI来源刊的列表中进行Ctrl+C/V之后,再删除一些无用信息,如它是否需要Current Contents/BIOSIS Previews 等信息,删除方法自然以在文本编辑器或Word中“替换”功能来实现。
但问题还是存在一些,这次由于某种考虑,将SCIE的期刊表也加入了其中,Word就达到了2000多页,Txt文件也有2M多,替换起来也足够慢的了,象死机一般,借用非windows自带文本处理器替换速度就快多了。但在替换后留下了众多无用的“空行”,这些空行才是自己要解决的问题。因为自己不会写程序,也不会用word中的VB宏写几句替换功能,只能笨办法找吧!
第一步:将(空格)+(空行)替换为(空行),解决一些空格空行在一起的特殊情况。word中办法是”(空行个数)+^p”替换为”^p”。
第二步:将两个以上的空格替换为两个,其实质是在现在的文本中,文字后的一个空行+之后的若干空行,替换为文本后的一个分行符+1个空行。将”^p^p^p”替换为”^p^p”即可,大不了同样的动作多执行几次而已。
第三步嘛,将Word版本打印成PDF文件,保存下来,2009年数据就告结束!
因为数据量太大,一些别的方法也是适用的,可是处理起来更费CPU,如方法2:
1:打开该word文本,点击“编辑”-“全选”
2: 点击“表格”-“转换”-“文字转换成表格”–”选择列数为2列“
3:合并单元格
4:点击“表格”-“转换”-“表格转换成文字”
5:完成
当然呀,此方法的后果是删除全部空行,不想删除的也删除了!
ultraedit很强大的说
回复本评论
改用excel吧
回复本评论