2009年SCI来源期刊列表应该处理了,已经好几年的都搜集整理了,当数据积累的年数久了,自然就有意义。

在SCI来源刊的列表中进行Ctrl+C/V之后,再删除一些无用信息,如它是否需要Current Contents/BIOSIS Previews 等信息,删除方法自然以在文本编辑器或Word中“替换”功能来实现。

但问题还是存在一些,这次由于某种考虑,将SCIE的期刊表也加入了其中,Word就达到了2000多页,Txt文件也有2M多,替换起来也足够慢的了,象死机一般,借用非windows自带文本处理器替换速度就快多了。但在替换后留下了众多无用的“空行”,这些空行才是自己要解决的问题。因为自己不会写程序,也不会用word中的VB宏写几句替换功能,只能笨办法找吧!

第一步:将(空格)+(空行)替换为(空行),解决一些空格空行在一起的特殊情况。word中办法是”(空行个数)+^p”替换为”^p”。

第二步:将两个以上的空格替换为两个,其实质是在现在的文本中,文字后的一个空行+之后的若干空行,替换为文本后的一个分行符+1个空行。将”^p^p^p”替换为”^p^p”即可,大不了同样的动作多执行几次而已。

第三步嘛,将Word版本打印成PDF文件,保存下来,2009年数据就告结束!

因为数据量太大,一些别的方法也是适用的,可是处理起来更费CPU,如方法2:
1:打开该word文本,点击“编辑”-“全选”
2: 点击“表格”-“转换”-“文字转换成表格”–”选择列数为2列“
3:合并单元格
4:点击“表格”-“转换”-“表格转换成文字”
5:完成

当然呀,此方法的后果是删除全部空行,不想删除的也删除了!

Tags: ,,,. 7 views
首页

2 Comments so far

Trackbacks/Pingbacks

留下评论

名称(必需)
Mail (必需),(will not be published)
网站(recommended)

Fields in bold are required. Email addresses are never published or distributed.

Some HTML code is allowed:
<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>
URLs must be fully qualified (eg: http://cunfu.info),and all tags must be properly closed.

Line breaks and paragraphs are automatically converted.

Please keep comments relevant. Off-topic, offensive or inappropriate comments may be edited or removed.