Posts Tagged ‘数据库’

2009-12-25

下周就要向学校汇报一年电子资源的使用效益分析了,2010年预算好做,决算也好做,就这个效益分析好难。
因2009年还没完结,数据库统计也不全面,但自己按过去有使用数据的12个月计,当作是一整年,也算合理吧。
有几条规律性的,先记一下:
1、远程访问远远大于镜像使用数据。
2、中文电子期刊全文下载量仍有大幅上升。
3、中文学位论文全文下载量仍有大幅上升。
4、中文电子图书阅读与下载量仍有大幅上升。
5、外文电子期刊全文下载量仍有大幅上升。
6、外文数据库的检索量有大幅上升。
大幅上升,绝不是夸张,只因在这里不能随便告诉每个量的具体值,涉及使用量问题,领导不批,俺一般不透露。
有一项俺统计的分外详细,那就是外文电子期刊的全文下载篇数,其中的数值倒是露一下:
下载量分段 刊数 刊数比例 下载量比
10000+         4         0.32%       16.83%
5000+          10        0.80%       12.20%
1000+          96         7.72%      33.95%
500+            96         7.72%      11.22%
100+           554        44.53%     20.02%
50+             484        38.91%      5.76%
总计          1244       100.00%     99.98%
注:最多一种刊全年下载量为43521篇;这下用来分析各学科的下载量、本校的核心馆藏,应该有些帮助了吧……数据都有了,下一步详细分析后,还能有些有意思的东西……
后补记:
有几个数据自己再记录一下:
1、100+下载期刊量占所有有下载期刊数的8.27%,占所有下载量的85.1%;从这个数据统计,不符合二八定律,即学术性期刊的被下载量的相对集中性比想象的更大(也可能仅是本校的特殊情况形);从另一角度看,91.73%有下载的期刊,仅被用户下载了14.9%的数据;
2、50+下载期刊量占所有有下载期刊数的13.53%,占所有下载量的90.3%;从另一个角度看,86.47%有下载的期刊,仅被用户下载了9.7%的数据;
3、具体学科专业方面,针对本校情况,有待继续深入,这一两天不想做了,有其他更重要的事等着;尤其是人文社科的电子期刊使用报告,比较难做,自然科学的报告好做多了!

Tags: ,,,,,. 71 views
2009-12-18

今天给某大学查询CSSCI几年来的收录数据,好几百条,CSSCI下载速度那个慢,另外下载时也没有想要的字段可以选择权(也许有,我没找到?),总之我是累够呛,我真不知道应该如何讲。
下载了几百条数据,问题出现了,许多字段都不是自己想要的,打印多费纸,委托单位也不需要,如“【英文篇名】、【学科分类】、【中图类号】、【标引词】、参考文献”等,有什么好的办法可以处理这些半有规律半没规律的数据吗?
同室的几位一起研究,得以解决,方法如下:
第一步:先将不需要的字段及参考文献替换为某一特殊符号,如将“【英文篇名】”替换为“#【英文篇名】”,其他同理;
第二步:在word中,选择“表格”-“转换”-“文本转换为表格”,选择转换为两列,以特殊符号“#”作为文字分隔,进行转换;
第三步:在转换的表格中,自然形成两列,其中一列就是不需要的字段,删除列就不用教了!
第四步:再将表格转换为文本;
第五步,进行回车符的替换,形成最后的报告。
附:以自己的一篇文章作为案本吧,看看CSSCI的字段情况
【文件序号】31G0252007100006
【来源篇名】虚拟参考咨询2.0全景扫描
【英文篇名】Landscape Scan of Virtual Reference 2.0
【来源作者】刘青华
【文章类型】论文
【基金】国家社科基金项目(青年05CTQ003)/东北师范大学人文社会科学校内青年基金项目(06QN033)
【期刊】图书馆杂志
【第一机构】东北师范大学
【机构名称】东北师范大学图书馆,130024
【学科分类】图书馆、情报与文献学
【第一作者】刘青华
【中图类号】G25
【年代卷期】2007,26(10):20-26
【标引词】虚拟参考咨询2.0/全景图/Web2.0
参考文献:
1.潘卫.……
2.张智雄.……
3.王博.……
4.…………以下略

Tags: ,,. 2 views
2009-12-15

一个老师来查自己的文章,核心期刊,在数据库中就是检索不到,俺们想了很多办法。下午仔细对比分析了一下,发现一个问题,似乎有点明白,但其实最后还是不明白。
老师发的文章在《中国实用医药》2007第2卷9期上,但在数据库中用《中国实用医药》杂志定位,无论是作者还是文章名检索都没有,无论是CNKI,还是万方还是重庆维普。但是此刊的2007,2(9)确实在数据库中。
再仔细就发现了问题:数据库中的2007,2(9)上的文章(后来自己再努力了一下,2007,2(10)也是一样),居然不是《中国实用医药》这本刊的文章,而是《中国实用医药杂志》这本刊,这样当然就查不到了真正要查的文章。
问题是:《中国实用医药杂志》这本刊的2007,2(9)和2007,2(10)如何混到数据库里去了的呢?而为什么真正的《中国实用医药》的两期文章却没有了呢?在网上查发现《中国实用医药杂志》似乎就是一种传说……
难道真的是中国期刊也是一种传说?
难道数据库里有了一个“狸猫换太子的传奇”?

文章1:《中国实用医药》2007,2(9) P53页,是这样的

文章2:《中国实用医药杂志》2007,2(9) P53页,是这样的
晚上下班前,我再进行了一次比对,发现了一个大的问题:
《中国实用医药》的外文刊名:China Practical Medicine
《中国实用医药杂志》的外文刊名是这样写的 Chian PracMed。BS,China都写错了……

Tags: ,. 77 views
2009-07-28

今天照理在单位加班,尽管没有再做“君子兰”查新,搞了一上午调查问卷的第二稿讨论(还好,群策群力,集思广益,就要拿出来了)。下午在办公室,突然想看一下2009年上半年(1—6月)的统计报告。下面是稍有趣的情况说明,略当备份了:
1.CNKI镜像与远程访问(北京)用量比值是:检索次数总数:镜像/远程=129/100; 全文下载总数:168/100
2.还是CNKI,2009年上半年检索与下载全文的关系,即每次检索会下载多少篇全文,比值为100/48(100次检索会下载48篇全文);而2008年全年的数据计算,100/36(100次检索会下载36篇全文),今年这个数据提高了12%,真是不可思议。注:我过去一直以为,100次检索,至少会有超过100篇的文章下载呢,反正也不花钱,现在看来我的想法是愚蠢的,数据的选择也是成本呀!
3.从各个专辑的使用统计来看,本校到底是人文社科类中文下载CNKI必不可少。2009年上半年(哲学与人文科学 F+社会科学Ⅰ辑G+社会科学Ⅱ辑H+经济与管理科学 J)占了CNKI全部下载文献的77.46%;而(基础科学 A+工程科技Ⅰ辑 B+工程科技Ⅱ辑 C+农业科技 D+医药卫生科技 E+信息科技I)仅占全部下载量的22.54%;再细点的比例是:“哲学与人文科学 F”占 27.30%、“社会科学Ⅱ辑H”占26.26%、“经济与管理科学 J”占15.26%。
4.外文数据库中,统计了Wiley-Blackwell,上半年由于Blackwell的订购以及Wiley全库,2009年上半年的使用量已经是2009年全年使用量(全文下载)的118.4%.
5.Scopus的使用数据不知为什么(也许是文摘索引类数据库,一年多了,读者习惯了会想起它来了,再加上学生大使的宣传推广工作效果不错),2009年上半年突飞猛进,上半年是2008年全年检索次数的111.4%。
6.EBSCO现象有趣,2009年上半年检索次数已经超过2008年全年检索数,但全文下载量却只有去年全年的1/3,我私下估计的原因在此不公开了。
7.JSTOR和ProQuest数据库,基本与2008年全年的1/2持平,看来订购的时间久了,变化的幅度也不会太大的. 另ACS2009年上半年是2008年全年全文下载量的55%; SDOL是2008年全年的58.5%,这两个全文下载量的重要数据库同比都有一定的增长。
其他的更多数据库,便不统计了!收拾包包回家,可以裸读一两天,但愿没有电话打过来……

Tags: ,,,. 2 views
2009-04-17

最近几个月的检索数据,可以看出一些用户行为:
按用户检索次数顺序对检索方式排序如下(其中Federated searches为0,而Affiliation searches机构检索也仅100余次)
Basic searches
Searches within search results
Combined searches
Author searches
Quick searches
Searches from external origin
Affiliation searches
Federated searches

Tags: ,,,. 7 views
2009-03-11

数据库的事儿,尤其是大学图书馆学术数据库的事儿,是个人就可以管一管,大不了就这么个程序,低个脑袋你就能做好:
1、试用呀,你不主动自然有数据库商主动让你试用,如果你不想买,可以试用多少年都行(当然一年只有一两次),我有时就想,我试用是为了数据库商好,如果大家都不试用,那些公司的工作人员不下岗就得减薪。
2、试用之后,你不用管,数据库商肯定会提供给你一个试用分析表,统计呀什么的。你看就明白,如果看还不明白,对方也会给你讲明白,如果讲不明白,那对方基本就不称职,如果你不是脑袋特别笨的话。这个时候可能有什么评估报告之类的。
3、你只要自己想一想,找相关院系的人聊一聊,便大概可以知道这个库是否有点用,当然你是不能做主的,即使你能做主,也要装着不能做主。当然有联合组团的通知与说明,通常会出现。
4、当然要提供给领导们了解情况,领导们觉得有意思,那就报更大的领导或组织进行考查讨论,那可能就是“校资源建设委员会”,委员会投票或拍板。剩下就是联系数据商,给IP什么的。
5、培训读者呀,发放宣传页呀,让数据资源利用起来嘛。这一切是图书馆最乐意做的,你要不做,那也可能你就下岗了,或者去别的部门了。
6、年终了,统计使用量,COUNTER什么的标准的,分析报告往上面交,看有没有效益,但学文的校长与学理的校长对效益分析,多少还有些不同看法呢,解释呀,征求意见呀,“虚心”听领导训话,偶尔插嘴说明一下。
7、根据领导的指示续订或停订,停订的进行一下分析,如果会出现哪些影响,先要考虑到可能出现的后果。
说了半天,到了续订的时候,有数据库商(国内外)给我提到的要涨价*%的原因,大多可以理解,因为他把你当正常人看待,可有的理由说出来,我也觉得可笑,便记了下来:
1、一外国数据库商(中国代理)给俺打电话,说要上涨N%,我问他原因,对方说:现在美国金融危机,对中国上涨N%比较合理。我当时就火大了,我说:WTO之后,中国就完全融入了世界全球化行列,世界其他国家的危机是在全球化背景之下的,中国必须也会受到影响,不能因为世界的经济问题就转嫁到中国来,让中国人背个“刘罗锅”,并且中国现在也进入经济危机之中呢!价格上涨的理由有很多,比如数据增加了,成本增加了,但他提的这个嘛,我难以接受。
2、一国内著名数据库商,提出要上涨N%以上,我也火大,如香港电影《暗战》里的那位警察官人一样“有火,尿有些黄”,只因对方提出的理由更可笑:因为数据库的检索系统与平台升级了,功能增加了,比如开始提供更好的“个性化服务”了。我笑了笑说:数据库商改进服务功能,是为了更好地服务用户而不应该是增加价格的理由,说低俗一点,你们增加与改进服务,只应该是为了吸引住那些用户的使用。如果增加一点功能就收钱,图书馆黄了就得了。就相当于一个作者没事儿时就给自己的著问题续个狗尾什么的,以涨点钱的目的。
我有时就想:钱真不是王八蛋,它是个好东西,不但数据库商能认识到,就连我这种人都喜欢钱。但喜欢归喜欢,要让别人给你钱,嘿,你还真得找个不错的理由才行!

Tags: ,. 9 views
2009-03-02

中午,收到了好几大包邮件,全是有关某些期刊的CNKI独家数字出版致用户的声明书,具体包括中国学术期刊(光盘版)电子杂志社、具体的期刊编辑部联合发的通报材料。
内容中有两条是关键的,本文摘录一下:
1.自**年**月**日起至本刊授权终止之日止,未经中国学术期刊(光盘版)电子杂志社与本刊许可,任何单位和个人均不得使用本刊出版的文献制作、出版和发行任何电子、网络等数字化产品,也不得利用本刊全文文献从事互联网信息服务。请用户向该社或其授权的发行机构订购本刊数字化文献。(本人注:关于某本具体的刊)
2.用户仍可继续使用此前已经购买的本刊曾经授权下表所列厂商在授权期限内出版、发行的本刊数字化文献。对于在该授权期限之外出版的本刊数字化文献,有关厂商必须停止销售,并将其从有关数字化产品中删除,用户则必须停止使用。(本人注:关于某本具体的刊)
本人注:在某些期刊(指个别而非全部)曾经授权的厂商(即非独家授权)本人大致看了一下,涉及到如下单位:
北京万方数据服务有限公司
北京书生网络技术有限公司
北京国研网信息有限公司
重庆维普资讯有限公司
台湾华艺数位艺术股份有限公司
北京龙源网通电子商务有限公司
解放军医学图书馆数据库研究与开发部
下一步,别的数据库商会做什么,我们用户只能是拭目以待吧?或有关数据的事情坐以待毙吧?

Tags: ,. 9 views
2009-01-15

CNKI现在很牛的,各个图书馆的使用率很高,不用人讲。但是CNKI内核的搜索方面,一直感觉不太好说,尤其是涉及到数字、符号与外文检索词时,检索结果有时是“惨不忍睹”,不知为何他们自己就没发现呢?
以一个检索词为例,比较一下偶测试结果,检索词为“1,10-菲咯啉(1,10-phen)”,用“1,10-phen”进入题目检索,这个词比较好呀,有数字有外文有字符。具体检索结果截图如下:
……
……

Google检索截图
……
……

Baidu检索截图
……
……

Web of Science(SCI)检索截图
……
……

SCOPUS检索截图
……
……

万方数据资源检索截图
……
……

重庆维普检索截图
……
……

CNKI检索截图
……
……

CNKI总网站上,在题名中输入检索词,选择“精确”,点击“检索文献”

Tags: ,. 10 views
2008-12-12

每至年底,对电子资源的效益评估对我来讲是个大任务。
近年来,由于追求一种片面的全文获取与下载的效益,有对登录、检索等项不太重视、甚至漠视的趋向,尤其当领导与报表只关注全文下载量,计算每篇文章的下载成本,久而久之,连自己也忘记了去反思。
其实在电子资源的国际评价标准如COUNTER中,涉及登录(Sessens-Logins)与检索(Searches Run- Queries)、浏览(Page Views/browsing/viewing)是有多项统计数据的。
而其中浏览browsing就有title-list|vol/iss|TOCs|citations等,而Page Views/viewing就有pages/articles数值。
而下载与打印文章数,对谁都很好讲解,读者与领导也很喜欢这种数据。唯独在对检索的理解上有些问题。
今天寻思了良久,才意识到:要想说服他人,必须先要说服自己!
检索的目的是寻求某种确定信息或信息的某些线索。经过检索如发现所需信息,是一种正面的积极的信息查询;检索后没有获得想要信息,却也不能说是否定或消极的结果或方式,因为它可能排除了在某个/些信息源中存在所需信息的这种不确定信息。
信息查询(检索功能派上用场)有两个目的:一是找到某信息的确定值或线索(追求已知);二是找到没有某信息的确定值或线索(排除未知)。
(1) 选择数据库、检索字段、组配方式等进行检索,结果出来的结果是检索者所需信息,这是一种已知信息的查找,此处的已知等同于已经存在之意,即已有的科研成果、动态消息等。
(2) 使用各种检索方法,最终追求对某一信息的排除,有如科技查新中新颖性查询与判断一样,某些组配式或关键词是无法检索出确切结果或相关结果,这看似一种否定意义的信息,却给某些科研人员带来极大的肯定性信息,即这种课题是值得去创新的去尝试的。
总结:
在上述第一种检索中,后续结果是:浏览标题、文摘、参考文献等,然后是全文文献的下载、打印。一种对已有信息的获取。
在上述第二种检索中,后续结果是:进行多次检索,都无法查到与自己所需信息相关的信息,这种看似失败的检索却成就或蕴藏着某种成功的希望与机会。一种对不存在信息的肯定。
至此,检索的作用(或许在检索次数中体现出效益)已较为清楚地呈现在读者与领导的面前了吧?!检索也是一种省时的信息查询与获取方式,这也算是效益吧? 检索能力也是个人信息素养的一部分,是一种考验与前进的动力,是否已经与效益二字相去甚远也……
拉杂着说了半天,就想说一句话:当检索结果为0时,也可能是一种不错的结果!

Tags: ,,. 10 views
2008-11-26

因为有城市与环境科学学院的老师总有查新项目,涉及地理学科,数据库选择:
GEOPHYS (Geophysics)
GEOSCI (Geosciences)
具体包括:
2: INSPEC_1898-2008/Oct W4
58: GeoArchive_1974-2008/Jun
62: SPIN(R)_1975-2008/Oct W3
87: TULSA (Petroleum Abs)_1965-2008/Nov W5
89: GeoRef_1785-2007/Apr B1
99: Wilson Appl. Sci & Tech Abs_1983-2008/Oct
105: AESIS_1851-2001/Jul
144: Pascal_1973-2008/Nov W4
292: GEOBASE(TM)_1980-2008/Nov W3
6: NTIS_1964-2008/Nov W5
8: Ei Compendex(R)_1884-2008/Nov W2
34: SciSearch(R) [...]

Tags: ,,. 5 views
 Page 1 of 4  1  2  3  4 »