2008-10-31

最近一周,每天中午假寐前的几分钟,就统计一下本博CTO钱涂先生替偶选择的“雅虎统计”中有关他人通过搜索引擎而搜索点击(“关键词分析”功能)进而访问到本“小镇村夫”网站上来的数据,只想用数据说明一下网络用户在搜索引擎使用中的行为特征。今天中午刚好凑足了100条数据,进行了简单的分析,列于下供自己备档,这种方法不算是实证吧,“泼妇”可千万别骂我呀,偶会好怕怕的!

1、在访问本博的来源中,通过Google共86条,Baidu共13条,Yahoo共1条。(注:本博服务器封杀了利害的百度爬虫)。

2、100条数据中,来自搜索引擎的第1个面页的92条,第2页面的6条,第3页面的2条。(注:条数也刚好是百分比),即92%来源于第1页面,6%来源于第2页面,2%来源于第3页面,第4之后为0%!

3、点击来源中每个页面的具体位置数据及比例见下图。先说明一下,“页面\位置”“1\7”表示第1页面的第7条URL记录(从上往下算啦,Google/Baidu/Yahoo都是每页显示10条记录URL)。从图表也看出来,第1页的前10条记录被访问的曲线也是下降曲线!

4、这下明白了吧,如果你PR值低,搜索引擎优化SEO做的不好,如果不能进入前3页,象我们这种小博客,被人点击的机会都没有,也许全靠那点RSS了,所以大家也就不要太为这些点击量而忧心忡忡或日思夜想了,该干嘛干嘛去吧!

5、当然,其它更多的数据早就说明了这个现象或问题,具体如Google:搜索改变思维(网络搜索引擎)

今天,Google Search除了搜索以外,也慢慢衍化成我们判断信息的标准,成了代替我们思考的机器,它“分析”出的前两条结果,我们就认为是“正确的”,是“最好的”。

以及万方对首页的抢占策略(学术搜索引擎)

使用万方数据资源的用户不到20%的检索者会翻到2页以上
使用万方数据资源的用户不到10%的检索者会翻到3页以上

自己的数据也说明这样的问题,这也是为什么搜索引擎商不按规则办事如百度便会被人封杀、SEO能混到饭吃也越来越难的原因吧!

在这个靠网络生存的年代,你不得不思考:抢占首页,抢占第一位置!按经济学的思维方式,这可是绝对的稀缺资源,这种稀缺性还不能靠分配来获取,那当然只能是某种方式的“竞争”而成了!当然,如果你没有什么利益的诉求,那这些搜索引擎用户行为可就是不关你鸟事了!

2008-10-28

生活与学术,观念与思考,往往会被直觉所蒙蔽,最近三天读书,好多的数据说明了好多的想当然的悖论,当然有些是自己的无知(这种无知也不仅是我的,可能是绝大多数人的),于是搜集整理了一下,备档记录(情绪发泄VS理性思考,直觉判断VS逻辑推理)

1、如果把每一个国家的国有经济占GDP的比重作为一个横坐标,把它的法治发展水平发展做为纵坐标,你会发现,国有经济比重越高的这些社会,它的法治水平普遍会更低。

2、中国的基尼系数2001年接近0.45,但如果城乡分别计算,城市是0.37,农村是0.33,都低于0.4。这便是城乡二元结构带来的统计方面的问题。

3、据数据分析,平均而言,人均增长率高的地区,收分配的差距反倒比较小,特别是浙江、福建、广东这些省份;而收入增长比较低的,收分配的差距则较大。

4、据数据分析,平均而言,国有经济比重越高的地区,收入差距越大。

5、据数据分析,平均而言,政府花钱占GDP比重越高的地方,基尼系数也越大,即收入分配差距越大。

6、据数据分析,平均而言,利润在GDP总是中比重越高的地方,人均收入越高,收增长的速度也越快;利润在GDP总是中比重越高的地方,收入差距越小。而利润占GDP比重越低的地方,基尼系数越大。

7、据数据分析,平均而言,市场化程度越高的地区,收入差距反倒越小,而不是越大。

上述3-7的问题之解可以用诺贝尔经济学奖得主莫里斯(1971,Mirrless)的贡献:效率与平等之间的矛盾源于有关个人生产能力信息的不对称。

8、研究结果表明,政府的行政成本对最近这些年的经济产生了负的影响

9、如果画一张图人均GDP增长图,日本以1950年为起点,中国台湾地区以1958年为起点,韩国以1962年为起点,中国以1978年为起点,我们会发现,中国非常令人振奋的经济增长并不是独一无二的。不仅中国的增长速度至今为止并不独一无二,而且导致它的直接因素也与东亚其他国家和地区非常相似。

10、实行“休克疗法”后,原来的技术和产业没有变化,出于以下两个原因,政府力图避免其破产并给予保护和补贴:(1)这些产业非常先进,对于国家的现代化发展很重要;(2)这些企业雇用了大量劳动力,一旦破产,必将引发大量失业,进而导致社会不安定。

相关阅读:
中国改革30年–10位经济学家的思考/张维迎主编/2008-6/上海人民出版社/45.0/平装

2008-09-28

1.Dialog三种平台,即DialogWeb、DialogClassic、DialogLink三种方式,进行费用比较(针对本人电脑网络环境),注DialogClassic与DialogLink设置为Connect Time方式,而DialogWeb为DialUnits方式。

2.在已经十分熟练的情况下,即选择数据库完全一致,几乎不耽误时间进行操作。

3.具体的检索过程如下:b 34; e au(cr)=bai zd; s e3(e13);t s1/66/all(收录检索)和t s1/66,K/all(引用检索); bye

其中查出收录文献85篇;被引用文献8篇,费用比较如下:

收录检索费用:DialogWeb $1.28;  DialogClassic $5.70;  DialogLink $2.56

引用检索费用:DialogWeb $5.74;  DialogClassic $8.48;  DialogLink $4.26

分析简述:

1.经上述数据对比,收录检索中DialogClassic方式最不可取,正如某国外统计数据所讲,一般DialogClassic比DialogWeb费用高10-15%,本人计算得出的值比这还要高;在引用检索中,DialogClassic仍然也是最费钱的方式,于是DialogClassic几乎是可以从自己使用的方式中淘汰。

2.SCI的收录检索DialogWeb方式最便宜;而引用检索DialogLink最费用最低。

另附显示格式:

t s1/66,k/1 (66免费格式+KWIC格式)
1/66,K/1  Links
SciSearch(R) Cited Ref Sci
(c) 2008 The Thomson Corp. All rights reserved.
15823346
Title: On limit theorem for the eigenvalues of product of two random matrices
Author(s): Bai ZD (REPRINT) ; Miao BQ; Jin BS
Journal: JOURNAL OF MULTIVARIATE ANALYSIS , 2007 , V 98 , N1 ( JAN ) , P 76-101
Cited References:
…BAI ZD, 1986, V73, P555, PROBAB THEORY REL

t s1/6/1 (6格式,即免费格式)
1/6/1  Links
Fulltext available through:   jiaotongunivercity
15823346   Genuine Article#: 111CK   Number of References: 14
On limit theorem for the eigenvalues of product of two random matrices
( ABSTRACT AVAILABLE )
Publication date: 20070100

使用技巧或问题小结:

?  e cr=bai zd, 1988? (注:e后可以一直扩展到作者+年份+卷+页+刊(缩写)),但切记,在“逗号”之后应该有一个小空格,否则麻烦多,偶就多花了10几美元才找到这个原因呀)
Ref   Items  Index-term
E1        1  CR=BAI ZD, 1988, V40, P491, ANN I STATIST
E2        1  CR=BAI ZD, 1988, V6, P1729, ANN PROBAB
E3        0  CR=BAI ZD, 1988?
E4        1  CR=BAI ZD, 1989, P342, P TENC 4 IEEE REG 10

2008-08-07

来源:任胜利:究竟有多少种学术期刊?

当今世界上的学术期刊总数是多少?这些期刊的主办单位、运作模式、地域分布等如何?ALPSP(Association of Learned and Professional Society Publishers,学术和专业学会出版者协会)前总裁、Learned Publishing主编Sally Morris女士在其论文“描绘期刊出版图谱:我们知之多少?”中感叹:我们知之甚少。

基于《乌利希(Ulrich)期刊指南》的全球期刊数量统计

根据Morris女士的统计,截至2007年3月2日,国际连续出版物宝典《Ulrich期刊指南》共收录有64628种学术期刊(其中在办的有56886种),其中的23588种为同行评议期刊。

共有9883家出版商,平均出版期刊:23588/9883=2.4。

期刊数量前4位出版商及其主办的期刊数量:Elsevier-1934种, Springer-1612种, Taylor & Francis-1025种, Blackwell + Wiley-1199种; 这些出版商所出版的期刊总数为5770种,占23588种期刊的24.8%。

上述四大出版商平均拥有期刊1443种,其余出版者平均拥有期刊1.8种。

按国家分布的期刊数量:美国、英国、荷兰、德国、澳大利亚、日本、加拿大、中国(第8位)。

全球期刊市场与论文产出状况

Mark Ware咨询公司于2006年9月就科技期刊的出版现状进行了全面综述,其统计数据表明,目前全球的英文科技期刊市场大约为50亿美元,有约9万人直接从事科技期刊业,另有2-3万人间接从事期刊业。

全球大约有23000种经同行评议的学术期刊,每年发表论文总共大约为140万篇,论文数量和期刊数量在过去200年来稳定增长,年增长率分别约为3%和3.5%,与研究人员的增长率(3%)一致,目前大约有550万研究人员。

ISI的期刊检索数据库中收录了约8700种期刊,其中大约5900种为科技期刊,1700种为社会科学类期刊,1130种为人文类期刊,这些期刊每年总共发表的论文大约为100万篇。

Scopus数据库收录期刊情况

世界最大的文摘与引文数据库Scopus共收录了来自4000余个出版者的15000余种同行评议期刊,据Elsevier科技部中国区总裁张玉国先生的数据,Scopus数据库中期刊的地区分布为:美国 7589,英国 4536,荷兰 2085,德国 1729,中国 633,日本630,法国 611,瑞典460,意大利454,加拿大404。

我国科技期刊数量

截至2005年,我国出版的科技期刊数量为4758种(不包含军队系统),其中学术类期刊为2058种 (占科技期刊总数的43.3%),技术类期刊和检索类期刊分别为1758种和79种。我国科技期刊的主办单位主要为研究院所、高等学校和学协会,这三类机构所拥有的科技期刊分别占我国科技期刊总数的28.8%,25.6和24.3%;我国基础科学、工程技术和医药类期刊的占有量分别约为40%,40%和20%,SCI检索系统中这三类期刊的数量比例分别大约为45%,20%和35%。

与国际上科学计量研究一样,我国的文献计量与研究评价中同样只认可少数经同行评议的”高水平”期刊,如中国科技信息研究所2007年版《中国科技期刊引证报告(核心版)》只收录统计源期刊1723种,北京大学出版社《中文核心期刊要目总览》2004年版(第四版)共评选出1798种核心期刊(其中科技期刊1065种),中国科学院国家科学图书馆主办的中国科学引文数据库(CSCD)2007-2008年共遴选了1083种期刊,其中英文刊55种,中文刊1028种;核心库期刊737种,扩展库期刊346种。

相关文献

Mark Ware Consulting Ltd. Scientific publishing in transition: an overview of current developments (2006年9月)
Morris S. Mapping the journal publishing landscape: how much do we know? Learned Publishing, 2007, 20: 299–310. http://dx.doi.org/10.1087/095315107X239654
Scopus Overview: What is it? . http://info.scopus.com/overview/what/
郭玉,赵新力,潘云涛, 等.我国科技期刊基本状况统计与分析. 编辑学报, 2006, 18(1):1-4
任胜利. 最新中国科技核心期刊大全—附引证指标. http://www.sciencenet.cn/blog/user_content.aspx?id=32722
任胜利. 我国科技期刊的现状及其在学术交流中的作用. http://www.sciencenet.cn/blog/user_content.aspx?id=22961
张玉国. 科技期刊的属性. http://www.sciencenet.cn/blog/user_content.aspx?id=33920