學術期刊擴散因子改進路徑
時間:2022-08-03 03:15:37
導語:學術期刊擴散因子改進路徑一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。
學術傳播不僅要看數量,也要看學術傳播的廣度,擴散因子就是在這樣的背景下產生的。Rowlands[1]認為期刊是知識擴散的單元,最早提出期刊擴散因子(JournalDiffusionFactors,JDF)的概念,即期刊論文每被引100次所涉及到的期刊數量。中國科學技術信息研究所同年在中國科技期刊引證報告中首次公布擴散因子,以后每年均公布該指標,擴大了該指標的影響。擴散因子的產生源于對期刊知識擴散和知識流動的評價要求。Singh[2]認為知識擴散(knowledgedif鄄fuse)應該等同于知識交流(knowledgeexchange)或知識流動(knowledgeflow)。Chenetal.[3]認為對于學術期刊而言,知識擴散是知識在科學文獻間的傳承,具體通過文獻之間的引用來反映,也可以稱為基于引文的知識擴散。Bonnevie[4]認為期刊被引是一種引證分析,反映施引期刊的范圍,高比率表示期刊的影響范圍較大,期刊有較高的影響力。關于擴散因子存在的問題,沈志超、龔漢忠等[5]研究發現擴散因子與總被引頻次和影響因子在部分期刊中并不平行一致,并且擴散因子與部分期刊實際學術影響力也不一致,甚至呈現反向變化趨勢,建議暫停使用該指標。鐘陽春、庾家良等[6]認為擴散因子計算公式中,分子是有限量,分母是無限量,現有的計算公式不能正確反映期刊的影響力,特別是不能正確揭示影響力正比于他引率和被引用刊數的本質。劉雪立[7]討論了擴散因子的人為操縱問題,認為如果某刊擴散因子明顯低于同學科其他期刊,則可高度懷疑該刊有人為操作的可能。擴散因子自從提出后,一些學者對其進行了進一步的拓展。Frandsen[8]認為擴散因子并不適用于評價期刊,提出修正指標新擴散因子(NewJournalDiffu鄄sionFactors,NJDF),即用期刊被引刊數除以載文量。葉艷、張李義[9]對擴散因子進行修正,采用他引影響因子來進行計算,即期刊被他引100次所涉及的期刊數。綜上所述,關于擴散因子及其應用的相關研究,總體上文獻不多。對于擴散因子的修正和改進,尚需要進行進一步的研究。總體上,在以下方面有待進一步深入研究:第一,期刊影響力與期刊擴散能力是兩個不同的概念,前者可以通過被引頻次、影響因子等指標反映,而后者可以通過被引刊數、擴散因子等來進行反映。關于影響力與擴散能力的關系,尚缺乏足夠的基礎研究和理論上的總結。第二,期刊載文量越大,選題和欄目更加豐富,內容跨度也大大增加,客觀上會拉大期刊的擴散因子,而關于這方面的研究總體不多。第三,自引無疑對擴散因子會產生影響,但是將自引剔除,完全采用他引次數來計算擴散因子值得商榷,因為適當的自引是正常的。本文在分析期刊載文量與自引等問題對擴散因子影響的基礎上,提出一個新的文獻計量指標———擴散指數,基于中國知網CNKI的引文數據,并以圖書館情報與文獻學CSSCI期刊為例,并對擴散指數的統計特征及與其他文獻計量指標關系特點進行分析,以期優化擴散因子,豐富文獻計量指標。
1擴散指數的原理
1.1期刊影響力與期刊擴散能力。期刊的影響力主要是通過期刊被引相關指標來反映的,期刊影響力的評價指標眾多,基于被引次數計算的指標大多數都是,如總被引頻次、影響因子、5年影響因子、他引影響因子、即年指標、h指數、特征因子、論文影響分值等等。期刊影響力指標又可以進一步分為數量指標與質量指標,數量指標就是反映被引總量的絕對指標,如總被引頻次、載文量、地區分布數等;質量指標是相對指標,影響因子、他引影響因子、h指數等。期刊的擴散能力是指期刊對學科內和學科外期刊的影響,由于學科特點不同,不同學科期刊的擴散能力是不一樣的,對于一些相對封閉的學科,與學科外其他期刊的關系相對較小,甚至與學科內的其他期刊關系也是如此;而對于一些基礎類、方法類學科,可能對其他學科也有較大影響,擁有較大的學科擴散能力。期刊論文在學科內外的擴散對于人類的知識進步具有重要意義,尤其對于交叉學科、跨學科的研究更有較大影響。由于學科擴散一般難以計量,所以人們還是通過論文被引刊數與被引數量來間接進行反映,擴散因子就是在這樣的背景下產生的。1.2期刊影響力與期刊擴散能力不存在必然的聯系。期刊影響力與期刊擴散能力是兩個完全不同的維度。由于期刊定位不同,即使對于同一學科的期刊,有的期刊更加強調專一性,論文側重在學科內某個相對較窄的研究領域,可能擁有較高的影響力。有的期刊則強調一定的寬度,論文涉及的范圍較廣,可能擁有較好的學科擴散能力。這兩類期刊不存在好壞之分,更沒有必要求全責備。盡管可能更多的雜志均同時追求影響力與擴散能力,但也不能因為擴散因子與影響因子的相關性問題來否定擴散因子。由于不同學科特點不同,有的學科可能追求專業性的期刊更多一些,有的學科可能追求寬度的期刊更多一些,所以不同學科期刊影響力與擴散能力的關系也會表現出不同的特點,可能正相關、負相關或不相關,這些都是正常的。擴散因子的提出者Rowlands[1]研究了圖書情報領域的42種期刊,發現期刊擴散因子與影響因子無正相關性。一些研究發現擴散因子與期刊影響力指標不相關,甚至負相關,就認為是擴散因子指標的問題,其實并非如此。關于擴散因子與影響因子的關系,其實還有一個隱含的問題,就是評價對象的時間軸并不統一。擴散因子是根據總被引頻次與被引刊數計算而來的,而這兩個指標的時間范圍是期刊創刊以來到統計當年;影響因子是根據期刊過去兩年發表的論文在統計當年的平均被引次數,時間范圍是3年。擴散因子更具有存量指標的特點,影響因子更具有流量指標的特點,兩者進行相關分析本質上存在邏輯錯誤,無論相關還是不相關均具有較大的偶然性。1.3擴散因子沒有考慮載文量的影響。載文量對期刊擴散因子的影響問題比較復雜。第一,載文量越大,可以刊載更多的論文,這些論文所涉及到的知識寬度會越來越大,擴散因子越大。如果期刊為了提高擴散因子而人為增加載文量,相對而言是比較容易的,所以在對擴散因子進行優化時,必須充分考慮到這個因素。Frandsen[8]提出新擴散因子,用期刊被引刊數除以載文量,倒是解決了這個問題,但是沒有考慮期刊的被引次數的影響。第二,載文量與期刊欄目設置和辦刊風格也有較大關系,如果期刊涉及的選題范圍較廣,這會增強載文量對擴散因子的影響,如果期刊選題相對較窄,也會弱化載文量對擴散因子的影響。載文量對擴散因子的影響同時具有正向機制與反向機制,最終結果取決于哪種機制更加強大。需要說明的是影響因子與載文量也有一定的關系,但研究結論并不一致。Bordonsetetal.[10]研究發現,隨著期刊載文量上升,期刊的影響因子逐年下降,這與影響因子的算法有關系。俞立平、張再杰等[11]此處同期載文量與影響因子不存在互動機制,載文量只對未來影響因子產生影響,影響因子也只對未來載文量產生影響。俞立平、張再杰[12]還發現,改革開放以,學術期刊發展分為起步期、成長期和調整期,載文量與影響因子的關系由正相關演變為負相關。1.4自引對擴散因子的影響。自引對擴散因子的影響包括兩個部分,第一是對分子被引刊數的影響,在正常引用的情況下,期刊一般也會出現自引,所以自引對分子是沒有太大影響的。第二是對分母被引次數的影響,過度自引無疑會增加被引次數,也就是說增加分母,從而降低擴散因子。也就是說,擴散因子天生就具有防止期刊過度自引的功能。在這種情況下,如果采用他引影響因子計算擴散因子,反而會提高擴散因子。1.5擴散因子的時效性較差。擴散因子計算的時間跨度問題是個隱含問題,這一點被忽略了。根據擴散因子的定義,分子為期刊創刊以來發表的所有論文在統計當年的被引期刊數,分母為期刊創刊以來所有論文在統計當年的總被引頻次。由于這個界定,導致擴散因子在評價時時效性比較差,雖然擴散因子每年公布,但本質上它具有存量指標的特點。俞立平[13]發現總被引頻次具有流量指標與存量指標的特點,認為對于時效性較強的評價,采用總被引頻次要慎重。擴散因子本質上具有類似特點,側重長期評價,對于時效性要求較強的評價,不宜采用擴散z因子,或者要對其進行優化。1.6擴散指數。綜合以上分析,可以得出如下結論:第一,采用擴散因子進行評價,完全可以不考慮其與期刊影響力指標的關系;第二,不需要考慮自引對期刊擴散因子的影響,自引一般難以提高擴散因子;第三,必須考慮載文量對期刊擴散因子的影響;第四,必須考慮增強擴散因子的評價時效性。考慮載文量對期刊影響因子的影響,需要在擴散因子的基礎上再除以載文量,為了和擴散因子加以區別,本文將其命名為擴散指數(JournalDiffusionIndex,JDI),即期刊每100篇論文100次被引涉及的期刊數量,即:JDI=JDF2P2伊100=U2C2伊P2伊10000(1)公式(1)中,JDF2為兩年擴散因子,即根據期刊過去兩年的被引刊數和被引頻次計算的擴散因子;P2為期刊過去兩年的載文量,U2為過去兩年期刊發表的論文在統計當年的被引刊數,C2為期刊過去兩年發表的論文在統計當年的被引次數。比如某期刊2015年載文量為100篇,2016年載文量為100篇,這兩年的載文量合計200篇,在2017年被引400次,被引刊數為60種,則該期刊的擴散指數為7.5(60/200/40010000)。與擴散因子相比,擴散指數具有以下特征:第一,擴散指數充分考慮到載文量對擴散因子的影響,一定程度上可以防止期刊為了提高擴散因子而人為增加載文量。第二,擴散指數充分考慮到期刊評價的時效性要求。一般而言,辦刊歷史越長,期刊被引刊數越多,擴散因子越大,因此對于辦刊歷史較短的期刊而言是不公平的,但采用較短的計算時間窗口,可以適當減少這個問題。至于擴散指數的其他特征,有待進行進一步分析。
2研究數據
本文基于中國知網的引文數據,采用圖書館情報與文獻學CSSCI期刊來進行相關分析。中國知網的引文數據庫收錄的期刊較多,包括7000多種自然科學與社會科學的學術期刊,與CSSCI引文數據庫相比各有特色,CSSCI引文數據庫所包含的期刊主要為人文社科領域的學術期刊,并且只包含CSSCI核心版與擴展版的期刊。從學科跨度角度,中國知網的引文數據庫更具有代表性,涉及的期刊更多,而且打破了自然科學與人文社科的界限。CSSCI圖書館情報與文獻學期刊共有20種,《情報學報》、《圖書館》引文數據尚不全,所以最終采取18種期刊的數據進行研究。擴散指數計算的時間為2017年,涉及到的被引刊數、被引次數也為2017年,而時間為2015-2016年。擴散指數的計算結果如表1所示。擴散指數的計算結果中,《中國圖書館學報》、《圖書情報知識》、《國家圖書館學刊》排在前3位,也就是說,這些期刊近兩年具有更好的擴散能力,尤其是在有限版面有限載文的情況下。擴散指數排在后幾位的期刊主要是《圖書情報工作》、《情報雜志》、《圖書館學研究》等,主要原因是這些期刊載文量較大,對擴散指數具有較大影響,換句話說,擴散指數能夠抑制載文量擴大對其的影響,這和擴散指數設計時的初衷是一致的。
3實證結果
3.1擴散指數的統計學特征分析。表2位擴散指數、影響因子、h指數的統計學特征比較。為了保證數據的可比性,h指數的計算也是2015~2016年發表的論文在2017年的結果,這樣可以保證擴散指數、影響因子、h指數的評價對象一致,時間跨度相同,具有完全的可比性。從數據分布看,擴散指數、影響因子的Jarque-Be鄄ra檢驗值分別為7.241、54.688,p值分別為0.027、0.000,拒絕正態分布的原假設,說明這兩個指標均不服從正態分布。而h指數的Jarque-Bera檢驗值為0.631,p值為0.729,不能拒絕正態分布原假設。從離散系數看,擴散指數的離散系數為0.710,影響因子和h指數的離散系數分別為0.487、0.236,擴散指數擁有最大的離散系數,用來評價時區分度良好,非常適合期刊數量較大的學科。3.2擴散指數與期刊影響力關系的回歸分析。擴散指數屬于期刊擴散能力指標,而影響因子與h指數屬于期刊影響力指標,根據前文分析,這是兩類不同性質的指標。為了進一步分析影響力對擴散能力的影響,采用回歸分析的結果如下:log(JDI)=8.977+2.051log(IF)-3.161log(h)(8.714)(8.135)(-8.097)R2=0.845n=18(2)回歸結果中,影響因子和h指數均在1%的水平下通過了統計檢驗,擬合優度R2較高,為0.845,說明期刊影響力與期刊擴散能力的相關度較高。影響因子的回歸系數為2.051,h指數的回歸系數為-3.161。h指數的回歸系數為負數,原因有兩個,第一是可能存在多重共線性,導致回歸系數為負;第二是,在降低多重共線性影響的情況下,h指數的回歸系數仍然為負數,在說明h指數更多代表了期刊的質量,高質量的期刊可能更加追求專業性,所以擁有較高的影響力,但不太具有較好的擴散能力,因此有必要進行進一步分析。下面進行多重共線性檢驗,影響因子的特征值為0.088,VIF為5.758,小于10,說明影響因子不存在多重共線性;h指數的特征值為0.002,接近0,VIF為37.043,大于10,說明h指數存在多重共線性。在這種情況下,就不能采用傳統的最小二乘法進行估計,而需要采用嶺回歸進行估計。嶺回歸是Hoerletal.[14]提出的一種改良的最小二乘法,專門用于共線性數據的回歸分析,其基本思想是當自變量間存在共線性時,解釋變量的相關矩陣行列式近似為零,X'X是奇異的,也就是說它的行列式的值也接近于零此時傳統的最小二乘法估計會失效,必須采用嶺回歸進行估計。嶺回歸嶺跡圖如圖1所示,當k=0.3時,回歸系數比較穩定,而當k>0.6時,回歸系數又開始發散,因此取k=0.3時的估計結果:log(JDI)=0.452+0.121log(IF)-0.756log(h)R2=0.923(3)嶺回歸的結果顯示,即使在大幅降低多重共線性的情況下,h指數與擴散指數的相關系數仍然為負,說明其結果是穩定的,也就是說,期刊的h指數與擴散能力具有負相關性。4研究結論(1)擴散指數是衡量學術期刊橫向擴散能力的優秀指標學術期刊的擴散能力與影響力是學術期刊的兩個重要標志,雖然任何期刊都在追求這兩種能力,但各有側重,兩者并無本質的必然聯系。擴散因子存在的主要問題是評價對象是創刊以來的期刊所有論文,所以時效性差,另外沒有排除載文量增加對擴散因子的影響。本文提出擴散指數JDI,即期刊過去兩年發表的論文在統計當年每100篇論文100次被引用涉及的期刊數量,用來對擴散因子進行優化,使得擴散因子難以通過提高載文量進行認為操縱,另外提高了評價的時效性。(2)擴散指數與影響因子正相關,與h指數負相關本文研究發現,擴散指數與影響因子正相關,與h指數負相關,這些結論是在降低多重共線性后采用嶺回歸分析的結果,因此具有更好的穩定性。擴散指數與h指數負相關的機制是,h指數更強調質量,而學術質量越高的期刊更加追求專業性,創新性較強,被引次數很高,但擴散能力反而不高。當然這是本文有限數據下的研究結論,至于其他學科擴散指數與影響力的關系有待進一步研究。需要說明的是,不能用期刊的擴散能力來判斷影響力,或者用影響力來判斷期刊的擴散能力,所以無論擴散指數與影響力指標的關系如何,并不影響擴散指數的使用。(3)擴散指數區分度較好,不服從正態分布本文研究發現,擴散指數的離散系數大于影響因子,影響因子的離散系數大于h指數,因此擴散指數擁有較高的區分度的概率較大,比較適合評價期刊數量較多的學科。此外,擴散指數和影響因子一樣,并不服從正態分布,根本原因是擴散指數較高的期刊數量較少,大部分期刊處于中低水平。(4)保證評價對象的時間軸一致才能進行比較所有的學術期刊評價指標均對評價對象的時間跨度有具體的限定,但這一點非常容易被忽視。比如將擴散因子與影響因子相比,擴散因子評價的是期刊創刊以來的所有論文,而影響因子評價的是期刊過去兩年發表的論文,時間軸并不統一。本文擴散指數的評價對象是期刊過去兩年發表的論文,因此與影響因子才能直接比較,如果與h指數比較,那么h指數也必須是期刊過去兩年發表的論文進行統計。
本文僅僅是圖情學期刊進行實證研究,由于不同的學科,作者引用行為之間差異很大。本文的研究結論普適性有待進一步探索。此外,文史哲一些學科領域可能引用圖書等文獻較多,這對擴散指數的應用也有一定的影響。擴散指數的進一步研究可從學科擴散的角度進行,由于篇幅所限,將在后續研究中進行討論。
作者:俞立平 周娟美 單位:1.浙江工商大學統計與數學學院 2.中北大學
- 上一篇:自主學習在小學體育教學的運用
- 下一篇:高職藥學類實訓課程體系構建探究