時間:2023-03-28 15:02:12
序論:寫作是一種深度的自我表達。它要求我們深入探索自己的思想和情感,挖掘那些隱藏在內心深處的真相,好投稿為您帶來了七篇信息計量學論文范文,愿它們成為您寫作過程中的靈感催化劑,助力您的創作。
普賴斯(Derek de Solla Price)(1922-1983)被譽為“科學計量學之父”,其主要學術成就體現在如下幾方面:發現了科學發展的指數規律;指出了論文間引證與被引證關系;創立了反映文獻老化程度的普賴斯指數;提出了反映科學家生產率的普賴斯定律等。貝爾納(J.D.Bernal)的《科學的社會功能》不僅為科學學,而且為科學計量學提供了基本的研究范式。受貝爾納科學學思想的影響,作為科學史家,普賴斯開始系統運用定量方法對科學、技術、醫學等進行歷史、哲學、社會學、心理學、經濟學、政治學、運籌學等等研究的先驅者之一。《巴比倫以來的科學》和《小科學,大科學》兩部著作成為他的科學計量學成果的集大成之作,也是科學計量學的奠基之作。尤其是情報學家加菲爾德(Eugene Garfield)博士創立科學引文索引(SCI)后,普賴斯巧妙地借助這一工具,賦予科學計量學研究以新的生命活力。1965年,他借助SCI在《科學》雜志上發表了科學計量學重要論文《科學論文的網絡結構》,為人們利用大規模數據繪制知識圖譜做出了開拓性探索。在這篇論文中第一次界定了“研究前沿(Research front)”和“知識基礎(Intellecture base)的內涵,使得利用科學引文數據探測和識別學科知識前沿和研究熱點成為可能。正是在普賴斯科學計量學范式的強大影響下,使科學計量學研究在全世界得到快速發展,并形成了多個國際科學計量學研究重鎮,如美國費城的德雷克賽爾大學、荷蘭的萊頓大學、英國的蘇塞克斯大學等。科學計量學理論、指標和方法的研究成果,也為宏觀科技政策和各層次的科技管理提供重要的工具和手段。
普賴斯獎是為紀念普賴斯的學術成就于1984年設立的國際科學計量學和信息計量學界最高獎。該獎項每兩年頒發一次,截至2011年,共有25位科學計量學家獲此殊榮。這些學者都是在科學計量學領域做出杰出貢獻的人,他們為推進科學計量學從“軟科學”走向“硬科學”做出了卓越成就,為科學計量學的繁榮和發展增添了濃墨重彩的一筆。
2011年在南非舉辦的國際科學計量學和信息計量學大會17個主要會議主題中提出了“學術生涯(Academic careers)”這一值得關注的研究領域。這不僅是科學計量學學科自我總結和反思的需要,也是科學計量學逐步走向成熟的一個重要標志。系統梳理普賴斯獎獲得者的學術思想和成就,對我國學者把握科學計量學發展的特點和發展方向不失為一個獨特視角。基于此,我們考慮從科學計量學角度對這些獲獎者的學術生涯逐一進行梳理,以便能從中挖掘若干有益的信息,并為豐富科學計量學的研究領域展現新的研究視角,為科學計量學史研究提供較為詳實的信息。
2012年是普賴斯誕辰90周年,為紀念這位在科學史和科學的定量研究方面做出巨大貢獻的學者,我們特編發四篇梳理普賴斯獎獲得者學術成就的文章,以深切緬懷普賴斯的卓越思想。
摘 要:文章以CNKI所收錄的文獻為依據,利用文獻計量方法,對我國中小學圖
>> 我國中小學圖書館研究:基于文獻計量學的統計分析 2006年―2015年我國中小學圖書館研究文獻計量分析 基于共詞分析的我國文獻計量學研究主題分析 基于文獻計量學的梨研究動態 檔案管理體制研究的文獻計量統計分析 基于文獻計量學的我國化學學科半衰期分析 基于文獻計量學的世界蘋果研究態勢分析 基于文獻計量學的梔子研究領域全景分析 基于文獻計量學的圖書館資源建設 我國中小學圖書館的發展現狀與對策 我國中小學圖書館建設的問題與對策 統計分析法與文獻計量法在檔案學研究中的應用分析 《科技與經濟》文獻計量與研究熱點統計分析 基于文獻管理軟件NoteExpress的文獻計量學研究的探討 基于文獻計量學的我國心理學學科半衰期分析 基于文獻計量學分析的我國酸棗研究現狀 基于文獻計量學的國內知識競爭力研究現狀 基于文獻計量學的管理學學科半衰期研究 基于文獻計量學的無人駕駛汽車技術研究 淺談我國中小學校圖書館員應具備的素質 常見問題解答 當前所在位置:l.
[2] 邱均平.信息計量學(二)第二講 文獻信息增長規律及應用[J].情報理論與實踐,2000(2):153-157.
[3] 于斌斌.學校圖書館利用對中學生學業表現的影響研究[D].天津:南開大學,2012:7.
[4] 邱均平.信息計量學(三)第三講 文獻信息老化規律及應用[J].情報理論與實踐,2000(3):237-240,192.
[5] 呂紅,馬海群.近8年我國信息構建論文的文獻計量統計分析與評價[J].情報科學,2010(10):1526-1531.
[6] 邱均平.信息計量學(四)第四講 文獻信息離散分布規律[J].情報理論與實踐,2000(4):315-320.
[7] 全浮.中學圖書館建設現狀調查:以煙臺市為例[D].煙臺:魯東大學,2013:3.
[8] 邱均平.信息計量學(五)第五講 文獻信息詞頻分布規律:齊普夫定律[J].情報理論與實踐,2000(5):396-400.
[9] 楊海花.近5年我國中小學圖書館理論研究綜述[J].圖書館學刊,2012(6):137-139.
2.1 數據來源
本研究選用的數據來源為中文社會科學引文索引(CSSCI)數據庫,而沒有選擇中國知網(CNKI)數據庫。主要原因如下:根據文獻計量學研究規律,如果某學科的文獻量呈逐年增長趨勢,則表明該學科處于穩步發展階段,其發展動向與研究成果的文獻量密切相關。一個研究主題的發文量和很多因素有關,例如主題文獻的易產性等。在某學科領域中,有些方面的主題比較容易產生出大量的學術論文,而有些領域則需要經過漫長的實驗、實證即大區域和長時段的研究才有少量論文產出,因此對學科內各研究領域而言,文獻發表的數量和質量不是“機會均等”的。此外,科研管理政策和學術氛圍也會影響到文獻量的增長,例如科研方法的規范性要求越高以及國際化接軌的程度越強都會影響到發文的數量。因此,科學計量學特別是共詞分析等方法對文獻集來源期刊的選擇有一定規定,應該選擇學科的核心期刊,特別是在一定范圍內在本學科領域中具有相當影響的重要刊物。通常一種期刊的級別越高,其對論文的質量要求也越高,通過同行專家的評議和審核,能夠有效確保文獻內容有較高的新穎性和學術性,從而把那些產文量大、學術性不夠強的文獻排除在外,進而提高學科內各研究主題文獻量“機會均等”的幾率。在這樣的條件下,發文量越大的主題越是學科中研究的熱點。對于少部分高質低投的論文,可以通過一定時期內的文獻共被引分析將其統計和反映出來。因此,本研究選用CSSCI來源期刊的文獻作為研究的對象科學合理。值得說明的是,由于CSSCI數據庫2008年才開始增加擴展版源刊,為保證數據統計的口徑一致,加之該數據庫不完整,所以本研究檢索數據不含CSSCI擴展版來源期刊。2013年3月7日,選擇檢索時間跨度為1998~2012年,以檢索條件:“(來源篇名(詞)=品牌/名牌)或者(關鍵詞=品牌/名牌)”進行檢索,經過辨識、去重和補充,共獲得有效文獻5134篇。其中,2012年有344篇。
2.2 研究方法與主要應用軟件
本研究將采取如下方法:文獻研究與內容分析相結合的方法、實證分析與規范分析相結合的方法、動態分析與靜態分析相結合的方法、定量分析與定性分析相結合的方法。其中,定量分析采取科學計量學理論與方法,即通過繪制科學知識圖譜把復雜的學科知識領域通過數據挖掘、信息處理、知識計量和圖形繪制而顯示出來,具體包括引文分析、共被引分析、共現分析、詞頻分析和社會網絡分析(SNA)等研究方法,主要的應用軟件包括CiteSpaceII、Bibexcel、UCINET、Netdraw和SPSS等分析軟件。其中,CiteSpace II是美國德雷克賽爾大學美籍華人陳超美教授開發出來的一種知識可視化計量軟件。CitespaceII是一個由Java語言編寫的主要基于共被引分析與共現分析的引文網絡與共詞網絡可視化軟件。
高被引學者是指,學者寫的論文被引用的次數很多,也就是常說的被引頻次很高,就叫“高被引學者”。
文獻計量學中測量論文的影響力或者質量的基本指標是論文的被引用次數,一名學者的影響力大小,可以根據其發表的所有論文獲得的引用次數來設計指標測算。學者發表的論文被數據庫收錄后,其他研究學者可以通過檢索來獲取信息,引用這篇論文,這些被引用的文章叫做被引文獻,被引文獻的作者叫被引學者。
(來源:文章屋網 )
1 網絡信息資源老化的原因及特征
1.1 網絡信息資源老化的原因
網絡信息資源的老化是指網絡信息資源中情報的有效價值隨著時間的流逝逐漸衰減,利用率逐步降低。這與傳統文獻的老化一樣,是一種普遍存在的現象。造成網絡信息資源老化的因素很多,我們大致可以將其歸納為以下幾個方面:
(1)網絡信息資源的增長。情報學家M.勞恩曾說過:“文獻增長得越快,文獻的半衰期就越短。”信息資源的增長和老化是同一事物的兩個方面,它們從不同的角度反映信息資源的動態變化。眾所周知,網絡信息資源的增長速度極其驚人。以我國為例,據中國互聯網絡信息中心的統計,2002年12月31日,全國網頁總數為157,091,220個,字節總數為2,877,754,095KB[1];2003年12月31日,全國網頁總數為311,864,590個,字節總數為6,059,431,526KB[2];到2004年12月31日,全國網頁總數就達到了650,682,300個,字節總數增長到20,537,214,718KB,與2003年相比,增幅分別為108.6%和238%[3]。
(2)網絡信息資源的更新。網絡信息資源的更新是指網絡信息資源在載體形態、數據組織方式、網址等外在特征不變的情況下,所含知識和情報在內容上的變化。1998和1999年,Bar-Ilan和Peritz對信息計量學領域網絡信息的生命周期研究表明,在6個月內近50%的網頁發生了變化[4];而Wallace Koehler的觀察結果更為顯著,他發現97%的網站6個月內會發生變化,如觀察時間為1年,則比例上升為99%。對于網頁而言,這組數據分別為98.3%和99.1%[5]。應該指出的是,網絡信息資源更新并沒有引起網絡信息資源總量的增長。
(3)網絡信息資源的消失。網絡信息資源的消失是指網絡信息資源無論出于何種原因,被從系統中刪除,不能再被訪問和利用。文獻[4]表明,68%的網頁1年內將被從網上移除;而文獻[5]發現,有12.2%的網站和20.5%的網頁6個月后不能再被訪問到。1年后,分別上升到17.7%和31.8%。并且,每周有0.5%的網頁和網站消失。與網絡信息資源的更新不同,網絡信息資源的消失意味著網絡信息資源總量的減少。
(4)替代性網絡信息資源的出現。隨著人類對客觀事物和社會運動規律認識水平的提高,原有的知識不斷被完善和突破。同時,由于技術的進步和社會信息需求的共同推動,網上信息的加工深度越來越大,原有的知識和情報被包含在新的知識和情報之中,因而,原來不完善、不全面的陳舊信息資源逐漸不再被利用。替代性網絡信息資源的出現并不意味著原有信息資源的更新和消失,而表現為網絡信息資源中,蘊含新知識和情報的信息的出現和信息總量的增長。
(5)網絡信息資源的吸引力。網絡信息資源的吸引力主要來自兩個方面:一是網絡信息資源所揭示和反映的對象所處的發展階段。處于誕生和發展初期的事物,相關網絡信息資源的數量往往呈指數增長,老化遵循負指數函數關系。進入成熟期后,信息的增長速率變小,老化曲線也變得平緩,半衰期加長。當對該事物的認識積累到一定程度,將出現質的飛躍,相關信息的增長進入新一輪的指數增長階段,相應的,老化曲線也恢復成負指數曲線。二是網絡信息資源的受關注程度。對于網絡信息資源所揭示和反映的對象而言,受關注程度越高,往往意味著知識更新越快,半衰期越短,反之則越長。對于網絡信息資源自身而言,其受關注程度遵循“Winner takes all”法則,受關注程度越高的網絡信息資源半衰期越短,也就是說信息更新越快,質量和數量也穩步提升。
1.2 網絡信息資源老化的特征
網絡信息資源老化與傳統文獻資源老化既有相同之處,又有顯著的差異,其獨特之處主要表現在:
(1)非累積性。傳統文獻資源的重要特征之一就是其存在的永續性,即使這些載體上的知識和情報完全失去了使用價值,它也不會消失。原有信息的修正與更新、替代信息的生產以及新信息的產生必須依靠新的載體。因此,傳統文獻資源從數量上來說,總是不斷增長的。而網絡信息資源則不然。網絡環境中的信息是介于產生后永續存在與即刻消失兩種狀態之間的第三類信息,它的更新和消亡是其存在和運動的常態。在網絡環境下,新信息的出現并不一定意味著信息總量的增長,而且,相當一部分信息在喪失其使用價值之后會徹底消失,引起信息總量的減少,呈現負增長狀態。所以,我們認為網絡信息資源具有非累積性,這表明網絡信息資源的老化研究往往只能基于特定時間點或時間段,難以系統地回溯其歷史狀態。
(2)動態性。動態性與非累積性是內在統一的。任何信息都是外在形態與所含內容的統一體。記錄信息的載體和信息的組織方式是信息資源的外在形態,而內容,即其所蘊含的知識和情報才是核心。傳統文獻資源的外部形態和內容是不可分割的,因而必然具有累積性。而網絡信息資源的外部形態和內容可以是相互獨立的,因此,在網絡信息資源載體的形態、信息組織方式、網址等保持不變的情況下,內容可以不斷更新,甚至刪除,這就體現為它的非累積性。眾所周知,半衰期、普賴斯指數的測定都是依據特定領域文獻資源的被利用情況,而網絡信息資源的動態性使其老化規律的研究增加了新的內容,即對網絡信息資源自身生命周期的研究。
(3)不完全性。傳統文獻,的生產和傳播是受控的,由相關機構統一審核和管理。因此,在傳統文獻資源老化研究中,研究對象的范圍一般相當清晰,在數量上也是可數的。而在網絡信息資源的老化研究中,研究對象的不完全性卻是無法回避的問題。導致該問題出現的原因主要來自兩個方面:一是網絡的開放性決定了網上信息的基本上處于不受控制的狀態,因此,任何研究者都無法確知網絡信息資源的精確構成和分布狀況,在研究特定領域的網絡信息資源時,也就不可能準確地劃定研究對象的范圍和數量。二是網絡信息資源的非累積性和動態性造成了研究對象在時間維度上的缺失,因此,在研究中也就難以系統地回溯研究對象的歷史狀態。
2 衡量網絡信息資源老化狀況的指標
根據網絡信息資源老化的原因及其特征,我們從網絡信息資源自身的生命周期和網絡信息資源被利用情況兩個方面,建立衡量網絡信息資源老化狀況的指標。
2.1 網絡信息資源的生命周期
網絡信息資源的生命周期反映的是網絡信息資源自身的老化狀況,可以采用半衰期和生存期兩項指標衡量。
2.1.1 半衰期
半衰期源于物理學領域,原指放射性元素的原子核有半數發生衰變所需的時間。我們借用這一概念,將網絡信息資源的半衰期定義為網絡信息資源的基本構成元素有半數發生變化所需的時間。根據是否考慮網絡信息資源的增量部分,網絡信息資源的半衰期又可以分為靜態半衰期和動態半衰期。
(1)靜態半衰期。靜態半衰期是指在不考慮增長的情況下,網絡信息資源的基本構成元素有半數發生變化(含消失)的時間。例如,以網頁為基本構成元素,考察網站A的靜態半衰期。假設網站A有10000個網頁,每個月有1000個不同的網頁發生變化,并且有100個網頁消失。根據上述定義,網站A的靜態半衰期為10000÷2÷(1000+100)=4.55(月)或0.38(年)。
(2)動態半衰期。動態半衰期是在考慮增長的情況下,網絡信息資源的基本構成元素中較新的一半產生于多長時間內。例如,在上例的基礎上,假設網站A每個月新增500個網頁。根據動態半衰期的定義,網站A的動態半衰期為10000÷[2×(1000+500)-(500-100)]=3.85(月)或0.32(年)。
當然,半衰期的計算在實際研究中情況會復雜得多。首先,網頁不會勻速地發生變化、消失和增長;其次,一個網頁可能連續多次發生變化,由于我們考察的基本元素是網頁,因此只能將其計為一次;第三,在計算動態半衰期時必須認識到,新增網頁也會發生變化;最后,出于研究的需要,我們可能會選擇在信息組織上比網頁粒度更細的單元作為基本構成元素,譬如知識單元、網絡鏈接、單詞等。
2.1.2 生存期
網絡信息資源的生存期是指特定網絡信息資源的URL存續時間。如同人的遺傳密碼一樣,URL是區分不同網絡信息資源的唯一標識,因此,我們認為URL是判定網絡信息資源生存期最理想的依據。根據該定義,只要URL保持不變,無論內容如何變化,都視為同一個網絡信息資源。在極端情況下,特定URL所對應的網絡信息資源內容甚至可以為空反之,即使內容沒有發生任何變化,只要URL被改動,我們就視為原信息資源“生命”的終結和新網絡信息資源的誕生。當然,如果特定網絡信息資源及其URL同時被刪除,同樣也意味著該網絡信息資源生存期的終止。
2.2 網絡信息資源的價值周期
網絡信息資源的價值周期的計量依據是其被利用的狀況,這與傳統文獻資源老化規律的研究思路基本相同。文獻半衰期的研究可以分為學科文獻的半衰期和論文的半衰期。學科文獻的半衰期是指某學科(專業)現時尚在利用的全部文獻中較新的一半是在多長一段時間內發表的;論文半衰期是指引用這篇論文的全部其他論文的二分之一是在這篇后的多長時間內發表的。需要強調的是,學科文獻的半衰期是相對于被引文獻而言,而論文的半衰期是相對于引用文獻而言的[6]。與此相對應,我們仍然以“半衰期”為指標衡量網絡信息資源的價值周期,并按研究對象分為宏觀網絡信息資源半衰期和微觀網絡信息資源半衰期。
(1)宏觀網絡信息資源半衰期。根據學科文獻半衰期的概念,我們將宏觀網絡信息資源半衰期定義為某主題領域網絡信息資源所含鏈接的鏈宿所指資源中較新的一半是在多長時間內產生的。例如,如果我們說網絡信息計量學的網絡信息資源半衰期是1.2年,就表明在我們進行統計研究的那一年里,在網上的網絡信息計量學文獻中的鏈接所指資源的50%是在最近1.2年內發表的。
宏觀網絡信息資源半衰期的研究是基于網絡信息資源中的鏈接。由于網絡信息資源中的鏈接與文獻的被引文獻是性質完全不同的兩類事物,因此,在借鑒其研究思路的同時,我們應該注意自身的特殊性。筆者認為,最重要的幾個需要解決的問題是:第一,必須明確鏈接的目的,也就是鏈源與鏈宿之間的關系;第二,當鏈宿的時間晚于鏈源所在網絡信息資源的時間時應當如何計算;第三,是應該采用網絡信息資源中所有的鏈接,還是只考察出鏈;第四,從理論上來說,我們需要獲得該主題領域的所有網絡信息資源,并提取其所含有的鏈接。由于網絡信息資源的不完全性,研究結果可能與客觀實際存在相當程度的差異。
(2)微觀網絡信息資源半衰期。參照論文半衰期的概念,微觀網絡信息資源半衰期是指指向該網絡信息資源的全部其他網絡信息資源的二分之一是在其后的多長時間內出現的。例如,網上某文檔的半衰期是1.5年,就意味著該文檔所獲得入鏈的鏈源所在網絡信息資源的50%出現于其后的1.5年內。
與宏觀網絡信息資源半衰期的研究相比,微觀網絡信息資源半衰期研究所面臨的問題相對較少。根據上述定義,微觀網絡信息資源半衰期的研究不涉及自鏈,并且基本不會出現入鏈的鏈源所在資源的時間早于研究對象出現時間這樣的情況。因此,需要考慮的問題中最主要的就是解決或盡量縮小網絡信息資源的不完全性。盡管有研究表明,網絡鏈接的使用動機與文獻引用動機存在巨大差異,但筆者認為,無論處于何種動機,網絡信息資源獲得入鏈就意味著其使用價值的實現,我們在計量其半衰期時不必做過多的區分[7]。
3 網絡信息資源老化研究展望
網絡信息資源的老化研究與網絡信息資源的增長、分布與利用研究共同構成了網絡信息計量學研究的基本框架,對豐富與完善網絡信息計量學的學科體系具有極高的理論價值。同時,網絡信息資源老化研究的成果也是網絡信息資源建設、管理和利用的依據,具有重要的現實意義。
目前,國內對網絡信息資源的老化研究才剛剛起步,所見文獻僅有2004年王宏鑫和邱均平在《情報理論與實踐》第4期所發表的《關于網絡信息老化研究的若干問題》一文[8]。因此,在現階段應該借鑒文獻計量學的研究成果,在充分認識網絡信息資源與傳統文獻資源所存在差異的基礎上,建立網絡信息資源老化研究的理論與方法體系,為探索網絡信息資源老化規律和實踐應用奠定基礎。
【參考文獻】
1 2002年中國互聯網絡信息資源數量調查報告.cnnic.net.cn/html/Dir/2003/11/22/1393.htm
2 2003年中國互聯網絡信息資源數量調查報告.cnnic.net.cn/download/manual/report20030330.pdf
3 2004年中國互聯網絡信息資源數量調查報告.cnnic.net.cn/download/2005/2005041401.pdf
4 Bar-Ilan, Peritz B.C.The life span of a specific topic on the Web: the case of "informatrics" a quantitative analysis. Scientometrics. 1999, 46(3):371-382
5 Wallace Koehler. An Analysis of Web Page and Web Site Constancy and Permanence. Journal of the American Society for Information Science. 1999, 50(2).
6 邱均平編著.文獻計量學.北京:科學技術文獻出版社,1988.
7 Hak Joon Kim. Motivations for hyperlinking in scholarly electronic articles: A qualitative study. Journal of the American Society for Information Science. 2000,51(10)
KI為數據源,用CiteSpace Ⅱ的關鍵詞聚類和突變詞檢測功能,客觀全面分析了國內知識圖
譜研究熱點及相關學者?研究前沿及熱點與前沿的演化,以揭示國內知識圖譜研究進展?
〔關鍵詞〕知識圖譜;CiteSpace
Ⅱ;共詞分析;研究熱點;研究前沿;VOSviewer
DOI:10.3969/j
.issn.1008-0821.2014.01.019
〔中圖分類號〕TP399;G202 〔文獻標識碼〕A 〔
文章編號〕1008-0821(2014)01-0084-05
Research Development of Mapp
ing Knowledge Domains in China
——Analysis Based on CiteSpace Ⅱ
Sun Yusheng Qiu Rongrong Deng Xing
(School of Management,Hubei University of Technology,Wuhan 430068,China)
〔Abstract〕”BZ〗With the CNKI as data source,this article made use of the keyword cluste
ring and burst detection function of CiteSpace Ⅱ,analyzed research hotspots and
related scholars,research frontier and the evolution between hotspots and front
iers objectively and comprehensively,in order to reveal the research development
of mapping knowledge domains in China.
〔Key words〕mapping knowledg
e domains;CiteSpace Ⅱ;co-word analysis;research hotspot;research frontier;VOSvi
ewer
作為一種可從宏觀?中觀?微觀層面可視化揭示學科?領域?主題發展概貌的方法,知
識圖譜可輔助學者多角度直觀審視領域研究主體(含機構)及其合作?研究熱點及前沿?研
究結構和現狀?研究范疇等,其理論及應用研究逐漸成熟,成為科學計量?信息計量?文獻
計量等領域新興研究熱點,發文量近年來成倍增長,呈J型曲線走勢?
知識圖譜根據構建方法分為傳統計量圖譜?三維構型圖譜?多維尺度圖譜?社會網絡圖譜?
自組織映射圖譜?尋徑網絡圖譜[1];所用工具包括引文分析軟件HistCite?統計
分析軟件SPSS?社會網絡分析軟件Pajek?Netdraw?Ucinet等;所用方法涉及詞頻分析?共
詞分析?共被引分析?聚類分析?因子分析等;所研究主題經歷算法?復雜網絡分析?科學
動態性內容分析,并趨于融合;所應用范圍不斷擴大,根據研究性質分為學科研究(如管理
學?醫學等)?主題研究(如政府績效管理?創新研究等)和其他研究(如遼寧省高校自然
科學學科分布與合作網絡)[2],根據實際應用分為科研領域?教育領域?社會問
題領域等[3];存在研究缺乏標準?方法不系統?深度不夠?中文引文數據庫不完
善?工具兼容中文文獻不理想等[4]問題?
本文基于CiteSpace Ⅱ分析國內知識圖譜研究熱點?前沿及熱點與前沿的演化,以揭示其研
究進展?
1 數據來源?研究框架?工具與方法
1.1 數據來源
中國知網(CNKI)相較其他中文數據庫,文獻數量最多,覆蓋面最全,為確保來源數據的高
相關性及高質性,本文以CNKI的中國學術期刊網絡出版總庫?中國博士學位論文全文數據庫
?中國優秀碩士學位論文全文數據庫為數據源,以“知識圖譜”為檢索詞,用主題方式進行
檢索,共得到552篇文獻(檢索時間為2013年8月24日,發文截止日期為2012年12月31日)并
保存為refworks格式?此外,國內“知識圖譜”最早出現在陳悅和劉則淵于2005年發表的《
悄然興起的科學知識圖譜》一文中?
1.2 研究框架
本文基于CiteSpace Ⅱ和共詞分析法,用路徑搜索算法精簡生成作者和主題詞共現網絡,分
析研究熱點及相關學者;用突變詞檢測算法探測突變詞及其突變率,分析研究前沿;生成關
鍵詞時區視圖以分析研究熱點與前沿的演化,最終揭示國內知識圖譜研究進展?
1.3 研究工具與方法
1.3.1 CiteSpace Ⅱ簡介
CiteSpace Ⅱ是陳超美博士開發的基于Java平臺及共引網絡理論[5],適用于多元
?分時?動態復雜網絡分析的?支持ISI格式(可將部分其他格式轉換為ISI格式)文獻數據
導入的開源知識圖譜軟件?其以可視化圖形展現并識別學科前沿及其演進路徑?經典基礎文
獻,輔助用戶挖掘?分析科學知識及其相互關系,并通過關鍵詞聚類和突變詞探測來確定領
域研究熱點和趨勢[6]?此外,還可進行作者合作?機構合作?關鍵詞共現?作者
共被引?文獻共被引等分析[7]?
1.3.2 研究方法
共詞分析法最早由法國文獻計量學家在20世紀70年代中后期提出,基本原理是統計一組詞兩
兩出現在同一文獻中的次數并基于此進行聚類,通過分析詞所代表學科和主題結構深度剖析
當前研究熱點[8]?
2 國內知識圖譜研究現狀分析
筆者用CiteSpace Ⅱ的數據格式轉換工具轉換并導入國內知識圖譜文獻數據,進行相應設置
后生成所需圖譜:在“preferences”中選擇“Chinese Encoding”選項;設置“Time Scal
ing”為1年;“Term Source”選擇為Title(標題)?Abstract(摘要)?Descriptor(敘
詞)?Identifiers(標識符);“Node Types”選擇“Author”;閥值設置為Top 30;最
后點擊“go”運行CiteSpace Ⅱ,生成通過不同顏色及大小反映各知識節點及其關聯的作者
與主題詞混合圖譜,見圖1?其中,方形節點表示熱點術語,圓形節點表示作者;節點大小
表示出現次數;節點年輪顏色及厚度表示出現時段;紫紅色外框節點是發生研究轉向或引發
大量學者關注的關鍵節點;節點間連線顏色和粗細表示關聯年代及關聯度[9]?FL)〗
2.1 研究熱點及代表作者分析
由圖1可看出,該共現混合網絡聚類效果不明顯,呈星形結構,研究力量較分散,一方面,
作為研究方法,知識圖譜實現方式?構建工具相對較多;另一方面,不同領域學者多用知識
圖譜進行各自領域主題研究?紫色外框主題詞節點“知識圖譜”?“科學知識圖譜”?“科
學計量學”?“研究熱點”?“信息可視化”具有較高中心性及頻次,為關鍵節點,其他主
題詞節點星形分散在其周圍?從與主題詞共現的作者連線顏色看,大連理工大學劉則淵?候
海燕?候劍華?陳悅?許振亮等構成的合作團隊最早開始該領域研究,其中紫色外框作者節
點劉澤淵?侯海燕?許振亮中心性較高,為核心作者?劉澤淵教授將知識圖譜引入國內并創
建了WISE(網絡——信息——科學——經濟計量)實驗室,其帶領的研究團隊(包括侯海燕
?陳悅?侯劍華等)開拓了國內知識計量學與科學知識圖譜研究的新方向[4];南
京大學宗乾進?袁勤儉?沈洪洲等構成的合作團隊近兩年發文量較高,該團隊利用其開發的
多功能數據處理軟件POPCite處理所收集原始數據[8],用CiteSpace?VOSviewer
?Ucinet等工具構建信息管理?旅游?管理學?金融等學科知識圖譜,發表了系列論文,為
知識圖譜應用做出了重要貢獻;其他學者合作關系不太明顯?
研究熱點是特定時段內數量較多且有內在聯系的文獻共同探討的科學問題或內容,通常其頻
次?中心性較高[10],國內知識圖譜領域中心性及頻次均較高的前16個熱點術語
(頻次均不小于23?中心性均不小于0.01)見表1?可看出:“知識圖譜”詞頻?中心性
均最高,這與檢索詞為“知識圖譜”有關;研究主題主要包括分析原理?研究內容?研究方
法?數據源及分析工具4方面?
表1 國內知識圖譜研究熱點術語的頻次
2.1.1 分析原理
知識圖譜定義的詳略程度及側重點各異,或注重結果展示(如可視化效果),或說明理論基
礎(如應用數學?計算機科學?科學學?信息科學?統計學?圖形學等),或強調研究方法
(如引文分析?共現分析?社會網絡分析等),但其內涵較一致:揭示科學知識發展進程與
結構?進行知識發現,屬科學計量學范疇[11]?“知識圖譜”的出現為文獻計量
發展奠定了新的里程碑,廣泛用于各學科領域,是“科學計量學”?“科學計量”研究最前
沿,同時“可視化”?“信息可視化”技術使“可視化圖譜”得以實現?圖1中
“信息可視化”?“科學知識圖譜”“科學計量學”?“知識地圖”及劉則淵和陳悅形成的
藍色多邊形網絡為國內知識圖譜領域早期研究主題及相關學者,知識圖譜源于科學計量學,
雛形是知識地圖,其較知識地圖更能揭示知識間聯系及進化規律[12]?早期主要
研究概念?發展歷程及定位等,以借鑒為主(翻譯國外專著與文獻),并結合實例展示其研
究方法與應用現狀[13]?從與分析原理主題詞共現的作者節點看,國內從事該方
面研究的主要有劉則淵?侯海燕?侯劍華?陳悅?楊中楷?葛莉?趙玉鵬?尹麗春?許振亮
?龐杰等?
2.1.2 研究內容
知識圖譜涉及的研究主題較廣泛且分散,主要研究具體領域的“研究熱點”?“研究前沿”
等,從圖1所示連線顏色可看出,其主要應用領域根據時間先后涉及“科學學”?“管理學
”?“情報學”?“競爭情報”?“體育科學”?“圖書館學”等?通過分析相關文獻,筆
者認為該領域應用研究主要分為知識基礎與知識構成,主流學派及代表人物,研究結構及演
化規律,研究熱點?前沿及趨勢,研究機構空間分布及學術合作五方面?具體體現為節
點“理論體系”?“學術群體”?“代表人物”,“研究進展”?“研究方向展望”?“前
沿領域”等?此外,還涉及“生物”?“人因工程”?“環境”?“信息”等主題研究?從
與研究內容主題詞共現的作者節點看,國內從事該方面研究的主要有侯海燕?袁勤儉?宗乾
進?沈洪洲?李江波?杜維濱等?
2.1.3 研究方法
研究方法決定研究內容揭示的角度?結合圖1?表1可得出知識圖譜研究方法主要包括“共
詞分析”?“社會網絡分析”?“引文分析”?“聚類分析”及“共引分析(共被引分析)
”等?“共詞分析”可進行主題分析,系統?全面?直觀了解學科結構及發展狀況,預測發
展趨勢;“社會網絡分析”旨在構建描述群體結構關系及行動者對群體或內部個體影響的關
系模型;“引文分析”可揭示高被引文獻,減少數據分析量,簡化研究;“聚類分析”根據
彼此相關度分類對象,使類內盡量相似?類間盡量相異,以揭示對象間關系,分析研究過程
;“共引分析(或共被引分析)”通過測度兩個或多個分析元素被其他元素共引情形來量化
元素間關聯度,進而刻畫科學發展的動態過程?圖1顯示,“共被引分析”包括“文獻共被
引”?“作者共被引”?“作品共被引”等;“共現分析”?“關鍵詞共現分析”?“詞頻
分析”?“作者共引”?“文獻共引”等研究方法頻次及中心性均較低?此外,從與研究方
法主題詞共現的作者節點看,國內從事該方面研究的主要有王琪?劉則淵?侯海燕?侯劍華
?盧章平?趙勇?趙玉鵬等?
2.1.4 數據源及分析工具
數據源選擇對知識圖譜構建至關重要,多以數據庫或期刊為導向?由于CSSCI收錄文獻質量
較高且含有參考文獻信息,國內具體領域研究狀況分析多以“CSSCI”為數據源;同樣,由
于“Web of Science”(ISIWeb的全稱)引文數據庫收錄文獻齊全且回溯時間久遠,國外具
體領域研究狀況分析多以“Web of Science”為數據源;此外,也有學者以具體領域“核心
期刊”為數據源進行期刊評價,為相關研究人員投稿?期刊自身發展提供參考?分析工具是
實現圖譜應用研究的途徑,目前多用CiteSpace?從與數據源及分析工具主題詞相關的作者
節點看,國內從事該方面研究的主要有趙蓉英?湯建民?姜春林等?
2.2 研究前沿分析
本文通過CiteSpace Ⅱ的Kleinberg算法檢測主題詞詞頻變化率,獲取知識圖譜領域突變詞
(出現頻次在較短時間內突然增加或使用頻次增長率明顯提高的術語),以此確定研究前沿
及趨勢[7],最終得到17個突變詞,將其按突現率高低及其突變時間段列出,詳見
表2?
2.2.1 注重計量?分析方法與可視化研究
計量分析?分析方法與可視化對知識圖譜研究至關重要,“科學計量”?“知識計量”?“
信息計量”依次成為各階段研究前沿,從知識計量及信息計量角度研究知識圖譜成為新的發
展方向?“共引分析”?“作者共引圖譜”?“代表人物”等是國內知識圖譜2006-2009年
研究方法的趨勢,“共詞分析”則是2011-2012年研究方法的趨勢?可視化技術的引入使傳
統二維或三維圖表?社會網絡等形式的知識圖譜表示過渡為“可視化圖譜”,成為知識圖譜
表示方法的發展趨勢?學者關注的焦點?
2.2.2 應用領域以學科為主并逐步擴展
隨著理論基礎及構建工具的發展和成熟,知識圖譜成為新研究方法并受到領域學者的廣泛關
注與應用,體現為突變率較高的“科學學”?“管理學”?“創業型大學”?“ERP”?“
創業教育”等,結合突變時間可看出,知識圖譜引入國內后迅速在學科領域得到應用,并逐
漸擴展到主題分析,其中創業教育是近兩年國內知識圖譜的主要研究主題?
2.2.3 研究主題以研究進展?前沿領域?作者關系為主
國內知識圖譜研究通過“研究進展”整體把握研究主題?整體狀況?核心內容;通過“前沿
領域”準確把握學科研究主題演化及最新動態,預測發展趨勢;通過分析“代表人物”及所
涉及學術群體了解領域研究力量分布和合作關系,常用方法是“作者共引圖譜”?
2.3 研究前沿與熱點的演化
為更好展示研究熱點與前沿的演化過程,本文用CiteSpace Ⅱ生成熱點與前沿詞匯的“Time
Zone”時區視圖,見圖2(隱藏了最大節點“知識圖譜”,以更好展示演進狀況)?其中,
節點及其大小表示熱點術語及其出現次數,其他特征(如年輪?連線等)含義與圖1相同?
分析圖2?表2可大致得出國內知識圖譜研究熱點與前沿的演進過程及發展趨勢:科學知識
圖譜的引入與信息可視化密切相關,而要確保知識圖譜的準確性和客觀性,就必須采用科學
計量方法,兩者均為知識圖譜研究的核心,始終受關注;2006年主要研究知識圖譜構建方法
,包括詞頻分析?引文分析?社會網絡分析等,其中,共引分析?作者共引圖譜?代表人物
等突變率較高,作者共引分析成為研究趨勢;2007年開始研究知識圖譜應用,主要集中在管
理學?科學學?創業型大學等領域;2008-2009年側重研究方法?研究工具與數據來源?研
究前沿;2010年,隨知識管理研究不斷發展,知識計量成為知識圖譜新研究思路,同時重視
可視化技術研究及應用;2011-2012年向綜合應用方向發展,通過知識圖譜方法全方位研究
學科領域進展,重點關注創業教育和共詞分析法,信息計量成為新的發展方向?
3 結束語
本文用CiteSpace Ⅱ,從研究熱點及其代表作者?研究前沿?研究熱點與前沿的演化三方面
分析了國內知識圖譜研究進展:研究熱點集中在分析原理?研究內容?研究方法?數據源及分析工具四方面:分析原理側重知識圖譜概念解析?發展歷程研究;研究內容
包括學科領域知識基礎與知識構成,主流學派及代表人物,研究結構及演化規律,研究熱點
?前沿及趨勢,研究機構空間分布及學術合作等;研究方法多用共詞分析?社會網絡分析?
引文分析?聚類分析及共引分析(共被引分析);數據源多用CSSCI和Web of Science,分
析工具多用CiteSpace?研究前沿注重計量?分析方法與可視化研究;應用領域以學科為主
并逐步擴展;研究主題以研究進展?前沿領域?作者關系為主?研究熱點及前沿演化過程為
:始終以信息可視化和科學計量為研究核心,2006年側重構建方法研究,應用研究主要集中
在2007年和2010年,2008-2009年側重構建方法?構建工具?數據來源研究,2011-2012年側
重通過知識圖譜全方位展現學科領域研究進展,創業教育和共詞分析法?信息計量將成為知
識圖譜新的研究趨勢?
下一步,筆者將用Ucinet?VOSviewer?SPSS等工具,采用多種分析方法,進一步研究國內
外知識圖譜研究進展,尤其是構建方法,為后續構建管理科學與工程學科知識圖譜奠定基礎
?
參考文獻
[1]陳悅,劉則淵,陳勁,等.科學知識圖譜的發展歷程[J].科學學研究
,2008,26(3):449-460.
[2]魏瑞斌.國內知識圖譜研究的可視化分析[J].圖書情報工作,2011,55(8):126
-130.
[3]廖勝姣,肖仙桃.科學知識圖譜應用研究概述[J].情報理論與實踐,2009,32(1
):122-125.
[4]肖明,陳嘉勇,李國俊.基于CiteSpace研究科學知識圖譜的可視化分析[J].圖書
情報工作,2011,55(6):91-95.
[5]孫雨生,仇蓉蓉.基于知識圖譜的國內網格門戶進展研究[J].信息資源管理學報,
2013,(1):59-66.
[6]王霞.基于知識圖譜的國際知識管理研究可視化分析[J].科技管理研究,2011,
(20):175-178.
[7]姜春林,劉盛博,丁.《中國科技期刊研究》研究熱點及其演進知識圖譜[J].中
國科技期刊研究,2008,19(6):954-958.
[8]宗乾進,沈洪洲.2009年我國圖書館學研究熱點和知識來源譜系——南京大學知識圖
譜研究組系列論文之一[J].圖書館雜志,2011,30(6):13-19.
[9]嚴若谷,周素紅,閆小培.西方城市更新研究的知識圖譜演化[J].人文地理,2011
,(6):83-88.
[10]姜陽陽.基于共詞分析的組織變革知識圖譜研究[D].大連:東北財經大學,2011
.
[11]趙丙軍,王霞,司虎克.基于CiteSpace的國內知識圖譜研究[J].圖書情報工
作網刊,2012,(8):23-31.
[12]陳悅,劉則淵.悄然興起的科學知識圖譜[J].科學學研究,2005,23(2):149
-154.
1 網絡信息資源老化的原因及特征
1.1 網絡信息資源老化的原因
網絡信息資源的老化是指網絡信息資源中情報的有效價值隨著時間的流逝逐漸衰減,利用率逐步降低。這與傳統文獻的老化一樣,是一種普遍存在的現象。造成網絡信息資源老化的因素很多,我們大致可以將其歸納為以下幾個方面:
(1)網絡信息資源的增長。情報學家M.勞恩曾說過:“文獻增長得越快,文獻的半衰期就越短。”信息資源的增長和老化是同一事物的兩個方面,它們從不同的 角度反映信息資源的動態變化。眾所周知,網絡信息資源的增長速度極其驚人。以我國為例,據中國互聯網絡信息中心的統計,2002年12月31日,全國網頁 總數為157,091,220個,字節總數為2,877,754,095KB[1];2003年12月31日,全國網頁總數為311,864,590個, 字節總數為6,059,431,526KB[2];到2004年12月31日,全國網頁總數就達到了650,682,300個,字節總數增長到 20,537,214,718KB,與2003年相比,增幅分別為108.6%和238%[3]。
(2)網絡信息資源的更新。網絡信息資源的更新是指網絡信息資源在載體形態、數據組織方式、網址等外在特征不變的情況下,所含知識和情報在內容上的變化。 1998和1999年,Bar-Ilan和Peritz對信息計量學領域網絡信息的生命周期研究表明,在6個月內近50%的網頁發生了變化[4];而 Wallace Koehler的觀察結果更為顯著,他發現97%的網站6個月內會發生變化,如觀察時間為1年,則比例上升為99%。對于網頁而言,這組數據分別為 98.3%和99.1%[5]。應該指出的是,網絡信息資源更新并沒有引起網絡信息資源總量的增長。
(3)網絡信息資源的消失。網絡信息資源的消失是指網絡信息資源無論出于何種原因,被從系統中刪除,不能再被訪問和利用。文獻[4]表明,68%的網頁1 年內將被從網上移除;而文獻[5]發現,有12.2%的網站和20.5%的網頁6個月后不能再被訪問到。1年后,分別上升到17.7%和31.8%。并 且,每周有0.5%的網頁和網站消失。與網絡信息資源的更新不同,網絡信息資源的消失意味著網絡信息資源總量的減少。
(4)替代性網絡信息資源的出現。隨著人類對客觀事物和社會運動規律認識水平的提高,原有的知識不斷被完善和突破。同時,由于技術的進步和社會信息需求的 共同推動,網上信息的加工深度越來越大,原有的知識和情報被包含在新的知識和情報之中,因而,原來不完善、不全面的陳舊信息資源逐漸不再被利用。替代性網 絡信息資源的出現并不意味著原有信息資源的更新和消失,而表現為網絡信息資源中,蘊含新知識和情報的信息的出現和信息總量的增長。
(5)網絡信息資源的吸引力。網絡信息資源的吸引力主要來自兩個方面:一是網絡信息資源所揭示和反映的對象所處的發展階段。處于誕生和發展初期的事物,相 關網絡信息資源的數量往往呈指數增長,老化遵循負指數函數關系。進入成熟期后,信息的增長速率變小,老化曲線也變得平緩,半衰期加長。當對該事物的認識積 累到一定程度,將出現質的飛躍,相關信息的增長進入新一輪的指數增長階段,相應的,老化曲線也恢復成負指數曲線。二是網絡信息資源的受關注程度。對于網絡 信息資源所揭示和反映的對象而言,受關注程度越高,往往意味著知識更新越快,半衰期越短,反之則越長。對于網絡信息資源自身而言,其受關注程度遵循 “Winner takes all”法則,受關注程度越高的網絡信息資源半衰期越短,也就是說信息更新越快,質量和數量也穩步提升。
1.2 網絡信息資源老化的特征
網絡信息資源老化與傳統文獻資源老化既有相同之處,又有顯著的差異,其獨特之處主要表現在:
(1)非累積性。傳統文獻資源的重要特征之一就是其存在的永續性,即使這些載體上的知識和情報完全失去了使用價值,它也不會消失。原有信息的修正與更新、 替代信息的生產以及新信息的產生必須依靠新的載體。因此,傳統文獻資源從數量上來說,總是不斷增長的。而網絡信息資源則不然。網絡環境中的信息是介于產生 后永續存在與即刻消失兩種狀態之間的第三類信息,它的更新和消亡是其存在和運動的常態。在網絡環境下,新信息的出現并不一定意味著信息總量的增長,而且, 相當一部分信息在喪失其使用價值之后會徹底消失,引起信息總量的減少,呈現負增長狀態。所以,我們認為網絡信息資源具有非累積性,這表明網絡信息資源的老 化研究往往只能基于特定時間點或時間段,難以系統地回溯其歷史狀態。
(2)動態性。動態性與非累積性是內在統一的。任何信息都是外在形態與所含內容的統一體。記錄信息的載體和信息的組織方式是信息資源的外在形態,而內容, 即其所蘊含的知識和情報才是核心。傳統文獻資源的外部形態和內容是不可分割的,因而必然具有累積性。而網絡信息資源的外部形態和內容可以是相互獨立的,因 此,在網絡信息資源載體的形態、信息組織方式、網址等保持不變的情況下,內容可以不斷更新,甚至刪除,這就體現為它的非累積性。眾所周知,半衰期、普賴斯 指數的測定都是依據特定領域文獻資源的被利用情況,而網絡信息資源的動態性使其老化規律的研究增加了新的內容,即對網絡信息資源自身生命周期的研究。
(3)不完全性。傳統文獻,的生產和傳播是受控的,由相關機構統一審核和管理。因此,在傳統文獻資源老化研究中,研究對象的范圍一般相當清晰,在數量上也 是可數的。而在網絡信息資源的老化研究中,研究對象的不完全性卻是無法回避的問題。導致該問題出現的原因主要來自兩個方面:一是網絡的開放性決定了網上信 息的基本上處于不受控制的狀態,因此,任何研究者都無法確知網絡信息資源的精確構成和分布狀況,在研究特定領域的網絡信息資源時,也就不可能準確地劃 定研究對象的范圍和數量。二是網絡信息資源的非累積性和動態性造成了研究對象在時間維度上的缺失,因此,在研究中也就難以系統地回溯研究對象的歷史狀態。
2 衡量網絡信息資源老化狀況的指標
根據網絡信息資源老化的原因及其特征,我們從網絡信息資源自身的生命周期和網絡信息資源被利用情況兩個方面,建立衡量網絡信息資源老化狀況的指標。
2.1 網絡信息資源的生命周期
網絡信息資源的生命周期反映的是網絡信息資源自身的老化狀況,可以采用半衰期和生存期兩項指標衡量。
2.1.1 半衰期
半衰期源于物理學領域,原指放射性元素的原子核有半數發生衰變所需的時間。我們借用這一概念,將網絡信息資源的半衰期定義為網絡信息資源的基本構成元素有 半數發生變化所需的時間。根據是否考慮網絡信息資源的增量部分,網絡信息資源的半衰期又可以分為靜態半衰期和動態半衰期。
(1)靜態半衰期。靜態半衰期是指在不考慮增長的情況下,網絡信息資源的基本構成元素有半數發生變化(含消失)的時間。例如,以網頁為基本構成元素,考察 網站A的靜態半衰期。假設網站A有10000個網頁,每個月有1000個不同的網頁發生變化,并且有100個網頁消失。根據上述定義,網站A的靜態半衰期 為10000÷2÷(1000+100)=4.55(月)或0.38(年)。
(2)動態半衰期。動態半衰期是在考慮增長的情況下,網絡信息資源的基本構成元素中較新的一半產生于多長時間內。例如,在上例的基礎上,假設網站A每個月 新增500個網頁。根據動態半衰期的定義,網站A的動態半衰期為10000÷[2×(1000+500)-(500-100)]=3.85(月)或 0.32(年)。
當然,半衰期的計算在實際研究中情況會復雜得多。首先,網頁不會勻速地發生變化、消失和增長;其次,一個網頁可能連續多次發生變化,由于我們考察的基本元 素是網頁,因此只能將其計為一次;第三,在計算動態半衰期時必須認識到,新增網頁也會發生變化;最后,出于研究的需要,我們可能會選擇在信息組織上比網頁 粒度更細的單元作為基本構成元素,譬如知識單元、網絡鏈接、單詞等。
2.1.2 生存期
網絡信息資源的生存期是指特定網絡信息資源的URL存續時間。如同人的遺傳密碼一樣,URL是區分不同網絡信息資源的唯一標識,因此,我們認為URL是判 定網絡信息資源生存期最理想的依據。根據該定義,只要URL保持不變,無論內容如何變化,都視為同一個網絡信息資源。在極端情況下,特定URL所對應的網 絡信息資源內容甚至可以為空反之,即使內容沒有發生任何變化,只要URL被改動,我們就視為原信息資源“生命”的終結和新網絡信息資源的誕生。當然,如果 特定網絡信息資源及其URL同時被刪除,同樣也意味著該網絡信息資源生存期的終止。
2.2 網絡信息資源的價值周期
網絡信息資源的價值周期的計量依據是其被利用的狀況,這與傳統文獻資源老化規律的研究思路基本相同。文獻半衰期的研究可以分為學科文獻的半衰期和論文的半 衰期。學科文獻的半衰期是指某學科(專業)現時尚在利用的全部文獻中較新的一半是在多長一段時間內發表的;論文半衰期是指引用這篇論文的全部其他論文的二 分之一是在這篇后的多長時間內發表的。需要強調的是,學科文獻的半衰期是相對于被引文獻而言,而論文的半衰期是相對于引用文獻而言的[6]。與此 相對應,我們仍然以“半衰期”為指標衡量網絡信息資源的價值周期,并按研究對象分為宏觀網絡信息資源半衰期和微觀網絡信息資源半衰期。
(1)宏觀網絡信息資源半衰期。根據學科文獻半衰期的概念,我們將宏觀網絡信息資源半衰期定義為某主題領域網絡信息資源所含鏈接的鏈宿所指資源中較新的一 半是在多長時間內產生的。例如,如果我們說網絡信息計量學的網絡信息資源半衰期是1.2年,就表明在我們進行統計研究的那一年里,在網上的網絡信息計 量學文獻中的鏈接所指資源的50%是在最近1.2年內發表的。
宏觀網絡信息資源半衰期的研究是基于網絡信息資源中的鏈接。由于網絡信息資源中的鏈接與文獻的被引文獻是性質完全不同的兩類事物,因此,在借鑒其研究思路 的同時,我們應該注意自身的特殊性。筆者認為,最重要的幾個需要解決的問題是:第一,必須明確鏈接的目的,也就是鏈源與鏈宿之間的關系;第二,當鏈宿的發 布時間晚于鏈源所在網絡信息資源的時間時應當如何計算;第三,是應該采用網絡信息資源中所有的鏈接,還是只考察出鏈;第四,從理論上來說,我們需要獲 得該主題領域的所有網絡信息資源,并提取其所含有的鏈接。由于網絡信息資源的不完全性,研究結果可能與客觀實際存在相當程度的差異。
(2)微觀網絡信息資源半衰期。參照論文半衰期的概念,微觀網絡信息資源半衰期是指指向該網絡信息資源的全部其他網絡信息資源的二分之一是在其后的多 長時間內出現的。例如,網上某文檔的半衰期是1.5年,就意味著該文檔所獲得入鏈的鏈源所在網絡信息資源的50%出現于其后的1.5年內。
與宏觀網絡信息資源半衰期的研究相比,微觀網絡信息資源半衰期研究所面臨的問題相對較少。根據上述定義,微觀網絡信息資源半衰期的研究不涉及自鏈,并且基 本不會出現入鏈的鏈源所在資源的時間早于研究對象出現時間這樣的情況。因此,需要考慮的問題中最主要的就是解決或盡量縮小網絡信息資源的不完全性。盡 管有研究表明,網絡鏈接的使用動機與文獻引用動機存在巨大差異,但筆者認為,無論處于何種動機,網絡信息資源獲得入鏈就意味著其使用價值的實現,我們在計 量其半衰期時不必做過多的區分[7]。
3 網絡信息資源老化研究展望
網絡信息資源的老化研究與網絡信息資源的增長、分布與利用研究共同構成了網絡信息計量學研究的基本框架,對豐富與完善網絡信息計量學的學科體系具有極高的理論價值。同時,網絡信息資源老化研究的成果也是網絡信息資源建設、管理和利用的依據,具有重要的現實意義。
目前,國內對網絡信息資源的老化研究才剛剛起步,所見文獻僅有2004年王宏鑫和邱均平在《情報理論與實踐》第4期所發表的《關于網絡信息老化研究的若干 問題》一文[8]。因此,在現階段應該借鑒文獻計量學的研究成果,在充分認識網絡信息資源與傳統文獻資源所存在差異的基礎上,建立網絡信息資源老化研究的 理論與方法體系,為探索網絡信息資源老化規律和實踐應用奠定基礎。
【參考文獻】
1 2002年中國互聯網絡信息資源數量調查報告.cnnic.net.cn/html/Dir/2003/11/22/1393.htm
2 2003年中國互聯網絡信息資源數量調查報告.cnnic.net.cn/download/manual/report20030330.pdf
3 2004年中國互聯網絡信息資源數量調查報告.cnnic.net.cn/download/2005/2005041401.pdf
4 Bar-Ilan, Peritz B.C.The life span of a specific topic on the Web: the case of "informatrics" a quantitative analysis. Scientometrics. 1999, 46(3):371-382
5 Wallace Koehler. An Analysis of Web Page and Web Site Constancy and Permanence. Journal of the American Society for Information Science. 1999, 50(2).
6 邱均平編著.文獻計量學.北京:科學技術文獻出版社,1988.