信息檢索基礎(chǔ)理論_第1頁
已閱讀1頁,還剩100頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第二章 信息檢索理論與技術(shù),第一節(jié) 信息檢索系統(tǒng)第二節(jié) 信息標(biāo)引及檢索原理第三節(jié) 檢索語言第四節(jié) 檢索技術(shù)第五節(jié) 檢索途徑與步驟,第一節(jié) 信息檢索系統(tǒng),一、信息檢索系統(tǒng)的概念與類型二、書本式檢索系統(tǒng)三、計(jì)算機(jī)檢索系統(tǒng)四、檢索系統(tǒng)的質(zhì)量評(píng)價(jià),一、信息檢索系統(tǒng)的概念與類型,1.信息檢索系統(tǒng)的概念,信息檢索系統(tǒng)是一類具有信息存儲(chǔ)和檢索功能的信息服務(wù)設(shè)施,2.信息檢索系統(tǒng)的類型,按使用設(shè)備,,書本

2、式檢索系統(tǒng)卡片式檢索系統(tǒng)縮微式檢索系統(tǒng)計(jì)算機(jī)檢索系統(tǒng),書本式檢索系統(tǒng),又稱檢索工具,檢索工具 是用來報(bào)道文獻(xiàn)、存儲(chǔ)文獻(xiàn)和提供查找文獻(xiàn)線索的工具,檢索工具的類型,,按著錄方式分: ﹡目錄型 ﹡題錄型 ﹡文摘型,(1)、目錄型檢索工具,目錄——以單位出版物為著錄對(duì)象,主要揭示出版物的外表特征。,著錄格式:,西葫蘆、南瓜高產(chǎn)栽培與加工技術(shù) / 李海真等編著 .- 北京 :中國(guó)農(nóng)業(yè)出版社,2003.03. -242頁;19c

3、m .- ISBN7-109-07770-5 :¥12.00,書 名,編 者,出版地、出版者,出版年月,總頁數(shù),規(guī) 格,國(guó)際標(biāo)準(zhǔn)書號(hào),價(jià) 格,目 錄 的 種 類,⑴ 館 藏 目 錄,① 分類目錄——依據(jù)分類法組織而成的目錄② 書名目錄——按書名字順組織起來的一種目錄③ 著者目錄——按著者姓名或名稱字順組織起來的目錄④ 主題目錄——按主題標(biāo)識(shí)字順組織排列的一種目錄,⑵ 聯(lián) 合 目 錄,⑶ 國(guó) 家 書 目,⑷

4、出版社與書店目錄,(2)、題錄型檢索工具,題錄——以單篇文獻(xiàn)為著錄對(duì)象,主要描述文獻(xiàn)的外表特征。,著錄格式:,031007529 鏟式精播打穴播種機(jī)結(jié)構(gòu)參數(shù)的設(shè)計(jì) / 李成華(沈陽農(nóng)業(yè)大學(xué),110161);趙鳳琴;夏建滿等 // 農(nóng)機(jī)化研究(哈爾濱).- 2003,(2).- 124-126,題錄號(hào),題 名,著者及工作單位,刊 名,出版年、期、頁,(3)、文 摘,文摘——以單篇文獻(xiàn)為著錄對(duì)象,既描述文獻(xiàn)的外表特征,又描述文獻(xiàn)的內(nèi)

5、容特征。,著錄格式:題錄 + 摘要,20034168 遼沈Ⅰ型日光溫室的建造 / 劉文合(沈陽農(nóng)業(yè)大學(xué)水利學(xué)院),王鐵良 … // 溫室園藝 .- 2003,(1) .- 21~22 為使遼沈Ⅰ型日光溫室實(shí)現(xiàn)正常年份冬季不加溫可越冬生產(chǎn)耐低溫蔬菜的目標(biāo),施工時(shí)應(yīng)注意以下關(guān)鍵環(huán)節(jié)…,,題 錄,,文 摘,2、檢索工具的結(jié)構(gòu),(1)、編輯與使用說明,(2)、目次表和主題詞表,(3)、正文部分,(4)、輔助索引,(

6、5)、附錄部分,(1)、編輯與使用說明,,(2)、目次表和主題詞表,,(3)、正文部分,,(4)、輔助索引,,(5)、附錄部分,,3、 索 引(INDEX),(1)、 索 引 的 定 義(2)、 索 引 的 結(jié) 構(gòu)(3)、 索 引 的 類 型,,(1)、索 引 的 定 義,將圖書、報(bào)刊、資料等文獻(xiàn)中的一些重要的、有價(jià)值的知識(shí)單元,如人名、題名、分類號(hào)、主題詞等,根據(jù)需要分別摘錄出來,并注明它們所在的地址(頁碼或文獻(xiàn)號(hào)),再按一定的順

7、序排列組織起來,附在檢索工具之后,或單獨(dú)編輯成冊(cè),稱為索引。,(2)、索 引 的 結(jié) 構(gòu),噴灌 春小麥 產(chǎn)量 干旱地區(qū) 土壤水分 20031331 冬小麥 節(jié)水 優(yōu)化 20032372 徑流量 水土流失 預(yù)測(cè) 模型 20033380 …噴灌機(jī) 大型 適應(yīng)性 中國(guó) 20033298噴灌技術(shù) 噴灌系統(tǒng) 2003134

8、6 …,標(biāo)目,說明語,存儲(chǔ)地址,Microcomputers ( see : computers ) Computer software ( see also : expert systems ),“參見” 參照,“見” 參照,,索引款目,,參照系統(tǒng),標(biāo)目注釋,,參照系統(tǒng)——連接相關(guān)標(biāo)目的媒介物,等義參照(直接參照) —— see 如:South Korea(see: Korea Republic)

9、 用于同義詞之間、舊名與新名之間、縮寫與全稱之間、俗名與學(xué)名之間… see后面的詞為標(biāo)題詞相關(guān)參照(間接參照)—— see also 如:Drainage(see also: subsurface drainage ; surface drainage) 指示其他相關(guān)標(biāo)題詞,,(3)、索 引 的 類 型,⑴ 著者索引——以著者為標(biāo)目,按著者名稱字順排列。,⑵ 主題索引——以主題詞為標(biāo)目,按主題詞字順排列。,⑶

10、分類索引——以分類號(hào)或類目的名稱為標(biāo)目,按分類 順序排列的索引。,⑷ 題名索引——以題名為標(biāo)目,按題名字順排列。,⑸ 專用索引——分子式索引、地名索引、報(bào)告號(hào)索引、 專利號(hào)索引…,著 者 索 引,,,主 題 索 引,,分 類 索 引,,,,,,,界,門,綱,科,屬,3. 計(jì)算機(jī)檢索系統(tǒng),計(jì)算機(jī)檢索系統(tǒng)由: 計(jì)算機(jī)檢索軟件(指令、程序或程序組)

11、 計(jì)算機(jī)硬件 (主機(jī)、外圍設(shè)備) 數(shù)據(jù)庫(信息源),,,數(shù)據(jù)庫的類型,文獻(xiàn)型數(shù)據(jù)庫非文獻(xiàn)型數(shù)據(jù)庫,,全文數(shù)據(jù)庫,書目數(shù)據(jù)庫,,數(shù)值型數(shù)據(jù)庫事實(shí)型數(shù)據(jù)庫圖像數(shù)據(jù)庫概念數(shù)據(jù)庫,數(shù)據(jù)庫結(jié)構(gòu),字 段,記 錄,順排文檔倒排文檔,數(shù)據(jù)庫,檢索工具結(jié)構(gòu),著錄項(xiàng)目,著錄款目,檢索工具,正文索引,,,文檔,,,,,字 段,記 錄,,,,主 要 字 段,TI——題名AU——著

12、者SO——出處JN——刊名PY——出版年AB——文摘DE——主題詞,LA——語種AN——記錄號(hào)IS——國(guó)際標(biāo)準(zhǔn)書號(hào)、期刊號(hào)DT——文獻(xiàn)類型AD——著者單位CL——分類,,主 要 字 段,英文題名,作者,作者單位,出處,語種,出版年,文摘,(1)文獻(xiàn)檢索系統(tǒng),,書目檢索系統(tǒng),全文檢索系統(tǒng),超文本檢索系統(tǒng),存儲(chǔ)關(guān)于文獻(xiàn)外表、內(nèi)容特征的一般描述性信息。如引文、文摘。也稱為二次文獻(xiàn)檢索系統(tǒng),如CABI、Agris、Agri

13、cola等。,存儲(chǔ)原始文獻(xiàn)的全文信息。包括題名、著者、摘要、關(guān)鍵詞、正文、參考文獻(xiàn)和著作日期全部數(shù)據(jù)。,主要用于檢索網(wǎng)絡(luò)信息資源,如網(wǎng)絡(luò)信息檢索工具搜索引擎。,第二章,第一節(jié) 信息檢索系統(tǒng),計(jì)算機(jī)檢索系統(tǒng)的類型,以事實(shí)為檢索對(duì)象的非文獻(xiàn)型檢索系統(tǒng) 提供有關(guān)人物、機(jī)構(gòu)、地域、事件等事實(shí)信息。 如人物傳記數(shù)據(jù)庫、機(jī)構(gòu)名錄數(shù)據(jù)庫、萬方《中國(guó)企業(yè)與產(chǎn)品數(shù)據(jù)庫》、電子形式的百科全書、年鑒、手冊(cè)、名錄。,(2)事實(shí)型檢索系統(tǒng),第二章

14、,第一節(jié) 信息檢索系統(tǒng),以數(shù)據(jù)形式記錄物質(zhì)、材料等實(shí)物的特性、參數(shù)、常數(shù)、價(jià)格等。 如人口數(shù)據(jù)庫、商品價(jià)格數(shù)據(jù)庫、世界糧農(nóng)統(tǒng)計(jì)數(shù)據(jù)庫。,(3)數(shù)值型檢索系統(tǒng),第二章,第一節(jié) 信息檢索系統(tǒng),存儲(chǔ)和檢索各種圖像或圖形及有關(guān)說明文字資料。,(4)圖像檢索系統(tǒng),(5)多媒體信息檢索,檢索主題的“全方位”信息 分為基于文本方式的多媒體信息檢索; 基于內(nèi)容特征的多媒體信息檢索,,第二章,第一節(jié) 信息檢索系統(tǒng),四、檢

15、索系統(tǒng)的質(zhì)量評(píng)價(jià),1、檢索工具收錄文獻(xiàn)的齊全情況 2、摘錄及標(biāo)引的質(zhì)量 3、索引完備情況 4、報(bào)道時(shí)差 5、使用方便情況,第二節(jié) 信息標(biāo)引及檢索原理,一、信息標(biāo)引二、檢索原理,一、信息標(biāo)引的類型及作用,1、信息標(biāo)引的含義,在信息處理過程中,將文獻(xiàn)的內(nèi)容特征和外部特征轉(zhuǎn)換成檢索標(biāo)識(shí),即對(duì)有檢索價(jià)值的特征信息,例如題名、作者、主題內(nèi)容、類別等進(jìn)行提取與標(biāo)識(shí),并組織成索引文檔,為用戶的查詢和訪問提供準(zhǔn)確而有效的檢索入口。,,,,

16、,標(biāo)引——給出信息標(biāo)識(shí),地下水 土壤水 動(dòng)態(tài)變化 井灌區(qū),S152.7,分類號(hào),主題詞,2、信息標(biāo)引的類型,,分類標(biāo)引——賦予信息分類號(hào)標(biāo)識(shí)的標(biāo)引過程主題標(biāo)引——賦予信息主題詞標(biāo)識(shí)的標(biāo)引過程,按標(biāo)識(shí)的形態(tài)和性質(zhì)分,,,按標(biāo)引手段分,人工標(biāo)引自動(dòng)標(biāo)引,(1)標(biāo)引深度(網(wǎng)羅度) 詳盡程度——網(wǎng)羅度越高, 有利于提高查全率(2)標(biāo)引專指度精細(xì)程度——專指度越高,

17、 有利于提高查準(zhǔn)率,3、信息標(biāo)引的質(zhì)量,,二、檢索原理,匹配,命中信息,,提問標(biāo)識(shí),,存儲(chǔ)標(biāo)識(shí),,原始信息,標(biāo)引,檢索工具,標(biāo)識(shí)匹配,存儲(chǔ)標(biāo)識(shí),檢索標(biāo)識(shí),標(biāo)引,信息需求,檢索語言,命中信息,檢索者,,,,,,存儲(chǔ)過程,,,檢索過程,第三節(jié) 檢 索 語 言,一、檢索語言的含義及作用二、檢索語言的類型,,LANGUAGE,一、檢索語言的含義及作用,檢索語言的含義檢索語言的作用,把文獻(xiàn)信息的存儲(chǔ)與

18、檢索聯(lián)系起來,把標(biāo)引人員與檢索人員聯(lián)系起來以便取得共同理解的語言,就叫檢索語言。檢索語言就是根據(jù)檢索需要而創(chuàng)造的一種人工語言。,檢索語言的含義,保證,檢索語言的作用,,1、存儲(chǔ)的一致性2、檢索與存儲(chǔ)的一致性3、使分散的信息系統(tǒng)化4、獲得最高的查全率和查準(zhǔn)率,二、檢索語言的類型及特點(diǎn),檢索語言,分類檢索語言,主題檢索語言,,代碼檢索語言,,標(biāo)題詞語言,敘詞語言,關(guān)鍵詞語言,1、分 類 檢索語言,是用分類號(hào)和類名來表達(dá)信息的主題概念。

19、以科學(xué)分類為基礎(chǔ),運(yùn)用概念劃分的方法,將知識(shí)按一系列的標(biāo)準(zhǔn)和邏輯規(guī)則進(jìn)行層層劃分,形成一個(gè)嚴(yán)格有序的直線式的知識(shí)門類等級(jí)體系。,構(gòu) 成 原 理,體 系 分 類 表,◆ 馬克思主義、列寧主義、毛澤東思想、鄧小平理論,◆ 哲 學(xué),◆ 社會(huì)科學(xué),◆ 自然科學(xué),◆ 綜合性圖書,C 社會(huì)科學(xué)總論D 政治、法律E 軍事F 經(jīng)濟(jì)G 文化、科學(xué)、教育、體育H 語言、文字I 文學(xué)J 藝術(shù)K 歷史、地理,A 馬克思主義

20、、列寧主義、毛澤東思想、鄧小平理論,,B 哲 學(xué)、宗教,N 自然科學(xué)總論O 數(shù)理科學(xué)和化學(xué)P 天文學(xué)、地球科學(xué)Q 生物科學(xué)R 醫(yī)藥、衛(wèi)生S 農(nóng)業(yè)科學(xué)T 工業(yè)技術(shù)U 交通運(yùn)輸V 航空、航天X 環(huán)境科學(xué)、安全科學(xué),Z 綜合性圖書,S1 農(nóng)業(yè)基礎(chǔ)科學(xué)S2 農(nóng)業(yè)工程S3 農(nóng)學(xué)(農(nóng)藝學(xué))S4 植物保護(hù)S5 農(nóng)作物S6 園藝S7 林業(yè)S8 畜牧、動(dòng)物科學(xué)、狩獵、蠶、蜂S9 水

21、產(chǎn)、漁業(yè),,,,,《中國(guó)圖書館分類法》,,S11 農(nóng)業(yè)數(shù)學(xué)S12 農(nóng)業(yè)物理學(xué)S13 農(nóng)業(yè)化學(xué)S14 肥料學(xué)S15 土壤學(xué) S157 水土保持,X1 環(huán)境科學(xué)基礎(chǔ)理論X2 社會(huì)與環(huán)境X3 環(huán)境保護(hù)管理X4 災(zāi)害及其防治X5 環(huán)境污染及其防治X7 廢物處理與綜合利用X8 環(huán)境質(zhì)量與環(huán)境監(jiān)測(cè)X9 安全科學(xué),體 系 分 類 表,T 工業(yè)技術(shù),,,X環(huán)境科學(xué),TH 機(jī)械、儀表

22、工業(yè)TK 能源與動(dòng)力工程TM 電工技術(shù)TN 無線電電子學(xué)、電信技術(shù)TP 自動(dòng)化技術(shù)、計(jì)算機(jī)技術(shù)TQ 化學(xué)工業(yè)TU 建筑科學(xué)TV 水利工程,,體 系 分 類 表,U交通運(yùn)輸,,U1綜合運(yùn)輸U(kuò)2鐵路運(yùn)輸U(kuò)4公路運(yùn)輸U(kuò)6水路運(yùn)輸,,41道路工程44橋涵工程45隧道工程46汽車工程48其他道路運(yùn)輸工具49交通工程與公路運(yùn)輸技術(shù)管理,TS輕工業(yè)、手工業(yè),,TS2食品工業(yè),TS20一般性問題,TS22食用

23、油脂加工工業(yè)一般性問題,TS27飲料冷食制造工業(yè),TS29罐頭工業(yè),TS20一般性問題,,TS201基礎(chǔ)問題,TS202食品原料及添加劑,TS205食品加工與保藏,TS206食品包裝學(xué),TS208食品加工廠,TS209食品工業(yè)副產(chǎn)品加工與利用,分類檢索語言的特點(diǎn),按學(xué)科專業(yè)集中相關(guān)文獻(xiàn)體現(xiàn)了學(xué)科的系統(tǒng)性從知識(shí)分類的角度揭示文獻(xiàn)信息之間的區(qū)別與聯(lián)系提供從學(xué)科專業(yè)領(lǐng)域檢索文獻(xiàn)信息,2、主題檢索語言,構(gòu) 成 原 理,是以主題詞來表達(dá)信息主

24、題概念的語言。利用自然語言中的名詞術(shù)語,經(jīng)過一定程度的規(guī)范化處理,作為表達(dá)文獻(xiàn)和提問內(nèi)容的主題詞,主題檢索語言的特點(diǎn),按特定事物集中文獻(xiàn)信息,有較強(qiáng)的直觀性,按標(biāo)識(shí)的特點(diǎn)和原理,,標(biāo)題詞語言敘詞語言關(guān)鍵詞語言,,標(biāo)題詞,(1)標(biāo) 題 詞 語言,經(jīng)過規(guī)范化,代表文獻(xiàn)的主題概念,,,對(duì)同義詞進(jìn)行優(yōu)選對(duì)詞的不同形式進(jìn)行歸一對(duì)近義詞進(jìn)行合并對(duì)多義詞進(jìn)行注釋對(duì)簡(jiǎn)稱進(jìn)行補(bǔ)全對(duì)俗稱進(jìn)行引見,對(duì)自然語言的優(yōu)選,主標(biāo)題詞——起主導(dǎo)作用

25、 多為表現(xiàn)實(shí)物、材料、結(jié)構(gòu)、 理論、 現(xiàn)象、工藝、過程等概念的詞副標(biāo)題詞——起說明或限定作用 多為表現(xiàn)主標(biāo)題詞某一方面內(nèi)的詞,,BRIDGES Construction Drainage Inspection,(2)敘 詞 語言,,﹡規(guī)范化詞﹡單元詞,敘 詞,,,敘詞表——敘詞款目片段

26、 選自《漢語主題詞表》,玉米,Yu mi,CornMaizeZea mays,D 包谷 玉蜀黍,F 馬齒玉米 甜玉米 硬粒玉米,S 禾谷類作物,Z 作物,C 雜種優(yōu)勢(shì),Zuo wu,作物,CropCrop plant,D 大田作物 農(nóng)作物,F 豆類作物 禾谷類作物 經(jīng)濟(jì)作物 …,Zazhong youshi,雜種優(yōu)勢(shì),H

27、eterosisHeterotic vigorHybrid vigor,C 高粱 黃瓜 玉米 雜合性 雜種一代 自交 …,,,,禾谷類作物,玉 米,作物,馬齒玉米甜玉米硬粒玉米,包谷玉蜀黍,雜種優(yōu)勢(shì),上位詞,上位詞,下位詞,相關(guān)詞,非敘詞,敘 詞 法 的 特 點(diǎn),后組式檢索語言,可達(dá)到概念的靈活組配完善的參照系統(tǒng),可擴(kuò)檢和縮檢用詞表達(dá)主題概念,滿足特性

28、檢索,① 提高查全率② 提高查準(zhǔn)率③ 進(jìn)行多途徑檢索,(3)關(guān) 鍵 詞 語言,文獻(xiàn)題目、摘要或正文中 具有實(shí)質(zhì)意義的詞,關(guān)鍵詞,關(guān) 鍵 詞 語言 的 特點(diǎn),,適于編制機(jī)檢系統(tǒng)用戶使用起來方便靈活,關(guān)鍵詞是未經(jīng)規(guī)范化或少量規(guī)范化的自然語言,查全率、查準(zhǔn)率受到影響,3、代碼檢索語言,構(gòu) 成 原 理,將元素符號(hào)、分子式、專利號(hào)、標(biāo)準(zhǔn)號(hào)、報(bào)告號(hào)、合同號(hào)、化合物登記號(hào)等符號(hào)代碼作為標(biāo)引和檢索標(biāo)識(shí),編制專用索引。,一、布爾檢索二、截詞檢索

29、三、位置檢索四、限定檢索五、加權(quán)檢索,第四節(jié) 檢 索 技 術(shù),第二章,一、布爾檢索,采用布爾邏輯與、或、非等運(yùn)算符對(duì)檢索詞進(jìn)行組配,形成檢索提問式。,邏輯與(and 或 *)邏輯或(or 或 +)邏輯非(not 或 -),布爾邏輯檢索,A*B,A+B,A-B,布爾邏輯檢索,AND ( 邏輯與 ),OR ( 邏輯或 ),NOT ( 邏輯非 ),例:environment AND health,表示檢索同時(shí)提及“envi

30、ronment“和” health“的文章,例:maize OR soybean,表示檢索提及maize或soybean或兩者都提及的文章,例:Surfing AND NOT internet,表示檢索提及AND NOT 之前的術(shù)語,但不提及其后術(shù)語的文章,組配檢索詞,擴(kuò)大或縮小檢索范圍,檢索課題:計(jì)算機(jī)在北美圖書館的應(yīng)用 圖書館*計(jì)算機(jī)*(北美+美國(guó)+加拿大)檢索課題:水資源承載力 水資源*(承載

31、力+承載能力),編寫檢索式,我國(guó)商業(yè)銀行中間業(yè)務(wù)發(fā)展的現(xiàn)狀、問題及對(duì)策溫度、水分及添加秸稈對(duì)蘋果根區(qū)土壤微生物群落的影響中耕施肥機(jī)的結(jié)構(gòu)設(shè)計(jì)與參數(shù)優(yōu)化溫度和紫外線對(duì)兩株蠟蚧輪枝菌的影響,在檢索中,常會(huì)遇到一些詞干相同、詞義相近的檢索詞或有英、美不同拼寫法的詞,為了減少檢索詞的輸入量,同時(shí)又?jǐn)U大檢索范圍,可使用截詞算符,以提高檢索效率。 截詞符一般用 “?”表示有限截?cái)?或 “ * ” 表示無限截?cái)唷?二、截詞檢索,,,“acid

32、??” 有限截詞可檢索出acid,acidic,acids檢不出acidify,acidity,二、截詞檢索,注,后截詞檢索主要用于:①詞的單復(fù)數(shù),如book?,potato??②年代,如199?(90年代),19??(20世紀(jì))③作者,如Lancaster*可檢出所有姓Lancaster的作者④同根詞,如politic*可檢出political、politicalize等,第二章,第四節(jié) 檢索技術(shù),布爾算符檢索時(shí),只對(duì)檢

33、索詞進(jìn)行邏輯組配,未限定檢索詞之間的位置及檢索詞在記錄中的位置關(guān)系。在某些情況下,若不限定檢索詞之間的位置關(guān)系會(huì)造成誤檢。如:檢索“biological*control”(生物防治)的文獻(xiàn),會(huì)將“抑制生物”(control biological)的文獻(xiàn)也查出來。,3、位置檢索,各檢索系統(tǒng)使用的位置算符有所不同.DIALOG系統(tǒng)的主要位置算符有:(W)、(nW)、(N)、(nN)、(F)、(C)、(S)。,W——CD(W)ROM 相當(dāng)于

34、檢索CD ROM 或 CD- ROM。 nW——wear(1W)material 相當(dāng)于檢索 wear material、 wear of material.N——表示兩詞相鄰且詞序可變。nN ——railway(2N)bridge可表示railway bridge、 bridge of railway、 bridge of the railway 等。,F——digital(F)computer / T

35、I表示題名字段(TI)中同時(shí)出現(xiàn)這兩個(gè)檢索詞的才算命中信息。C——表示兩詞必須同時(shí)在同一個(gè)文獻(xiàn)記錄中,兩詞的詞序、出現(xiàn)的字段不限。S——表示兩詞必須同時(shí)出現(xiàn)在同一句短語中,兩詞的詞序不限,中間插入詞數(shù)量不限。,▲ W / n,表示兩個(gè)單詞之間相隔不多于n個(gè)單詞,且詞序可以顛倒,例如:apples w/3 pears 與 pears w/3 apples 的檢索結(jié)果相同,▲ pre / n,表示兩個(gè)單詞間距小于n個(gè)單詞,且詞序不可變,

36、例如:biological pre/1 control 與 control pre/1 biological有不同的檢索結(jié)果,,,1 詞位置檢索,“布爾邏輯檢索”與”詞間位置檢索”的比較,布爾邏輯檢索,,,檢索結(jié)果,,,,檢索結(jié)果不準(zhǔn)確,詞間位置檢索,,,,檢索結(jié)果,,,,準(zhǔn)確的檢索結(jié)果,要求參加檢索運(yùn)算的兩個(gè)檢索詞必須在同一自然句中出現(xiàn),先后順序不受限制。 位置算符:(S) Sentence

37、 Apple (S) Pear,2 同句檢索,第二章,第四節(jié) 檢索技術(shù),同字段檢索:檢索詞(或檢索項(xiàng))必須同時(shí)出現(xiàn)在數(shù)據(jù)庫記錄的同一個(gè)字段中,詞序可變。 位置算符:(F) Field digital(F)computer / TI,3 同字段檢索和同記錄檢索,同記錄檢索:檢索詞(或檢索項(xiàng))必須同時(shí)出現(xiàn)在同一條數(shù)據(jù)庫記錄中 ,詞序可變。

38、 位置算符:(C) Citation,第二章,第四節(jié) 檢索技術(shù),指限定字段檢索,即限定檢索詞在記錄中出現(xiàn)的字段范圍。檢索時(shí),計(jì)算機(jī)只對(duì)限定字段進(jìn)行查找。,4、限定檢索,apple? / TI(篇名)machine in AB(文摘)breeding in DE(主題詞)AU=Smith-JS(著者)LA=French(語種)JN=Nature(刊名)PY>=1992(出版年),,,限 定 檢 索,,

39、,,限定字段檢索結(jié)果,,五、加權(quán)檢索,加權(quán)檢索是判定檢索詞或字符串在滿足檢索邏輯后對(duì)文獻(xiàn)命中與否的影響程度,是從量的方面對(duì)檢索詞之間的組配關(guān)系加以限制和表示。 加權(quán)檢索是對(duì)每一個(gè)檢索詞給定一個(gè)數(shù)值表示其重要程度,稱為權(quán)值。,第二章,第四節(jié) 檢索技術(shù),—— 相當(dāng)于詞頻檢索,,檢索運(yùn)算規(guī)則,1、同級(jí)運(yùn)算自左向右進(jìn)行2、布爾運(yùn)算AND和NOT先執(zhí)行,OR其次執(zhí)行3、括號(hào)內(nèi)的運(yùn)算先執(zhí)行、多層括號(hào)從內(nèi)向外逐次進(jìn)行4

40、、當(dāng)檢索提問式含有截詞符、位置算符、限制符時(shí),布爾運(yùn)算最后執(zhí)行,第五節(jié) 檢索途徑和步驟,一、檢 索途 徑二、檢 索步 驟,一、檢 索 途 徑,(1)、分 類 途 徑,按學(xué)科的分類體系查找文獻(xiàn)的途徑,分類目錄、分類索引,范圍較廣的文獻(xiàn)族性檢索,利 用,適合,含義,關(guān)鍵,不適合,專指度高、新興學(xué)科、跨學(xué)科,掌握分類法、確定課題所屬分類號(hào)和類目,(2)、主 題 途 徑,含 義,利 用,適 合,通過文獻(xiàn)內(nèi)容來確定主題詞查找文獻(xiàn)的途徑,主題

41、索引,內(nèi)容較專深的文獻(xiàn)檢索,(3)、著 者 途 徑,利 用,含 義,根據(jù)著者姓名查找文獻(xiàn)的途徑,著者索引,(4)、題名 途 徑,含 義,以文獻(xiàn)名稱為檢索標(biāo)識(shí)來查找信息的途徑,利 用,書名索引、篇名索引、期刊名稱,(5)、代碼途 徑,含 義,以信息專用的代碼為檢索標(biāo)識(shí)進(jìn)行檢索的途徑,利 用,標(biāo)準(zhǔn)號(hào)索引、專利號(hào)索引、報(bào)告號(hào)索引,二、檢 索 步 驟,1、分析研究課題,確定檢索范圍 2、選擇檢索系統(tǒng),確定檢索途徑 3、確定檢索標(biāo)識(shí),編制

42、檢索提問式 4、執(zhí)行檢索操作 5、獲取并整理檢索結(jié)果,,(1)主題范圍的確定(2)學(xué)科范圍的確定(3)時(shí)間范圍的確定(4)地域范圍的確定(5)信息類型的確定,1、分析研究課題,確定檢索范圍,2、選擇檢索系統(tǒng),確定檢索途徑,選擇檢索系統(tǒng)。(1)根據(jù)課題學(xué)科范圍和信息類型選擇(2)根據(jù)檢索系統(tǒng)收錄范圍選擇(3)選擇界面友好操作簡(jiǎn)單的檢索系統(tǒng),確定檢索途徑。(1)根據(jù)檢索系統(tǒng)提供的途徑選擇(2)課題范圍較廣選擇分類途

43、徑,課題范圍較窄選擇主題途徑(3)采用著者、專利號(hào)、分子式等途徑,3、確定檢索標(biāo)識(shí),編制檢索提問式,確定檢索標(biāo)識(shí)(1)選擇核心概念、排除無關(guān)概念(2)利用分類表、敘詞表等作為選擇依據(jù)(3)采用關(guān)鍵詞時(shí),注意同義詞、近義詞等(4)受控詞和非受控詞互相補(bǔ)充(5)了解上位詞、下位詞、同位詞(6)避免生僻詞匯,編制檢索提問式(1)提高查全率(2)提高查準(zhǔn)率,原始文獻(xiàn)的獲取方式,(1)根據(jù)所查線索查找原文(2)根據(jù)著者姓名及通

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論