2007/6/17

資訊檢索白話文運動–自然語言檢索(Nature Language)

在五四運動中,透過白話文的推廣,讓知識的流通更快速﹔今天,我們則是透過自然語言的檢索技術,讓資訊檢索的學習門檻更低,資訊獲得的速度更快。

以往,我們往往為了查詢一個主題,可能要透過好幾個輪迴的檢索過程,才能確認挑選出我們所需要的資訊。譬如「為什麼太陽光紫外線的曝曬會使罹患皮膚癌的風險增加?」。首先,必須先挑出可以作為查詢點的關鍵字,譬如「紫外線(UV)」和「皮膚癌(Skin Cancer)」。

但是我們會發現,當我們在作查詢時,我們可能使用的關鍵字是簡稱,譬如紫外線的簡稱是UV;可能是一般的稱呼,譬如Skin Cancer是一般的通稱,真正的醫學標題是Skin Neoplasms。我們必須先去知道正式的名稱或是所有相關的同義辭彙,譬如Cancer這個字還可能以Tumor、Neoplasms、Carcinoma等等的字詞代表。

在Ovid Medline的查詢中,因為有MeSH的主題辭彙分類,我們可以透過Ovid系統中的Mapping Subject Headings的方式來精確我們的查詢結果。

但是如果我們需要去查詢電子書時,沒有了MeSH的輔助,我們靠什麼方式快速有效的查到我們要的資訊呢?

此時,自然語言檢索(Nature Language)也就運應而生了。我們不再需要把一個問題拆成好幾個關鍵詞分開查詢,而是直接輸入一個問題,像是「Why UV from sun light increase the risk of skin cancer?」。



以Books@Ovid為例,Ovid會將讀者輸入的詞彙作所有可能詞性或詞態變化的查詢,再依據每個關鍵字彼此之間的距離計算關聯度,最後提供最接近問題的答案。


我們只要看看系統提示的內文片段是否和我們的需求符合,確定之後,點選Ovid Full Text就可以直接連結到電子書的內文瀏覽。


我們所選擇的內容會明顯的標示出來,包括我們輸入的字詞和該篇文章所在的章節段落,都可以一次呈現。除了線上瀏覽之外,為了方便讀者對於內容的引用所需,文章段落中的參考文獻都可以透過連結的方式直接連結。



再加上參考文獻的對外連結功能,資料庫和電子期刊資料一次到位。

這樣的功能除了提供Books@Ovid的讀者來使用之外,臨床決策支援系統ClinicallResource@Ovid現在也同步提供。


現在看起來,查資料一點都不困難了,不是嗎? 連動輒上千頁的書籍,利用自然語言檢索的方式,彈指之間就可以找到我們需要的資料。由於資訊檢索技術的再突破,我們可以把更多的時間放在實際的研究工作或是醫療照護上面,知識的腳程又往前加快了許多。

0 回應: