- 相關(guān)推薦
基于因特網(wǎng)的個(gè)性化信息服務(wù)研究
【內(nèi)容提要】個(gè)性化信息服務(wù),是針對(duì)不同用戶采用不同服務(wù)策略和方式提供不同信息內(nèi)容的服務(wù)。它具有以用戶為中心、對(duì)用戶需求進(jìn)行挖掘、靈活多樣和主動(dòng)將信息推送給用戶的特點(diǎn)。其類型有:個(gè)性化內(nèi)容定制服務(wù);個(gè)性化信息檢索定制服務(wù);個(gè)性化界面定制服務(wù)。用戶個(gè)性化需求可通過(guò)用戶訪問(wèn)記錄挖掘、Bookmark和Agent獲取。個(gè)性化信息服務(wù)模型,可采用信息A gent自主學(xué)習(xí)法、信息過(guò)濾法、基于多Multi-Agent ……隨著因特網(wǎng)的飛速發(fā)展,網(wǎng)上信息資源迅猛增長(zhǎng),現(xiàn)有的搜索引擎如YAHOO等越來(lái)越難以滿足用戶獲取信息的需要。這些搜索引擎在服務(wù)中,一方面忽略用戶的個(gè)性化要求,另一方面不能提供主動(dòng)信息服務(wù),使因特網(wǎng)上的海量信息和用戶對(duì)信息的有限獲取能力形成了強(qiáng)烈的反差,使得因特網(wǎng)上信息的獲取和利用面臨著嚴(yán)重的效率和質(zhì)量問(wèn)題。有效解決這些問(wèn)題的辦法,就是利用新技術(shù)提高用戶獲取信息的能力,使信息服務(wù)更加符合用戶自己的需要,概括地說(shuō),就是建立面向用戶的個(gè)性化服務(wù)機(jī)制。
1 個(gè)性化信息服務(wù)的定義與特點(diǎn)
1.1 個(gè)性化信息服務(wù)的概念
個(gè)性化信息服務(wù)是網(wǎng)絡(luò)信息服務(wù)發(fā)展的重要方向,已經(jīng)引起國(guó)內(nèi)外許多專家學(xué)者的研究興趣,因而近兩年這方面的研究成果較多。但何謂個(gè)性化信息服務(wù)?個(gè)性化信息服務(wù)應(yīng)包括哪些內(nèi)容?如何實(shí)現(xiàn)個(gè)性化信息服務(wù)等問(wèn)題,現(xiàn)在還沒(méi)有統(tǒng)一的科學(xué)認(rèn)識(shí)。所以在一些文獻(xiàn)里,又將個(gè)性化信息服務(wù)稱之為個(gè)性化服務(wù)、個(gè)性化定制服務(wù)、個(gè)性化信息搜索服務(wù)、個(gè)性化信息推薦服務(wù)、個(gè)性化信息提醒服務(wù)和個(gè)性化信息代理服務(wù)等等。下面是一些具有一定代表性的觀點(diǎn)。
(1)個(gè)性化信息服務(wù)是根據(jù)客戶的特性提供具有針對(duì)性的信息內(nèi)容和系統(tǒng)功能[1]。
。2)個(gè)性化信息服務(wù)就是將用戶感興趣的信息主動(dòng)提交給用戶[2]。
。3)個(gè)性化信息服務(wù)是基于信息用戶的信息使用行為、習(xí)慣、偏好和特點(diǎn),來(lái)向用戶提供滿足其各種個(gè)性化需求的一種服務(wù)[3]。
。4)所謂個(gè)性化信息服務(wù),是指能夠滿足用戶的個(gè)人信息需求的一種服務(wù),在某一特定的網(wǎng)上功能和服務(wù)方式中,自己設(shè)定網(wǎng)上信息來(lái)源方式、表現(xiàn)形式、特定網(wǎng)上功能及其它網(wǎng)上服務(wù)方式等,而主動(dòng)地向用戶提供可能需要的信息服務(wù)[4]。
。5)所謂個(gè)性化信息服務(wù),首先它應(yīng)該是一種能滿足用戶的個(gè)體信息需求的服務(wù),即根據(jù)用戶提出的明確要求,或通過(guò)對(duì)用戶個(gè)性、習(xí)慣的分析而主動(dòng)向用戶提供其可能需要的信息和服務(wù);其次它應(yīng)該是一種培養(yǎng)個(gè)性,引導(dǎo)信息需求的服務(wù),以此促進(jìn)信息業(yè)的多樣化和多元化發(fā)展”[5]。
(6)個(gè)性化信息代理就是一個(gè)能夠理解用戶真正需求的智能Agent。所謂個(gè)性是指Agent行為中所表現(xiàn)的一致的、穩(wěn)定的、可信的、典型的特征和態(tài)度集;個(gè)性可以表示為有序的目標(biāo)集和對(duì)于目標(biāo)的規(guī)劃的偏好程度[6]。
筆者認(rèn)為,個(gè)性化信息服務(wù),就是針對(duì)不同用戶采用不同的服務(wù)策略和方式,提供不同的信息內(nèi)容的服務(wù)。
1.2 個(gè)性化信息服務(wù)的特點(diǎn)
綜上所述,個(gè)性化信息服務(wù)的根本就是尊重用戶(或者說(shuō)以用戶為中心),研究用戶的行為、興趣、愛(ài)好和習(xí)慣,為用戶搜索、組織、選擇、推薦更具針對(duì)性的信息服務(wù)。通過(guò)對(duì)個(gè)性化信息服務(wù)特點(diǎn)的了解和掌握,可以使我們的服務(wù)更具針對(duì)性,從而提高用戶對(duì)信息服務(wù)的滿意度。具體地說(shuō),個(gè)性化信息服務(wù)具有以下特點(diǎn):
。1)以用戶為中心。所有的服務(wù)必須以方便用戶、滿足用戶需求為前提。
(2)允許用戶充分表達(dá)個(gè)性化需求,能夠?qū)τ脩粜枨笮袨檫M(jìn)行挖掘。信息服務(wù)的系統(tǒng)不僅要提供友好界面,而且要方便用戶交互,方便用戶描述自己的需求,方便用戶反饋對(duì)服務(wù)結(jié)果的評(píng)價(jià)。要能夠了解用戶的個(gè)人需求、習(xí)慣、愛(ài)好和興趣,為其提供“量身定制”的個(gè)性化信息服務(wù)。
。3)服務(wù)方式更加靈活、多樣。不僅要為用戶提供更加準(zhǔn)確的信息,而且還要能夠按照用戶指定的方式進(jìn)行服務(wù),如滿足用戶對(duì)信息的顯示方式、提供結(jié)果的方式(紙質(zhì)、電子版、網(wǎng)絡(luò)版、電子郵件等)的要求,對(duì)服務(wù)時(shí)間的要求,對(duì)服務(wù)地點(diǎn)的要求等。
(4)能夠主動(dòng)將用戶所需信息推送給用戶。
2 個(gè)性化信息服務(wù)的類型
在個(gè)性化信息服務(wù)系統(tǒng)中,用戶可以根據(jù)自己的需要,選擇不同的信息資源;依據(jù)自己的習(xí)慣,指定信息的顯示方式,如對(duì)信息檢索結(jié)果的不同的元數(shù)據(jù)排序。對(duì)于一般用戶可能更關(guān)心需求的主題,希望將論文的題名放在顯著的位置,而對(duì)于一個(gè)專家,他可能更關(guān)注學(xué)科內(nèi)某些專家的研究成果,希望將著者姓名放在最顯著的位置等等。就現(xiàn)階段的環(huán)境條件而言,個(gè)性化信息服務(wù)至少應(yīng)包括個(gè)性化內(nèi)容定制服務(wù)、個(gè)性化信息檢索定制服務(wù)、個(gè)性化界面定制服務(wù)和個(gè)性化信息推薦服務(wù)四個(gè)方面。
2.1 個(gè)性化內(nèi)容定制服務(wù)
個(gè)性化定制服務(wù)是有效獲取用戶需求信息的方法之一。它通過(guò)用戶定制獲取用戶的個(gè)性化信息,從而理解用戶的需求,為用戶提供更為準(zhǔn)確的信息服務(wù),提高用戶的滿意度。同時(shí)通過(guò)與用戶的直接或間接的溝通,改善與用戶的關(guān)系,增加用戶的忠誠(chéng)度[7]。
在個(gè)性化內(nèi)容定制服務(wù)中,用戶可以根據(jù)自己的興趣和需求定制信息。定制的內(nèi)容包括信息資源、界面和服務(wù)等等。個(gè)性化信息定制服務(wù)系統(tǒng)通常提供一些信息資源,讓用戶選擇(定制)。例如在數(shù)字圖書(shū)館中,人們可以選擇數(shù)據(jù)庫(kù)資源、電子期刊、電子圖書(shū)、相關(guān)網(wǎng)站、學(xué)科導(dǎo)航、搜索引擎等等。也有一些系統(tǒng)讓用戶指定資源地址,系統(tǒng)提供有關(guān)的更新通知等服務(wù)(這是一種簡(jiǎn)單的主動(dòng)信息服務(wù)方式,系統(tǒng)能夠及時(shí)主動(dòng)將有關(guān)資源的更新信息推送給用戶,提醒用戶及時(shí)利用)。
另外,如安全與隱私保護(hù)也是個(gè)性化信息定制服務(wù)中需要注意的重要問(wèn)題。安全包括用戶私人信息的安全和系統(tǒng)管理的安全。隱私保護(hù)也是用戶關(guān)心的問(wèn)題,一旦用戶的個(gè)人信息被泄露,用戶就會(huì)失去對(duì)我們的信任,而遠(yuǎn)離我們的服務(wù),隱私保護(hù)需要制定完善的隱私保護(hù)政策,提供隱私政策公示,并提供用戶隱私公開(kāi)的工具和運(yùn)用保證隱私不外泄的保護(hù)技術(shù)等。
2.2 個(gè)性化信息檢索定制服務(wù)
在數(shù)據(jù)庫(kù)檢索或網(wǎng)上信息的查詢中,不同的用戶由于其擁有的檢索知識(shí)和所處的領(lǐng)域不同,往往其習(xí)慣也不同。初學(xué)者一般習(xí)慣用簡(jiǎn)單檢索,專業(yè)人員習(xí)慣用高級(jí)檢索。另外,不同用戶可能用不同的詞匯表達(dá)同一專業(yè)概念,不同用戶對(duì)檢索結(jié)果的選取原則和排序方法也可能不同。諸如此類,正是用戶個(gè)性化的顯著表現(xiàn)。因此,檢索定制需要充分支持用戶在檢索策略、檢索方法和檢索結(jié)果處理上的個(gè)性化。根據(jù)初步分析,檢索定制可包括[8]:
。1)個(gè)人檢索模板定制。用戶可根據(jù)個(gè)人需要對(duì)所需信息的專業(yè)(用分類號(hào)或主題詞、關(guān)鍵詞確認(rèn))、應(yīng)用目的(用文獻(xiàn)類型區(qū)別,例如期刊論文、專利、會(huì)議文獻(xiàn)等)、深度、語(yǔ)言、地域、數(shù)量、時(shí)域等進(jìn)行定制,從而內(nèi)在地表達(dá)自己相對(duì)穩(wěn)定的檢索限制條件。用戶在每次檢索時(shí)也可以選擇“屏蔽”(Over write)模板條件,靈活表達(dá)特殊要求。
(2)檢索工具定制(選擇數(shù)據(jù)庫(kù)檢索系統(tǒng)和搜索引擎)。已納入資源定制。
。3)檢索式表示方式定制;用戶可自定義默認(rèn)檢索方式是簡(jiǎn)單或復(fù)雜方式,自定義布爾檢索式中“與”、“或”、“非”的表示符號(hào),系統(tǒng)還可為用戶記錄最近的特定數(shù)量的檢索式,供用戶選擇使用。
。4)個(gè)人詞表定制?蓪(xiě)入用戶自定義的常用詞匯的自定義規(guī)范詞、通用限制詞(檢索時(shí)對(duì)所有檢索式均加上此檢索詞)、特殊限制詞(對(duì)某一個(gè)或幾個(gè)詞使用的限制詞)、以及同義詞和近義詞;當(dāng)該用戶使用這些常用詞匯時(shí),系統(tǒng)可根據(jù)個(gè)人詞表調(diào)用相應(yīng)詞匯優(yōu)化檢索,或彈出相應(yīng)詞匯供用戶選擇使用。
(5)檢索結(jié)果處理定制?蓪(duì)檢索結(jié)果的相關(guān)度計(jì)算標(biāo)準(zhǔn)、輸出格式、排序方式、重復(fù)記錄整合方式、分類組織、下載格式、傳送地址等進(jìn)行定制。
(6)檢索歷史分析定制。用戶可要求系統(tǒng)動(dòng)態(tài)追蹤其檢索過(guò)程,提取最常用的檢索詞和檢索式,最經(jīng)常選擇的數(shù)據(jù)庫(kù)、期刊、網(wǎng)站等資源,最經(jīng)常排除的資源,相近用戶最常用的檢索詞、檢索式、數(shù)據(jù)庫(kù)、期刊及網(wǎng)站等(但必須掩蔽“相近用戶”實(shí)際身份)。當(dāng)然,這種追蹤必須事先得到用戶的授權(quán)(包括是否同意作為“相近用戶”被分析的授權(quán)),同時(shí)必須安全地保護(hù)這些歷史數(shù)據(jù),這些歷史數(shù)據(jù)可用來(lái)自動(dòng)修改用戶的有關(guān)定制信息(例如定題選報(bào)記錄)。
2.3 個(gè)性化界面定制服務(wù)
個(gè)性化界面定制服務(wù)是讓用戶根據(jù)自己的愛(ài)好選擇桌面的顯示方式,它包括界面的結(jié)構(gòu)布局,顯示顏色和顯示內(nèi)容的排列方式等。例如在一些網(wǎng)站中,讓用戶輸入自己的個(gè)人信息,然后生成“我的主頁(yè)”,“我的搜索引擎”,“我的圖書(shū)館”等等這類服務(wù)都屬于個(gè)性化界面定制服務(wù)。
2.4 個(gè)性化信息推薦服務(wù)
通過(guò)網(wǎng)絡(luò)信息的挖掘,了解用戶的需求和興趣,為用戶提供個(gè)性化的實(shí)時(shí)信息推薦服務(wù),也是因特網(wǎng)服務(wù)的一個(gè)發(fā)展方向。面向單個(gè)用戶的實(shí)時(shí)個(gè)性化推薦服務(wù)有4種方法[9]:
。1)在Cache內(nèi)的協(xié)作推薦。
(2)利用聚類方法實(shí)現(xiàn)實(shí)時(shí)個(gè)性化推薦。
。3)利用分類方法實(shí)現(xiàn)實(shí)時(shí)個(gè)性化推薦。
(4)利用協(xié)作推薦的方法實(shí)現(xiàn)實(shí)時(shí)個(gè)性化推薦。
3 用戶個(gè)性化需求的獲取方法
對(duì)用戶需求、興趣、愛(ài)好的了解和獲取是個(gè)性化信息服務(wù)具備針對(duì)性的關(guān)鍵,而對(duì)用戶網(wǎng)絡(luò)信息需求的分析、獲取和管理是保證個(gè)性化信息服務(wù)實(shí)施的基礎(chǔ)。對(duì)用戶需求的獲取。目前主要有兩大類方法:一類是通過(guò)人,機(jī)交互模式獲取用戶的信息需求。這類方法的優(yōu)點(diǎn)是可以準(zhǔn)確地獲得用戶的需求信息,也是目前絕大多數(shù)檢索系統(tǒng)所采用的方法。缺點(diǎn)是主動(dòng)性差。對(duì)于以信息拉取技術(shù)為核心的信息服務(wù)系統(tǒng),系統(tǒng)一般提供一個(gè)與用戶進(jìn)行實(shí)時(shí)交互的檢索界面,讓用戶表達(dá)需求。對(duì)于以信息推送技術(shù)為核心的信息服務(wù)系統(tǒng),系統(tǒng)會(huì)提供給用戶一個(gè)表達(dá)信息需求的定制表單。用戶可以十分詳細(xì)地填寫(xiě)自己的個(gè)性化需求信息。另一類是通過(guò)對(duì)用戶訪問(wèn)記錄的挖掘,獲取用戶的需求、興趣和愛(ài)好等。這種方法的主動(dòng)性強(qiáng),一般用于個(gè)性化主動(dòng)信息服分系統(tǒng)中,對(duì)用戶需求行為的挖掘,目前有三種方法:一是通過(guò)Cookie logs挖掘;二是通過(guò)Bookmark進(jìn)行網(wǎng)絡(luò)信息過(guò)濾;三是利用智能Agent跟蹤用戶信息行為。
3.1 用戶訪問(wèn)記錄的挖掘
網(wǎng)絡(luò)用戶訪問(wèn)記錄的挖掘主要是從Web的訪問(wèn)記錄中抽取具有意義的模式。Web中的每個(gè)服務(wù)器都保留了用戶的訪問(wèn)日志(Web access log)等記錄,保存了有關(guān)用戶訪問(wèn)和交互的信息。分析這些數(shù)據(jù)可以用來(lái)了解用戶的需求行為,為用戶提供個(gè)性化的服務(wù)。目前Web使用記錄挖掘技術(shù)和工具可以分為兩大類:訪問(wèn)模式的追蹤和個(gè)性化的使用記錄的追蹤。一般的訪問(wèn)模式追蹤通過(guò)分析使用記錄來(lái)了解用戶的訪問(wèn)模式和傾向,以改進(jìn)站點(diǎn)的組織結(jié)構(gòu);而個(gè)性化的使用記錄追蹤則傾向于分析個(gè)別用戶的偏好,其目的是根據(jù)不同用戶的訪問(wèn)模式,為用戶提供個(gè)性化的定制服務(wù)[10]。
用戶訪問(wèn)挖掘針對(duì)用戶對(duì)Web的訪問(wèn)記錄,利用路徑分析、分類聚類、關(guān)聯(lián)規(guī)則和序列模式的發(fā)現(xiàn)等方法進(jìn)行分析,尋找其中蘊(yùn)涵的用戶知識(shí)和模式。Web訪問(wèn)信息挖掘的數(shù)據(jù)對(duì)象主要是日志數(shù)據(jù)。當(dāng)用戶訪問(wèn)Web服務(wù)器時(shí),服務(wù)器方將會(huì)產(chǎn)生三種類型的日志文件:Server logs,Error logs和Cookie logs,記錄用戶的訪問(wèn)情況[11]。
Cookie是由互聯(lián)網(wǎng)服務(wù)器產(chǎn)生的記號(hào)并由客戶端持有,用于識(shí)別用戶和用戶的會(huì)話。通過(guò)Cookie分析,獲取用戶個(gè)性化需求、興趣和愛(ài)好,目前還是一種較為有效的方法。但由于Cookie存儲(chǔ)在客戶計(jì)算機(jī)上,使用中會(huì)由于各種原因?qū)е翪ookie內(nèi)容失真,因而通過(guò)對(duì)Cookie的挖掘獲取用戶的個(gè)性化需求,也有一定的局限性。
3.2 利用Bookmark(書(shū)簽)獲取用戶的個(gè)性化需求
當(dāng)用戶在因特網(wǎng)上用瀏覽器瀏覽主頁(yè)時(shí),經(jīng)常會(huì)遇到自己需要的和喜歡的站點(diǎn)和主頁(yè),只要點(diǎn)一下瀏覽器的Bookmark菜單,就能將當(dāng)前的站點(diǎn)存入Bookmark中。下次訪問(wèn)時(shí),只要從Bookmark中取出即可使用。用戶可以對(duì)Bookmark進(jìn)行多級(jí)管理,不同的目錄反映用戶不同的興趣,這給對(duì)用戶需求的分析提供了依據(jù)。
利用用戶在瀏覽器上存儲(chǔ)的Bookmark獲得用戶信息需求是一種有效的方法。在Bookmark中存儲(chǔ)的信息往往是用戶最關(guān)心的,需要記錄下來(lái)以便以后再讀。Bookmark結(jié)構(gòu)化的信息存儲(chǔ)更能夠確切地表達(dá)用戶需求。我們可以利用用戶對(duì)文章的評(píng)價(jià)來(lái)表達(dá)用戶的信息需求。對(duì)存入Bookmark的某一推薦目錄的文章,可以認(rèn)為是用戶喜歡的文章,作為學(xué)習(xí)中的正例;在其他目錄的文章,或是經(jīng)過(guò)推薦沒(méi)有被選中的文章將作為學(xué)習(xí)的反例。根據(jù)向量空間法將正反例表示成向量,就可以利用機(jī)器學(xué)習(xí)的方法對(duì)新文章進(jìn)行推薦[12]。
利用Bookmark進(jìn)行信息過(guò)濾有很多優(yōu)勢(shì)。用戶可以導(dǎo)入自己已有的Bookmark文件或直接在瀏覽網(wǎng)絡(luò)時(shí)通過(guò)客戶端軟件加入的新書(shū)簽,并且可以對(duì)其進(jìn)行各種編輯操作。用戶可以明確地對(duì)文章的內(nèi)容與自己的需求是否一致作出評(píng)價(jià),通過(guò)反饋信息將使信息推薦更為準(zhǔn)確。用戶可以靈活地設(shè)置推薦的范圍,系統(tǒng)對(duì)用戶信息的推薦信息直接并入Bookmark結(jié)構(gòu)中,完全符合用戶的習(xí)慣。另外,系統(tǒng)使瀏覽器的Bookmark功能實(shí)現(xiàn)網(wǎng)絡(luò)化,即利用網(wǎng)絡(luò)服務(wù)器存儲(chǔ)用戶的Bookmark信息,這樣,可以使用戶在任何地方、各種平臺(tái)上擁有一致的Bookmark信息。
3.3 利用智能Agent獲取用戶個(gè)性化需求
監(jiān)視用戶的信息查詢過(guò)程的方法能自動(dòng)獲得用戶的信息需求。其方法是在用戶的終端上運(yùn)行一個(gè)監(jiān)視的信息代理(agent)。信息代理將用戶在web瀏覽時(shí)的相關(guān)信息不斷傳送給遠(yuǎn)端的服務(wù)器.服務(wù)器將信息進(jìn)行整理、組織,并從中分析出用戶的信息偏好。
4 個(gè)性化信息服務(wù)模型的構(gòu)建
要實(shí)現(xiàn)個(gè)性化信息服務(wù),系統(tǒng)必須具備兩方面的能力:一是構(gòu)建個(gè)
性化信息Agent模型,即將個(gè)性化信息從全局信息空間中分離出來(lái);二是構(gòu)建用戶Agent模型,即跟蹤用戶行為,學(xué)習(xí)、記憶用戶興趣,通過(guò)描述用戶的興趣特征來(lái)建立個(gè)性化用戶模型。此外,還需要有功能強(qiáng)大的網(wǎng)絡(luò)信息搜索能力和友好的用戶界面,這既是構(gòu)建信息Agent和用戶Agent的基礎(chǔ),也是實(shí)現(xiàn)個(gè)性化信息服務(wù)的保障。
4.1 個(gè)性化信息模型的構(gòu)建方法
信息Agent具有多種特性,從不同的特性角度出發(fā),可以用不同的方法來(lái)構(gòu)建個(gè)性化信息模型。這里主要介紹三種常用的方法[13]。
。1)信息Agent的自主學(xué)習(xí)方法。個(gè)性化服務(wù)的對(duì)象是一個(gè)個(gè)具體的用戶,因而建立個(gè)性化信息模型時(shí),信息Agent必須對(duì)用戶感興趣的信息類型有所了解,并以此作為信息模型構(gòu)建的基準(zhǔn),通過(guò)不斷的學(xué)習(xí)積累形成一個(gè)有規(guī)模的模型。信息Agem可以直接探求用戶的信息興趣和愛(ài)好,也可以從用戶信息檢索和利用行為中提取這個(gè)基準(zhǔn),然后由Agent執(zhí)行一定的算法,將這些信息轉(zhuǎn)化為知識(shí)存入用戶信息模型中。信息Agent有兩種不同的學(xué)習(xí)方法:一是關(guān)鍵詞學(xué)習(xí)。這種學(xué)習(xí)方法是首先對(duì)搜索來(lái)的信息進(jìn)行處理,將信息中的關(guān)鍵詞按出現(xiàn)頻率、出現(xiàn)位置提取出來(lái),根據(jù)關(guān)鍵詞的頻率來(lái)確定唯一表征信息體的關(guān)鍵詞,將具有相同表征關(guān)鍵詞的信息聚類,并存入相應(yīng)的個(gè)性化信息模型中。采用關(guān)鍵詞學(xué)習(xí)方法提高了建立多個(gè)個(gè)性化信息模型的效率。二是字典學(xué)習(xí)。這是一種對(duì)相似概念的學(xué)習(xí)。在這種學(xué)習(xí)方法中,信息Agent為個(gè)性化信息模型提供的每個(gè)基準(zhǔn)關(guān)鍵詞創(chuàng)建一個(gè)字典,字典根據(jù)關(guān)鍵詞的權(quán)值來(lái)確定其權(quán)限:搜索權(quán)和學(xué)習(xí)權(quán)。一個(gè)信息單元是否被學(xué)習(xí)首先得看其關(guān)鍵詞的權(quán)值是否達(dá)到搜索權(quán)所規(guī)定的權(quán)值,否則首輪即被模型所淘汰。即使是過(guò)了搜索關(guān),也只有當(dāng)關(guān)鍵字的權(quán)值達(dá)到學(xué)習(xí)權(quán)時(shí),該關(guān)鍵字才能被納入字典用來(lái)表征個(gè)性化信息模型。信息Agent通過(guò)不斷的學(xué)習(xí),并在學(xué)習(xí)中修改字典,最終可得到一個(gè)關(guān)鍵字的相對(duì)穩(wěn)定的字典。
。2)信息過(guò)濾的方法,信息過(guò)濾系統(tǒng)是根據(jù)用戶的信息需求對(duì)動(dòng)態(tài)信息流進(jìn)行過(guò)濾,把滿足用戶需求的信息傳送給用戶,可以提高獲取信息的效率。信息過(guò)濾也是構(gòu)建個(gè)性化信息模型的有效方法,它根據(jù)一定的標(biāo)準(zhǔn)將那些不相關(guān)的信息濾掉,僅保存與用戶需求相關(guān)的信息。信息Agent根據(jù)自己的關(guān)鍵詞域,提取幾個(gè)權(quán)重比較大的關(guān)鍵詞作為過(guò)濾的標(biāo)準(zhǔn)(E-profile),每個(gè)E-profile描述著一個(gè)方面的信息需求。E-profile是否標(biāo)準(zhǔn).可在實(shí)踐中被檢驗(yàn):那些對(duì)信息需求描述不準(zhǔn)確的E-profile個(gè)體在競(jìng)爭(zhēng)中將被淘汰。反之則形成越來(lái)越大的規(guī)模,構(gòu)成一個(gè)內(nèi)容充實(shí)的個(gè)性化信息模型。常用的信息過(guò)濾方法有兩種:基于關(guān)鍵詞向量的過(guò)濾方法和基于文獻(xiàn)集的信息過(guò)濾方法;陉P(guān)鍵詞向量的信息過(guò)濾方法是一種相似過(guò)濾方法。其思想是比較表征信息單元的關(guān)鍵詞與信息Agent給出標(biāo)準(zhǔn)關(guān)鍵詞之間的相似性,只有當(dāng)相似性達(dá)到一定的度,該信息單元才被保留下來(lái)。確立關(guān)鍵詞的相似度是這種過(guò)濾方法的核心。在此我們將信息單元的關(guān)鍵詞與標(biāo)準(zhǔn)關(guān)鍵詞都看作向量,其相似度就是這兩個(gè)向量夾角的余弦值。
。3)基于多Multi-Agent System的合作方法。網(wǎng)絡(luò)個(gè)性化服務(wù)不是面向單一用戶的個(gè)性化服務(wù),服務(wù)于每個(gè)用戶的信息Agent之間并不是孤立的關(guān)系,它們通過(guò)相互合作構(gòu)成一個(gè)MAS。MAS的合作求解能力遠(yuǎn)遠(yuǎn)超過(guò)單個(gè)Agent,這是MAS產(chǎn)生的最直接的原因。通過(guò)MAS的合作,使每個(gè)用戶擁有一個(gè)或多個(gè)Agent,這些Agent推薦的信息在內(nèi)容上都有相關(guān)性,克服了單個(gè)信息Agent功能不強(qiáng)的缺陷。多Agent之間的合作是通過(guò)多Agent協(xié)商協(xié)議來(lái)完成的。協(xié)商協(xié)議是MAS實(shí)現(xiàn)協(xié)同、協(xié)作、沖突消解和矛盾處理的關(guān)鍵環(huán)節(jié)。在MAS中,協(xié)商協(xié)議被描述成四元組:{目標(biāo)Agent,源Agent,消息名,消息內(nèi)容},這種四元組形式通過(guò)嵌套使用來(lái)擴(kuò)大合作的范圍。信息Agent之間一旦達(dá)成合作協(xié)議,多個(gè)信息Agent的個(gè)性化信息模型就構(gòu)成一個(gè)邏輯體,每個(gè)信息Agent就將自己和伙伴Agent的信息文檔推薦給相關(guān)用戶,以充實(shí)用戶信息需求的內(nèi)容。
4.2 用戶模型的構(gòu)建方法
建立用戶模型是實(shí)現(xiàn)個(gè)性化服務(wù)的另一個(gè)重要方面。用戶模型是實(shí)現(xiàn)個(gè)性化服務(wù)的起點(diǎn),用戶模型不僅是個(gè)性化信息模型的構(gòu)建依據(jù),又是實(shí)現(xiàn)個(gè)性化服務(wù)的目標(biāo),個(gè)性化信息最終將被推向具有相應(yīng)興趣的用戶。用戶模型實(shí)際上就是對(duì)某一用戶行為、興趣傾向的描述,以確立他所需信息服務(wù)的類型。
在對(duì)用戶的信息服務(wù)中,用戶所處的領(lǐng)域不同,使用的信息服務(wù)系統(tǒng)不同,獲取用戶信息的方法不同,建模的方法也不同。通常情況下,通過(guò)與用戶交互,獲取用戶信息來(lái)建立模型較為簡(jiǎn)單,較易實(shí)現(xiàn)。利用智能的方法,通過(guò)對(duì)用戶需求行為(如用戶瀏覽器中的cookies文件,用戶的bookmark文件等)的分析,挖掘用戶的需求、興趣和愛(ài)好來(lái)建立模型較復(fù)雜,技術(shù)上也較難實(shí)現(xiàn)。這方面的研究還有待深入。對(duì)于隱式建模方法,用戶模型的建設(shè)過(guò)程主要有四步[14]:
(1)內(nèi)容向量。內(nèi)容向量是一個(gè)表示信息內(nèi)容的向量,可以被用于向量空間模型成對(duì)的匹配。內(nèi)容向量來(lái)源于初始用戶的活動(dòng)記錄(以往信息利用行為),或用戶的反饋等。一旦建立,就僅僅改變其權(quán)值就可以了。
。2)一列當(dāng)前活動(dòng)的上下文(或用戶以往信息行為的文檔)。初始內(nèi)容向量每個(gè)元素對(duì)應(yīng)一些上下文。以后隨用戶的不同活動(dòng),每個(gè)用戶的上下文就發(fā)生改變。
。3)一列當(dāng)前活動(dòng)的特征。
。4)一個(gè)用戶關(guān)鍵詞的集合。每一個(gè)關(guān)鍵詞都有一定的權(quán)值,用于表征它對(duì)該用戶的實(shí)際重要性。在用戶反饋之后,關(guān)鍵詞被動(dòng)態(tài)插入、修改或刪除。
用戶模型建立后,對(duì)其更新也要遵循一定的規(guī)則。通常是根據(jù)用戶的反饋信息相應(yīng)地更新用戶模型的不同部分。
個(gè)性化服務(wù)的關(guān)鍵是用戶需求信息的獲取。真正的用戶動(dòng)態(tài)需求信息的獲取,必須利用智能代理技術(shù)。在這方面的研究,雖然取得了一定的成果,但距離實(shí)際應(yīng)用或用戶的要求還有較大的差距。
【參考文獻(xiàn)】
1 薛菘.基于web數(shù)據(jù)庫(kù)平臺(tái)的圖書(shū)館個(gè)性化服務(wù):MyLi brary.圖書(shū)情報(bào)工作,2002(8)
2,13 張玉峰等.基于Agent的個(gè)性化信息服務(wù)模型研究.情報(bào)學(xué)報(bào),2001,20(5)
3 史田華.因特網(wǎng)個(gè)性化信息服務(wù).情報(bào)資料工作,2002(1)
4 王悅.新信息環(huán)境下圖書(shū)館的個(gè)性化信息服務(wù)芻議.圖書(shū)情報(bào)工作,2002(8)
5 盧共平.數(shù)字圖書(shū)館的個(gè)性化信息服務(wù).圖書(shū)情報(bào)工作,2002(8)
6 馬獻(xiàn)明等.個(gè)性化網(wǎng)上信息代理技術(shù)的研究概述.廣西師范大學(xué)學(xué)報(bào),2000,18(3)
7 黃曉斌.網(wǎng)絡(luò)文獻(xiàn)的知識(shí)發(fā)現(xiàn)研究.武漢大學(xué)博士學(xué)位論文,2002
8,10 張曉林等.基于Web的個(gè)性化信息服務(wù)機(jī)制.現(xiàn)代圖書(shū)情報(bào)技術(shù),2001(1)
9,11 田捷.數(shù)字圖書(shū)館技術(shù)與應(yīng)用.北京:科學(xué)出版社,2002
12 盧增祥等.利用Bookmark服務(wù)進(jìn)行網(wǎng)絡(luò)信息過(guò)濾.軟件學(xué)報(bào),2000,11(4)
14 高文.數(shù)字圖書(shū)館——原理與技術(shù)實(shí)現(xiàn).北京:清華大學(xué)出版社,2000
【基于因特網(wǎng)的個(gè)性化信息服務(wù)研究】相關(guān)文章:
因特網(wǎng)與教育信息資源的開(kāi)發(fā)08-07
WebQuests:因特網(wǎng)環(huán)境下的研究性學(xué)習(xí)08-07
基于網(wǎng)絡(luò)環(huán)境下的信息技術(shù)課程教學(xué)的探討與研究08-17
因特網(wǎng)與教育——論因特網(wǎng)對(duì)教育之利弊08-17
因特網(wǎng)與教育——論因特網(wǎng)對(duì)教育之利弊08-11
走進(jìn)因特網(wǎng)的教案08-16
基于Webquest的研究性課程的開(kāi)展案例08-07
基于汽車(chē)空調(diào)實(shí)訓(xùn)教學(xué)的研究08-18