人工免疫網(wǎng)絡(luò)分類器的設(shè)計及其應(yīng)用研究.pdf_第1頁
已閱讀1頁,還剩144頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、人工免疫系統(tǒng)(Artificial Immune System,AIS)是一種新的軟計算技術(shù),在過去的十多年間得到了迅速的發(fā)展。由于具有強大的信息處理能力,AIS被廣泛應(yīng)用于各種領(lǐng)域,尤其是機器學(xué)習(xí)中的分類問題。在AIS的所有的模型中,免疫網(wǎng)絡(luò)能夠快速、有效地歸納訓(xùn)練空間,因此,基于AIS的分類器大多是采用免疫網(wǎng)絡(luò)來設(shè)計和實現(xiàn)的。雖然免疫分類器在實際應(yīng)用中取得了較大的成功,但是這些分類器也存在問題,限制了分類器的分類性能。這些問題包括:

2、
  1、沒有考慮細胞之間的相互關(guān)系對分類性能的影響,記憶細胞的確定缺乏有效的指導(dǎo);
  2、沒有對訓(xùn)練空間進行適當(dāng)?shù)霓D(zhuǎn)換,分類學(xué)習(xí)直接在輸入空間中進行,限制了算法的能力;
  3、有些系統(tǒng)采用線性機制來控制抗體群體的進化,難以對抗體群體的進化產(chǎn)生有效的擾動,影響了算法的精細搜索能力;
  4、記憶細胞群體的產(chǎn)生過于隨機,算法沒有有效的細胞質(zhì)量評估和淘汰機制;
  5、在使用批量訓(xùn)練方法時,抗體群體的進化缺

3、乏有效的指導(dǎo),使得抗體群體的組合空間過大而難以搜索到優(yōu)化的分類器。
  為了改善人工免疫分類器的問題,本文提出了基于抗原對的訓(xùn)練方法、記憶細胞剪切方法、核空間以及模糊邏輯等方法,并結(jié)合免疫網(wǎng)絡(luò)高效的歸納能力來設(shè)計分類器。具體細節(jié)描述如下:
  1、提出了一種新的訓(xùn)練方法,該方法利用抗原對來指導(dǎo)記憶細胞的生成。對于每一個訓(xùn)練抗原,確定與訓(xùn)練抗原最近且不同類的抗原為其對偶抗原,并以訓(xùn)練抗原為中心,抗原對距離一半為半徑確定候選細胞

4、區(qū)域。當(dāng)抗體群體在進化的過程有抗體出現(xiàn)在該區(qū)域時結(jié)束對訓(xùn)練抗原的訓(xùn)練,并確定候選細胞區(qū)域中距離對偶抗原最近的抗體為記憶細胞。這種訓(xùn)練方法不僅考慮到了抗體-抗原之間的相互關(guān)系,還考慮到了細胞之間的相互位置關(guān)系對分類性能的影響,有利于搜索到更優(yōu)的分類器。算法被用于6個人工數(shù)據(jù)集以及5個UCI數(shù)據(jù)集的分類,同時,該算法被應(yīng)用于語音情感識別。算法的分類結(jié)果與支持向量機SVM、決策樹算法C4.5、BayesNet等著名算法的分類結(jié)果進行了比較,結(jié)

5、果顯示該算法對于這些問題具有良好的分類性能。
  2、提出了一種基于核函數(shù)的人工免疫識別系統(tǒng)。在傳統(tǒng)的人工免疫識別系統(tǒng)AIRS中,抗體-抗原的親和度采用Euclidean距離來表示,這種線性空間的表示機制限制了算法的非線性能力。通過使用核函數(shù),將訓(xùn)練空間由輸入空間轉(zhuǎn)換至高維的特征空間,改善算法的非線性能力。同時,對記憶細胞群體中的每個細胞進行質(zhì)量評估,淘汰完全不能識別近鄰抗原的弱細胞。算法被用于5個UCI標(biāo)準(zhǔn)數(shù)據(jù)集的分類,同時,算

6、法被應(yīng)用于肝炎和心臟病的診斷,診斷結(jié)果通過混淆矩陣和AUC指標(biāo)加以評估。通過比較本文算法與其他算法的分類性能,發(fā)現(xiàn)本文算法獲得的分類準(zhǔn)確率不僅顯著高于AIRS獲得分類準(zhǔn)確率,而且也優(yōu)于參與比較的經(jīng)典分類算法達到的分類準(zhǔn)確率。
  3、傳統(tǒng)AIRS采用的線性資源分配方法難以對抗體群體的進化產(chǎn)生有效的擾動,不利于算法對訓(xùn)練空間進行精細搜索。本文提出2種非線性資源分配方法來改善算法性能,即離散資源分配方法和模糊邏輯資源分配方法。離散資源

7、分配方法將整個刺激度區(qū)間離散為若干個子區(qū)間,并為位于相同子區(qū)間的抗體分配等量資源,這樣即可在資源數(shù)量不變的情況下僅通過優(yōu)化子區(qū)間數(shù)量來改變資源分配結(jié)果,實現(xiàn)對抗體群體生成的擾動,提高算法的精細搜索能力。模糊邏輯資源分配方法將模糊邏輯表示為一個參數(shù),這樣就不需要根據(jù)不同的問題預(yù)先設(shè)計模糊邏輯,而僅通過改變參數(shù)即可實現(xiàn)模糊邏輯的搜索,改善算法的精細搜索能力。最后,算法對記憶細胞進行適應(yīng)度評估,并通過淘汰適應(yīng)度偏低的記憶細胞來進一步優(yōu)化分類器

8、。算法被應(yīng)用于6個標(biāo)準(zhǔn)UCI數(shù)據(jù)集的分類測試,結(jié)果顯示算法具有良好的分類性能。同時,算法被應(yīng)用于心臟病、糖尿病和乳腺癌3種疾病的診斷,診斷結(jié)果通過AUC和混淆矩陣進行檢驗,結(jié)果顯示算法對這3種疾病的診斷性能良好。最后,將算法應(yīng)用于銀行用戶信用分析,通過比較發(fā)現(xiàn)算法在用戶信用評估方面也有良好的性能。
  4、免疫網(wǎng)絡(luò)分類算法大多采用增量式訓(xùn)練方法,這種方法雖然可以為每個抗原產(chǎn)生一個優(yōu)化的記憶細胞,但不能保證獲得優(yōu)化的記憶細胞群體,為

9、此,提出了一種基于禁忌搜索策略的免疫網(wǎng)絡(luò)分類算法。算法采用批量式訓(xùn)練方法,該方法將抗原整體提呈給抗體群體,并通過評估抗體群體整體質(zhì)量來進化分類器。為了有效減少搜索空間,類域內(nèi)部區(qū)域被禁止產(chǎn)生同類抗體,這樣,抗體的生成被主要限制在類域分界線附近。同時,評估抗體的適應(yīng)度,淘汰類域分界線附近低適應(yīng)度的抗體,使得抗體群體能夠較好地歸納抗原空間,更好地反映抗原空間的局部特征。算法被應(yīng)用于4個UCI數(shù)據(jù)集的分類測試,結(jié)果顯示算法具有優(yōu)良的分類性能,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論