基于樸素貝葉斯、線性判別、二次判別分類算法的選股實證研究.pdf_第1頁
已閱讀1頁,還剩64頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、本文基于樸素貝葉斯分類算法、線性判別分類算法、二次判別分類算法進行選股實證研究,為廣大投資者提供一種投資決策建議,具有現(xiàn)實的研究意義。
  本文詳細介紹了樸素貝葉斯,線性判別分析,二次判別分析用于分類的原理,算法優(yōu)缺點、步驟及具體處理細節(jié),并將其運用于多因子選股實證。
  樸素貝葉斯假定各個因子間相互獨立,但實際上,實際因子數(shù)據(jù)很難滿足這樣嚴苛的假設(shè),這會導(dǎo)致模型估不準。一開始采用了主成分分析對實際因子進行轉(zhuǎn)換,但是效果并不

2、令人滿意。因此提出了不要求因子間相互獨立的線性判別和二次判別分類算法。線性判別假設(shè)各類別的方差相同,為總體方差,二次判別假設(shè)各類別方差不同。針對線性判別和二次判別分類算法,本文采用Ledoit-Wolf方差縮減法對協(xié)方差矩陣的估計值進行了縮減以提高模型性能。
  本文選取了滬深300作為股票池,選取了估值、成長、財務(wù)質(zhì)量、杠桿、市值、動量反轉(zhuǎn)、波動率、股價、Beta、換手率、情緒、股東、技術(shù)13大類39個因子暴露度作為樣本的原始特

3、征,對訓(xùn)練集月收益率進行標(biāo)簽化,采用滾動訓(xùn)練集,選取最長訓(xùn)練期進行做多,做空,多空三種策略回測,并選取滬深300作為基準組合進行對照。
  本文選取了正確率和AUC兩個指標(biāo)比較了樸素貝葉斯,線性判別,二次判別分類模型的分類效果,選取年化超額收益率、超額收益最大回撤、信息比率三個指標(biāo)比較三種分類模型的回測表現(xiàn)。絕大多數(shù)時候,線性判別分類模型的分類效果和回測表現(xiàn)均優(yōu)于其他分類模型。認為這是由于線性判別分類模型考慮了因子間的相關(guān)性,并且

4、假設(shè)不同類別的因子相關(guān)性相同,這種假設(shè)最符合實際情況。二次判別分類模型的假設(shè)最為詳細,但由于需要顧及的參數(shù)最多,會導(dǎo)致估計上的偏差影響結(jié)果。當(dāng)特征數(shù)目不多且數(shù)據(jù)量較大時,線性判別分類模型有著絕對的優(yōu)勢。
  此外,本文還將三種模型同邏輯回歸模型進行比較,得出線性判別分類算法和邏輯回歸在分類效果和回測表現(xiàn)相似,總體上略優(yōu)于邏輯回歸,樸素貝葉斯和二次判別分類算法在分類效果和回測表現(xiàn)上均不如邏輯回歸的結(jié)論。本文認為這主要是在估計協(xié)方差矩

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論