2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩60頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、在當(dāng)今這個大數(shù)據(jù)的時代,越來越多的生產(chǎn)和活動被數(shù)據(jù)化到網(wǎng)絡(luò)和數(shù)據(jù)庫上。這些大數(shù)據(jù)記錄了人們生活的方方面面,研究這些數(shù)據(jù)會發(fā)現(xiàn)許多有價值的信息。諸如沃爾瑪超市將尿布啤酒放在一起買的例子就不多說了。大數(shù)據(jù)在醫(yī)療和商品推薦方面的應(yīng)用更是具有極大的商業(yè)價值。在使用大數(shù)據(jù)之前我們需要了解到現(xiàn)今數(shù)據(jù)表現(xiàn)出來的一些特征。由于現(xiàn)今互聯(lián)網(wǎng)的普及,數(shù)據(jù)顯示出分布廣泛、更新快速、高維度和隱私性的特點。為了解決這幾點問題,本文提出了一個具有隱私保護(hù)的分布式在線

2、學(xué)習(xí)框架來對這些數(shù)據(jù)進(jìn)行挖掘?qū)W習(xí)。
  本文假設(shè)在這樣一個場景下:數(shù)據(jù)的收集與存儲是分布在不同的數(shù)據(jù)中心;由于隱私保護(hù)的原因,不同數(shù)據(jù)庫是不能進(jìn)行原始樣本數(shù)據(jù)的交換;但是為了充分發(fā)掘數(shù)據(jù)中的價值,各個數(shù)據(jù)中心必須協(xié)同合作完成研究。
  為了解決在上述場景下的數(shù)據(jù)研究,那我們必須賦予每個節(jié)點(數(shù)據(jù)中心)根據(jù)本地數(shù)據(jù)進(jìn)行獨立學(xué)習(xí)處理數(shù)據(jù)的能力。節(jié)點之間只能交換計算中的中間變量。本文首先研究的就是如何在有限交流的情況下是的整體節(jié)點

3、目標(biāo)優(yōu)化函數(shù)收斂大一起。伴隨著數(shù)據(jù)交流必有隱私泄露的風(fēng)險,因此我們有考慮在分布式計算引用差分隱私來保護(hù)數(shù)據(jù)的安全。本文主要的貢獻(xiàn)在于理論上數(shù)學(xué)證明的這種分布式計算的可行性和安全隱私保護(hù)的級別。并且做了大量的實驗驗證理論推導(dǎo)的正確性。最后,本文根據(jù)實際場景,對我們的算法提出了兩點拓展應(yīng)用。一是將分布式在線學(xué)習(xí)的計算結(jié)果可以轉(zhuǎn)化為相應(yīng)的離線算法收斂結(jié)果;二是采用mini-batch的方法增加每次迭代使用的數(shù)據(jù)樣本數(shù)量,加快計算效率并提升隱私

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論