版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、人工智能的核心技術(shù)是什么?《人工智能標(biāo)準(zhǔn)化白皮書(shū)(2018)》1機(jī)器學(xué)習(xí)機(jī)器學(xué)習(xí)(MachineLearning)是一門(mén)涉及統(tǒng)計(jì)學(xué)、系統(tǒng)辨識(shí)、逼近理論、神經(jīng)網(wǎng)絡(luò)、優(yōu)化理論、計(jì)算機(jī)科學(xué)、腦科學(xué)等諸多領(lǐng)域的交叉學(xué)科,研究計(jì)算機(jī)怎樣模擬或?qū)崿F(xiàn)人類的學(xué)習(xí)行為,以獲取新的知識(shí)或技能,重新組織已有的知識(shí)結(jié)構(gòu)使之不斷改善自身的性能,是人工智能技術(shù)的核心?;跀?shù)據(jù)的機(jī)器學(xué)習(xí)是現(xiàn)代智能技術(shù)中的重要方法之一,研究從觀測(cè)數(shù)據(jù)(樣本)出發(fā)尋找規(guī)律,利用這些規(guī)律
2、對(duì)未來(lái)數(shù)據(jù)或無(wú)法觀測(cè)的數(shù)據(jù)進(jìn)行預(yù)測(cè)。根據(jù)學(xué)習(xí)模式、學(xué)習(xí)方法以及算法的不同,機(jī)器學(xué)習(xí)存在不同的分類方法。(1)根據(jù)學(xué)習(xí)模式將機(jī)器學(xué)習(xí)分類為監(jiān)督學(xué)習(xí)、無(wú)監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)等。監(jiān)督學(xué)習(xí)監(jiān)督學(xué)習(xí)是利用已標(biāo)記的有限訓(xùn)練數(shù)據(jù)集,通過(guò)某種學(xué)習(xí)策略方法建立一個(gè)模型,實(shí)現(xiàn)對(duì)新數(shù)據(jù)實(shí)例的標(biāo)記(分類)映射,最典型的監(jiān)督學(xué)習(xí)算法包括回歸和分類。監(jiān)督學(xué)習(xí)要求訓(xùn)練樣本的分類標(biāo)簽已知,分類標(biāo)簽精確度越高,樣本越具有代表性,學(xué)習(xí)模型的準(zhǔn)確度越高。監(jiān)督學(xué)習(xí)在自然語(yǔ)言處理
3、、信息檢索、文本挖掘、手寫(xiě)體辨識(shí)、垃圾郵件偵測(cè)等領(lǐng)域獲得了廣泛應(yīng)用。無(wú)監(jiān)督學(xué)習(xí)無(wú)監(jiān)督學(xué)習(xí)是利用無(wú)標(biāo)記的有限數(shù)據(jù)描述隱藏在未標(biāo)記數(shù)據(jù)中的結(jié)構(gòu)規(guī)律,最典型的非監(jiān)督學(xué)習(xí)算法包括單類密度估計(jì)、單類數(shù)據(jù)降維、聚類等。無(wú)監(jiān)督學(xué)習(xí)不需要訓(xùn)練樣本和人工標(biāo)注數(shù)據(jù),便于壓縮數(shù)據(jù)存儲(chǔ)、減少計(jì)算量、提升算法速度,還可以避免正、負(fù)樣本偏移引起的分類錯(cuò)誤問(wèn)題。主要用于經(jīng)濟(jì)預(yù)測(cè)、異常檢測(cè)、數(shù)據(jù)挖掘、圖像處理、模式識(shí)別等領(lǐng)域,例如組織大型計(jì)算機(jī)集群、社交網(wǎng)絡(luò)分析、市場(chǎng)
4、分割、天文數(shù)據(jù)分析等。強(qiáng)化學(xué)習(xí)強(qiáng)化學(xué)習(xí)是智能系統(tǒng)從環(huán)境到行為映射的學(xué)習(xí),以使強(qiáng)化信號(hào)函數(shù)值最大。由于外部環(huán)境提供的信息很少,強(qiáng)化學(xué)習(xí)系統(tǒng)必須靠自身的經(jīng)歷進(jìn)行學(xué)習(xí)。強(qiáng)化學(xué)習(xí)的目標(biāo)是學(xué)習(xí)從環(huán)境狀態(tài)到行為的映射,使得智能體選擇的行為能夠獲得環(huán)境最大的獎(jiǎng)賞,使得外部環(huán)境對(duì)學(xué)習(xí)系統(tǒng)在某種意義下的評(píng)價(jià)為最佳。其在機(jī)器人控制、無(wú)人駕駛、下棋、工業(yè)控制等領(lǐng)域獲得成功應(yīng)用。(2)根據(jù)學(xué)習(xí)方法可以將機(jī)器學(xué)習(xí)分為傳統(tǒng)機(jī)器學(xué)習(xí)和深度學(xué)習(xí)。傳統(tǒng)機(jī)器學(xué)習(xí)傳統(tǒng)機(jī)器學(xué)
5、習(xí)從一些觀測(cè)(訓(xùn)練)樣本出發(fā),試圖發(fā)現(xiàn)不能通過(guò)原理分析獲得的規(guī)律,實(shí)現(xiàn)對(duì)未來(lái)數(shù)據(jù)行為或趨勢(shì)的準(zhǔn)確預(yù)測(cè)。相關(guān)算法包括邏輯回歸、隱馬爾科夫方法、支持向種自適應(yīng)機(jī)制以確定演化機(jī)制的影響等。2知識(shí)圖譜知識(shí)圖譜本質(zhì)上是結(jié)構(gòu)化的語(yǔ)義知識(shí)庫(kù),是一種由節(jié)點(diǎn)和邊組成的圖數(shù)據(jù)結(jié)構(gòu),以符號(hào)形式描述物理世界中的概念及其相互關(guān)系,其基本組成單位是“實(shí)體—關(guān)系—實(shí)體”三元組,以及實(shí)體及其相關(guān)“屬性—值”對(duì)。不同實(shí)體之間通過(guò)關(guān)系相互聯(lián)結(jié),構(gòu)成網(wǎng)狀的知識(shí)結(jié)構(gòu)。在知識(shí)圖
6、譜中,每個(gè)節(jié)點(diǎn)表示現(xiàn)實(shí)世界的“實(shí)體”,每條邊為實(shí)體與實(shí)體之間的“關(guān)系”。通俗地講,知識(shí)圖譜就是把所有不同種類的信息連接在一起而得到的一個(gè)關(guān)系網(wǎng)絡(luò),提供了從“關(guān)系”的角度去分析問(wèn)題的能力。知識(shí)圖譜可用于反欺詐、不一致性驗(yàn)證、組團(tuán)欺詐等公共安全保障領(lǐng)域,需要用到異常分析、靜態(tài)分析、動(dòng)態(tài)分析等數(shù)據(jù)挖掘方法。特別地,知識(shí)圖譜在搜索引擎、可視化展示和精準(zhǔn)營(yíng)銷方面有很大的優(yōu)勢(shì),已成為業(yè)界的熱門(mén)工具。但是,知識(shí)圖譜的發(fā)展還有很大的挑戰(zhàn),如數(shù)據(jù)的噪聲問(wèn)
7、題,即數(shù)據(jù)本身有錯(cuò)誤或者數(shù)據(jù)存在冗余。隨著知識(shí)圖譜應(yīng)用的不斷深入,還有一系列關(guān)鍵技術(shù)需要突破。3自然語(yǔ)言處理自然語(yǔ)言處理是計(jì)算機(jī)科學(xué)領(lǐng)域與人工智能領(lǐng)域中的一個(gè)重要方向,研究能實(shí)現(xiàn)人與計(jì)算機(jī)之間用自然語(yǔ)言進(jìn)行有效通信的各種理論和方法,涉及的領(lǐng)域較多,主要包括機(jī)器翻譯、機(jī)器閱讀理解和問(wèn)答系統(tǒng)等。(1)機(jī)器翻譯機(jī)器翻譯技術(shù)是指利用計(jì)算機(jī)技術(shù)實(shí)現(xiàn)從一種自然語(yǔ)言到另外一種自然語(yǔ)言的翻譯過(guò)程?;诮y(tǒng)計(jì)的機(jī)器翻譯方法突破了之前基于規(guī)則和實(shí)例翻譯方法的
8、局限性,翻譯性能取得巨大提升。基于深度神經(jīng)網(wǎng)絡(luò)的機(jī)器翻譯在日??谡Z(yǔ)等一些場(chǎng)景的成功應(yīng)用已經(jīng)顯現(xiàn)出了巨大的潛力。隨著上下文的語(yǔ)境表征和知識(shí)邏輯推理能力的發(fā)展,自然語(yǔ)言知識(shí)圖譜不斷擴(kuò)充,機(jī)器翻譯將會(huì)在多輪對(duì)話翻譯及篇章翻譯等領(lǐng)域取得更大進(jìn)展。目前非限定領(lǐng)域機(jī)器翻譯中性能較佳的一種是統(tǒng)計(jì)機(jī)器翻譯,包括訓(xùn)練及解碼兩個(gè)階段。訓(xùn)練階段的目標(biāo)是獲得模型參數(shù),解碼階段的目標(biāo)是利用所估計(jì)的參數(shù)和給定的優(yōu)化目標(biāo),獲取待翻譯語(yǔ)句的最佳翻譯結(jié)果。統(tǒng)計(jì)機(jī)器翻譯主
9、要包括語(yǔ)料預(yù)處理、詞對(duì)齊、短語(yǔ)抽取、短語(yǔ)概率計(jì)算、最大熵調(diào)序等步驟?;谏窠?jīng)網(wǎng)絡(luò)的端到端翻譯方法不需要針對(duì)雙語(yǔ)句子專門(mén)設(shè)計(jì)特征模型,而是直接把源語(yǔ)言句子的詞串送入神經(jīng)網(wǎng)絡(luò)模型,經(jīng)過(guò)神經(jīng)網(wǎng)絡(luò)的運(yùn)算,得到目標(biāo)語(yǔ)言句子的翻譯結(jié)果。在基于端到端的機(jī)器翻譯系統(tǒng)中,通常采用遞歸神經(jīng)網(wǎng)絡(luò)或卷積神經(jīng)網(wǎng)絡(luò)對(duì)句子進(jìn)行表征建模,從海量訓(xùn)練數(shù)據(jù)中抽取語(yǔ)義信息,與基于短語(yǔ)的統(tǒng)計(jì)翻譯相比,其翻譯結(jié)果更加流暢自然,在實(shí)際應(yīng)用中取得了較好的效果。(2)語(yǔ)義理解語(yǔ)義理解
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
評(píng)論
0/150
提交評(píng)論