天文信息自動處理及目標(biāo)檢測的研究.pdf_第1頁
已閱讀1頁,還剩111頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、宇宙的形成、發(fā)展和演化是人類永恒的研究課題。宇宙包含了所有的空間、時間、物質(zhì)和能量。對于宇宙的研究水平,標(biāo)志著一個國家在科技發(fā)展中的位置,對自然科學(xué)的眾多學(xué)科有著特殊的重要意義,也是當(dāng)代科學(xué)技術(shù),特別是尖端空間技術(shù)發(fā)展的巨大推動力。
   天文學(xué)研究的途徑在光學(xué)波段主要有兩種:天體光譜和天文圖像。前者是一維數(shù)據(jù),后者是二維數(shù)據(jù),二者之間聯(lián)系密切。光譜分析可以定性或定量地測定天體的化學(xué)組成,通過直接或間接的方法確定天體的光度、表面

2、溫度、直徑、質(zhì)量、視向速度及自轉(zhuǎn)。因此,光譜分析在天文學(xué)中占有重要的地位。對天文圖像的分析是另一種研究宇宙天體的途徑。利用天文圖像可以對天體目標(biāo)的形態(tài)結(jié)構(gòu)信息,包括天體的年齡、狀態(tài)、演變趨勢等進(jìn)行研究,為天文目標(biāo)觀測與研究提供重要的技術(shù)支持。
   國家大科學(xué)項目LAMOST(Large Sky Area Multi-Object Fiber SpectroscopicTelescope)于1997年正式立項,2009年6月通過

3、國家驗收,并逐步投入運行。它具有4米口徑,可以觀測到20.5星等的暗弱天體。在5度視場上可以放置4000根光纖,最多可以同時獲得4000個天體的光譜,成為世界上光譜獲取率最高的望遠(yuǎn)鏡。LAMOST的觀測目標(biāo)是宇宙中星系與恒星。隨著LAMOST的運行,在每個觀測夜晚都能夠采集萬余條光譜,得到的光譜數(shù)據(jù)量是數(shù)十億字節(jié)。因此,在光譜數(shù)據(jù)的自動識別和分析方面,急需研究海量天體光譜的自動識別與分析方法,包括天體光譜的自動識別、分類以及物理參數(shù)自動

4、測量等。
   山東大學(xué)威海天文臺WOSDU(Weihai Observatory of Shandong University)用于搜尋太陽系小行星和超新星巡天。每天會產(chǎn)生大量的天文圖像數(shù)據(jù)。以小行星搜索為例,每天都會拍攝大量的天文圖像,圖像尺寸為2048×2048×16bit,數(shù)據(jù)量為8M。要發(fā)現(xiàn)新的小行星,首先要在圖像中快速檢測各個星體,然后根據(jù)圖像坐標(biāo)換算成天球坐標(biāo),再在星表中進(jìn)行比對。若發(fā)現(xiàn)星表里不存在,則將其作為候選

5、體繼續(xù)追蹤觀測,并計算出相應(yīng)軌道,以便確認(rèn)是否是新的小行星。由于天文圖像數(shù)量很大,這一流程涉及到大量的處理工作,而天體目標(biāo)檢測就是一個重要的步驟。圖像識別中,準(zhǔn)確度和速度成為主要的指標(biāo)。如何快速有效地識別圖像中的天體便成為我們研究的一個課題。由此可見,海量天文圖像的快速及有效的處理,向計算機信息技術(shù)提出了迫切的需求,同時,天文數(shù)據(jù)所具有的海量性和開放性也為計算機信息技術(shù)展開了一個重要的研究和應(yīng)用領(lǐng)域。對這些海量數(shù)據(jù)及時有效的處理,需要借

6、助于圖像處理、數(shù)據(jù)挖掘、信號處理等多項現(xiàn)代信息處理技術(shù)。
   本課題利用數(shù)據(jù)挖掘、圖像處理、人工智能、信號處理等先進(jìn)的信息技術(shù),在國家自然基金項目的支持下,以LAMOST與WOSDU的天文數(shù)據(jù)為研究和應(yīng)用背景,針對天文數(shù)據(jù)的預(yù)處理、天文圖像的目標(biāo)檢測、高維天體光譜數(shù)據(jù)的自動分類、稀少天體的數(shù)據(jù)挖掘等若干關(guān)鍵問題展開研究,設(shè)計和驗證了一系列有效的算法,并開發(fā)出可供LAMOST使用的天體光譜自動識別與分析系統(tǒng)。本研究屬于天文和信息

7、交叉學(xué)科的研究,是將最新的計算機信息技術(shù)在天文領(lǐng)域的一項具體的應(yīng)用,以期在天文研究中取得新的科學(xué)成果。因此,本課題的研究具有非常好的理論和應(yīng)用價值。
   本課題研究的內(nèi)容包括四個方面:(1)天文數(shù)據(jù)預(yù)處理及發(fā)射線識別;(2)圖像的目標(biāo)檢測;(3)天文光譜的自動分類;(4)稀少天體的數(shù)據(jù)挖掘。
   針對上述關(guān)鍵問題,開展了如下的研究和創(chuàng)新工作:
   首先是天文光譜去噪的研究。通過望遠(yuǎn)鏡觀測到的一維光譜數(shù)據(jù)在探

8、測階段因噪聲而受到影響,導(dǎo)致信噪比降低,因而去噪工作非常重要。作為信號估計的一個組成部分,去噪問題一直在信號處理領(lǐng)域被廣泛研究。信號降噪的目的是從被加性噪聲污染的信號中還原原始信號。在過去的二十多年中,許多研究集中在使用小波變換去除噪聲。已經(jīng)提出了許多基于正交小波的閾值規(guī)則。然而,正如Coifman和Donoho指出的,基于正交小波的去噪算法在不連續(xù)信號的鄰域中會表現(xiàn)出偽吉布斯現(xiàn)象。因此他們提出了一種平移不變的降噪模式來減少這種影響。另

9、外,就均方根誤差和信噪比而言,相對于非冗余的信號表示,冗余的信號表示顯示了相當(dāng)好的優(yōu)越性。因此,這種平移不變的冗余轉(zhuǎn)變是非常適合于光譜信號的降噪的。Kingsbury提出的雙樹復(fù)小波變換是冗余而且近似于平移不變的。本文提出一種基于雙樹復(fù)小波變換(DTCWT)的光譜降噪算法,該算法處理的光譜具有更高的信噪比和光譜質(zhì)量。針對天文光譜的預(yù)處理,本文研究了基于雙樹復(fù)小波變換的自適應(yīng)降噪方法。該方法利用最大后驗估計理論來對復(fù)小波系數(shù)進(jìn)行自適應(yīng)收縮

10、,在保護譜線等重要信息的前提下,抑制噪聲和偽吉布斯現(xiàn)象,提高去噪算法運行效率,為光譜的后續(xù)處理提供了有效的工具。此外,我們還進(jìn)行了具有發(fā)射線恒星的自動檢測研究。恒星光譜一般具有明顯的吸收線或者吸收帶特征,而具有發(fā)射線的恒星光譜對應(yīng)著特殊類型的恒星,如激變變星、Herbig Ae/Be等。對這些光譜的后續(xù)研究有著重要的意義。本文提出了一種能夠自動識別發(fā)射線恒星光譜的方法。該方法首先對光譜進(jìn)行連續(xù)譜歸一化,然后通過比較譜線對應(yīng)的流量及其鄰域

11、流量的均值和標(biāo)準(zhǔn)差,來判斷是否存在發(fā)射線。對SDSS DR8大樣本數(shù)據(jù)的實驗表明,該方法能夠完整、準(zhǔn)確地識別發(fā)射線恒星。而且,由于該方法不涉及復(fù)雜的變換和運算,因而識別速度非???,可用于諸如LAMOST、SDSS這樣大型光譜巡天項目中發(fā)現(xiàn)發(fā)射線恒星光譜。
   其次,是天體目標(biāo)的檢測。在天文研究中,通過天體觀測而得到的CCD圖像(Charge Coupled Device,電荷耦合器件)通常以FITS文件(Flexible Im

12、ageTransport System)格式存儲。每幅圖像都很大,可以達(dá)到8M或更大。此外,通過連續(xù)觀測而得到的這類圖像的數(shù)量又是非常大的,因此如何對這些圖像進(jìn)行實時的處理是非常重要的,也是具有挑戰(zhàn)性的。而天體的檢測又是天文圖像處理的一個重要步驟。本文設(shè)計并實現(xiàn)了基于空域的天文圖像目標(biāo)檢測方法。利用遞歸方式,設(shè)計并實現(xiàn)了掃描加速器。實驗表明,該算法大大提高了目標(biāo)檢測速度,實現(xiàn)了對目標(biāo)的快速準(zhǔn)確的檢測并可獲得目標(biāo)的多個參數(shù),同時建立了天球

13、三維模型,可以根據(jù)指定天區(qū),對滿足一定條件的恒星從星表數(shù)據(jù)庫中進(jìn)行檢索,然后在三維天球坐標(biāo)系中形象地顯示其分布,實現(xiàn)了星表查詢結(jié)果的三維可視化。
   再次,對于高維光譜數(shù)據(jù)分類研究。隨機森林是一種高效、穩(wěn)定的算法,和其他算法相比在效率和準(zhǔn)確率上具有一定的優(yōu)勢。隨機森林中計算效率和準(zhǔn)確率,受樹的個數(shù)和隨機屬性的個數(shù)影響。在保證訓(xùn)練時間和準(zhǔn)確率的情況下,選擇適當(dāng)?shù)拈撝担梢允褂?xùn)練時間最短準(zhǔn)確率最高。合適的樹的個數(shù)閾值會在保證準(zhǔn)確率

14、的基礎(chǔ)上,使訓(xùn)練時間最短;而合適的隨機屬性的個數(shù)會使得訓(xùn)練的時間最短。而閾值是和數(shù)據(jù)相關(guān)的,閾值選取的好壞直接影響效率和準(zhǔn)確率。本文提出了利用遺傳算法優(yōu)化隨機森林分類參數(shù)的模式。利用該模式可以快速地確定隨機森林進(jìn)行光譜分類時所需的關(guān)鍵參數(shù),從而改變了傳統(tǒng)單純憑經(jīng)驗設(shè)定隨機森林分類參數(shù)的方式,提高了分類算法的自動化和智能化程度,提高了分類準(zhǔn)確率,減少了分類器訓(xùn)練時間。
   最后,針對激變變星的搜尋,提出了利用PCA降維與BP人工

15、神經(jīng)網(wǎng)絡(luò)相結(jié)合的稀少天體的數(shù)據(jù)挖掘方法。利用PCA降維,大大減少了高維光譜數(shù)據(jù)的維度空間,然后利用BP人工神經(jīng)網(wǎng)絡(luò)進(jìn)行篩選,提高了激變變星搜尋的準(zhǔn)確率,減少了模型訓(xùn)練時間。實驗證明,該方法對于發(fā)現(xiàn)特殊天體是行之有效的。該方法不僅對激變變星適用,對于其它類別的特殊天體也是適用的。該方法可極大地減少人工處理的工作強度和時間。由于速度快,基本可滿足LAMOST光譜數(shù)據(jù)的準(zhǔn)實時處理。如果具備并行數(shù)據(jù)處理環(huán)境,還可以使數(shù)據(jù)的輸入、降維、挖掘等操作

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論