支持業(yè)務(wù)流程建模的塊結(jié)構(gòu)流程挖掘技術(shù)的研究.pdf_第1頁
已閱讀1頁,還剩161頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、隨著市場經(jīng)濟(jì)的發(fā)展,企業(yè)、機(jī)構(gòu)需要順應(yīng)市場需求的變化,隨時(shí)快速調(diào)整業(yè)務(wù),提高應(yīng)對市場變化的快速反應(yīng)能力。因此企業(yè)的信息系統(tǒng)中支持業(yè)務(wù)運(yùn)行的業(yè)務(wù)流程部分需要再造或優(yōu)化,而流程的再造或優(yōu)化首先需要理解當(dāng)前業(yè)務(wù)流程運(yùn)行的模式。目前,業(yè)務(wù)流程運(yùn)行模式的提煉主要依賴技術(shù)人員與業(yè)務(wù)人員的溝通,其所得結(jié)果有很強(qiáng)的主觀性,缺乏整體、完善性,且時(shí)間成本高、效率低。目前,大多數(shù)企業(yè)的信息系統(tǒng)管理應(yīng)用軟件,無論提供或不提供顯式的流程,這些軟件都提供企業(yè)實(shí)際業(yè)

2、務(wù)執(zhí)行的記錄,即流程日志。如何分析這些日志數(shù)據(jù),從中找出業(yè)務(wù)流程運(yùn)行的模式,用于快速的流程再造和柔性管理是迫切需要解決的問題,而流程日志中抽取的業(yè)務(wù)流程模型,可以真實(shí)反映企業(yè)業(yè)務(wù)流程的執(zhí)行,支持業(yè)務(wù)流程再造或優(yōu)化的快速建模。
   本文研究的基礎(chǔ)--簡單格式的流程日志并不是僅僅局限于工作流管理系統(tǒng)所提供,目前公司、機(jī)構(gòu)的信息系統(tǒng),它們的事務(wù)系統(tǒng),如ERP、CRM、B2B、SCM等都提供本文研究所需的簡單格式的日志信息。也就是說,

3、只需要收集記錄了業(yè)務(wù)流程中各個(gè)任務(wù)活動(dòng)發(fā)生的順序序列,即流程日志。流程日志記錄了業(yè)務(wù)流程執(zhí)行的真實(shí)情況,從中挖掘出業(yè)務(wù)流程模式更加可信易讀。
   因?yàn)榱鞒棠P偷慕Y(jié)構(gòu)往往比較復(fù)雜,存在循環(huán)、并行、選擇、非自由選擇等難以表述清楚的塊結(jié)構(gòu),現(xiàn)有文獻(xiàn)的挖掘方法對這些結(jié)果的處理不理想,如循環(huán)結(jié)構(gòu)、非自由選擇結(jié)構(gòu)等,目前沒有普適的處理方法解決這些問題。
   此外,利用流程日志中的時(shí)間信息可以挖掘到更精確的活動(dòng)邏輯關(guān)系并計(jì)算流程工

4、作的性能,但是大多數(shù)的流程挖掘方法并沒有充分利用日志中的時(shí)間信息。
   本文主要是深入研究并提煉給出了流程挖掘概念、流程日志的數(shù)學(xué)表示、流程模型的Petri網(wǎng)表示及結(jié)構(gòu)化工作流網(wǎng)概念,并給出相關(guān)的數(shù)學(xué)描述以及定義。在此基礎(chǔ)上的研究工作主要有以下三個(gè)方面的貢獻(xiàn):
   第一,目前,企業(yè)應(yīng)用系統(tǒng)軟件沒有統(tǒng)一的流程日志規(guī)范標(biāo)準(zhǔn),日志格式分為兩類:無時(shí)間標(biāo)志型日志和有時(shí)間標(biāo)志型日志且一般原始日志帶有噪音。針對無時(shí)間標(biāo)志型日志,

5、采用多步抽取模型方法,提出了一種基于簡單流程日志格式的塊結(jié)構(gòu)挖掘方法BRC(Block_Structure Replace Compression:BRC),挖掘任務(wù)之間的邏輯關(guān)系,用于構(gòu)建日志所反映的業(yè)務(wù)流程模型。
   基本塊結(jié)構(gòu)對應(yīng)于四種結(jié)構(gòu)即順序、并行、選擇和循環(huán)結(jié)構(gòu)。方法首先定義了能夠被挖掘的流程的基本要求,即結(jié)構(gòu)化流程模型。方法的基本思想是在對四種基本結(jié)構(gòu)進(jìn)行分析的基礎(chǔ)上,從日志中找出具有這些結(jié)構(gòu)的模塊,并用結(jié)點(diǎn)來替

6、換每個(gè)模塊。通過循環(huán)使用四種模塊挖掘算法從日志中挖掘和替換,使得日志不斷收縮。如果最后得到的日志是一個(gè)點(diǎn),則只需進(jìn)行一次逆變換,即將前面得到的模塊按照相反的順序依次代入到流程模型中,這樣得到一個(gè)容易理解的基于工作流網(wǎng)的WF網(wǎng)模型。同時(shí),證明用該種方法得到的工作流網(wǎng)是合理的,安全的。在對順序任務(wù)和選擇任務(wù)進(jìn)行挖掘的過程中,考慮到來自其他并行任務(wù)的干擾,BRC提出并采用了并行任務(wù)等價(jià)類概念,即首先從日志中劃分出并行任務(wù)等價(jià)類,再依次搜索各等

7、價(jià)類,挖掘出其中的順序和選擇任務(wù),從而很好地解決了并行任務(wù)對結(jié)構(gòu)化挖掘的干擾問題。通過生成和運(yùn)行一定數(shù)量的實(shí)驗(yàn)數(shù)據(jù),對BRC方法的挖掘質(zhì)量進(jìn)行了檢驗(yàn)分析,證明該方法在復(fù)雜流程的挖掘方面具有明顯優(yōu)勢。討論了帶噪音的因果關(guān)系挖掘、帶噪音的并行關(guān)系挖掘、帶噪音的選擇結(jié)構(gòu)的挖掘,并給出了帶噪音處理的改進(jìn)型結(jié)構(gòu)化挖掘算法。
   第二,無時(shí)間標(biāo)志型日志中并行關(guān)系的挖掘是相對困難且計(jì)算量較大,針對有時(shí)間標(biāo)志型日志,提出了一種基于時(shí)間間隔的簡

8、單流程日志格式的挖掘方法,用于構(gòu)建日志所反映的業(yè)務(wù)流程模型。
   方法的基本思想不同于事件模型類思想,在事件挖掘類中,把一個(gè)任務(wù)的執(zhí)行看作是不可分割的,是一個(gè)原子性事件。而從基于時(shí)間間隔日志的流程挖掘方法解決方案看,每一個(gè)任務(wù)的執(zhí)行都具有一個(gè)時(shí)間間隔,即任務(wù)的開始事件和任務(wù)的結(jié)束事件。可以再拓展這個(gè)模型成為捕獲更精確的模型視圖,在其中,執(zhí)行活動(dòng)是一個(gè)沿著時(shí)間軸的時(shí)間間隔,并且兩個(gè)間隔可以互相交叉。間隔方法分為兩大步驟:(1):

9、產(chǎn)生流程執(zhí)行圖。針對每一執(zhí)行產(chǎn)生一個(gè)DAG圖。在單個(gè)執(zhí)行中的間隔交叉使得此DAG圖易于對并行關(guān)系的挖掘,對具有同樣活動(dòng)集合的執(zhí)行圖進(jìn)行合并產(chǎn)生單個(gè)DAG圖;(2)合并流程執(zhí)行圖。對于流程圖的一個(gè)子圖,各個(gè)運(yùn)行于其上的執(zhí)行覆蓋相同的活動(dòng)集合,也就是業(yè)務(wù)流程中使用不同的參數(shù)來選擇合作伙伴的有向邊是一樣的。因此合并結(jié)果所產(chǎn)生的DAG圖就是流程的控制流圖。方法通過合并各個(gè)依賴于日志的DAG圖,產(chǎn)生現(xiàn)實(shí)意義上的流程模型圖。驗(yàn)證對比了兩類算法:間隔

10、算法和非間隔算法。得出了有意義的一些結(jié)論,如丟失邊或多余邊與流程日志規(guī)模之間的關(guān)系等。
   第三,針對一般情況下,流程日志帶有噪音且是不完備的,探討分析了噪音情況,給出了日志中任務(wù)邏輯關(guān)系挖掘方法。方法中定義了一個(gè)概念:順序關(guān)系。該關(guān)系是基于START和COMPLETE這兩種事件類型和它們的時(shí)間戳的。隨后給出順序關(guān)系的度量方法。提出了一個(gè)挖掘流程模型圖的方法,源流程模型可以包括所有的基本塊結(jié)構(gòu)和非自由選擇結(jié)構(gòu)。
  

11、提出的方法使用具有時(shí)間戳的任務(wù)狀態(tài)流程日志,利用時(shí)間信息,比如活動(dòng)的平均等待時(shí)間、平均執(zhí)行時(shí)間去挖掘流程模型。在挖掘流程模型時(shí),首先通過掃描一次日志,為每一個(gè)任務(wù)構(gòu)建平均值表:然后在平均值表的基礎(chǔ)上分兩步執(zhí)行:第一步是挖掘基本的結(jié)構(gòu),比如順序路由、并行路由、選擇和循環(huán)路由;第二步是分析流程模型的高級(jí)結(jié)構(gòu),如或連接結(jié)構(gòu)。通過以上兩步,能挖掘出預(yù)期的流程模型。另外使用算法進(jìn)行挖掘的時(shí)候,去除噪音問題通過觀測起始值來決定。最后對提出的挖掘算法

12、和文獻(xiàn)中已經(jīng)提到的算法做了比較,得出的結(jié)論是:TWM能挖掘α算法所挖掘的所有流程,然而,α算法不能挖掘TWM能挖掘的所有的流程,TWM和α算法在時(shí)間復(fù)雜度方面是等同的。另外,提出的算法對解決隱藏任務(wù)挖掘提供了有用的信息。
   此外,研究工作中,實(shí)現(xiàn)了一個(gè)支持流程挖掘算法的原型系統(tǒng)。設(shè)計(jì)此系統(tǒng)的目的主要是:(1)驗(yàn)證α算法的有效性:(2)以此和我們所提方法算法進(jìn)行有意義的比較,獲得有效的可信度;(3)驗(yàn)證針對復(fù)雜變異結(jié)構(gòu)流程,α

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論