當(dāng)前位置:工程項(xiàng)目OA系統(tǒng) > 泛普各地 > 湖南OA系統(tǒng) > 長沙OA系統(tǒng) > 長沙OA軟件行業(yè)資訊
基于可復(fù)用構(gòu)件思想的ETL架構(gòu)設(shè)計(jì)
申請(qǐng)免費(fèi)試用、咨詢電話:400-8352-114
文章來源:泛普軟件數(shù)據(jù)倉庫的數(shù)據(jù)來源常包含著噪聲數(shù)據(jù)、不完整數(shù)據(jù)、甚至是不一致的數(shù)據(jù)。為了得到高質(zhì)量的數(shù)據(jù),必須對(duì)抽取(Extract)出來的原始數(shù)據(jù)做一系列復(fù)雜轉(zhuǎn)換(Transform)處理,最后裝載(Load)到數(shù)據(jù)倉庫中。這種從原始數(shù)據(jù)到數(shù)據(jù)倉庫之間,對(duì)數(shù)據(jù)進(jìn)行的操作稱為ETL過程,其工作量大約占系統(tǒng)的60%,實(shí)現(xiàn)ETL過程的效率和質(zhì)量很大程度上決定了數(shù)據(jù)倉庫系統(tǒng)的構(gòu)建效率和質(zhì)量。目前研究ETL過程都是集中于個(gè)案的研究,強(qiáng)調(diào)ETL系統(tǒng)的可擴(kuò)展性和靈活性,對(duì)于如何在類相似或相近的數(shù)據(jù)倉庫項(xiàng)目中共享ETL過程的研究則很少,很大程度上阻礙了數(shù)據(jù)倉庫項(xiàng)目建設(shè)效率的進(jìn)一步提高。如何在一類相似或相近的數(shù)據(jù)倉庫項(xiàng)目中發(fā)現(xiàn)其共同特征、知識(shí)和需求,使得ETL過程可以在這些數(shù)據(jù)倉庫項(xiàng)目中被反復(fù)使用,大幅度提高實(shí)現(xiàn)ETL過程的效率,從而提高數(shù)據(jù)倉庫構(gòu)建的效率,研究該問題具有一定理論意義及實(shí)用價(jià)值。基于可復(fù)用構(gòu)件思想的ETL架構(gòu)設(shè)計(jì)
設(shè)計(jì)思想
基于構(gòu)件技術(shù)的軟件復(fù)用提倡以已有的工作為基礎(chǔ),充分利用過去工作中積累的知識(shí)和經(jīng)驗(yàn),將已經(jīng)辨識(shí)的具有相對(duì)獨(dú)立功能的構(gòu)件應(yīng)用于新系統(tǒng)的開發(fā),保證新系統(tǒng)開發(fā)的過程中,能夠?qū)⒅攸c(diǎn)集中于辨識(shí)和實(shí)現(xiàn)應(yīng)用系統(tǒng)特有的構(gòu)成成分,最終縮短系統(tǒng)開發(fā)周期,提高系統(tǒng)的質(zhì)量。
基于構(gòu)件技術(shù)的軟件復(fù)用的核心思想包括如下幾個(gè)方面:
(1)構(gòu)件化設(shè)計(jì)。通過系統(tǒng)地分析一類相似或相近的數(shù)據(jù)倉庫項(xiàng)目,識(shí)別出其共同特征和可變特征,并對(duì)這些特征進(jìn)行抽象,形成領(lǐng)域分析模型,并據(jù)此進(jìn)一步識(shí)別出可復(fù)用的構(gòu)件。
(2)層次化設(shè)計(jì)。層次化設(shè)計(jì)可以提高系統(tǒng)的可擴(kuò)展性和可維護(hù)性。通過層次化設(shè)計(jì)可以將所有識(shí)別的構(gòu)件按一定的規(guī)則(如抽象級(jí)別、處理對(duì)象和處理的功能)分類管理,然后以分層的形式來組織,進(jìn)而確定不同層構(gòu)件之間的交互方式,保證每個(gè)構(gòu)件的變化只涉及它的鄰近兩層的相關(guān)構(gòu)件,實(shí)現(xiàn)系統(tǒng)一定程度上的開放性。
(3)接口化設(shè)計(jì)。不同層次的構(gòu)件之間需要溝通,溝通需要規(guī)范,通過規(guī)范的接口可實(shí)現(xiàn)構(gòu)件之間溝通的規(guī)范化。接口只制定規(guī)范,具體實(shí)現(xiàn)交由構(gòu)件內(nèi)部完成。接口化設(shè)計(jì)將構(gòu)件的差異放到實(shí)現(xiàn)階段,而不是在設(shè)計(jì)階段,使得設(shè)計(jì)階段可以致力于軟件架構(gòu)設(shè)計(jì)的完整性和復(fù)用性,使得不同系統(tǒng)之間處理的差異通過替換構(gòu)件而無需變動(dòng)架構(gòu)就可得到解決。
ETL架構(gòu)模型設(shè)計(jì)
基于可復(fù)用構(gòu)件思想的ELT架構(gòu)(如圖1所示)主要分成基礎(chǔ)服務(wù)層、抽取層、集成轉(zhuǎn)換層、特殊處理層四個(gè)層次,每個(gè)層次的功能如下所述。
1、抽取層
抽取層構(gòu)件位于ETL架構(gòu)的最底層,直接面對(duì)數(shù)據(jù)源,完成數(shù)據(jù)抽取階段的工作。鑒于數(shù)據(jù)倉庫數(shù)據(jù)源差異性大的特點(diǎn),這個(gè)層的ETL構(gòu)件在不同數(shù)據(jù)倉庫間差異很大,可重用程度總體上比較低。
2、集成轉(zhuǎn)換層
集成轉(zhuǎn)換層構(gòu)件主要將抽取層抽取的數(shù)據(jù)轉(zhuǎn)換成格式規(guī)范、含義統(tǒng)一、質(zhì)量良好的數(shù)據(jù),并集成到數(shù)據(jù)倉庫中。由于是在兩個(gè)層接口構(gòu)件之間,所以集成轉(zhuǎn)換層構(gòu)件的輸入和輸出都要滿足層間接口構(gòu)件的約定,在相似數(shù)據(jù)倉庫項(xiàng)目之間的差異主要體現(xiàn)在業(yè)務(wù)處理規(guī)則上。集成轉(zhuǎn)換層為每類數(shù)據(jù)對(duì)象提供一類ETL處理構(gòu)件,同層構(gòu)件之間相對(duì)獨(dú)立,通過抽象各個(gè)相似數(shù)據(jù)倉庫項(xiàng)目業(yè)務(wù)規(guī)則,將其封裝在構(gòu)件內(nèi),保證ETL架構(gòu)在相似數(shù)據(jù)倉庫之間移植時(shí),只要通過配置業(yè)務(wù)規(guī)則,ETL構(gòu)件即可投入使用。
3、特殊處理層
為了保證后續(xù)功能開發(fā)者可以將注意力放在功能關(guān)注的指標(biāo)上,而不要關(guān)心指標(biāo)的具體口徑,更不要擔(dān)心指標(biāo)口徑變化和指標(biāo)口徑在相似數(shù)據(jù)倉庫項(xiàng)目之間的差異對(duì)功能移植造成不利影響,在集成轉(zhuǎn)換層構(gòu)件處理的基礎(chǔ)上,專門增加了特殊處理層,負(fù)責(zé)將數(shù)據(jù)倉庫中按流水交易形式組織的數(shù)據(jù)換算成按KPI組織的形式。
4、基礎(chǔ)服務(wù)層
為了給ETL提供一個(gè)相對(duì)穩(wěn)定和靈活的架構(gòu),在元數(shù)據(jù)管理的構(gòu)件識(shí)別的基礎(chǔ)上引入了基礎(chǔ)服務(wù)層,擴(kuò)展了傳統(tǒng)意義上的元數(shù)據(jù)管理的功能,包含元數(shù)據(jù)管理構(gòu)件、層間接口構(gòu)件、KPI自動(dòng)測(cè)試構(gòu)件三大類:這些構(gòu)件構(gòu)成了ETL基礎(chǔ)和骨架,為系統(tǒng)的穩(wěn)定性和適應(yīng)性奠定了基礎(chǔ)。
(1)元數(shù)據(jù)管理構(gòu)件。元數(shù)據(jù)是關(guān)于數(shù)據(jù)的數(shù)據(jù),元數(shù)據(jù)管理構(gòu)件主要完成ETL子系統(tǒng)中元數(shù)據(jù)管理模塊的功能,具體分成三小類,分別是負(fù)責(zé)維護(hù)數(shù)據(jù)倉庫架構(gòu)的維護(hù)類構(gòu)件、負(fù)責(zé)維護(hù)業(yè)務(wù)規(guī)則的維護(hù)類構(gòu)件和調(diào)度類構(gòu)件。
(2)層間接口構(gòu)件。為了在各個(gè)數(shù)據(jù)倉庫項(xiàng)目之間平穩(wěn)的移植ETL,在此設(shè)計(jì)了層間接口構(gòu)件。從抽象層面上為各數(shù)據(jù)倉庫項(xiàng)目提供一個(gè)相同的ETL處理框架,為ETL處理過程各層次的各種功能構(gòu)件提供接口,實(shí)現(xiàn)構(gòu)件具體處理過程對(duì)架構(gòu)的透明化,為系統(tǒng)功能擴(kuò)展留下了余地。
(3)KPI(關(guān)鍵績效指標(biāo))自動(dòng)測(cè)試構(gòu)件。測(cè)試無疑是保證系統(tǒng)質(zhì)量的一個(gè)重要方法,ETL也不例外,但是,ETL過程測(cè)試和一般的軟件測(cè)試在測(cè)試過程、測(cè)試方法、評(píng)價(jià)標(biāo)準(zhǔn)等方面都有比較大的不同,它是一個(gè)非常繁瑣、工作量巨大、有一定規(guī)律的過程。
從抽象層面上看,一類相似或相近的數(shù)據(jù)倉庫項(xiàng)目每個(gè)KPI(關(guān)鍵績效指標(biāo))的維度組合是相對(duì)固定的,測(cè)試標(biāo)準(zhǔn)和過程是一致的,所以,在ETL架構(gòu)中,專門提供了KPI自動(dòng)測(cè)試類構(gòu)件,為每類KPI提供一個(gè)自動(dòng)測(cè)試構(gòu)件,其基本處理邏輯如圖2所示。
該類構(gòu)件能夠快速發(fā)現(xiàn)ETL架構(gòu)中集成層和轉(zhuǎn)換層中相關(guān)構(gòu)件數(shù)據(jù)處理過程中隱藏的問題,從而降低ETL過程測(cè)試的難度和工作量,大幅度提高ETL架構(gòu)的效率和質(zhì)量。
- 1廈門OA軟件
- 2合肥OA軟件行業(yè)資訊
- 3杭州OA軟件
- 4鄭州OA軟件
- 5濟(jì)南OA軟件
- 6青島OA軟件
- 7太原OA軟件
- 8上海OA軟件
- 9上海OA軟件行業(yè)資訊
- 10石家莊OA軟件
- 11天津OA軟件
- 12沈陽OA軟件
- 1網(wǎng)“助”云計(jì)算
- 2協(xié)同OA辦公軟件系統(tǒng)走免費(fèi)的路線,3年內(nèi)找出盈利的模式
- 3從整合角度定義企業(yè)架構(gòu)組件
- 4微軟和Google的云存儲(chǔ)服務(wù)比較
- 5如何解決服務(wù)器虛擬化中遇到的問題?
- 6CCD還是CMOS 高清攝像機(jī)的成本博弈
- 7淺析光網(wǎng)絡(luò)中光交換機(jī)的應(yīng)用技術(shù)
- 8選購重復(fù)數(shù)據(jù)刪除方案的五個(gè)指標(biāo)
- 9智能電網(wǎng)中的無線通信技術(shù)解析
- 10災(zāi)備計(jì)劃通過VMware解決裸機(jī)恢復(fù)問題
- 11物聯(lián)網(wǎng)后的商業(yè)革新
- 12淺議SOA成熟度模型五個(gè)階段
- 13企業(yè)3G信息化是什么意思?
- 14磁盤備份與虛擬磁帶庫備份淺析
- 15生物識(shí)別技術(shù)加強(qiáng)身份安全管理
- 16OA軟件和企管之星產(chǎn)品納入了更為先進(jìn)的理念
- 17虛擬化響起安全警報(bào)
- 18電子紙飛躍即將來臨
- 19淘寶數(shù)據(jù)庫專家深入解析數(shù)據(jù)倉庫架構(gòu)
- 20Win2008 R2的Hyper-V R2存儲(chǔ)功能解析
- 21中國聯(lián)通北京手機(jī)支付商用親體驗(yàn)
- 223G無線監(jiān)控為何出現(xiàn)持續(xù)降溫局面
- 23全面介紹RAID7與RAID6磁盤陣列技術(shù)
- 24幫你節(jié)省項(xiàng)目開發(fā)的7種正在流行編程語言
- 25即將走出實(shí)驗(yàn)室的6大IT創(chuàng)新
- 26呼叫中心績效管理的關(guān)注點(diǎn)在哪里?
- 27三種3G技術(shù)的優(yōu)勢(shì)分別是什么?
- 28中間件技術(shù)趨勢(shì):應(yīng)用系統(tǒng)實(shí)用化
- 29Ad-hoc網(wǎng)絡(luò):無需要固定設(shè)施的無線移動(dòng)網(wǎng)絡(luò)
- 30下一代防火墻:更高速更智能
成都公司:成都市成華區(qū)建設(shè)南路160號(hào)1層9號(hào)
重慶公司:重慶市江北區(qū)紅旗河溝華創(chuàng)商務(wù)大廈18樓