成都公司:成都市成華區(qū)建設(shè)南路160號(hào)1層9號(hào)
重慶公司:重慶市江北區(qū)紅旗河溝華創(chuàng)商務(wù)大廈18樓
當(dāng)前位置:工程項(xiàng)目OA系統(tǒng) > 領(lǐng)域應(yīng)用 > 醫(yī)院管理OA系統(tǒng) > 門診收費(fèi)管理系統(tǒng)
基于Lucene檢索引擎的電子病歷全文檢索系統(tǒng)
申請(qǐng)免費(fèi)試用、咨詢電話:400-8352-114
1 前言
隨著醫(yī)院信息化建設(shè)的進(jìn)行,電子病歷作為臨床醫(yī)療信息的基礎(chǔ)和醫(yī)院信息系統(tǒng)的核心構(gòu)成了業(yè)務(wù)管理、醫(yī)療衛(wèi)生決策系統(tǒng)的基礎(chǔ)6但國內(nèi)目前各大醫(yī)院通常并不把電子病歷管理視為一個(gè)獨(dú)立的單元, 電子病歷管理系統(tǒng)一般都是作為醫(yī)院信息系統(tǒng)的一個(gè)模塊存在。目前,對(duì)于病歷信息的查詢?yōu)g覽也只能通過查詢患者的一些結(jié)構(gòu)化的數(shù)據(jù)庫信息得到該患者的ID號(hào),然后通過病歷的存儲(chǔ)規(guī)則來找到相應(yīng)的病歷。每次得到的信息都是個(gè)別的,而且無法實(shí)現(xiàn)全文檢索.存在于病歷文本中的大量非結(jié)構(gòu)化的信息不能作為檢索條件,因而這些信息也不能為醫(yī)療工作者所利用。因此. 目前電子病歷管理系統(tǒng)的檢索查詢機(jī)制迫切需要向滿足醫(yī)生需求、科研輔助和采用全文檢索的方向轉(zhuǎn)變,為以后電子病歷管理正式成為醫(yī)院管理的一個(gè)獨(dú)立分支打下良好的基礎(chǔ)?;诖耍覀兲岢隽嘶贚ucene檢索引擎建立電子病歷全文檢索系統(tǒng),它以基于關(guān)鍵字的全文檢索技術(shù)為基礎(chǔ).能夠提供方便快捷的方式為臨床醫(yī)療、醫(yī)學(xué)科研工作及病歷管理提供支持。
2 電子病歷的前期預(yù)處理
病歷是患者在醫(yī)院診斷治療全過程的原始記錄,貫穿于患者在醫(yī)院就診的各個(gè)環(huán)節(jié)中。由于目前病歷信息的電子化大都附屬于傳統(tǒng)的HIS系統(tǒng),但HIS系統(tǒng)并不等于電子病歷系統(tǒng)。因?yàn)閺碾娮硬v的角度看患者信息應(yīng)該是完整的、集成的.電子病歷系統(tǒng)應(yīng)該能夠以統(tǒng)一的視圖向用戶提供患者的繼承信息;而從傳統(tǒng)的HIS每個(gè)子系統(tǒng)來看,患者信息卻是局部的、分散的。所以要對(duì)電子病歷進(jìn)行全文檢索,首先要建立一個(gè)規(guī)范的、合乎要求的電子病歷描述模型,將分散于HIS系統(tǒng)中的電子病歷信息讀出并轉(zhuǎn)換為統(tǒng)一形式的文件存儲(chǔ)于電子病歷庫中。XML(eXtensible Markup Language,即擴(kuò)展標(biāo)記語言)就是建立并實(shí)現(xiàn)該模型的一個(gè)有效手段。
XML是一種結(jié)構(gòu)化描述語言。其優(yōu)勢(shì)在于,它不僅是一種標(biāo)識(shí)語言,更是一種可以定義描述對(duì)象結(jié)構(gòu)的元語言。XML采用了層次化的面向?qū)ο蟮慕Y(jié)構(gòu)描述方法.非常適合于描述病歷這樣復(fù)雜的內(nèi)容.在表達(dá)能力方面優(yōu)于關(guān)系數(shù)據(jù)庫。
使用XML描述病歷內(nèi)容,要先定義病歷內(nèi)容的結(jié)構(gòu)。在此基礎(chǔ)上實(shí)現(xiàn)以數(shù)據(jù)庫形式存儲(chǔ)的患者信息到病歷結(jié)構(gòu)的轉(zhuǎn)換,從而實(shí)現(xiàn)由以支持日常業(yè)務(wù)管理為目的的數(shù)據(jù)庫描述到以患者為中心的描述。形成的XML文件是病歷存儲(chǔ)管理的基本單位。

3 全文檢索引擎Lucene簡(jiǎn)介
Lucene是Apache軟件基金會(huì)Jakarta項(xiàng)目組的一個(gè)子項(xiàng)目,是一個(gè)開放源代碼的全文檢索引擎工具包,作為一個(gè)優(yōu)秀的全文檢索引擎,其系統(tǒng)結(jié)構(gòu)具有強(qiáng)烈的面向?qū)ο筇卣?。首先是定義了一個(gè)與平臺(tái)無關(guān)的索引文件格式;其次通過抽象將系統(tǒng)的核心組成部分設(shè)計(jì)為抽象類.具體的平臺(tái)實(shí)現(xiàn)部分設(shè)計(jì)為抽象類的實(shí)現(xiàn);此外,與具體平臺(tái)相關(guān)的部分(比如文件存儲(chǔ))也封裝為類,經(jīng)過層層的面向?qū)ο笫降奶幚?,最終達(dá)成了一個(gè)低耦合高效率、容易二次開發(fā)的檢索引擎系統(tǒng)。因此.Lucene得到了非常廣泛的應(yīng)用。
4 系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
4.1 平臺(tái)和開發(fā)環(huán)境簡(jiǎn)介
本系統(tǒng)的平臺(tái)和開發(fā)環(huán)境為:操作系統(tǒng):Windows NT/2O00/XP;開發(fā)語言:Java,JSP;全文檢索開發(fā)庫:Apache Lucene 2.2;Web服務(wù)器:ApacheTomcat 6.0:開發(fā)工具:IBM Eclipse 3.2.0。
4.2 總體架構(gòu)
不電子病歷全文檢索系統(tǒng)主要實(shí)現(xiàn)對(duì)電子病歷的表示、存儲(chǔ)、組織和訪問,即根據(jù)用戶的查詢要求,從電子病歷庫中檢索出相關(guān)信息資料。其中心環(huán)節(jié)是電子病歷內(nèi)容的表達(dá)、信息查詢的獲得以及相關(guān)信息的匹配。整個(gè)系統(tǒng)設(shè)計(jì)為4個(gè)功能模塊:數(shù)據(jù)預(yù)處理模塊、索引建立模塊、全文檢索模塊和用戶界面模塊。各個(gè)模塊的基本功能和模塊之間的邏輯和數(shù)據(jù)關(guān)系如圖1所示。
依圖l中的序號(hào),整個(gè)系統(tǒng)的信息處理流程為:
A.?dāng)?shù)據(jù)預(yù)處理模塊讀入電子病歷的原始數(shù)據(jù)(一般以數(shù)據(jù)庫表的形式儲(chǔ)存在HIS系統(tǒng)中),將原始電子病歷加工為XML文件.然后儲(chǔ)存于XML電子病歷庫中;
B.索引建立模塊讀入XML電子病歷庫中儲(chǔ)存的XML文件.把建立好的全文索引儲(chǔ)存于全文索引庫中;
C.用戶通過用戶界面模塊提出檢索請(qǐng)求,用戶界面模塊調(diào)用全文檢索模塊使用電子病歷的全文索引進(jìn)行檢索,將得到的檢索結(jié)果返回給用戶;
D.用戶查看了檢索結(jié)果中電子病歷的摘要后如果需要進(jìn)一步查看電子病歷的全文,可以通過用戶界面模塊直接根據(jù)檢索結(jié)果中的文檔ID從XML電子病歷庫中獲取全文。
5 系統(tǒng)測(cè)試和評(píng)價(jià)
5,1 測(cè)試環(huán)境
(1)軟件環(huán)境
測(cè)試環(huán)境采用Sun公司的JDK1.5.0,操作系統(tǒng)采用的是微軟的Windows XP SP2。數(shù)據(jù)庫服務(wù)器采用的是Oracle8i及其自帶的JDBC驅(qū)動(dòng)。
(2)硬件環(huán)境
運(yùn)行服務(wù)器采用的CPU為Inter Pentium 3.0E,內(nèi)存2 GB.硬盤160GB。
5.2 測(cè)試結(jié)果
測(cè)試過程中一共選取了3個(gè)和疾病癥狀有關(guān)的關(guān)鍵詞“肥胖”、“腹痛”和“惡心”作為測(cè)試檢索條件數(shù)據(jù),測(cè)試結(jié)果經(jīng)過進(jìn)一步分析計(jì)算后可以得到的數(shù)據(jù)見表1。
注:P@30指前30個(gè)檢索結(jié)果中符合條件的文檔數(shù)
由于測(cè)試數(shù)據(jù)集過大(共約26 000多篇),很難通過人工方式確定全部文檔集中符合條件的文檔數(shù),所以無法有效地計(jì)算查全率;檢索出的命中文檔數(shù)量也比較多,但和搜索引擎一樣,通常只有“First Page”的結(jié)果會(huì)被用戶關(guān)注,因此我們計(jì)算的查準(zhǔn)率只基于前30個(gè)檢索結(jié)果。通過上表可以看出,本系統(tǒng)的查準(zhǔn)率較高,基本達(dá)到了系統(tǒng)設(shè)計(jì)的性能要求。
6 小結(jié)
從測(cè)試結(jié)果可以看出系統(tǒng)滿足設(shè)計(jì)要求,符合功能需要。但是僅僅基于關(guān)鍵字檢索顯然是不夠的,下一步要實(shí)現(xiàn)“智能”全文檢索還需要對(duì)系統(tǒng)進(jìn)行基于語義的檢索功能擴(kuò)展,使檢索結(jié)果不僅僅滿足于與用戶提交的關(guān)鍵字進(jìn)行字面上的匹配。而是檢索出與此概念有關(guān)的、用戶真正想要的信息,以進(jìn)一步提高查全率[31。
【參考文獻(xiàn)】
【1] 1 王曉,羅二平,張健.基于語義的電子病歷智能全文檢索叨.醫(yī)療衛(wèi)生裝備,2008,29(4):45-46.
【2 】薛萬國.XML與電子病歷m.國外醫(yī)學(xué):醫(yī)院管理分冊(cè),2002(1):33—34.
[3] 高少?。诓樵兺卣购途垲惣夹g(shù)的資源檢索系統(tǒng)的研究與應(yīng)用[D1.上海:上海交通大學(xué)碩士學(xué)位論文,2007:10一11.
本站推薦
- 1基于軟件項(xiàng)目管理正向遍歷的智慧解決方案與實(shí)施路徑
- 2基于saas平臺(tái)的采購管理系統(tǒng)助力企業(yè)降本增效
- 3基于java的藥品采購管理系統(tǒng):提升效率降低成本秘訣大
- 4基于JavaEE采購管理系統(tǒng)的高效采購流程與智能決策方案
- 5基于mes生產(chǎn)管理系統(tǒng)實(shí)現(xiàn)高效生產(chǎn)流程與成本精準(zhǔn)控制
- 6基于VS的醫(yī)藥進(jìn)銷存管理系統(tǒng)助你高效管控藥品出入庫
- 7基于vb的庫存管理系統(tǒng)助企業(yè)高效控庫存降成本
- 8基于erp系統(tǒng)的生產(chǎn)制造管理系統(tǒng)助企業(yè)提效降本增競(jìng)爭(zhēng)力
- 9基于java的物流信息管理系統(tǒng):高效精準(zhǔn)提升物流運(yùn)營效率

