申請免費試用、咨詢電話:400-8352-114
AMTeam.org
摘要:
智能化訪問所有的信息--你需要弄清楚尋找什么信息,已知什么信息和如何利用信息。
跨越信息訪問的鴻溝!
by AMT方厚政 編譯
什么是“非結構化數據”,為什么把非結構化數據“結構化”的呼聲越來越高it?非結構化數據大量存在,一般公司80%-90%的信息是非結構化數據。例如Word和PowerPoint文件,電子郵件和公司內部網的時事通訊等都是非結構化數據。員工們常常抱怨當開始一個新項目時總得再次從頭開始,以及抱怨要花費大量時間來查找相關文件。現在,信息技術部門正努力幫助用戶獲取和利用組織里的更多的數據,并把數據同廣泛的組織業(yè)務活動聯系起來。
本文主要討論如何跨越企業(yè)當前于已有的保存在關系數據庫里的面向記錄的數據和存放在電子文檔和文件集里的多如牛毛的網絡非結構化數據之間的鴻溝
。最主要目標是幫助企業(yè)如何充分利用可獲得的信息,從而使企業(yè)行為更為明智:最根本的一點,公司想弄清楚自己已經知道了的信息!但是正如許多公司所發(fā)現的那樣,這并不是件容易的事。
首先,要把大量的原始數據整理的有條有理是件十分困難的事情。但由于特定的用戶或工作并不需要所有的信息,所以IT部門開始時一般關注那些盡管只涉及公司信息存儲空間較易處理部分但有很大特定價值的應用,更糟糕的是,他們?yōu)檫@類應用所設計的信息訪問方法并不適合訪問所有信息這一更大目標。這些傾向會破壞公司在信息訪問方面長期努力的成果。
可訪問公司所有信息的“智能信息訪問方法”大目標要求該方法支持訪問大量不同任務,方面和項目的信息。知識員工沒有時間或不愿意去熟悉許多不同的訪問界面或到不同的地方去收集他們不同業(yè)務活動所需的信息。這是我們需要首先解決的問題,不是嗎?
這成為門戶概念和實施發(fā)展的驅動力。但是,光有門戶是不夠的。這不只是讓所有的文檔通過一個訪問渠道獲得。這一點,我們在通過網絡瀏覽器訪問網站就做到了。
“在所有文檔搜索”及其效率低下的單調的逐頁瀏覽方式很難支持公司的即時需求。其他許多功能包括分類,信息可視化,內容挖掘和分析等功能都需要安裝以優(yōu)化原始搜索。當這個更為豐富的交互式內容訪問工具集安裝后,用戶能以統(tǒng)一的渠道訪問所有的內容就顯得尤為重要了。
但是,公司必須首先搞清楚自己在尋找什么信息,已經有了什么信息和如何利用信息。
一組需要區(qū)分的概念
為了實現更好的信息訪問,許多相關概念應加以區(qū)分。當然,區(qū)分原來的結構化數據(關系數據庫)VS.非結構化數據(文本)很重要,但是,公司也需要處理好內部(公司)VS.和外部(網站)的需要。通常項目需求分析說明了知識管理系統(tǒng)集成了這些信息分塊。
結構化/非結構化:無疑用戶想通過門戶從關系數據庫獲取數據和從內容存儲集里獲取文檔,但是,如果只是提供多頁的鏈接是不夠的。用戶需要內容分析技術來揭示和利用有意義的知識。單純搜索的意義并不大,知識員工需要通過搜索后的“發(fā)現”,即獲悉搜索到的信息所蘊含的意義。
內部/外部:顯然,組織都需要從外部網站上獲取有價值的內容。更難的挑戰(zhàn)在于允許用戶和組織通過公司內部渠道獲取外部信息。例如,某一制藥公司的一個研究人員可能很想通過技術詞匯如醫(yī)藥主題的標題來了解市場消息,或者根據內部的與該制藥公司獨特視角相關的分類法來了解相關市場信息。
內容/上下文:人們普遍認為一篇文檔的各種相關上下文線索有助于幫助用戶確定特定資源是否能為其需要服務。但是由于搜索軟件作為基于內容的訪問工具的流行,基于內容的元數據概念趨向于被局限為“文檔所包含的詞句”的搜索引擎方法。然而,文檔一般以各種關系和結構涉及多個主題,受到多個方面的影響?;趦热莸奶卣靼ㄕZ言,語調,流派,多個和兩個同時發(fā)生的主題,提及的各種項目(人物,地點,組織)等等。這些基于內容衍生的元數據當然能幫助用戶更好地挑選文檔,但是隨著時間的推移,這些元數據可用于開發(fā)利用大型文檔存儲集也變得同樣重要。
運作/戰(zhàn)略:存儲的內容常用來支持特定運營目標(例如,制藥公司的藥品報告文檔)。一旦馬上使用后,這些文檔被保留下來和根據相關規(guī)定或別的原因加以嚴格控制。通常,這種面向未來的知識管理會喪失與遺留文檔相關的機遇。因為“打開”這些營運資料的風險性和許多困難,許多項目只是關注那些容易獲得的信息。這是錯誤的。尋找釋放這些被“封存”起來的信息的功用的方法,從而滿足支持獲取完整知識的要求是很重要的。
對許多公司來說,進行出售其大型IT項目的決策時感到很為難,而且關注象統(tǒng)一信息訪問方法這樣的最終目標似乎有一定風險。但是,我們都知道“知識就是力量”。大部分的CIO和CEO對那些生成后對組織就沒有用的信息十分反感,這將導致競爭性優(yōu)勢的喪失和生產率的下降。
對于有目光長遠的組織,解決辦法是迭代的實施方法。把智能信息訪問方法用于一個接一個的特定項目,充分利用被廣泛使用的工具來訪問和使用各種來自企業(yè)各個部門的信息。
作者聯系方式:houzheng.fang@amteam.org
|