2.4.2 基于信息挖掘的智能決策支持系統(tǒng)IDSSIM
該項(xiàng)內(nèi)容已獲國家發(fā)明專利《一種基于信息挖掘的智能決策支持系統(tǒng)構(gòu)造方法》(ZL 03105330.0)(見附件 )。
1) 總體結(jié)構(gòu)(如圖17所示)
2) 主要模塊與功能
粗略地講:IDSSIM = DM + WM + KAS + RM
上式中,DM:數(shù)據(jù)挖掘(Data Mining),在此我們主要指知識(shí)發(fā)現(xiàn)創(chuàng)新技術(shù)中的結(jié)構(gòu)化數(shù)據(jù)的挖掘即KDD*系統(tǒng);
WM:Web挖掘(Web Mining),主要包括基于Web的文本挖掘、用戶訪問日志挖掘及Web結(jié)構(gòu)挖掘;
KAS:交互式知識(shí)獲取構(gòu)件(Knowledge Acquirement System),主要用于領(lǐng)域?qū)<抑R(shí)的歸納獲取;
RM:推理機(jī)構(gòu)件(Reasoning Machine),主要由智能決策支持系統(tǒng)進(jìn)行推理時(shí)使用。
以上四部分通過綜合知識(shí)庫和Web知識(shí)庫貫穿在一起。
(1) 結(jié)構(gòu)化數(shù)據(jù)挖掘模塊(KDD*系統(tǒng))。主要實(shí)現(xiàn)對(duì)結(jié)構(gòu)化數(shù)據(jù)進(jìn)行的挖掘過程;我們分兩點(diǎn)進(jìn)行說明:
a. 新的數(shù)據(jù)挖掘結(jié)構(gòu)模型——KDD*。簡單的說,KDD*=KDD+雙庫協(xié)同機(jī)制,所
謂雙庫協(xié)同機(jī)制,即構(gòu)建數(shù)據(jù)庫與基礎(chǔ)知識(shí)庫的內(nèi)在聯(lián)系“通道”,從而用基礎(chǔ)知識(shí)庫去制約與驅(qū)動(dòng)KDD的發(fā)掘過程,改變KDD固有的運(yùn)行機(jī)制,在結(jié)構(gòu)與功能上形成了相對(duì)于KDD而言的一個(gè)開放的、優(yōu)化的擴(kuò)體。具體實(shí)現(xiàn)是通過啟發(fā)式構(gòu)件和中斷式構(gòu)件完成的。
b. 數(shù)據(jù)挖掘過程中的集成算法庫:數(shù)據(jù)庫經(jīng)預(yù)處理后形成挖掘數(shù)據(jù)庫,挖掘數(shù)據(jù)庫是本部分的挖掘基礎(chǔ)。在本部分中,我們?cè)O(shè)計(jì)了一個(gè)集成挖掘算法庫,此庫集成于決策支持系統(tǒng)的模型庫中,其中針對(duì)幾類主要的知識(shí)類型,對(duì)應(yīng)的聚集一些有效的挖掘算法;同時(shí)該算法庫具有可擴(kuò)展性特征。算法庫連接于一個(gè)接口引擎,接口引擎在系統(tǒng)控制器的作用下根據(jù)用戶需求選擇合適的發(fā)掘方法,進(jìn)行相應(yīng)的工作。挖掘出的知識(shí)放入衍生知識(shí)庫。
(2) Web挖掘模塊。主要實(shí)現(xiàn)對(duì)非結(jié)構(gòu)化、復(fù)雜的信息(包括文本信息、用戶訪問日志信息)進(jìn)行的發(fā)掘過程;
這里主要包括兩大部分,一是文本信息的挖掘,二是對(duì)用戶訪問日志信息的挖掘。對(duì)于文本信息的挖掘,我們主要利用小波分析、潛在語義索引、概念格等方法地集成和融合,對(duì)于用戶訪問日志信息的挖掘,我們將利用序貫?zāi)J竭M(jìn)行挖掘處理。
另外考慮到Web信息的知識(shí)挖掘需要實(shí)時(shí)從Web網(wǎng)絡(luò)中獲取復(fù)雜類型信息,所以我們將結(jié)合智能搜索引擎技術(shù)從Internet上檢索得到初始數(shù)據(jù)集,經(jīng)過預(yù)處理后形成挖掘數(shù)據(jù)集合以便進(jìn)行后續(xù)挖掘處理。
(3) 交互式知識(shí)獲取模塊。它為用戶提供了友好的交互界面,使系統(tǒng)可以較方便的獲取專家知識(shí)。
(4) 推理機(jī)模塊。它將針對(duì)不同問題集形成相對(duì)應(yīng)的決策樹,以便使用決策樹進(jìn)行推理進(jìn)程。在推理機(jī)實(shí)現(xiàn)過程中將集成各種有效的推理機(jī)制(例如案例推理等),為對(duì)決策問題進(jìn)行問題求解,產(chǎn)生相應(yīng)的解決方案。
3) 動(dòng)態(tài)知識(shí)庫系統(tǒng)
在以上各模塊的基礎(chǔ)上,知識(shí)庫的提升和融合將貫穿整個(gè)過程。在此過程中,對(duì)于內(nèi)部數(shù)據(jù)挖掘而言,知識(shí)庫經(jīng)過了基礎(chǔ)知識(shí)庫、衍生知識(shí)庫、合成知識(shí)庫、擴(kuò)展知識(shí)庫的不斷提升過程。基礎(chǔ)知識(shí)庫中存放的是初始知識(shí)和專家領(lǐng)域知識(shí),該知識(shí)庫通過一個(gè)知識(shí)獲取構(gòu)件連接在人機(jī)對(duì)話部件,專家可隨時(shí)加入新的領(lǐng)域知識(shí),因此這個(gè)知識(shí)庫是一個(gè)動(dòng)態(tài)的知識(shí)庫;衍生知識(shí)庫中存放的是KDD*發(fā)現(xiàn)的新知識(shí),衍生知識(shí)庫和基礎(chǔ)知識(shí)庫通過冗容性等處理形成合成知識(shí)庫。
對(duì)于Web信息挖掘而言,將構(gòu)造一個(gè)Web知識(shí)庫,并且最終在該智能決策系統(tǒng)中與內(nèi)部知識(shí)發(fā)現(xiàn)過程形成的綜合知識(shí)庫進(jìn)行融合,即把不同知識(shí)表示的、異構(gòu)的、不同源的知識(shí)相融合,形成最終的知識(shí)發(fā)掘知識(shí)庫。
上一頁 [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] 下一頁
|