2.3 新技術(shù)方法
這里所論的技術(shù)方法主要包括:數(shù)據(jù)挖掘算法、數(shù)據(jù)預(yù)處理方法、知識表示方法、知識評價(jià)方法、知識優(yōu)化方法等。
按照知識發(fā)現(xiàn)的發(fā)展歷程,我們來展開對相應(yīng)的技法的描述如下所示:
由理論基礎(chǔ)、內(nèi)在認(rèn)知機(jī)理和新結(jié)構(gòu)模型派生出十種新技術(shù)方法。即:1) 源于KDD*的挖掘關(guān)聯(lián)規(guī)則的Maradbcm算法;2) 基于遺傳算法與梯度下降法聚類算法;3) 基于事實(shí)與規(guī)則的KDK*歸納發(fā)現(xiàn)新算法;4) 源于KD(D&K)的關(guān)聯(lián)規(guī)則的自動(dòng)評價(jià)系統(tǒng)方法;5) 基于小波神經(jīng)網(wǎng)絡(luò)的混沌模式的挖掘算法;6) 因果關(guān)聯(lián)規(guī)則的挖掘算法;7) 源于DFSSM的Web文本分類挖掘算法;8) 源于DFSSM的Web文本聚類挖掘算法;9) 圖象信息挖掘算法(相似模式等);10)源于KD(D&K)的分布式數(shù)據(jù)庫(水平、垂直分片)關(guān)聯(lián)規(guī)則挖掘算法。這些用于處理結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)和半結(jié)構(gòu)化數(shù)據(jù)和知識庫的知識發(fā)現(xiàn)的新技法,經(jīng)與原有技法的大量的實(shí)驗(yàn)對比,均表現(xiàn)出較大的優(yōu)勢,并在不同程度上解決了一些固有的問題;其表現(xiàn)出來的高效性和可擴(kuò)展性是由KDTICM這一新理論決定的。
新技術(shù)方法的新穎性與先進(jìn)性:限于篇幅限制,下面僅給出四個(gè)例子加以說明。
2.3.1源于KDD*的挖掘關(guān)聯(lián)規(guī)則的Maradbcm算法(以下簡稱M算法)
基于雙庫協(xié)同機(jī)制和KDD*模型,我們提出了一種全新的挖掘關(guān)聯(lián)規(guī)則的M算法,其主要步驟如下:
數(shù)據(jù)預(yù)處理:這里主要是用戶選擇真實(shí)數(shù)據(jù)庫,對真實(shí)數(shù)據(jù)庫中的連續(xù)屬性進(jìn)行離散化,形成發(fā)掘數(shù)據(jù)庫(n個(gè)表,table1,table2,…,tablen)
調(diào)用啟發(fā)協(xié)調(diào)算法的步驟
x=2
for every riÎKx
求取intensity(ri)
if intensity(ri)
delete ri from Kx
else
KDD_process(rx) //激發(fā)KDD進(jìn)程進(jìn)行定向挖掘
x:=x+1
求取
從中產(chǎn)生Kx
if Kx¹f
for every riÎKx
求取intensity(ri)
if intensity(ri)i在可達(dá)矩陣中所對應(yīng)的元素等于1 then
delete ri from Kx
else
KDD_process(rx) //激發(fā)KDD進(jìn)程進(jìn)行定向挖掘
轉(zhuǎn)步驟10)
顯示新產(chǎn)生的規(guī)則
結(jié)束
procedure KDD_process(rx:array of Integer)
execSQL() // 執(zhí)行SQL語句進(jìn)行定向搜索
calculate support(ri), confidence(ri), LS(ri)
if support(ri)>minSup and confidence(ri)>minCon and LS(ri)>minLS then
interruptive_coordinator(ri) // 調(diào)用維護(hù)型協(xié)調(diào)器,進(jìn)行重復(fù)、冗余、矛盾、從屬、循環(huán)等的處理
該項(xiàng)內(nèi)容已獲國家發(fā)明專利《一種基于雙庫協(xié)同機(jī)制的KDD*方法及系統(tǒng)》(ZL 01145080.0)(見附件 )。
上一頁 [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] 下一頁
|