1.3 首次提出KDK
與雙基融合機制相關,首次獨立提出基于知識庫的知識發(fā)現(xiàn)(KDK),即從海量的知識庫中發(fā)現(xiàn)更深層次的知識的非平凡過程。這是至今在國內外尚待開拓的專題,它的成功將直接作用于知識獲取和大型知識庫的構建,不僅為海量數據挖掘中領域知識的參與奠定了基礎,也對人工智能中的其它一些重要問題(如智能系統(tǒng)等)的實現(xiàn)具有重要意義。針對知識庫里的事實,采用歸納學習方法產生歸納假設,再用卡爾納普的歸納邏輯進行假設的驗證與評價;針對知識庫里的規(guī)則,采用廣義概念格方法產生歸納假設,再用柯恩的歸納邏輯進行假設的驗證與評價。該項內容已正式申報國家發(fā)明專利《一種融入R型協(xié)調器的KDK系統(tǒng)》(200510086965.8)、《一種融入R型與S型協(xié)調器的KDK系統(tǒng)》(200510086964.3)和《一種基于雙基融合機制的的KDK*系統(tǒng)》(200510086966.2)(見附件 )。
1.4與相關工作的對比分析
當我們在1997—2000年做出上述研究成果后,我們花費大量時間仔細查找該領域國際著名學者發(fā)表論文的字里行間中有無類似的學術思想,并加以對比分析,其結果如下:
1) 1992年, Gregory Piatetsky-Shapiro等提出“采用領域知識輔助初始發(fā)現(xiàn)的聚焦”,“限定性搜索”的思想.
雙庫協(xié)同原理(機制). 在知識發(fā)現(xiàn)的過程中,在知識庫與數據庫特定的構造下, 知識庫中素結點與數據庫中數據子類結構的層之間一一對應, 即結構對應定理. 為 “定向搜索”與“定向挖掘”奠定了可實現(xiàn)性的理論基礎與方法. 此外, 基于結構對應關系, 我們從認知心理學的“創(chuàng)見意向”與“心理信息修復”出發(fā), 構造了“啟發(fā)型協(xié)調器”, 這就具體實現(xiàn)了領域知識(基礎知識庫)——知識短缺——創(chuàng)見意向——領域知識輔助聚焦(原來靠用戶感興趣度實施聚焦)——系統(tǒng)自主形成定向挖掘.
2) 1993年, J. P. Yoon與L. Kerschberg提出“知識與數據庫同步進化的思想”.
我們從認知系統(tǒng)的角度, 構造了“維護型協(xié)調器”, 每從數據庫中發(fā)現(xiàn)一條新知識都要實時地到知識庫中進行定向搜索, 以處理冗余、重復、矛盾、循環(huán)與從屬現(xiàn)象, 進行“實時維護”.
反之, 數據庫被動態(tài)擴張后, 根據我們發(fā)現(xiàn)的“信息擴張原理(機制)” ——揭示了動態(tài)挖掘進程中的參數演化規(guī)律(即參數演化定理)、突變規(guī)律,對知識的進化、評價與可理解性處理等提出了能行可判定方法.
3) 1996年, Sarabjot. S. Anand等提出“用戶的先驗知識與先前發(fā)現(xiàn)的知識可以耦合到發(fā)現(xiàn)過程中”的思想.
“雙基融合原理(機制)”揭示了兩個截然不同的知識發(fā)現(xiàn)(即一個是基于數據庫的KDD, 另一個是基于知識庫的KDK)過程模型邏輯等價關系(定理). 據此, KDD與KDK可以耦合在新知識發(fā)現(xiàn)過程模型KD(D&K)中(這時, KDK歸納出的假設可以到KDD中進行挖掘驗證). 另一層意思是通過雙庫協(xié)同原理(機制), 對先前發(fā)現(xiàn)的知識, 不斷地以用戶的先驗知識(背景知識)為參照系, 在知識發(fā)現(xiàn)過程中加以耦合.
結論:迄今為止,人工智能與計算機科學界,對知識發(fā)現(xiàn)這一年輕學科尚無人系統(tǒng)與可實現(xiàn)地研究過知識發(fā)現(xiàn)系統(tǒng)(過程)的內在認知機理。我們的工作另辟蹊徑,從一開始就定位在認知科學的全新理念上,改變固有的學術思想,并導致了下述的基于內在認知機理的知識發(fā)現(xiàn)理論KDTICM的產生。
2. 原創(chuàng)性技術發(fā)明點(創(chuàng)新點)
2.1 三個機制的實現(xiàn)技術 2.1.1 雙庫協(xié)同機制的實現(xiàn)技術
雙庫協(xié)同機制主要是利用認知心理學的兩個重要特征(即“創(chuàng)建意向”與“心理信息修復”)來研究知識發(fā)現(xiàn)的兩個重要主題,從而對知識發(fā)現(xiàn)的過程進行改造,該機制通過兩個協(xié)調器來實現(xiàn)。具體而言:(1)通過模擬“創(chuàng)建意向”來實現(xiàn)系統(tǒng)自主發(fā)現(xiàn)知識短缺,實施啟發(fā)式的聚焦(除用戶感興趣式的聚焦外);(2)通過模擬“心理信息修復”來實現(xiàn)知識庫的實時維護。該項內容已獲國家發(fā)明專利《一種基于雙庫協(xié)同機制的KDD*方法及系統(tǒng)》(ZL 01145080.0)(見附件 )。
1) 啟發(fā)協(xié)調算法與啟發(fā)型協(xié)調器
啟發(fā)型協(xié)調器的功能是模擬“創(chuàng)建意向”這一認知心理特征,從而實現(xiàn)“主動推送”,即系統(tǒng)自身發(fā)現(xiàn)知識短缺。在經典KDD進程中,系統(tǒng)的聚焦通常是由用戶提供感興趣方向,KDD沿此方向進行挖掘。但如果僅沿此方向進行,大量數據中的潛在有用的信息往往被用戶忽略。為幫助KDD盡可能多的搜索到對用戶有用的信息,以彌補用戶或領域專家自身的局限性,提高機器的認知自主性,我們構造了啟發(fā)型協(xié)調器。這樣,知識發(fā)現(xiàn)系統(tǒng)在原有的用戶聚焦的基礎上,又增加了系統(tǒng)自身提供聚焦方向的功能。啟發(fā)型協(xié)調器是通過啟發(fā)協(xié)調算法來實現(xiàn)的,算法的奠基是等價定理與結構對應定理; 圖2將給出該算法的流程圖:
圖2 啟發(fā)協(xié)調算法流程圖
上一頁 [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] 下一頁
|