復(fù)雜供水系統(tǒng)建模與控制新方法 :
本課題是國家經(jīng)委資助的節(jié)能研究項目。對供水系統(tǒng)按管網(wǎng)、水廠、過程三級進行遞階控制。研究的完整性,此前未見先例。研究雖然針對供水系統(tǒng),但從中提出的控制理論新概念、新方法卻具有普遍意義。
管網(wǎng)級的控制任務(wù)是在滿足供水負荷要求的條件下,調(diào)度各水廠,分配負荷,達到最大限度節(jié)能的目的。過去的管網(wǎng)模型,一般是純統(tǒng)計模型,其回歸系數(shù)無物理意義,因而只能進行水負荷量的分時預(yù)報,不能作分地預(yù)報,這又正是管網(wǎng)調(diào)度的關(guān)鍵。也有純機理模型,但它只能用于簡單的樹狀管網(wǎng),不具普遍意義。本研究提出“宏觀統(tǒng)計機理模型”,采用定性合成,定量分析的方法,綜合了上述兩種模型的優(yōu)點[1]。針對模型中有約束參數(shù)估計的困難,研究了模型統(tǒng)計擬合誤差和基本模型擬合誤差下降保持一致的條件,并在此基礎(chǔ)上提出將參數(shù)最小二乘遞推估計與“基本誤差調(diào)試法”相結(jié)合求解問題[2],最終解決了建模中的維數(shù)高、非線性、信息不充分等難題。此模型每個節(jié)點流量可計算得出,它代表一個區(qū)域的用水負荷。利用此模型,加上對多層遞階預(yù)報的改進,滿意地解決了復(fù)雜管網(wǎng)水負荷量的分時分地預(yù)報[3]。接著,對模型的隱含特征、非凸性等適當(dāng)處理,采用Tamura目標協(xié)調(diào)法,得出了更為簡便的離線最優(yōu)控制算法。采用離線算法與實時修正相結(jié)合,保證了控制的精度和實時性,滿意地實現(xiàn)了管網(wǎng)的動態(tài)遞階控制[4]。
水廠水量控制的任務(wù)是根據(jù)管網(wǎng)級的調(diào)度指令,協(xié)調(diào)廠內(nèi)各生產(chǎn)過程的運行,達到降低生產(chǎn)成本的目的。研究考慮了利用清水池的儲水作用進行電負荷的調(diào)峰,并利用其水位變化使泵站得到更有利的組合運行方式,這給各生產(chǎn)過程又加上一個強耦合,問題是一個難于按子系統(tǒng)或按時間作簡單分解的復(fù)雜系統(tǒng)。研究考慮到水質(zhì)處理眾多過程對水量控制的影響可以集中為一個具有傳輸滯后τ的水流過程,此過程把取水、清水池儲水、送水聯(lián)系起來,叫作“關(guān)聯(lián)過程”。只要對τ進行在線辯識并適時修正水量控制模型就可將水質(zhì)控制過程與水量控制過程解耦[5-6]。這樣的時延動態(tài)過程優(yōu)化,已有算法尚無法求解。研究中提出“后效型微分動態(tài)規(guī)劃”,推導(dǎo)了算法,證明了一定條件下的收斂性,解決了Bellman以來未曾解決的一般時延動態(tài)過程尋優(yōu)問題[7]。為了追求更高的效益,又對水廠這種概周期過程的周期初態(tài)尋優(yōu),提出一種“虛擬尋優(yōu)法”[8]。為了克服模型與實際系統(tǒng)差異帶來的不良后果,研究了閉環(huán)遞階控制,提出“一種自適應(yīng)雙反饋遞階控制系統(tǒng)”[9-10]。利用運行參數(shù)快時變與系統(tǒng)特征參數(shù)慢時變的巨大差異,用開環(huán)算法得到閉環(huán)遞階控制的效果,計算量少,收斂性好,解決了閉環(huán)控制實時性問題。
泵站控制決策方面,在一般條件下討論了泵站選泵與調(diào)速問題,其主要困難在于離散變量與連續(xù)變量混合
作用。為此也采用了遞階思想,分兩層尋優(yōu)。此方法為一般混合規(guī)劃問題提供了新思路。此外,在信息不充分條件下,提出用校正式線性逼近法對水泵參數(shù)進行在線辯識,實現(xiàn)自適應(yīng)控制[11-12]。
以上理論研究成果部分地在現(xiàn)代化水廠中得到應(yīng)用,部分解決了只引進硬件沒有優(yōu)化控制軟件的問題。論文發(fā)表后,大多被別的研究所引用,部分被EI(美)和“科學(xué)技術(shù)速報”(日)摘引,被眾多論文集全文重復(fù)轉(zhuǎn)載。整個研究經(jīng)省級鑒定認為達到國際先進水平,部分居國際前沿地位。2005年,項目整體獲“世界優(yōu)秀學(xué)術(shù)成果金獎”,部分論文獲中國記錄年鑒匯編委員會的“中國科學(xué)發(fā)展優(yōu)秀學(xué)術(shù)成果一等獎”等各種獎項。
發(fā)表的論文:
[1] 段文澤,劉士榮.城市供水系統(tǒng)建模方法研究[J].系統(tǒng)工程理論與實踐,1988,8(3):17-27.
[2] 劉士榮,段文澤.大規(guī)模管網(wǎng)系統(tǒng)的有約束參數(shù)估計[J].重慶建筑工程學(xué)院學(xué)報,1987,(3):18-30.
[3]段文澤,劉士榮.城市供水系統(tǒng)負荷量的分時分地預(yù)報.中國系統(tǒng)工程學(xué)會.發(fā)展戰(zhàn)略與系統(tǒng)工程[C].北京:學(xué)術(shù)期刊出版社,1987:573-579.
[4]段文澤,劉士榮.大規(guī)模供水系統(tǒng)的動態(tài)遞階最優(yōu)控制[J].系統(tǒng)工程理論與實踐,1990,10(6):39-47.
[5]段文澤,楊少林.水廠生產(chǎn)過程最優(yōu)協(xié)調(diào)控制[J]. 中國給水排水,1990,6(3):28-31.
[6]段文澤,李遠樹.大系統(tǒng)控制的關(guān)聯(lián)過程協(xié)調(diào)模型及優(yōu)化算法[J].系統(tǒng)工程學(xué)報,1992, 7(2): 106-115.
[7]段文澤,楊少林.后效型微分動態(tài)規(guī)劃及其應(yīng)用[J].控制與決策,1990,Suppl.1:13-18.
[8]李遠樹,段文澤.無限長概周期過程的虛擬尋優(yōu)控制[J].信息與控制,1991,20(4):11-15.
[9]段文澤,李遠樹.一種自適應(yīng)雙反饋遞階控制系統(tǒng)[J].自動化學(xué)報,1993,19(2):146-153.
[10]DUAN Wenze, LI Yuanshu. An Adaptive Hierarchical Control System with Dual Feedback [J].Chinese J. of Automation, ALLERTON PRESS,INC. 1994,6(1).
[11]段文澤,李遠樹.給水泵站最優(yōu)調(diào)度策略與通用程序[J].中國給水排水,1987,3(6):3-9.
[12]段文澤,楊少林.泵站調(diào)速節(jié)能的自適應(yīng)控制[J].電氣傳動,1990,20(5):38-45.
電氣傳動控制系統(tǒng)及其工程設(shè)計—專著特色與創(chuàng)新介紹 :
本書的特色有三:
一是內(nèi)容的新穎性,力圖反映當(dāng)時電氣傳動領(lǐng)域的最新進展,同時也包括作者本人的工程實踐和研究成
果;
二是強調(diào)實踐性,但又不失系統(tǒng)性,重點放在工程實際問題上,安排作者曾經(jīng)完成的工程實例[1]貫穿全書;
三是內(nèi)容的廣泛性,不僅研究單機自動化問題,還涉及與電氣傳動有關(guān)的生產(chǎn)過程及大系統(tǒng)自動控制。這種風(fēng)格的著作在國內(nèi)尚屬少見。
本書目標是作為工業(yè)自動化專業(yè)高年級大學(xué)生、研究生、教師以及工程師從事研究工作的參考。著作出版后被一些名牌大學(xué)大量引用于教材中,被一些作者在研究工作中頻繁引用。專著于1996年獲電子工業(yè)部二等獎,相關(guān)的一些論文也曾獲省市科協(xié)、全國電氣自動化學(xué)術(shù)年會優(yōu)秀論文獎、中國管理科學(xué)理論成果特等獎、世界重大學(xué)術(shù)成果特等獎等多個獎項。有的論文被《中國學(xué)術(shù)大百科全書》、《世界重大學(xué)術(shù)成果精選》等多種典籍全文轉(zhuǎn)載。
在“電氣傳動方案選擇與參數(shù)計算”一章中,分析了負載與電機配合工作的穩(wěn)定性、調(diào)速特性、過渡過程特性、可靠性和經(jīng)濟指標等基本問題。按照不同負載特性,討論了機床傳動、軋制機械、起重機械、透平機械等典型生產(chǎn)機械的工藝特點、傳動方案選擇和參數(shù)計算問題,其中包括了作者工程實踐的總結(jié)[1]。這些生產(chǎn)實踐知識在國內(nèi)文獻中,還很少看見系統(tǒng)的論述。
在“調(diào)速系統(tǒng)”一章里,對“調(diào)速范圍”提出了更加符合生產(chǎn)實際的定義,不僅從靜差率的觀點看,還動態(tài)地從轉(zhuǎn)速不勻度去考察,給出了計算調(diào)速范圍的方法[2-3],用以指導(dǎo)調(diào)速系統(tǒng)研究。在線性系統(tǒng)工程設(shè)計方法的基礎(chǔ)上,進一步討論了非線性校正、變結(jié)構(gòu)系統(tǒng)設(shè)計等問題。研究表明,突破線性系統(tǒng)設(shè)計的框框,對改進系統(tǒng)性能往往能收到更顯著的效果,如基于相平面分析提出的“浮動死區(qū)”微分反饋方案,就大大提高了系統(tǒng)的快速性[4],“按速差變換結(jié)構(gòu)”的方案[5],不但提高了系統(tǒng)性能,還簡化了結(jié)構(gòu)。書中討論了數(shù)字仿真與計算機輔助設(shè)計,提出一些相應(yīng)的設(shè)計方法[6-8] ,對解決非線性系統(tǒng)、多變量系統(tǒng)等問題是有效的。
在“位置隨動系統(tǒng)”一章里,對不同構(gòu)成方案進行了歸納分類,討論了實現(xiàn)這些方案的特殊部件選擇問題。除位置輸入、速度輸入、加速度輸入外,對于一般輸入,對于擾動作用下的穩(wěn)態(tài)設(shè)計討論較細。比較了不同系統(tǒng)結(jié)構(gòu)和動態(tài)設(shè)計方法,并在此基礎(chǔ)上提出一種帶速差校正的復(fù)合控制隨動系統(tǒng)設(shè)計方法[9],能較好地兼顧運行的平穩(wěn)性和快速性。提高低速性能是隨動系統(tǒng)中的重要特殊問題,本書討論了力矩擾動、干摩擦影響和減速器彈性影響,綜合了已有國外文獻和作者的研究結(jié)果[2-3]。本章結(jié)束了貫穿全書的工程實例[1][9],給出了相應(yīng)的設(shè)計圖,具有較強的實踐性和解決問題的獨創(chuàng)性。這是一些名牌大學(xué)編寫教材時引用較多的一章。
“生產(chǎn)過程與大系統(tǒng)最優(yōu)控制”是電氣傳動系統(tǒng)應(yīng)用中必然遇到的問題,專列一章進行討論,涉及最短時間控制、最小能耗控制和多模態(tài)控制等。具體討論了起重機械和風(fēng)機水泵優(yōu)化控制的實例。國內(nèi)外的電梯控制一直把運行時間最短作為優(yōu)化目標,作者研究了平穩(wěn)快速起制動條件下的最小能耗控制規(guī)律,以后又進一步完善了這一研究,比較了兩種控制規(guī)律的能耗,形成完整的成果[10]。風(fēng)機水泵類的能耗占有很大比重,對其最優(yōu)節(jié)能控制規(guī)律卻一直沒有深入的研究。本章“給水泵站最優(yōu)節(jié)能控制”一節(jié)總結(jié)了作者在這方面的研究[11-13],后來又進一步研究了節(jié)能的自適應(yīng)控制問題[14]。對大系統(tǒng)最優(yōu)控制,國內(nèi)還很少成熟的應(yīng)用,本書選擇了作者仿真研究的一個典型實例,用以論述建模、預(yù)報和控制中若干復(fù)雜問題的處理方法,可參考“復(fù)雜供水系統(tǒng)建模與控制新方法”一文,見:
“可靠性設(shè)計與系統(tǒng)調(diào)試維修”一章在扼要介紹可靠性理論基礎(chǔ)上給出了設(shè)計的工程實例。以作者的工程實踐為主線,對提高可靠性的具體措施進行了討論,包括:干擾抑制[15]、生產(chǎn)過程檢查與質(zhì)量控制、系統(tǒng)調(diào)試、故障診斷與系統(tǒng)保護等。扼要介紹了故障自診斷與自保護問題。作者在實踐中形成的調(diào)試基本方法后來在引進項目的大型變頻裝置調(diào)試中發(fā)揮了重要作用,保證了現(xiàn)代化水廠的生產(chǎn)與節(jié)能。
發(fā)表的相關(guān)論文
[1] 段文澤. 錯位無環(huán)流調(diào)速-電軸系統(tǒng)[J].重型機床,1980,(1):43-50.
[2] 段文澤. 寬調(diào)速系統(tǒng)調(diào)速范圍的分析研究[J].四川機械,1982,(12):18-27.
[3] 段文澤等. 調(diào)速系統(tǒng)低速性能的分析研究[J].電氣傳動,1983,13(4):21-31.
[4] 段文澤,姚加飛.快速系統(tǒng)中電流變化率非線性控制的研究報告[J].重慶建筑工程學(xué)院學(xué)報,1983,5(2):33-55.
[5] 李遠樹等(在段文澤指導(dǎo)下完成).按速差變換結(jié)構(gòu)的調(diào)速系統(tǒng)[J].電氣傳動,1987,17(5):1-5.
[6] 童明叔. 關(guān)于飽和非線性特性仿真的商榷[J].信息與控制,1985,14(4).
[7] 童明叔. 調(diào)壓調(diào)磁速度控制系統(tǒng)的計算機輔助設(shè)計[J].電氣傳動,1988,18(1).
[8] 童明叔. 在控制系統(tǒng)設(shè)計中應(yīng)用單純形法尋優(yōu)時應(yīng)注意的問題[J].重慶建筑工程學(xué)院學(xué)報,1988,10(1).
[9] 段文澤. 按速差校正的復(fù)合控制隨動系統(tǒng)[J].電氣傳動,1989,19(3):23-29,52.
[10] 段文澤. 電梯兩種控制規(guī)律設(shè)計及其對比研究[J].電氣傳動,1996,26(3):32-39.
[11] 段文澤. 供水泵站最優(yōu)節(jié)能控制策略研究.第三屆全國電氣自動化學(xué)術(shù)年會論文集[C].天津.1986:684-689.
[12] 段文澤等. 給水泵站最優(yōu)調(diào)度策略與通用程序[J].中國給水排水,1987,3(6):3-9.
[13] 姚加飛,李遠樹,段文澤.供水泵站微機最優(yōu)實時控制系統(tǒng)[J].重慶建筑工程學(xué)院學(xué)報,1987,9(4):57-64.
[14] 段文澤等. 泵站調(diào)速節(jié)能的自適應(yīng)控制[J].電氣傳動,1990,20(5):38-45.
[15] 段文澤. 直流電子拖動系統(tǒng)中的抗干擾問題[J].機床通訊,1976,(4):21-40.
JX-1機器翻譯系統(tǒng)試驗研究報告 :
段文潤1 段文澤2 段文滋3
(1 四川大學(xué) 2 重慶大學(xué) 3 瀘洲市六中)
摘要:JX-1 機器翻譯系統(tǒng)以“隱詞形論”為基礎(chǔ)來排除歧義,將自然語言作成一種“梯級表達”形式,用以提高語法和翻譯規(guī)則的覆蓋面。在知識表達方面采用框架式矩陣表達并采用常量和變量相結(jié)合來標志語法、語義和語境特征。語法分析采用隱詞形分類和句法分析交錯進行、相互反饋的方法。在與規(guī)則匹配時采用解耦智能搜索解決“組合爆炸”問題。用PROLOG編程時綜合出一種程序全局結(jié)構(gòu)優(yōu)化模式,大大減少了存儲空間的消耗;采用了指針重定位防止程序出錯的措施。對系統(tǒng)的試驗表明,翻譯達到了較為理想的準確度。
注: 此項工作中,段文潤負責(zé)機器翻譯的語言學(xué)基礎(chǔ)及工程框架,段文澤及段文滋負責(zé)工程實現(xiàn)及程序編寫。參與此項工作的還有段之宓、段琦麗、段鷹,荷芒等人。
1 JX-1機譯試驗課題的背景
機器翻譯始自上世紀四十年代,已有60余年的歷史。目前正進入初步實用階段。其質(zhì)量只能達到30—40%的合格率。提高質(zhì)量的瓶頸在于語言知識的粒度不夠細。對于“細度”問題,上世紀70年代末—80年代,曾提出過多種語法理論。這些理論重視詞匯及短語的“復(fù)雜特征”(即“細度”),為機器翻譯可預(yù)期的商業(yè)實用指明了正確的道路。然而,它們過多地把注意力放到了復(fù)雜特征知識的表達及相關(guān)的演算上。對復(fù)雜特征應(yīng)是一些什么特征及它們的排歧機制本身重視不夠。此后流行的語料庫語言學(xué)及統(tǒng)計方法為機器翻譯所需知識的獲取開辟了半自動化的道路,近年的機器詞典又為詞典的義素化打下了基礎(chǔ)。然而,它們對復(fù)雜特征的全面細化及其排歧機制仍缺乏商用性的貢獻。因此,這個問題至今仍是有待突破的瓶頸。我們在上世紀80年代末也曾獨立提出了基于復(fù)雜特征的“隱詞形論”框架 [1-2]。此后,於1994—1998年曾經(jīng)用以進行過一次受限詞典與受限句型的英—漢機譯試驗(JX—1系統(tǒng)),取得了良好的效果,本文將作簡要介紹。JX-1系統(tǒng)采用規(guī)則匹配方法,進一步的工作可將它與統(tǒng)計方法相結(jié)合,通過機器自學(xué)習(xí),以取得規(guī)則更大的覆蓋面。
2 JX-1采用的語言理論---隱詞形論及隱詞形語法
2.1什么是隱詞形?
簡單說,就是帶有功能、語義、語境信息的詞形。
一般認為,man是一個詞。但是,還有man’s, men等形式。這便是詞的詞形(wordform)。man可以出現(xiàn)在不同的語境中,從而表現(xiàn)出它潛在具有的各種功能和語義,這便是隱詞形。例如:wife and man中man的意義是“丈夫”。又如1) It’s a man.和 2)The car is drived by a man 。1) 里man的功能是作表語,而2)中 man的功能是被動主體。此man非彼man。
2.2什么是隱詞形語法?
隱詞形類別的劃分可粗可細。最粗的是一般講的詞類,最細的是能排除詞形之一切功能、語義歧義的類別。所謂語法規(guī)則,乃是以詞形的類作定義域的多元一次代數(shù)函數(shù)(即以詞形的類充當(dāng)規(guī)則的項)。類分得愈細,函數(shù)值(短語或句子)的岐義愈少。如果把類劃分到最小等價類,歧義便接近於零,這便是我們提出的隱詞形語法,F(xiàn)以詞man相關(guān)的幾條短語規(guī)則作簡單的比較:
2.2.1 Chomsky式短語結(jié)構(gòu)語法基本上以傳統(tǒng)的詞類作規(guī)則的項,故其排歧能力很弱。例如
(1)Det + N -> Np
是一條常見的短語結(jié)構(gòu)規(guī)則,適用於短語實例a man (Det表示限定語,a ∈Det)。本來,man ∈N∪Vt∪Int∪Adj。通過這條規(guī)則后,刪除了Vt和Int ,仍然保留N∪Adj。
2.2.2一般的復(fù)雜特征語法以帶有若干特征的詞類作為規(guī)則的項。特征本質(zhì)上是對詞類的進一步分類。故此類語法的排歧能力大大增強。例如,將(1)修改為規(guī)則
(2)Det + N(n/adj兼類,語境結(jié)構(gòu):Det + N +[非N]) ->Np@N(語境結(jié)構(gòu):Det + N +[非N]),其中@之后的N是短語的中心詞,下同;[非N]是短語之外的語境限制條件。短語 a man 通過規(guī)則(2)以后,而只余下man∈N。詞類歧義全被消除。再將(2)修改為
(3)a + N(n/adj兼類,帶不定冠詞,泛指,單數(shù),不帶限定性定語,語境結(jié)構(gòu):a + N +[非N] )->Np@N(帶不定冠詞,泛指,單數(shù),不帶限定性定語,語境結(jié)構(gòu):a + N +[非N] )
此處引進了不定冠詞a這一常量作為規(guī)則的一個項。通過此規(guī)則后,因為有man∈(帶不定冠詞,泛指,單數(shù),不帶限定性定語,語境結(jié)構(gòu):a + N +[非N]),所以刪除了詞 man 潛在可能具有的特性:①“無冠詞”,②“特指”,③“復(fù)數(shù)”④帶限定性定語。從而,其詞義中便可以刪除由這四項特性依次決定的以下十多個義項:①人科(如morden man);老兄、老弟(作呼語);代表(如our man in Havana)② 最合適的人(如It’s the man you need. He is the very man);頭頭、老板、白人、白人社會、毒品販子等( the man,美語中的俚語);③ 男雇員(如master and men);士兵們(如oficier and men);④校友、大學(xué)生(如an Oxford man)。
2.2.3 隱詞形語法把最小等價類作為語法規(guī)則的項,將會進一步減少歧義。如把(3)修改為
(4) a + N(n/adj兼類,帶不定冠詞,泛指,單數(shù),不帶限定性定語,可數(shù)名詞,語境結(jié)構(gòu):①([非系動詞,且非as,且非帶賓語和賓語補足語的動詞] + a + N + [非N] )∧②([非“句號”,且非“句號+Adverbial”] + a + N + [非N∧非Vp之一般現(xiàn)在時] ))→Np @ N(帶不定冠詞,泛指,單數(shù),不帶限定性定語,可數(shù)名詞,指個體,語境結(jié)構(gòu):①([非系動詞,且非as,且非帶賓語和賓語補足語的動詞] + a + N + [非N] )∧②([非“句號”,且非“句號+Adverbial”] + a + N + [非N∧非Vp之一般現(xiàn)在時] ))。
a man 通過此規(guī)則后,應(yīng)有man∈(4)中的@N,并繼承了它的全部特征。由于名詞若是單數(shù)且可數(shù)且?guī)Р欢ü谠~且泛指且出現(xiàn)在上述語境結(jié)構(gòu)(注:此時應(yīng)刪除其中“非N”之外的“非”字,并將①、②之間的∧改為∨,把①和②中的“且”改為“或”)中,乃表示一個類;若不改變語境規(guī)定則表示一個個體;故短語實例若通過規(guī)則(4),則其名詞乃指個體而非類。譯成漢語時,個體一般要加“一”字,類則一般不必加“一”字。因此,這條規(guī)則排除了以下表示類的用法:①The worker is a man(男人[類])[but not a woman,or a monkey].② He worked there as a teacher(教師[類])[but not an engineer].③ The army will make a man of you(男子漢[類])[won’t be like a woman].④A semi-conductor has some important properties(半導(dǎo)體[類])[but not a conductor]。只余下⑤ there is coming a man by bus ([一個男]人)這類表示個體的用法。再把以上的(4)修改為規(guī)則
(5) a + N(n/adj兼類,帶不定冠詞,泛指,單數(shù),不帶限定性定語,可數(shù)名詞,指個體,非專業(yè)詞且非口語詞且為修辭中性詞,語境結(jié)構(gòu):①([非系動詞,且非as,且非帶賓語和賓語補足語的動詞] + a + N +[非N])∧②([非“句號”,且非“句號+Adverbial”] + a + N + [非Vp之一般現(xiàn)在時] ))->Np@ N(帶不定冠詞,泛指,單數(shù),不帶限定性定語,可數(shù)名詞,指個體,非專業(yè)詞且非口語詞且為修辭中性詞,語境結(jié)構(gòu):①([非系動詞,且非as,且非帶賓語和賓語補足語的動詞] + a + N+[非N])∧②([非“句號”,且非“句號+Adverbial”] + a + N + [非Vp之一般現(xiàn)在時] ))。
a man 通過此規(guī)則后,man∈(5)中的@N,也繼承了它的全部特征,因此應(yīng)排除專業(yè)、口語,和帶修辭色彩等相關(guān)詞義,man又可刪除以下義項:球隊男隊員(體),棋子(體),(反映上帝的)人(宗),封臣、佃戶(史),情夫(口),16-17歲的男孩(帶戲謔色彩)。
短語規(guī)則(5)基本上已將詞形man 劃分入最小等價類,其詞匯歧義已全部消除 [3] ,只剩下“(男)人”一個義項,功能已明確為“泛指個體”(暫沒有討論可能的種種“格”功能)。
通過上例可以看出,隱詞形語法無論在基于規(guī)則匹配的規(guī)則制定中,還是在基于統(tǒng)計方法的語料庫編制時,其排歧能力都是最強的。
3. JX-1系統(tǒng)的知識表達
JX-1的知識表達框架類似‘功能合—文法’的‘復(fù)雜特征—值’框架,仍然用矩陣表示。不過,矩陣的元素一般沒有采取‘<特征名>=值
’的形式,而是直接記入特征值;但是,事先規(guī)定好矩陣中的元
應(yīng)表示何類特征。這樣做有利於減少機器的運算量,提高運算速度。下面,我們示意性地給出詞形is coming的矩陣表達形式(還應(yīng)增加fi的數(shù)量,以表示數(shù)、人稱、方式(陳述、假定、疑問)等等特征)如表1。
表1 詞形is coming∈Vi的表達式(其中假定其Vi子類有5種,假定其現(xiàn)在進行時的轉(zhuǎn)義有5種,15個義項及其義素乃根據(jù)牛津詞典)
編號 |
詞形 |
義項 |
子類 |
各義項要求的格之承擔(dān)者應(yīng)具有的義素x |
各義項對應(yīng)的義素集 |
各詞形的語法意義 |
第一義項 |
… |
第四義項 |
…第15 義項 |
第一義項 |
… |
第四義項 |
直至第15 義項 |
現(xiàn)在進行時(is coming) |
直至最后的形態(tài) |
1 |
is coming |
來,走來 |
Version-sp |
agentive(x) |
… |
degree(x) |
… |
Move |
… |
reach |
… |
直義(正在……) |
0 |
2 |
0 |
2 |
2 |
direction(x) |
… |
0 |
… |
towards to speaker |
… |
fall |
… |
轉(zhuǎn)義1(計劃、打算…) |
0 |
3 |
0 |
3 |
3 |
goal(x) |
… |
0 |
… |
0 |
… |
rise |
… |
轉(zhuǎn)義2(將要…) |
0 |
4 |
0 |
達到… |
4 |
instrument(x) |
… |
0 |
… |
0 |
… |
0 |
… |
4 |
0 |
5 |
0 |
5 |
5 |
0 |
… |
0 |
… |
0 |
… |
0 |
… |
5 |
0 |
6 |
0 |
6 |
0 |
0 |
… |
0 |
… |
0 |
… |
0 |
… |
6 |
0 |
7 |
0 |
7 |
0 |
0 |
… |
0 |
… |
0 |
… |
0 |
… |
0 |
0 |
… |
0 |
… |
0 |
0 |
… |
0 |
… |
0 |
… |
0 |
… |
0 |
0 |
15 |
0 |
15 |
0 |
0 |
… |
0 |
… |
0 |
… |
0 |
… |
0 |
0 |
其中:
1、取0值表示某項內(nèi)詞形或特性不存在,因此當(dāng)詞形表達式作為一個項進入規(guī)則與實例相匹配(匹配只檢查交集是否非空,非空則匹配成功)時,只需要對非零特征進行匹配。
2、這個表格框架已對作為詞的come預(yù)留了位置,只要把第1列(
)與第6列(
)的0補充成為相應(yīng)的詞形及其語法意義,便已是come
的表達式。當(dāng)然,要作為詞come的表達式,還應(yīng)以
的形式添加上
,n和int(感嘆詞)等詞類的特征,再增加三張表。
3、可以看出
自身也是矩陣。把它們轉(zhuǎn)置一下,將列變成行,并只占一列,則將成為一個三維的結(jié)構(gòu),使義項與義項,詞形與詞形對上號。
4、若f1,f2,f3中只取一行,f4中只取一列和一至若干行,f5中只取一列,f6中只取一行一列,構(gòu)成矩陣,便是隱詞形的矩陣表達。例如:is coming k=Vi〔is coming , 來 , Version-sp ,〔agentive(x), instrument(x)〕,〔move , towards to speaker〕, 直義(正在…) 〕指的是 is coming 的第k號隱詞形,屬於Vi,形態(tài)是is coming ,詞義是“來”,屬于Vi的子類Version-sp(可構(gòu)成主謂倒裝句者),要求的格是agentive(主格)和instrument(工具格),承擔(dān)格的名詞應(yīng)有義素x ,詞項“來”具有的義素有move和towards to speaker,“直義”指現(xiàn)在進行時的語法意義是直義。
4. 隱詞形語法的弱點和JX-1的對策----自然語言的梯級表示
隱詞形語法也有其弱點,一是制定規(guī)則很花人力,二是規(guī)則的覆蓋面窄?紤]到規(guī)則之常量愈多,則歧義愈少;我們可以用帶有不同數(shù)目常量的規(guī)則來減輕我們制訂隱詞形語法規(guī)則的工作量;同時也可容許一般的短語結(jié)構(gòu)文法,以保證系統(tǒng)的覆蓋面。這樣,將自然語言作成一種梯級的表示 [4]。這種方法不失為目前開發(fā)機器翻譯系統(tǒng)的權(quán)宜之計。例如,針對Chengdu sets to control environment pollution適配的句型,我們可以提出規(guī)則① N+Vt+Np → S ②N(地名, x, y)+Vt(階段動詞[表示開始、繼續(xù)、結(jié)束等意義] 要求接inf, x, y)+Vt(inf,要求其賓語具有義素z )+Np(N(t)+N([z,t])) → S ③N(地名, x, y)+Vt(階段動詞,x y)+ control environment pollution ∈Vp@Vi(inf)) → S 。①是一般的短語結(jié)構(gòu)文法規(guī)則,顯然會留下許多歧義;甚至可能把sets to譯成“開始大吃”。②是隱詞形短語結(jié)構(gòu)規(guī)則。其中, x, y可保證主、謂語之間人稱和數(shù)的一致;z可以保證動、賓之間的可搭配性;t 可以保證N作N的定語時的可搭配性。因此,基本上沒有歧義(詞典中x,y, z, t定義不當(dāng)時,仍可能誤譯)。③由于規(guī)則的第3項是短語常量,更可保證譯文的正確性。④我們甚至可以定義Happy birthday → S 這樣的全常量“規(guī)則”,并把它們記入英漢對照詞典。這當(dāng)然是絕對正確的。
上面規(guī)則中的常量有兩種類型:一是將詞組直接寫入規(guī)則,如規(guī)則③的第三項;第二種如規(guī)則②、③中的“地名”,它明確規(guī)定了隱詞形特征,相對于x, y, z, t 而言,也可看成特征常量,x, y,等則看成變量。常量愈多,譯文愈準,覆蓋面愈窄。顯然,②、③中如果把x,y, 改為“第3人稱”和“單數(shù)”,規(guī)則的覆蓋面就會變窄。
這種分詞匯常量、特征常量和特征變量的表達方法就是“梯級表示”,它有利于逐步地分層地對句子進行分析,避免一攬子的搜索匹配帶來的“組合爆炸”。
JX-1系統(tǒng)正是按上述方案進行試驗的。試驗結(jié)果表明:隱詞形語法和帶常量的語法規(guī)則處理的文章和句子全部正確,其余部分正確率仍然較低。
5. JX-1的語法分析過程----切分組合與規(guī)則的調(diào)用
我們沒有采用常用的對短語結(jié)構(gòu)樹形圖進行搜索的分析方法。我們采用的是隱詞形分類和句法分析交錯進行、相互反饋的方法。這一方面是為了適應(yīng)隱詞形語法的需要,另一方面也可以減少多余的搜索,F(xiàn)以There is coming a man with a hammer為例,示意性地說明其過程。
1)查詞典并調(diào)用屈折規(guī)則,進行第一次切分,得There / is coming / a / man / with / a / hammer. 切分前,come∈Vi∪Vt∪N∪Int,經(jīng)過屈折規(guī)則的切分,只剩下 is coming∈Vi∪Vt。
2)調(diào)用簡單名詞短語規(guī)則,進行第二次切分,得There/ is coming /np( a man) / with /np( a hammer)。切分前,man ∈N∪Vt∪Int∪Adj ,切分后只剩下了man∈N,且man的詞匯歧義全部排除(見前文)。切分前,hammer∈N∪Vi∪Vt,切分后hammer∈N(討論從略)。至此,句中已無詞類岐義,已不必再調(diào)用詞類兼類排歧規(guī)則模塊,或相應(yīng)的統(tǒng)計模塊。
3)調(diào)用介詞短語規(guī)則,進行第三次切分得There / is coming /np( a man) /pp(with( a hammer))。
4)調(diào)用格分類判定規(guī)則(討論從略),進行第四次切分,得There / is coming / np( np( a man)pp( withnp( a hammer)))。切分前pp∈修飾格∪趨向格∪目的格∪工具格,man∈施事格∪賓格,is coming∈Vi∪Vt;切分后pp及np(a hammer)僅余修飾格,pp作np( a man)的定語; np( a man)為施事格,作主語(含大np); is coming 僅余Vi,with僅余義項“帶著”。
5)調(diào)用現(xiàn)在進行時直義、轉(zhuǎn)義分類規(guī)則,和帶常量的句型規(guī)則“(There + is coming + NP)∈simple sentence”對全句進行組合,得s(There /is coming /np(np(a man) pp(with np(a hammer))),且there的義項是“過來”。至此,句法分析全部完成。
6)調(diào)用詞義排岐模塊 [3],消除句中詞匯的一切多余義項。
6. JX-1中的翻譯規(guī)則
JX-1沒有采用“源語分析→目標語生成”兩大模塊的一般處理模式,而是采取對每個短語和句子的分析結(jié)果給出一條翻譯規(guī)則的方法。例如,首先可以對5)編號如下:
s(aThere /b is coming /c np(a’ np(a’’ a b’’ man) b’ pp(d with e np(f a g hammer))),其中 a b c d e f g a’ b’ a’’ b’’ 等等皆是各成分和單詞的編號。
利用分析得出的隱詞形及隱詞形短語的特性,可制訂翻譯規(guī)則:a+b+c(a(a+b)+b(d+e(f+g)))→ c(a’’+個+d+g+的+b’’)+正+b+a = a’’+個+d+g+的+b’ ’+正+b+a 。調(diào)用此規(guī)則,并填入各隱詞形的義項,得譯文“一個帶著錘子的人正走過來”
顯然,用我們這種方法,省去了一大模塊,故可以大大減少機器的工作量。而翻譯規(guī)則的制定也比較簡單,并因為它與句法分析結(jié)果一一對應(yīng),其準確性也更高。
(注意:(1)pp的短語翻譯規(guī)則從略,(2)有的短語分析表達式不宜單獨給出翻譯規(guī)則(討論從略),(3)5.6.兩節(jié)中從略的部分,可參閱文[2]。
7. JX-1中的規(guī)則匹配與搜索策略[5-6]
在機器翻譯處理句子時,按文[2]的“隱詞形語法”,在短語切分組合過程中,每個部分(項)在專用的機譯詞典中具有多個語法、語義、語境特征并有相應(yīng)的譯義,如表1所示。在程序中它們可用多個字符串或復(fù)合數(shù)據(jù)結(jié)構(gòu)表達。它們在句子中又可構(gòu)成更多的組合方案。究竟選擇哪個組合方案才能得到正確的譯義,就要把各種方案和句法規(guī)則相匹配。由此,抽取一類相關(guān)對象組合模型表述如下:
模型1:設(shè)有m個對象G1,G2,…Gm,它們分別是字符串或復(fù)合數(shù)據(jù)結(jié)構(gòu)的集合。不影響問題的一般性,設(shè)它們都各自有n個數(shù)據(jù)(對應(yīng)機譯中n個特征)。
G1 ={G11,G12,…,G1n}
G2 ={G21,G22,…,G2n} (1)
……
Gm ={Gm1,Gm2,…,Gmn}
按順序從每個對象中抽出一個數(shù)據(jù)來進行排列(對應(yīng)句子),可得nm種,其中之一為
S_={G1_,G2_,…,Gm_} (2)
其中下劃線_ 表示某一個號碼,F(xiàn)在要從nm 種排列中,搜索出能與規(guī)則
T=[T1,T2,…,Tm](3)
相匹相匹配的一種。這里,規(guī)則對象數(shù)據(jù)的特征用不同字符表示。某些字符(特征)是已知的常量,如a,b,c等,它們在(句型)規(guī)則中形成固定的搭配;另一些則是未知的,如x,y,z等,它們可以取不同值[(這樣可判定詞匯和格的搭配關(guān)系以便排除詞匯和格的歧義;并簡化句內(nèi)的一致關(guān)系的處理,使一條短語或句型規(guī)則囊括更多的句子)。不同對象的數(shù)據(jù)之間可能是相關(guān)的,在句中,相應(yīng)字符(與表1中 
相對應(yīng))應(yīng)相等(若是表簡單特征的字符便要求相等;若是字符指一個集合表示一個復(fù)雜特征,則要求“交集非空”。不過,要求集合A與集合B之交集非空,實際上也就是要求A與B有相同的元素,只是運算復(fù)雜一點而已。下同)。例如:
T1=“axbycd”
T4=“efxgzh”
T5=“ijklmx”
T7=“nyzopq”
其中,T1的第2位,T4的第3位,T5的第6位都是x,它們應(yīng)相等;T1的第4位,T7的第2位都是y,又應(yīng)相等;T4的第5位,T7的第3位都是z,也應(yīng)相等。因此,T1、T4、T5以參數(shù)x相關(guān),T1、T7以參數(shù)y相關(guān),T4、T7以參數(shù)z相關(guān)。與之相匹配的G1_,G4_,G5_,G7_就應(yīng)滿足下面的三個全局相關(guān)約束條件(分別相對于x,y,z 三個參數(shù)):
g12 = g43 = g56
g14 = g72 (5)
g45 = g73
其中g(shù)12 表示G1_(G1中的某個數(shù)據(jù))中的第2個字符,其余類推。
對于上面搜索問題采用深度優(yōu)先策略時,往往產(chǎn)生“組合爆炸”,而啟發(fā)式智能搜索又難以實現(xiàn)。我們?nèi)裟芙獬龑ο笾g的相關(guān)關(guān)系,即實現(xiàn)解耦,問題就大為簡化,如圖1所示。
圖1 相關(guān)對象組合的解耦遞解智能搜索
這里,解耦處理后的搜索已變成三個獨立的搜索,開銷將大為減少,從nm次減為nm次。在JX-1工作中我們提出“閉環(huán)消除法”,利用先驗知識(相當(dāng)于機譯中的句法規(guī)則),消去不滿足相關(guān)約束的那些數(shù)據(jù),剩下的全部滿足相關(guān)約束。匹配時就只需考慮數(shù)據(jù)中那些已知項的匹配,也就只需順序搜索了。由于消去一些數(shù)據(jù),順序搜索次數(shù)也更少一些。在文[6]的一個例子中,n=5,m=10,最壞情況下要花 nm = 9765625次搜索;而采用解耦智能搜索后,考慮到分兩層處理,只花81次搜索。“深度優(yōu)先”的操作次數(shù)是“解耦遞階智能搜索”的120563倍。!
文[5-6]證明了方法的有效性。上機試驗的結(jié)果,在既定條件下操作次數(shù)減少12倍。
8. 機譯系統(tǒng)的PROLOG程序結(jié)構(gòu)優(yōu)化與糾錯 [7-8]
PROLOG作為人工智能語言,在知識表達、邏輯推理、狀態(tài)空間搜索等方面都具有明顯的優(yōu)越性,其描述性語言特征也使問題求解大為簡化。它把每個謂詞作成一個封閉體,除了通過“約束-非約束變量”的渠道與外界進行雙向數(shù)據(jù)交換外,別無它路。這一方面減弱了模塊間的耦合性,增強了程序的可移植性,減少了出錯概率;另一方面也少了一個數(shù)據(jù)通道。如果謂詞的執(zhí)行成功,一些被占用的空間就不能釋放,常出現(xiàn)堆溢出問題。當(dāng)程序規(guī)模增大時,這一問題尤為突出。
在JX-1的工作中,我們以減少存儲空間消耗為主要目標,研究了程序的優(yōu)化結(jié)構(gòu)[7]。在分析程序基本結(jié)構(gòu)及其優(yōu)化方法的基礎(chǔ)上,提出一種強制失敗-數(shù)據(jù)旁路結(jié)構(gòu),作為已有優(yōu)化方法的補充。由此綜合出一種全局結(jié)構(gòu)優(yōu)化模式。
對一篇短文作重復(fù)翻譯試驗的結(jié)果,程序優(yōu)化前只能運行一次,第二次即出現(xiàn)堆溢出。優(yōu)化后,按計算能運行2580次。這實際上已相當(dāng)于不受限制,因為翻譯多次后總要退出菜單。當(dāng)重新進入翻譯系統(tǒng)時,一切又已恢復(fù)如初?梢娺@一研究為在微機上運行較大型的翻譯軟件奠定了一個良好的基礎(chǔ)。
一些程序語言(PROLOG和C語言等)具有指針定位不確定性的問題,它常使程序出錯,嚴重時甚至無法往下運行。在JX-1的工作中,分析了其產(chǎn)生的條件,提出了用“特征辯識”對指針重定位的對策,保證了程序的正確運行[8]。
參考文獻:
1. 段文潤.俄語簡單句句型的“群”描寫——數(shù)理語言學(xué)的一種代數(shù)方法[A],科學(xué)的整體化趨勢[C]. 成都:四川大學(xué)出版社.1989
2.段文潤,段之宓,段琦麗.隱詞形論及其在機器翻譯中的應(yīng)用. 中國科技創(chuàng)新網(wǎng),論文在線: /Article/ShowArticle.asp?ArticleID=3173, 2007.10.24.
3. 段綺麗.機器翻譯中詞義的常識排岐[A].重慶大學(xué)學(xué)報 [J ],2005,28(3):69-71
4. 段綺麗,段之宓. 機器翻譯中自然語言的梯級表示模型[A].機器翻譯研究進展[C].北京:電子工業(yè)出版社,2002
5. 段鷹,荷芒. 機器翻譯中的一種狀態(tài)空間搜索方法. 重慶大學(xué)學(xué)報[J],2006,29(3):99-102
6. 段鷹,段文澤. 一類相關(guān)對象組合的解耦遞階智能搜索. 中國科技創(chuàng)新網(wǎng),論文在線: /Article/ShowArticle.asp?ArticleID=2644, 2007.9.3.
7. 段鷹,段文澤. PROLOG邏輯程序設(shè)計的結(jié)構(gòu)優(yōu)化. 重慶建筑大學(xué)學(xué)報 [J],1998,20 (6) :91-99
8. 段鷹,薛克飛, 段文澤. 邏輯程序設(shè)計中指針的重定位.計算機應(yīng)用研究 [J],1998,15(2):264-265