智能電網(wǎng)(輸變電部分)領(lǐng)域知識(shí)體系構(gòu)建和語義研究與應(yīng)用
如今,隨著電力技術(shù)的發(fā)展日新月異,用戶對(duì)電能質(zhì)量的要求也逐漸提高,多個(gè)國(guó)家陸續(xù)提出了各自關(guān)于智能電網(wǎng)建設(shè)的方案。國(guó)家電網(wǎng)公司作為國(guó)有特大型央企,提出了建設(shè)堅(jiān)強(qiáng)智能電網(wǎng),以實(shí)現(xiàn)電網(wǎng)中電力流、業(yè)務(wù)流、
如今,隨著電力技術(shù)的發(fā)展日新月異,用戶對(duì)電能質(zhì)量的要求也逐漸提高,多個(gè)國(guó)家陸續(xù)提出了各自關(guān)于智能電網(wǎng)建設(shè)的方案。國(guó)家電網(wǎng)公司作為國(guó)有特大型央企,提出了建設(shè)堅(jiān)強(qiáng)智能電網(wǎng),以實(shí)現(xiàn)電網(wǎng)中電力流、業(yè)務(wù)流、信息流的高度融合。智能電網(wǎng)的發(fā)展必將使電力系統(tǒng)各環(huán)節(jié)的聯(lián)系更加緊密、數(shù)據(jù)與信息交互更加頻繁,也正因?yàn)槿绱耍骷?jí)電網(wǎng)工作人員對(duì)知識(shí)的需求也更加迫切。

1、當(dāng)前智能電網(wǎng)領(lǐng)域知識(shí)服務(wù)存在的問題
1 )知識(shí)資源組織管理體系結(jié)構(gòu)落后?,F(xiàn)有的智能電網(wǎng)知識(shí)資源組織管理體系結(jié)構(gòu)比較單一,缺乏知識(shí)點(diǎn)間的關(guān)聯(lián)性,層級(jí)簡(jiǎn)單,體系結(jié)構(gòu)仍以圖書形式為主,分類單一,知識(shí)點(diǎn)僅遵循“用、代、屬、分、參”關(guān)系,顯示方法比較扁平化,已經(jīng)不能滿足高性能、大容量知識(shí)服務(wù)的建構(gòu)、處理與運(yùn)行的要求。如何描述、存儲(chǔ)、管理、處理、分析和使用海量分布的知識(shí)資源進(jìn)行知識(shí)服務(wù),是智能電網(wǎng)領(lǐng)域知識(shí)服務(wù)應(yīng)用的重要問題 。
2 )知識(shí)服務(wù)開發(fā)成本高、更新維護(hù)困難。智能電網(wǎng)領(lǐng)域的專家系統(tǒng)和知識(shí)服務(wù)應(yīng)用雖然可以較好地滿足用戶對(duì)知識(shí)服務(wù)的需求,但受到知識(shí)本身時(shí)效性強(qiáng)、更新速度快等特點(diǎn)的影響,導(dǎo)致此類知識(shí)服務(wù)的開發(fā)成本高,重用難度大,使得其實(shí)現(xiàn)和推廣的難度相對(duì)較大。
3 )知識(shí)服務(wù)同用戶需求本身存在一定的差距。當(dāng)前智能電網(wǎng)的知識(shí)服務(wù)檢索結(jié)果往往沒有考慮檢索者本身的實(shí)際情況,以及用戶難以用計(jì)算機(jī)能理解的方式描述出其希望了解的內(nèi)容。
造成這些問題的原因,一方面在于激增的數(shù)據(jù)超過了現(xiàn)有用戶和系統(tǒng)所能承受、處理和利用的范圍,導(dǎo)致數(shù)據(jù)無法被及時(shí)、合理地組織,決策者未能從中得到應(yīng)有的啟示;另一方面,知識(shí)的表現(xiàn)形式使其不能被有效利用,這是因?yàn)槟壳暗闹R(shí)表示方法不利于電網(wǎng)知識(shí)的發(fā)現(xiàn),進(jìn)而導(dǎo)致不能形式化地表示電網(wǎng)領(lǐng)域知識(shí)。
因此,本文研究基于語義網(wǎng)技術(shù),并以輸變電圖書為樣例,對(duì)智能電網(wǎng)(輸變電部分)領(lǐng)域知識(shí)開展研究,完成智能電網(wǎng)(輸變電部分)知識(shí)體系構(gòu)建,以期更好地為國(guó)家電網(wǎng)公司提供知識(shí)服務(wù)。另外,通過本文研究成果對(duì)國(guó)家電網(wǎng)公司企業(yè)級(jí)知識(shí)管理系統(tǒng)進(jìn)行優(yōu)化,有利于實(shí)現(xiàn)知識(shí)整理和標(biāo)引、知識(shí)協(xié)同構(gòu)建、資源自動(dòng)檢索和標(biāo)注、知識(shí)服務(wù)模型以及知識(shí)資源個(gè)性化推送等目標(biāo) 。以智能電網(wǎng)(輸變電部分)領(lǐng)域知識(shí)為研究范圍,以10 kV 配網(wǎng)不停電作業(yè)知識(shí)為突破口,著力做好該領(lǐng)域知識(shí)收集、概念抽取、語義研究和本體設(shè)計(jì),研究知識(shí)體系構(gòu)建以及知識(shí)庫搭建工作。
本文內(nèi)容包含系統(tǒng)梳理智能電網(wǎng)(輸變電部分)領(lǐng)域的主題詞條,闡明詞條之間的相互聯(lián)系和相互作用;基于本體語言的知識(shí)表示方法和原則,開發(fā)專用的本體工具,構(gòu)建智能電網(wǎng)(輸變電部分)知識(shí)體系;并以語義檢索應(yīng)用為目的完成智能電網(wǎng)(輸變電部分)專業(yè)知識(shí)庫的建立,為整個(gè)智能電網(wǎng)領(lǐng)域知識(shí)體系的構(gòu)建提供理論依據(jù)及技術(shù)支持,同時(shí)可對(duì)智能電網(wǎng)領(lǐng)域知識(shí)挖掘、發(fā)現(xiàn)與利用進(jìn)行有益的探索 。
基于本體設(shè)計(jì)、語義標(biāo)引技術(shù),在電力領(lǐng)域?qū)<业闹笇?dǎo)和配合下,對(duì)智能電網(wǎng)(輸變電部分)領(lǐng)域知識(shí)開展研究,研究該領(lǐng)域知識(shí)收集、概念抽取、本體設(shè)計(jì)、語義標(biāo)引、概念體系構(gòu)建的關(guān)鍵技術(shù)路徑,并完成了最終的知識(shí)庫搭建工作。所完成的專業(yè)知識(shí)庫系統(tǒng)提供了網(wǎng)站作為檢索接口,集成了本體工具、數(shù)據(jù)加工模型的圖書文獻(xiàn)檢索等技術(shù) , 實(shí)現(xiàn)了智能電網(wǎng)(輸變電部分)知識(shí)的語義檢索應(yīng)用。系統(tǒng)除了處理常規(guī)的文本檢索之外,還提供了本體的交互式圖形可視系統(tǒng)、自然語言及問句式查詢系統(tǒng)、語義增強(qiáng)搜索系統(tǒng)以及相關(guān)詞條推薦系統(tǒng),可以智能化地協(xié)助用戶提高檢索效率 。
2、領(lǐng)域知識(shí)收集
領(lǐng)域知識(shí)收集工作包括對(duì)793 本與輸變電專業(yè)相關(guān)圖書、《電力名詞(第二版送審稿)》中指定書目以及《電力主題詞表》的計(jì)算機(jī)自動(dòng)處理,并結(jié)合專家所提供的分類體系開展工作。
2.1自動(dòng)分詞
對(duì)這些圖書進(jìn)行自動(dòng)分詞,即將一本書、一段話看作一個(gè)漢字序列,通過計(jì)算機(jī)將其切分成一個(gè)個(gè)單獨(dú)的詞,以便進(jìn)行下一步的理解和分析。
在 本 文 研 究 中,對(duì) 開 源 工 具Ikanalyzer 、Rwordseg進(jìn)行了調(diào)研和試驗(yàn)。Ikanalyzer提供了可供Java使用的jar包,以及面向全文檢索工具Lucene的接口,使用方便,主要用它來建立索引、本體以及對(duì)搜索語句進(jìn)行分詞,準(zhǔn)確率可達(dá)95% ,其分詞示例分詞前的整個(gè)段落:“在電力系統(tǒng)中,除應(yīng)采取各項(xiàng)積極措施消除或減少發(fā)生故障的可能性外,故障一旦發(fā)生,必須迅速而有選擇地切除故障元件,這是保證電力系統(tǒng)安全運(yùn)行的最有效方法之一,而繼電保護(hù)裝置就是能反映電力系統(tǒng)中電氣元件發(fā)生故障或不正常運(yùn)行的狀態(tài),并動(dòng)作于斷路器跳閘或發(fā)出信號(hào)的一種自動(dòng)裝置。”
計(jì)算機(jī)分詞和自動(dòng)去除無實(shí)意的詞后的效果如下:“電力系統(tǒng)中因各項(xiàng)措施消除減少發(fā)生故障可能性外,故障發(fā)生而有選擇切除故障元件這是保證電力系統(tǒng)安全運(yùn)行最有效方法之一,而繼電保護(hù)裝置電力系統(tǒng)中電氣元件發(fā)生故障不正常運(yùn)行狀態(tài)動(dòng)作斷路器跳閘發(fā)出信號(hào)一種自動(dòng)裝置”,可以達(dá)到建立索引的要求。
Rwordseg是一個(gè)R環(huán)境下的中文分詞工具,使用rJava調(diào)用Java分詞工具Ansj。Ansj基于Apache License ,是一個(gè)完全開源、免費(fèi)的Java中文薦分詞工具。它的實(shí)現(xiàn)原理基于Google語義模型和條件隨機(jī)場(chǎng)模型。分詞速度可達(dá)每秒約200萬字(在Mac Air下測(cè)試),準(zhǔn)確率能達(dá)到96%以上。通過研究,重寫了一個(gè)Java 版本,并且全部開源,使得 Ansj可用于人名識(shí)別、地名識(shí)別、組織機(jī)構(gòu)名識(shí)別、多級(jí)詞性標(biāo)注、關(guān)鍵詞提取、指紋提取等領(lǐng)域,支持行業(yè)詞典、用戶自定義詞典。
2.2詞向量訓(xùn)練
詞向量訓(xùn)練是利用深度學(xué)習(xí)的思想把單詞表示
成向量的一種方式,語義越相近的詞,形成的向量相似度越高。本文采用Google word2vec工具(基于Apache License 2 .0 的開源工具,提供continuou sbag-of-words和skip-gram architectures等算法對(duì)詞向量進(jìn)行訓(xùn)練)進(jìn)行詞向量訓(xùn)練,得到詞向量之后,可以進(jìn)一步得出這些詞向量的聚類。
2.3詞語篩選
根據(jù)停用詞表,去除“的”、“比如”、“別的”等無實(shí)意、頻繁出現(xiàn)的但對(duì)專業(yè)語義分析無實(shí)際幫助的詞,編寫程序去除無關(guān)的標(biāo)點(diǎn)符號(hào)、亂碼字符及其他短字符。在此基礎(chǔ)上,研究人員通過人工對(duì)得到的詞語進(jìn)行篩選,得出重要的名詞和動(dòng)詞以及相關(guān)概念的英文名和中文描述信息,作為本體分析的對(duì)象 。其中,名詞集用來構(gòu)建領(lǐng)域本體的相關(guān)概念,動(dòng)詞集用來描述領(lǐng)域本體概念之間的關(guān)系。
3、概念抽取
本文研究根據(jù)專家提供的輸變電專業(yè)概念分類,對(duì)領(lǐng)域知識(shí)中的相關(guān)名詞集進(jìn)行總結(jié)歸納,以半自動(dòng)的方式從相關(guān)的圖書和詞典中提取出相關(guān)概念,并將其結(jié)構(gòu)化,形成分類體系 。
專家提供的輸變電專業(yè)概念分類主要包含資產(chǎn)、作業(yè)、文檔的大體框架分類結(jié)構(gòu),但不涉及每個(gè)具體詞條的歸屬。其中資產(chǎn)可以在EnterpriseArchitecture軟件中查看。其他分類體系通過專家口述,研究人員進(jìn)行記錄,專家進(jìn)行核對(duì)的形式提供。
在領(lǐng)域知識(shí)收集之后,使用Apache Jena(Apche的開源項(xiàng)目,提供了Java接口,可使用Java編程對(duì)本體進(jìn)行創(chuàng)建、修改、讀入、保存、查詢、推理等操作)將概念體系導(dǎo)入本體,將詞條進(jìn)行粗分類;在此基礎(chǔ)上,多次征求高校電氣學(xué)院領(lǐng)域?qū)<业囊庖?,使用Stanford Protégé工具(本體開發(fā)工具,具有導(dǎo)入、可視化編輯和保存本體的功能)進(jìn)行交互展示,供專家審核、修改,并進(jìn)行細(xì)分類 。Protégé(本體開發(fā)工具)中對(duì)本體進(jìn)行展示及審核修改的工作界面如圖1所示。
4、本體設(shè)計(jì)
在此階段中,根據(jù)相關(guān)圖書及專家所提供的頂層概念模型,使用Apache提供的開源工具Jena創(chuàng)建本體,并使用Protégé 和Word文檔相結(jié)合的方式進(jìn)行人工核對(duì)。
存儲(chǔ)了中英文名的類如圖2所示,其中每個(gè)類均存儲(chǔ)了中英文名、所屬詞典以及簡(jiǎn)介。
具體建立過程如下:
1 )根據(jù)字符串匹配的方式得出父類與子類的關(guān)系;
2 )根據(jù)詞典中的描述信息建立等價(jià)類關(guān)系;
3 )根據(jù)詞典中的描述信息得出包含關(guān)系,如:根據(jù)U型掛環(huán)的描述信息得出結(jié)論“U型掛環(huán)有連接件”;
4 )根據(jù)詞典中的描述信息定義反關(guān)系,如:“有連接件關(guān)系的反關(guān)系是組成U型掛環(huán)”;
5 )根據(jù)名稱定義包含關(guān)系及其反關(guān)系;
6 )根據(jù)詞典中的描述信息建立相關(guān)關(guān)系,如:鋼管塔的描述信息及其所建立的關(guān)系,圖3顯示了從鋼管塔的描述信息中建立其與金具、導(dǎo)線和絕緣子的關(guān)系;
7 )根據(jù)詞典中的描述信息建立數(shù)值型屬性,如:塔高的數(shù)值屬性;
8 )建立實(shí)例,如:以中原變電站為例,變電站類有地址屬性,屬性用string表示,中原變電站作為其中一個(gè)具體的變電站,地址在鄭州,將鄭州作為中原變電站的地址屬性的值。
根據(jù)Protégé軟件的自動(dòng)統(tǒng)計(jì)信息,本次研究所建成的本體的規(guī)模共有8094個(gè)類、21657個(gè)Object型屬性、7511個(gè)父類–子類關(guān)系以及757個(gè)等價(jià)類。
5、語義標(biāo)引
在此階段,利用已有的本體對(duì)該領(lǐng)域中的文檔資源進(jìn)行標(biāo)引,從而實(shí)現(xiàn)語義推理的目的,最終實(shí)現(xiàn)語義信息檢索 。
在語義標(biāo)引過程中,對(duì)屬于本體中的實(shí)例,如:“巡視”、“維護(hù)”、“sub station”等加上html的標(biāo)簽,在前端通過處理與其他未標(biāo)注文本進(jìn)行區(qū)別顯示,點(diǎn)擊時(shí)可自動(dòng)查詢相應(yīng)本體。
使用Jena 和Java 對(duì)本體進(jìn)行標(biāo)注。首先,將本體中類的中文名和英文名用Jena 導(dǎo)出,并根據(jù)詞條長(zhǎng)度進(jìn)行由長(zhǎng)到短的排序,排序后,“電子互感器”排在“互感器”之前。使用Java 遍歷排序后的數(shù)組,為文本中匹配處依次加上 標(biāo)簽,避免了重復(fù)地將“電子互感器”標(biāo)注為“電子互感器”和“互感器”。
專業(yè)詞匯如“變電站”、“互感器”等的標(biāo)注基本無誤。本體中的其他相關(guān)詞匯中含有一些多義詞,人工篩選了“條件”、“單元”、“連結(jié)”等多義詞進(jìn)行剔除。
6、概念體系設(shè)計(jì)
在專家的幫助下,將智能電網(wǎng)的中英文名、描述信息、層次結(jié)構(gòu)及其關(guān)系等知識(shí)進(jìn)行整合,得到智能電網(wǎng)(輸變電部分)領(lǐng)域中的一個(gè)概念體系。
概念體系包含了智能電網(wǎng)領(lǐng)域(輸變電部分)中前面提到的所有信息(即概念分類體系以及詞條的中英文名、釋義、等價(jià)類、屬性等)。以光纜為例,光纜示例如圖4 所示。
圖4中303.3.8 是“光纜”在本文概念體系中的編號(hào),“optical fiber cable ”是英文名,“18.307 ”是“光纜”在《電力名詞(第二版送審稿)》中的編號(hào),“以光纖為傳輸元件……”這句話是“光纜”的描述信息,“相關(guān)材料”,表示“光纜”與“材料”這個(gè)概念相關(guān)。

責(zé)任編輯:lixin
免責(zé)聲明:本文僅代表作者個(gè)人觀點(diǎn),與本站無關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí),對(duì)本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾,請(qǐng)讀者僅作參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。
我要收藏
個(gè)贊
-
權(quán)威發(fā)布 | 新能源汽車產(chǎn)業(yè)頂層設(shè)計(jì)落地:鼓勵(lì)“光儲(chǔ)充放”,有序推進(jìn)氫燃料供給體系建設(shè)
2020-11-03新能源,汽車,產(chǎn)業(yè),設(shè)計(jì) -
中國(guó)自主研制的“人造太陽”重力支撐設(shè)備正式啟運(yùn)
2020-09-14核聚變,ITER,核電 -
探索 | 既耗能又可供能的數(shù)據(jù)中心 打造融合型綜合能源系統(tǒng)
2020-06-16綜合能源服務(wù),新能源消納,能源互聯(lián)網(wǎng)
-
新基建助推 數(shù)據(jù)中心建設(shè)將迎爆發(fā)期
2020-06-16數(shù)據(jù)中心,能源互聯(lián)網(wǎng),電力新基建 -
泛在電力物聯(lián)網(wǎng)建設(shè)下看電網(wǎng)企業(yè)數(shù)據(jù)變現(xiàn)之路
2019-11-12泛在電力物聯(lián)網(wǎng) -
泛在電力物聯(lián)網(wǎng)建設(shè)典型實(shí)踐案例
2019-10-15泛在電力物聯(lián)網(wǎng)案例
-
新基建之充電樁“火”了 想進(jìn)這個(gè)行業(yè)要“心里有底”
2020-06-16充電樁,充電基礎(chǔ)設(shè)施,電力新基建 -
燃料電池汽車駛?cè)雽こ0傩占疫€要多久?
-
備戰(zhàn)全面電動(dòng)化 多部委及央企“定調(diào)”充電樁配套節(jié)奏
-
權(quán)威發(fā)布 | 新能源汽車產(chǎn)業(yè)頂層設(shè)計(jì)落地:鼓勵(lì)“光儲(chǔ)充放”,有序推進(jìn)氫燃料供給體系建設(shè)
2020-11-03新能源,汽車,產(chǎn)業(yè),設(shè)計(jì) -
中國(guó)自主研制的“人造太陽”重力支撐設(shè)備正式啟運(yùn)
2020-09-14核聚變,ITER,核電 -
能源革命和電改政策紅利將長(zhǎng)期助力儲(chǔ)能行業(yè)發(fā)展
-
探索 | 既耗能又可供能的數(shù)據(jù)中心 打造融合型綜合能源系統(tǒng)
2020-06-16綜合能源服務(wù),新能源消納,能源互聯(lián)網(wǎng) -
5G新基建助力智能電網(wǎng)發(fā)展
2020-06-125G,智能電網(wǎng),配電網(wǎng) -
從智能電網(wǎng)到智能城市
-
山西省首座電力與通信共享電力鐵塔試點(diǎn)成功
-
中國(guó)電建公司公共資源交易服務(wù)平臺(tái)摘得電力創(chuàng)新大獎(jiǎng)
-
電力系統(tǒng)對(duì)UPS的技術(shù)要求