0 引言
电网故障诊断[1-2]是指利用保护和断路器的动作信息以及电压电流的变化信息,识别故障元件或故障区域。为了提高故障诊断的准确性和快速性,国内外有关学者提出了专家系统(ES)、人工神经网络(ANN)、Petri网络等多种人工智能方法。以上这些诊断方法对送至控制中心的准确表达的信号大都可以取得较为满意的结果,但在容错能力方面都有其局限性,即当诊断所依据的实时信息不充分或信息因畸变而变异或丢失时,将可能导致错误的诊断结论。该问题的实质是由各方法所采用的诊断原理的容错性能所确定的,这也是故障诊断系统推向实用化所要解决的关键问题。因此,有必要发展一种鲁棒性强,适应各种不利情况的电网故障诊断方法,保证电力系统的安全稳定运行。
电网故障诊断可以用一个模式分类问题来描述,很适合应用粗糙集(RS)理论[3-4]的决策表方法。粗糙集理论是一种新的处理模糊和不确定知识的数学工具。其主要思想是:在保持信息系统的分类能力不变的前提下,通过知识的约简,道出问题的决策或分类规则。近年来,它已被广泛应用于过程控制、模糊识别和数据挖掘等领域[5]。
本文尝试在故障诊断系统中使用粗糙集理论的方法,来处理因保护装置和断路器误动作或信号传输误码而造成的误动作。而这一过程实现主要的依据是粗糙集理论中的属性约简,至今为止许多科学家关于粗糙集研究探讨的关键问题仍是属性约简问题。目前已有的基于粗糙集理论的属性约简算法由于计算复杂度高,因而不适用大规模数据的约简。如:由Skowron提出的通过可辨识矩阵[6]把求属性约简的算法转化为由合取范式到析取范式的逻辑换算关系,但逻辑换算本生就是NP-hard[7]问题,其只适合于非常小的数据集。文献[9]将信息量引入信息系统,提出了一种基于信息量的属性约简算法,但该算法不能有效解决决策表这种特殊的信息系统。为此,本文在可辨识矩阵的基础上,引用了决策表中决策属性集相对条件属性集的条件信息量[8]的概念,在此基础上,提出了一种新的基于信息量的属性约简算法,通过例子分析,表明该算法是有效的。
1 粗糙集理论
定义1.1 信息系统[12]: 4元组S=(U,A,V,f)[,是一个信息系统,其中U表示对象的非空有限集合,称为论域。A表示属性的非空有限集合。V是属性的值域集,其中Vi是属性ai的值域。f是信息函数, f∶U×A→V,它为每个对象的每个属性赋予个信息值。
A可进一步划分为两个集合:条件属性集C和决策属性集D,并满足A=CèD且C?D=φ,这时S=(U,A,V,f)又被称为决策系统。
定义 1.2 不可分辨关系:每一个非空的属性子集PíA, P≠?决定了U上的一个二元等价关系,IND(P):IND(P) ={(x,y)∈U×U," a?P,f(x,a)=f(y,a)}这个关系被称为由P决定的不可分辨关系。
定义1.3 约简:设S=(U,A,V,f)是一个信息系统,P∈A,如果有① IND(P)= IND(A) ② P是独立的,则称P是A一个约简
定义1.4 核:设S=(U,A,V,f)是一个信息系统,A中所有必要的属性组成的集合称为属性集A的核,记作Core(A)
定义1.5 可辨识矩阵:设S=(U,CèD,V,f)是一个信息系统,S的可辨识矩阵是一个∣U∣×∣U∣的对称矩阵,矩阵的每一项定义为Cij为:
(c )=
定义1.6 改进的可辨识矩阵:在上述的可辨识矩阵中把包含核属性的元素去掉,剩下的矩阵即为改进的可辨识矩阵
性质1.1:信息系统S=(U,CèD,V,f),C为S的可辨识矩阵,若有|Cij |=1,则该属性必为核元素。
定义1.7:条件信息量:设S=(U,CèD,V,f)是一个决策系统PíA,QíA知识Q(U/IND(Q)) ={Y1,Y2,…Ym}(属性集合)相对于知识P(U/IND(P))={X1,X2,…Xn}(属性集合)的条件信息量I(Q︱P)为:
性质1.2:设S=(U,A,V,f)是一个决策表, A =CèD,C为初始条件属性集,D为决策属性集,ai∈C,i=1,2,…,m,(m=∣C∣),则有:I(D∣{a1})≥I(D∣{a1}è{a2})≥…≥I(D∣{a1}è…è{am})=I(D∣C)。
性质1.3:设S=(U,A,V,f)是一个决策表, A=CèD,C为初始条件属性集,D为决策属性集,B为属性约简后得到的条件属性集,C0是决策表的核。如果ai∈B-C0是任意一个不能被约简的属性,则有:I(D∣{ C0})>I(D∣C0è{a1})>…> I(D∣C0è{a1}è…è{ai}è…)>…> I(D∣B)
说明:如果属性约简以决策表的核为起点,那么在约简过程中,条件信息量的变化规律是单调递减的。
2 基于可辨识矩阵和信息量属性约简算法
本文针对目前已有的基于粗糙集理论的属性约简算法计算复杂度高,而不适用于大规模数据的约简,提出了在可辨识矩阵的基础上,引用了决策表中决策属性集相对条件属性集的条件信息量的概念,以此得到了约简过程中启发式搜索的条件。在此基础上,提出了一种新的属性约简算法,通过例子分析,表明该算法是有效的。
2.1算法描述
由性质1.2知,如果一个属性不能为属性子集A的分类增加任何信息,即I(D∣Aè{a})=I(D∣A),就可以将这个属性约简。约简后的决策表的条件信息量等于初始决策表的条件信息量,即I(D∣C)=I(D∣B),其中B为最后得到的约简,以此作为算法的终止条件。
由于核是惟一的且核为任何约简的子集,因此,核可作为求最小约简的起点。由性质1.3知,向属性子集A中不断添加不能约简的属性a得到的条件信息量I(D∣Aè{a})的变化规律呈递减性。在求约简的过程中,选择属性加入约简属性集的方法是采用贪心算法,在不属于已求的约简属性集的属性中选择一个条件信息量最小的属性加入到约简集中,直至满足I(D∣C)=I(D∣B)。
基于可辨识矩阵和信息量的属性约简算法为:
输入:一个决策表S=(U,A,V,f),其中R=CèD,,其中,U为论域,C和D分别为条件和决策属性集。
输出:该决策表的一个相对约简。
步骤1.求出决策表的可辨识矩阵,得到属性核、改进的可辨识矩阵;
步骤2.计算条件属性C与决策属性D的条件信息量I(D| C);
步骤3.计算I(D| C0),其中C0核属性;
步骤4.令B=CO(核属性),对条件属性集C-B重复:
①对相对可辨识矩阵中的每个属性p∈C-B,计算条件信息量I(D| Bè{p});
②选择使条件信息量I(D| Bè{p})最小的属性,记作p(若同时有多个属性达到最小值,则分别加入p);并且B= Bè{p};
③若I(D| B)= I(D| C),则终止;否则,转①;
步骤5.最后得到的B就是C相对于D的一个相对约简。
2.2. 算法的例证分析
本算法已用VC++实现,为了考察算法的有效性,本文选取一个简单的配电系统的故障诊断作为决策表进行属性约简,如图1所示:
 图1 简单的配电系统图
表1含有7个故障样本其中论域U={1,2,3,4,5,6,7},条件属性C={CB1,CB2,CB3,
CO1,RR1, CO2,CO3},决策属性D={故障区域},
样本
CB1
CB2
CB3
CO1
RR1
CO2
CO3
故 障
区 域
1
1
0
0
1
0
0
0
Sec1
2
0
1
0
0
0
1
0
Sec2
3
0
0
1
0
0
0
1
Sec3
4
1
0
0
0
1
1
0
Sec2
5
1
0
0
0
1
0
1
Sec3
6
1
0
0
0
1
0
0
Sec2-3
7
0
0
0
0
0
0
0
No
表1 配电系统故障诊断的决策表
下面使用上述方法进行属性约简步骤1.求出可辨识矩阵和核属性可辨识矩阵为如表2所示:
表2 决策表(表1)的可辨识矩阵
0
CB1,CB2,CO1,CO2
CB1,CB3,CO1,CO3
CO1,RR1,CO2
CO1,RR1,CO3
CO1,RR1
CB1,CO1
0
CB1,CB3,CO2,CO3
0
CB1,CB2,RR1,CO2,CO3
CB1,CB2,RR1,CO2
CB2,CO2
0
CB1,CB3,RR1,CO2,
0
CB1,CB3,RR1,CO3,
CB3,CO3
0
CO2,CO3
CO2
CB1,RR1,CO2
0
CO3
CB1,RR1,CO3
0
CB1,RR1
0
Core(C,D)={CO2,CO3}
改进的可辨识矩阵里含有不为零的属性组合有:{ CB1,RR1}、{ CO1,RR1}和{ CB1,CO1}共3组。
步骤2.计算条件属性C与决策属性D的条件信息量I(C;D)
U/C={{1},{2},{3},{4},{5},{6},{7}}, U/D={{1},{2,4},{3,5},{6},{7}}
I(D| C)=0。
步骤3.计算核属性C0与决策属性D条件信息量I(D| C0),I(D| C0)= 0.2857。
步骤4 对改进的可辨识矩阵中的每个属性(CB1,CO1,RR1)求取条件信息量结果如表3:
表3 条件信息量
属性P
CB1
CO1
RR1
I(D|C0∪{p})
0.1429
0.1429
0.1429
上述每个条件信息量的值一样,说明这三个属
性都不能约简,对CB1而言有:I(D| C0∪{CB1,RR1})= I(D|C)=0,所以B={CB1,RR1, CO2,CO3},I(D| B)= I(D| C)终止。
同理:I(D| C0∪{ CO1,RR1 }= I(D| C)=0,此时B={ CO1,RR1, CO2,CO3};
I(D| C0∪{ RR1, CB1}= I(D| C)=0,此时B={ RR1, CB1, CO2,CO3}。
步骤5 所给算法求出该决策表的约简有3个,分别为:{ CO1,RR1, CO2,CO3},{ RR1, CB1, CO2,CO3},{ CB1,RR1, CO2,CO3}。
3. 计算机仿真结果
本文提出的改进的约简算法已经用VC++实现,这里采用四母线系统的作为仿真对象,系统部分接线如图2所示。系统共有9个元件:4条母线B1~B4 ,一台变压器T1和四条输电线路L1~L4。在仿真过程中考虑的保护配置系统有:[1] [2] 下一页
|