留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于递归聚类与相似性的模糊神经网络结构设计

李微 乔俊飞

李微, 乔俊飞. 基于递归聚类与相似性的模糊神经网络结构设计[J]. 机械工程学报, 2017, 43(2): 210-216. doi: 10.11936/bjutxb2016040086
引用本文: 李微, 乔俊飞. 基于递归聚类与相似性的模糊神经网络结构设计[J]. 机械工程学报, 2017, 43(2): 210-216. doi: 10.11936/bjutxb2016040086
LI Wei, QIAO Junfei. Structure Design of Fuzzy Neural Networks Based on Recursive Clustering and Similarity[J]. JOURNAL OF MECHANICAL ENGINEERING, 2017, 43(2): 210-216. doi: 10.11936/bjutxb2016040086
Citation: LI Wei, QIAO Junfei. Structure Design of Fuzzy Neural Networks Based on Recursive Clustering and Similarity[J]. JOURNAL OF MECHANICAL ENGINEERING, 2017, 43(2): 210-216. doi: 10.11936/bjutxb2016040086

基于递归聚类与相似性的模糊神经网络结构设计

doi: 10.11936/bjutxb2016040086
基金项目: 国家自然科学基金资助项目(61533002);国家杰出青年科学基金资助项目(61225016);北京市科技新星计划(Z131104000413007)
详细信息
  • 中图分类号: TP183

Structure Design of Fuzzy Neural Networks Based on Recursive Clustering and Similarity

  • 摘要: 针对模糊神经网络结构设计问题,提出一种基于递归聚类与相似性的结构设计方法. 首先,提出以输出变化强度为导向、以结构细分为手段的递归聚类方法对网络初始结构进行设计. 其次,通过计算模糊规则的相似性,将高度相似的规则进行合并,在保持良好精度的前提下,对网络初始结构进行简化. 最后,通过函数逼近、非线性系统辨识仿真实验验证了方法的可行性和有效性.

     

  • Mamdani模糊神经网络是常用的模糊神经网络模型之一,其模糊规则表达式为

    IF x1 is A 1 j , …, xn is A n j , THEN yj=wj (1)

    式中:j=1,2,…,m,m为规则数;xi(i=1,2,…,n)表示第i个输入变量,n为输入变量个数; A i j 表示变量xi的第j个模糊子集;yj为第j条规则的输出;wj为第j条规则结论部分参数.

    不失一般性,对多输入单输出Mamdani模糊神经网络进行讨论,模型输出可表示为

    y(x)= j = 1 m u ¯ j (x)wj (2)

    式中:y为模型输出;x=[x1,x2,…,xn]为输入向量; u ¯ j 为第j条规则的前提部分输出,其计算式为

    u ¯ j (x)= u j ( x ) i = 1 m u i ( x ) (3)

    uj(x)= i = 1 n μij(xi)= i = 1 n exp (- ( x i - c ij ) 2 / σ ij 2 ) (4)

    式中:μij为第j条规则关于变量xi的高斯隶属函数;cijσij分别为高斯函数的中心与宽度.

    一般而言,模糊神经网络辨识问题可描述如下:对于一个未知的映射函数f: y=f(x),由已知的输入输出数据(x(t), y(t))(t=1,2,…,T)中学习出一个能够最精确表示未知函数f的模糊神经网络模型.

    模糊神经网络辨识本质上是有监督学习问题,因此系统辨识的聚类方法应充分利用导师(输出)信号以满足系统辨识的特殊要求,即:当系统处于近似平滑区域时,粗糙聚类足以满足精度要求,以避免出现过拟合现象;当系统处于高度非线性区域时,需要较精细的类对该区域进行描述.

    基于系统辨识的特殊聚类要求,提出递归聚类的Mamdani模糊神经网络结构设计方法. 该递归聚类方法的基本思想是以输出变化强度为导向、以结构细分为手段的递归迭代过程.

    首先,采用k-均值方法[10]将输入数据x(t)=[x1(t), x2(t), …, xn(t)]划分为K个类,其中

    K= M - m ε + (5)

    式中:[*]+表示大于*的最小整数函数;ε表示聚类精度,该值可根据实际应用中模型精度要求来确定,如可将其设置为输出信号均值的10%;mM分别为样本集合中输出数据y(t)的最小值和最大值.

    m = min t = 1,2 , , T { y ( t ) } M = max t = 1,2 , , T { y ( t ) } (6)

    式(5)表明,将输出最大值与最小值之间的误差划分为K个类,使得每一类的输出变化强度均小于聚类精度,由此可以采用一条规则对该类进行描述.

    其次,根据每一类输出变化强度,判断该类是否需要进一步划分. 对于所获得的第i个类Ii (i=1, 2, …, K),计算其输出数据信息集合

    Oi={y(t)|x(t)∈Ii} (7)

    计算Oi中输出信号的变化强度

    Δi= 1 n i x ( t ) I i [ y ( t ) - y ¯ i ] 2 (8)

    式中:niOi中输出信号的个数; y ¯ i Oi中输出信号的平均值,即

    y ¯ i = 1 n i x ( t ) I i y(t) (9)

    比较输出变化强度Δi和精度阈值的大小. 如果Δiε,则表明第i个类的输出相对平滑,满足精度要求,不需要进一步划分;如果Δi,则表明第i个类的输出非平滑或高度非线性,不满足精度要求,需要进一步划分.

    假设第iIi不满足精度要求,需要进行子聚类,详细过程同上,其中最小值和最大值miMi

    m i = min y ( t ) O i { y ( t ) } M i = max y ( t ) O i { y ( t ) } (10)

    子聚类个数为

    Ksi= M i - m i ε + (11)

    根据上述方法判断Ksi个类的输出强度是否满足精度要求,进而确定该类是否需要进一步划分. 重复上述过程,经过有限次迭代后,自动获得合适的聚类,并且所有类的输出变化强度均满足精度要求,形成递归聚类方法.

    递归聚类方法具有以下优点: 1) 利用输出信息指导聚类过程,属于有监督学习方法,使聚类更准确; 2) 满足系统辨识的特殊聚类要求,即在系统处于平滑区域时进行粗糙聚类,在高度非线性区域时进行精细聚类; 3) 能够自动确定合适的聚类个数,避免通过试错法获得,降低了算法的复杂度.

    假设利用递归聚类算法得到H个类,每个类作为模糊神经网络的一条模糊规则,聚类中心作为隶属函数的中心,聚类标准差作为隶属函数的宽度,从而获得网络的隶属函数. 高斯函数中心与宽度为

    ck,i= 1 n k j = 1 n k xi(kj)ck=(ck,1,…,ck,n)i=1,2,…,n; k=1,2,…,H (12)

    σk,i= 1 2 1 n k j = 1 n k [ x i ( k j ) - c k , i ] 2 σl=(σl,1,…,σl,n)i=1,2,…,n; k=1,2,…,H (13)

    式中:nk为第k类训练样本的个数;kj为第k类第j个样本;高斯隶属函数中心与宽度分别为c=[c1, c2, …, cH],σ=[σ1, σ2, …, σH]. 模糊规则结论部分参数计算为

    wk= 1 n k j = 1 n k y(kj) k=1,2,…,H (14)

    基于高斯函数的中心、宽度和规则结论部分参数,根据式(2)~(4)即可建立Mamdani模糊神经网络的初始结构模型.

    利用递归聚类算法获得Mamdani模糊神经网络结构后,需要对神经网络的参数进行辨识. 文中采用梯度下降法[11]学习参数.

    首先,定义目标函数

    E= 1 2 ( y d - y ) 2 (15)

    式中:yd为系统实际输出;y为Mamdani模糊神经网络输出.

    参数学习的目的是使得期望目标函数E最小. 根据附加动量项的梯度下降法学习连接权值wj,则wj更新为

    wj(t+1)=wj(t) E w j (wj(t)-wj(t-1))=wj(t)(yd-y) u ¯ j (wj(t)-wj(t-1)) (16)

    式中:η为学习率;ζ为动量项系数.

    高斯函数中心与宽度更新公式分别为

    cij(t+1)=cij(t) E c ij (cij(t)-cij(t-1)) (17)

    E c ij =2wj(y-yd ( i j r α i ) ( k i μ kj ) ( x i - c ij ) exp ( - ( x i - c ij ) 2 / σ ij 2 ) ( i = 1 r α i ) 2 σ ij 2 (18)

    σij(t+1)ij(t) E σ ij (σij(t)ij(t-1)) (19)

    E σ ij =2wj(y-yd ( i j r α i ) ( k i μ kj ) ( x i - c ij ) 2 exp ( - ( x i - c ij ) 2 / σ ij 2 ) ( i = 1 r α i ) 2 σ ij 3 (20)

    根据学习高斯隶属函数的中心、宽度以及规则结论部分连接权值,从而得到Mamdani模糊神经网络初始模型.

    基于上述介绍,递归聚类Mamdani模糊神经网络结构设计算法归纳如下:

    步骤1 利用k均值聚类将输入样本划分为K类如式(5).

    步骤2 根据每一类输出变化强度和聚类精度阈值的关系,判断该类是否需要进一步划分. 对于不满足精度要求的类进一步划分为Ksi个类如式(11). 当所有类的输出变化强度都满足精度要求时,停止聚类.

    步骤3 利用聚类结果获得Mamdani模糊神经网络的结构和初始参数.

    步骤4 采用梯度下降法对网络参数进行学习,获得Mamdani模糊神经网络初始模型.

    经过递归聚类与梯度法获得的Mamdani模糊神经网络可能存在相似的模糊规则,导致规则冗余. 因此,需要对相似规则进行合并. 与文献[12]类似,文中只考虑规则前提部分的相似性.

    假设模糊神经网络的一对规则表述为

    IF x is A,THEN y is wA (21)

    IF x is B, THEN y is wB (22)

    式中:AB为输入空间U上2个多变量模糊集;U= i = 1 n Ui= i = 1 n [ai,bi]⊂Rn,aibi分别为输入变量xi的下限和上限;A=A1×A2××An;B=B1×B2××Bn. AB的隶属函数分别为

    uA(x)= i = 1 n μ A i (xi),uB(x)= i = 1 n μ B i (xi) (23)

    根据相似性定义[13],模糊规则相似性的另一种计算方法为输入变量相应模糊集对的交集面积和与并集面积和的比值. 因此,提出交并集面积和的模糊规则相似性方法,其计算式为

    S(A,B)= i = 1 n M ( A i B i ) i = 1 n M ( A i B i ) (24)

    其中

    M(AiBi)= a i b i u A i B i (xi)dxi= a i b i min { u A i (xi), u B i (xi)}dxi (25)

    M(AiBi)= a i b i u A i B i (xi)dxi= a i b i max { u A i (xi), u B i (xi))dxi (26)

    式中:S(A, B)表示AB的相似度;M(AiBi)和M(AiBi)分别表示AiBi交集和并集的面积.

    由式(24)可知,与最小值模糊规则相似度计算方法相比,交并集面积和相似性计算方法具有较好的可区分性,能够更好地对模糊规则相似性进行计算.

    基于模糊规则相似性的网络结构简化方法具体步骤如下:

    首先,利用式(24)~(26)计算所有对规则的相似度S,其中单变量模糊集相似性采用文献[14]提出的方法进行计算.

    其次,计算相似度最大值Smax=max S,并将其与相似度阈值St进行比较. 通常相似度阈值设置为0.6. 如果Smax>St,则将最大相似度所对应的2条模糊规则进行合并;如果Smax<St,则不进行合并. 在相似规则合并过程中,高斯函数中心、宽度以及结论部分参数都采用平均值进行计算[4]. 依据上述方法重新计算所有对规则相似度,将大于阈值的最大相似度所对应的规则进行合并. 重复上述过程,直到最大相似度小于阈值时停止计算,得到简化后的模糊神经网络.

    最后,为提高模型的精度,再次利用梯度法对网络参数进行学习,最终获得结构简洁、精度令人满意的Mamdani模糊神经网络.

    基于上述介绍,相似规则计算与合并的模糊神经网络结构简化算法归纳如下:

    步骤1 利用式(24)~(26)计算所有规则对的相似度S.

    步骤2 计算最大相似度Smax,将其与相似度阈值St进行比较,若Smax>St,转到步骤3;若Smax<St,转至步骤4.

    步骤3 将最大相似度所对应的两条模糊规则进行合并. 重复步骤1~3直至最大相似度小于阈值.

    步骤4 利用梯度法学习网络参数.

    选取式(27)给出的函数进行研究:

    y=0.6sin(πx)+0.3sin(3πx)+0.1sin(5πx) (27)

    式中x∈[-1,1].

    在定义域区间内按均匀分布随机产生200组输入输出数据作为样本,其中100组用于训练模糊神经网络,其余100组用于测试. 相似度阈值设为0.6. 利用所获得的Mamdani模糊神经网络对函数式(27)进行逼近,逼近结果与逼近误差分别如图1、2所示,几种不同方法的性能比较如表1所示.

    图  1  Mamdani模糊神经网络逼近效果
    Figure  1.  Approximation result of Mamdani FNN
    图  2  Mamdani模糊神经网络逼近误差
    Figure  2.  Approximation error of Mamdani FNN

    图1给出了Mamdani模糊神经网络的逼近效果. 图2给出了相应逼近误差. 由图可知,所获得的Mamdani模糊神经网络能够很好地逼近函数式(27). 在此实验中,经过相似性计算后,所有相似度均小于阈值,因此,无须对相似规则进行合并.

    表1为几种不同方法在模糊规则数、参数个数、训练均方根误差(root mean square error,RMSE)及测试RMSE性能指标的比较. 通过表中数值对比可知,与文献[7]的输出内容聚类和文献[8]的输出约束聚类结构设计方法相比,提出的递归聚类结构设计方法在采用相同模糊规则数与参数个数的情况下,具有更小的训练误差和测试误差,由此表明,提出方法比文献[7-8]的方法对函数式(27)具有更高的逼近精度;与文献[15]的方法相比,提出的方法具有更少的规则数和参数个数,以及较小的测试误差. 因此,提出的递归聚类方法具有较高的逼近精度.

    表  1  不同方法的性能对比
    Table  1.  Comparisons between different methods
    方法 模糊规则数 参数个数 训练RMSE 测试RMSE
    Wang等[8] 8 24 0.0241 0.0492
    Pedrycz等[7] 8 24 0.150 0.153
    Pedrycz等[7] 10 30 0.1470 0.1620
    Wang等[15] 11 33 0.0018 0.0225
    本文 8 24 0.0167 0.0395
    本文 10 30 0.0100 0.0168
    下载: 导出CSV 
    | 显示表格

    由仿真实验图及表中结果显示,提出的Mamdani模糊神经网络能够实现对函数式(27)的逼近. 因此,递归聚类是一种有效的Mamdani模糊神经网络结构设计方法.

    式(28)给出了一个典型的非线性系统,该系统被广泛用于验证模糊神经网络算法的有效性[16-19].

    y(t+1)= y ( t ) y ( t - 1 ) [ y ( t ) + 2.5 ] 1 + y 2 ( t ) + y 2 ( t - 1 ) +u(t) (28)

    式中:u(t)=sin(2πt/25),t∈[1,400];y(0)=0,y(1)=0.

    由式(28)可知,该模型由3个输入(y(t), y(t-1), u(t))、1个输出(y(t+1))组成. 由式(28)在t∈[1,400]上得到400组样本数据,其中前200组用于网络训练,其余200组用于测试. 相似度阈值设为0.6.

    图3给出了提出的Mamdani模糊神经网络对非线性系统式(28)的辨识效果. 图4为相应的辨识误差. 几种不同方法的结果比较如表2所示.

    图  3  Mamdani模糊神经网络辨识效果
    Figure  3.  Identification result of Mamdani FNN
    图  4  Mamdani模糊神经网络辨识误差
    Figure  4.  Identification error of Mamdani FNN

    实验过程如下:首先,递归聚类的Mamdani模糊神经网络具有6条模糊规则;其次,采用交并集面积和对模糊规则相似性进行计算,其中2条规则相似度为0.6578,大于相似度阈值. 因此,将这2条规则进行合并,从而获得具有5条规则的Mamdani模糊神经网络.

    图3、4可知,递归聚类的Mamdani模糊神经网络对非线性系统式(28)具有较好的辨识效果,辨识误差较小.

    表2给出了几种不同方法在模糊规则数、参数个数及测试RMSE性能指标的比较. 通过表中数值对比可知,提出方法在结构简化前采用6条规则和42个参数,结构简化后规则数和参数个数分别为5和35,结构简化后的测试RMSE比简化前略高. 与其他几种方法相比,提出方法在结构简化后的规则数、参数个数以及测试RMSE三个指标均最小. 因此,提出的方法能够在具有令人满意精度的情况下,获得简洁的网络结构,实现对非线性函数式(28)的辨识.

    表  2  不同方法的性能对比
    Table  2.  Comparisons between different methods
    方法 模糊规则数 参数个数 测试RMSE
    DFNN[14] 6 48 0.1315
    SOFMLS[17] 6 48 0.0290
    GA[18] 7 37 0.0500
    MCFC[19] 0.0874
    本文(结构简化前) 6 42 0.0207
    本文(结构简化后) 5 35 0.0259
    下载: 导出CSV 
    | 显示表格

    实验结果显示,递归聚类的Mamdani模糊神经网络能够较好地对非线性系统进行辨识,且具有较高的辨识精度. 因此,递归聚类与交并集面积和相似性是有效的Mamdani模糊神经网络结构设计方法.

    1) 提出了以输出变化强度为导向、以结构细分为手段的递归聚类方法,通过递归迭代对模糊神经网络初始结构进行设计.

    2) 提出了相似规则合并的结构简化方法,通过计算模糊规则相似性,将高度相似的规则进行合并,对网络初始结构进行简化.

    3) 为了验证提出方法的有效性,给出了函数逼近与非线性系统辨识2个仿真实验. 实验结果表明,提出的方法能够在具有令人满意精度的情况下,获得简洁的网络结构,实现模糊神经网络结构设计.

    The authors have declared that no competing interests exist.
  • 图  Mamdani模糊神经网络逼近效果

    Figure  1.  Approximation result of Mamdani FNN

    图  Mamdani模糊神经网络逼近误差

    Figure  2.  Approximation error of Mamdani FNN

    图  Mamdani模糊神经网络辨识效果

    Figure  3.  Identification result of Mamdani FNN

    图  Mamdani模糊神经网络辨识误差

    Figure  4.  Identification error of Mamdani FNN

    表  1  不同方法的性能对比

    Table  1.   Comparisons between different methods

    方法 模糊规则数 参数个数 训练RMSE 测试RMSE
    Wang等[8] 8 24 0.0241 0.0492
    Pedrycz等[7] 8 24 0.150 0.153
    Pedrycz等[7] 10 30 0.1470 0.1620
    Wang等[15] 11 33 0.0018 0.0225
    本文 8 24 0.0167 0.0395
    本文 10 30 0.0100 0.0168
    下载: 导出CSV

    表  2  不同方法的性能对比

    Table  2.   Comparisons between different methods

    方法 模糊规则数 参数个数 测试RMSE
    DFNN[14] 6 48 0.1315
    SOFMLS[17] 6 48 0.0290
    GA[18] 7 37 0.0500
    MCFC[19] 0.0874
    本文(结构简化前) 6 42 0.0207
    本文(结构简化后) 5 35 0.0259
    下载: 导出CSV
  • [1] KUNG C C, SU J Y.Affine Takagi-Sugeno fuzzy modelling algorithm by fuzzy c-regression models clustering with a novel cluster validity criterion[J]. IET Control Theory and Application, 2007, 1(5): 1255-1265.
    [2] LI C S, ZHOU J Z, FU B, et al.T-S fuzzy model identification with a gravitational search-based hyperplane clustering algorithm[J]. IEEE Transactions on Fuzzy System, 2012, 20(2): 305-317.
    [3] PEDRYCZ W, IZAKIAN H.Cluster-centric fuzzy modeling[J]. IEEE Transactions on Fuzzy System, 2014, 22(6): 1585-1597.
    [4] CHEN M Y, LINKENS D A.Rule-base self-generation and simplification for data-driven fuzzy models[J]. Fuzzy Sets and Systems, 2004, 142(2): 243-265.
    [5] DELGADO M, GOMEZ-SKARMETA A F, MARTIN F. A fuzzy clustering-based rapid prototyping for fuzzy rule-based modeling[J]. IEEE Transactions on Fuzzy System, 1997, 5(2): 223-233.
    [6] PRASAD M, LIN Y Y, LIN C Y, et al.A new data-driven neural fuzzy system with collaborative fuzzy clustering mechanism[J]. Neurocomputing, 2015, 167: 558-568.
    [7] PEDRYCZ W, KWAK K C.Linguistic models as a framework of user-centric system modeling[J]. IEEE Transactions on Systems, Man, and Cybernetics—Part A: Systems and Humans, 2006, 36(4): 727-745.
    [8] WANG D, ZENG X J, KEANE J A.An output-constrained clustering approach for the identification of fuzzy systems and fuzzy granular systems[J]. IEEE Transactions on Fuzzy System, 2011, 19(6): 1127-1140.
    [9] CHAO C T, CHEN Y J, TENG C C.Simplification of fuzzy neural systems using similarity analysis[J]. IEEE Transactions on Systems, Man, and Cybernetics—Part B: Cybernetics, 1996, 26(2): 344-354.
    [10] MACQUEEN J.Some methods for classification and analysis of multivativate observations [C]∥Proceedings of 5-th Berkeley Symposium on Mathematical Statistics and Probability. Berkeley: University of California Press, 1967: 281-297.
    [11] 李国勇. 神经模糊控制理论及应用[M]. 北京: 电子工业出版社, 2009: 286-316.
    [12] LENG G, PRASAD G, MCGINNITY T M.An on-line algorithm for creating self-organizing fuzzy neural networks[J]. Neural Networks, 2004, 17(10): 1477-1493.
    [13] SETNES M, BABUSKA R, KAYMAK U, et al.Similarity measures in fuzzy rule base simplification[J]. IEEE Transactions on Systems, Man, and Cybernetics—Part B: Cybernetics, 1998, 28(3): 376-386.
    [14] LI W, QIAO J F, ZENG X J.Accurate similarity analysis and computing of Gaussian membership functions for FNN simplification[C]//12th International Conference on Fuzzy Systems and Knowledge Discovery. New York: Institute of Electrical and Electronics Engineers Inc, 2015: 402-409.
    [15] WANG D, ZENG X J, KEANE J A.A clustering algorithm for radial basis function neural network initialization[J]. Neurocomputing, 2012, 77: 144-155.
    [16] ER M J, WU S Q.A fast learning algorithm for parsimonious fuzzy neural systems[J]. Fuzzy Sets and Systems, 2002, 126(3): 337-351.
    [17] RUBIO J D J. SOFMLS: online self-organizing fuzzy modified least-squares network[J]. IEEE Transaction on Fuzzy Systems, 2009, 17(6): 1296-1309.
    [18] GUENOUNOUA O, DAHHOU B, CHABOUR F.TSK fuzzy model with minimal parameters[J]. Applied Soft Computing, 2015, 30: 748-757.
    [19] PRASADMCHOU KPSAXENAAet al.Collaborative fuzzy rule learning for Mamdani type fuzzy inference system with mapping of cluster centersProceedings of 2014 IEEE Symposium Series on Computational Intelligence. New York: Institute of Electrical and Electronics Engineers Inc20141520

    PRASAD M, CHOU K P, SAXENA A, et al.Collaborative fuzzy rule learning for Mamdani type fuzzy inference system with mapping of cluster centers[C]//Proceedings of 2014 IEEE Symposium Series on Computational Intelligence. New York: Institute of Electrical and Electronics Engineers Inc, 2014: 15-20.

  • 加载中
图(4) / 表(2)
计量
  • 文章访问数:  95
  • HTML全文浏览量:  56
  • PDF下载量:  0
  • 被引次数: 0
出版历程
  • 收稿日期:  2016-04-26
  • 网络出版日期:  2022-09-13
  • 刊出日期:  2017-02-01

目录

/

返回文章
返回