李玉鑑 杨红丽 刘兆英

李玉鑑, 杨红丽, 刘兆英. 深层感知器结构设计的逐层主成分分析方法[J]. 机械工程学报, 2017, 43(2): 230-236. doi: 10.11936/bjutxb2016040024
LI Yujian, YANG Hongli, LIU Zhaoying. Deep Perception Structure Design Via Layer-wise Principal Component Analysis[J]. JOURNAL OF MECHANICAL ENGINEERING, 2017, 43(2): 230-236. doi: 10.11936/bjutxb2016040024
基金项目: 国家自然科学基金资助项目(61175004);高等学校博士学科点专项科研资助项目(20121103110029);中国博士后科学基金资助项目(2015M580952)

    作者简介: 李玉鑑(1968—), 男, 教授, 主要从事模式识别、图像处理、机器学习、数据挖掘方面的研究, E-mail:liyujian@bjut.edu.cn

  • 中图分类号: TP391

Deep Perception Structure Design Via Layer-wise Principal Component Analysis

  • 摘要: 为了解决深层感知器的结构设计问题,提出了一种逐层主成分分析方法. 该方法根据训练数据集的分布特点,在适当控制信息损失的条件下,可以有效地确定每层神经元的个数. 首先,依据样本维数和标签类数分别确定输入层和输出层神经元的个数;然后,对训练样本集进行主成分分析,利用降维后的维数确定第2层神经元的个数;最后,在确定其他层神经元的个数时,将上一次降维后的样本经过非线性激活函数作用,再进行主成分分析,得到降维后的样本维数即为该层神经元的个数. 在MNIST手写字数据集上的实验结果表明:该方法有助于简化深层感知器的结构,在减少参数个数、缩短收敛时间和降低训练难度等方面均具有优越性.


  • 图  深层感知器结构图

    Figure  1.  Deep perception structure

    图  GLPCA确定的不同层数网络结构及相应的训练和测试错误率

    Figure  2.  Training and test error of networks with various structures designed by GLPCA

    表  1  对比实验数据和结果

    Table  1.   Data and results of comparison experiments

    实验 Hinton实验 逐层主成分分析实验
    网络层数 5 5 6
    网络结构 784-500-500-2000-10 784-388-352-325-10 784-388-352-325-302-10
    神经元总个数 3794 1859 2161
    参数个数 1.67×106 5.59×105 6.58×105
    收敛时间/h(相同机器训练) 10.218 2.121 2.300
    测试集错误率/% 1.20、1.14 1.15 1.09
    下载: 导出CSV

    表  2  实验相关数据及结果

    Table  2.   Experiment data and results

    网络层数 深层感知器结构 训练错误率达到0 训练网络收敛 测试错误率/%
    迭代次数 时间/h 迭代次数 时间/h 网络收敛 迭代过程中最低
    3 784-388-10 32 0.497 129 2.514 1.58 1.51
    4 784-388-352-10 39 0.538 105 2.132 1.39 1.29
    5 784-388-352-325-10 28 0.463 63 2.121 1.15 1.11
    6 784-388-352-325-302-10 27 0.724 54 2.300 1.09 1.06
    7 784-388-352-325-302-282-10 28 1.074 48 2.415 1.15 1.14
    8 784-388-352-325-302-282-264-10 25 2.303 48 4.834 1.19 1.15
    下载: 导出CSV
