摘 要:將医院网络入侵行为作为研究对象,提出基于SSA和 ELM 的网络入侵特征选择模型,有效实施网络入侵行为检测。该方法应用 SSA 算法优选网络入侵特征属性,用于改进 EI.M 网络分类性能,通过减少模型输入特征数,来降低计算复杂度。将模型用于医院网络 Dos,Probe,R2L.等攻击行为样本检测,结果表明检测准确率能够达 90%以上,检测时长在 0.5 s 以内,误报率不超 0.3%,能满足医院网络入侵检测高效、准确、可靠的检测要求
关键词:SSA;ELM;医院网络:入侵检测
中图法分类号:TP393文献标识码:A
1 引言
随着网络技术的普及与应用,各种网络攻击、非法入侵层出不穷,给网络信息安全带来了较大威胁。医院内部网络一旦遭受非法入侵,容易造成患者隐私数据泄露、丢失,从而影响医院正常运营,甚至引发严重的经济损失和社会影响。在网络入侵检测方面,对各种机器学习方法进行了研究,如采用布谷鸟算法和支持向量机实现入侵检测,但仅在处理小样本时可以达到较高准确率,而处理海量数据时容易出现滞后情况[1] ;采用网络搜索法依靠特征参数寻优,尽管能够通过分类器分类,但遍历搜索列表中每组参数将造成搜索时间过长,模型训练效率较低;采用麻雀搜索算法(SSA)直接在相邻特征参数间搜索,更新判断参数选取方向,舍弃无法优化分类器性能的参数,可以迅速查找到优秀特征参数组[2] 。在此基础上,应考虑入侵检测数据不均衡的问题,为避免直接采用机器学习方法造成少数类分类精度较低的问题,需从算法层面着手,结合入侵行为相对正常行为数量少的特点,采用极限学习机(ELM)建立单隐层前馈神经网络,设定隐含层神经元快速学习,以获得良好的泛化性能。综上所述,提出采用基于SSA 算法和ELM 算法的医院网络入侵特征选择和检测模型,通过优化特征参数、模型分类性能,从而获得较高整体检测效率,提升入侵行为检测准确率。
2 网络入侵特征选择模型
2.1 SSA 算法
作为群体智能优化方法,SSA 算法模仿麻雀觅食和逃避捕食者的过程,按照比例将整个麻雀群划分为发现者和追随者,并随机选择个体兼任警戒者[3] 。其中,发现者能量储备较高,负责食物搜索,为追随者指明食物方向;随着追随者能量下降,将跟随发现者去往觅食位置获取能量;警戒者在发现捕食者入侵后,将向群体发出警报,以确保群体安全。采用该算法,假设麻雀群体在N×D 维空间内寻找食物,N 为群体规模, D 为搜索优化维度。空间内食物F = [ F1,F2,…,FD ]T ,麻雀中个体位置为X = [Xn1,Xn2,…,XnD ]T ,n = 1,2,…,N,搜索空间上限为ub = [ub1,ub2,…,ubD ]T ,下限为lb =[lb1,lb2,…,lbD ]T ,则能够完成群体初始化,得到:
式中,E(S,β)为网络输出误差值,H 为深入矩阵,β 为输出权重矩阵,T 为样本目标输出矩阵。采用ELM 实现非线性问题优化,应用极限定理、差值定理等使网络隐含层激活函数达到无穷小,确认输入层权值和隐含层阈值不会给输出层结果输出带来明显影响。因此,采用ELM 可以将训练过程转换为求解最小二乘数β 的过程,得到:
β =H+T (8)
式中,H+为H 的广义逆矩阵,通过正交法获取,能够求解得到唯一的最小值。