《河南大学》 2019年
收藏 | 手机打开
二维码
手机客户端打开本文

基于改进蜻蜓算法的生物医学数据特征选择方法研究

郑金格  
【摘要】:随着人类社会的不断进步,生命健康逐渐成为了人类生存发展的重要需求。而各种类型的疾病是影响人类生命健康的首要因素。随着基因组测序技术的日渐完善,大量有价值数据被积累下来。对这些数据的有效挖掘与分析,可有效推动临床诊断工作的进一步发展。基因表达数据通常拥有少量的数据样本,但却包含着大量的冗余信息。面对如此大规模数据,不仅医疗人员很难在短时间内对数据进行有效分析,即使通过数据分析算法对数据进行处理,过多冗余信息也容易导致算法产生过度拟合,从而误导医疗人员的诊断。特征选择方法作为数据预处理的有效方法,被广泛应用到医学数据的处理工作当中。作为一种高效的数据降维技术,特征选择在医学领域获得了广泛关注,已被成功的应用到疾病数据诊断工作当中。其中,基于Wrapper的特征选择方法因为具有更高的分类精度和灵活性成为了研究的热点内容。该方法的性能主要受到搜索算法的影响,不同的搜索算法对结果的影响也有所不同。蜻蜓算法作为一种新兴的搜索算法,已经被广泛应用到参数优化、全局寻优等问题当中。本文对蜻蜓算法的特征选择策略进行了改进,并将其应用到帕金森、肺癌、白血病等疾病数据的预测诊断工作当中,主要研究成果如下:(1)提出了一种基于改进蜻蜓算法的帕金森疾病特征选择策略。针对目前已经累积的帕金森疾病的相关数据,本文提出了一种基于改进蜻蜓算法(Improve Binary Dragonfly Algorithm,IBDA)的特征选择策略。通过该方法对帕金森数据的特征进行分析和筛选,有助于对潜在帕金森病人的快速诊断和治疗。该方法首先利用DE算法对Logical回归序列产生的初始种群进行更新,选取最佳个体作为BDA更新的初始种群,通过BDA算法的平行、聚合、分离、觅食和避敌五种行为来进一步求解。此外,在迭代过程中采取精英策略来保持种群的优良性,利用Levy飞行避免求解陷入局部最优。实验数据来自UCI上公开的帕金森数据集,并从多个指标比较了IBDA、WOA、BALO和GA等其他特征选择算法的性能,实验结果表明提出的IBDA算法在帕金森疾病特征选择上具有更好的性能。(2)提出了一种基于优化蜻蜓算法的高维疾病数据特征选择策略。高维疾病数据的冗余问题一直是医疗诊断工作中亟待解决的重要问题之一,但通过特征选择技术可有效处理该问题。本文主要针对白血病、肺癌等高危疾病进行特征选择操作,通过选取有效的疾病特征来帮助医疗人员进行早期的诊断工作。该方法主要在蜻蜓算法的基础上加入精英策略保证最优解传递的同时,又加入了模拟退火算法,有效提高了算法的收敛速度和预测精度,增强了算法的搜索性能。本次实验将该方法与一些经典的方法,如信息增益、卡方检测、Relief、GA算法和MPSO算法分别进行了大量的比较实验,实验结果表明,该方法在高维数据处理工作中具有一定的参考意义。
【学位授予单位】:河南大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:R318;TP18

(、、)

支持CAJ、PDF文件格式


【相似文献】
中国期刊全文数据库 前10条
1 赵玮;;采用机器学习的聚类模型特征选择方法比较[J];华侨大学学报(自然科学版);2017年01期
2 严菲;王晓栋;;基于局部判别约束的半监督特征选择方法[J];模式识别与人工智能;2017年01期
3 张玉红;周全;胡学钢;;面向跨领域情感分类的特征选择方法[J];模式识别与人工智能;2013年11期
4 姚旭;王晓丹;张玉玺;权文;;特征选择方法综述[J];控制与决策;2012年02期
5 孙霞;郑庆华;;一种面向非平衡数据的邻居词特征选择方法[J];小型微型计算机系统;2008年12期
6 龚静;曾建一;;文本聚类中的特征选择方法[J];吉首大学学报(自然科学版);2008年02期
7 王欣欣;;混合自适应引力搜索优化的特征选择方法[J];计算机工程与应用;2017年12期
8 戴建国;;一种新的有监督特征选择方法[J];陕西理工大学学报(自然科学版);2017年04期
9 徐璐;李雄伟;张阳;王晓晗;桂伟龙;;基于概率分布的硬件木马检测特征选择方法[J];火力与指挥控制;2017年09期
10 王晓栋;严菲;谢勇;江慧琴;;基于稀疏图表示的特征选择方法研究[J];计算机工程与科学;2015年12期
中国重要会议论文全文数据库 前10条
1 李高明;易东;;基因表达谱高维大数据的特征选择方法应用策略[A];2017年中国卫生统计学学术年会论文集[C];2017年
2 顾成杰;张顺颐;刘凯;黄河;;基于粗糙集和禁忌搜索的特征选择方法[A];江苏省电子学会2010年学术年会论文集[C];2010年
3 唐凤珍;Lukas Adam;斯白露;;基于多类别支持向量机的组特征选择方法[A];第四届全国神经动力学学术会议摘要集[C];2018年
4 徐燕;王斌;李锦涛;孙春明;;知识增益:文本分类中一种新的特征选择方法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
5 王秀娟;郭军;郑康锋;;基于互信息可信度的特征选择方法[A];2006通信理论与技术新进展——第十一届全国青年通信学术会议论文集[C];2006年
6 肖婷;唐雁;;文本分类中特征选择方法及应用[A];2008年计算机应用技术交流会论文集[C];2008年
7 靖红芳;王斌;杨雅辉;;基于类别分布的特征选择框架[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
8 陈庆轩;郑德权;郑博文;赵铁军;李生;;中文文本分类中基于文档频度分布的特征选择方法[A];黑龙江省计算机学会2009年学术交流年会论文集[C];2010年
9 徐燕;孙春明;王斌;李锦涛;;基于词条频率的特征选择算法研究[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
10 陈鑫;梁海洁;廖腾峰;;基于TSVM分类器和混合型特征选择方法的入侵检测研究[A];2010年全国开放式分布与并行计算机学术会议论文集[C];2010年
中国博士学位论文全文数据库 前10条
1 郑月锋;面向结构化数据的启发式混合特征选择方法研究[D];吉林大学;2019年
2 潘吴斌;加密流量精细化分类技术研究[D];东南大学;2018年
3 杜利敏;面向不平衡数据的特征选择与半监督分类算法研究[D];西南交通大学;2017年
4 吴越;面向网站无障碍检测的组稀疏特征选择方法的研究及应用[D];浙江大学;2018年
5 边婧;不平衡网络异常数据代价敏感特征及实例选择[D];太原理工大学;2016年
6 毛勇;基于支持向量机的特征选择方法的研究与应用[D];浙江大学;2006年
7 裴志利;数据挖掘技术在文本分类和生物信息学中的应用[D];吉林大学;2008年
8 尹留志;关于非平衡数据特征问题的研究[D];中国科学技术大学;2014年
9 张逸石;基于冗余—互补散度及特征包络前沿的数据驱动特征选择方法研究[D];华中科技大学;2016年
10 于哲夫;一种新的特征选择方法及其在路面使用性能分析中的应用[D];大连海事大学;2011年
中国硕士学位论文全文数据库 前10条
1 王莹;基于群智能算法的特征选择方法研究[D];吉林大学;2019年
2 郑金格;基于改进蜻蜓算法的生物医学数据特征选择方法研究[D];河南大学;2019年
3 张玉梅;基于流形规整的扩展自适应Lasso多类别特征选择方法研究[D];安徽大学;2019年
4 金姗姗;射频指纹特征选择与降维方法研究[D];哈尔滨工程大学;2019年
5 张尧;基于互信息的特征选择方法研究[D];西安理工大学;2019年
6 张英杰;基于文档层词频重排序的特征选择方法的研究与应用[D];西安理工大学;2019年
7 陈云飞;基于启发式算法的特征选择方法研究及应用[D];兰州大学;2019年
8 潮洛蒙;基于信息熵和迭代SVM的特征选择方法研究[D];哈尔滨工程大学;2019年
9 戴建国;基于类别概率的特征选择方法[D];广州大学;2018年
10 黄磊;癌症分类中基因选择的收缩特征选择算法研究[D];湖南大学;2015年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026