摘要
目的研究适用于全基因组关联分析研究的自动基因选择方法。方法提出了一个基于随机复杂度约束的岭回归优化方法模型——L20模型,并通过推导给出了该模型的快速求解方法。结果通过在1组糖尿病临床数据和4组癌症基因芯片公开数据集上的实验,验证了L20算法的有效性。L20算法不受样本和特征维度限制,对稀疏建模问题的输出结果稳定性好,预测准确性高。且该方法在特征选择过程中即可同步确定特征参数,算法效率高。结论实验数据表明该方法性能优于基因组关联分析研究常用的特征选择算法,为肿瘤遗传标记定位研究提供了一种有希望的解决方案。
- 单位