摘要
以可扩展性极强的开源软件R程序语言为工具,发挥在统计学和数据挖掘领域强大的数据分析能力,重点研究R语言用于读写FITS格式文件软件包RFITSIO的主要功能和特点,并对LOMAST采集的FITS文件进行详细介绍,将海量LOMAST巡天光谱DR2数据用RFITSIO读出恒星光谱,并利用R语言的主成分分析工具提取各类型光谱数据的特征量即主成分。从含有大量冗余信息的光谱中提取代表恒星光谱特征的主要成分,通过采用主成分分析方法提取光谱特征,重构后能够有效降低原始光谱数据受噪声的影响,为后续数据挖掘工作提供研究基础。
- 单位