New generation of sky survey telescopes (e.g. LAMOST and SDSS) produce large amount of spectra. Automated classification of spectra is highly required. Galaxies, and especially active galactic nucleus (AGNs), are important targets for sky survey programs. Efficient and automated methods for galaxy spectra classification is the basis of systematic research on the physical properties and evolution of galaxies. In this project, deep learning techniques will be applied to spectra and carry out unsupervised feature learning and combine with other machine learning algorithms for spectra classification of galaxies and AGNs. According to its success in many other fields, deep neural networks may largely increase the accuracy of classification. Specifically, deep neural networks such as auto-encoders can reduce the error and complexity introduced by artificial feature engineering, and enhance applicability to different classification problems. Also, the classification method can be explained better when combined with decision tree ensembles. As a result, the output of this project include classification algorithms that can be applied to LAMOST galaxy spectra and can be extend to other spectra classification task.
LAMOST、SDSS等新一代观测设备的运行使天体光谱获取率大大提高,为天文学家们提供了丰富的研究样本。将光谱按不同天体分类是天文学家们利用光谱开展研究的前提。对河外星系,尤其是活动星系核的研究一直是天文研究的热点之一,对星系光谱进行分类是研究星系的物理特性和演化规律的基础。本项目针对新一代巡天观测设备获取的海量光谱数据,开展星系光谱自动分类算法研究。具体来说,应用深度自编码器等非监督特征学习方法来进行星系光谱特征的自动学习,可灵活结合其他有监督的机器学习方法探索星系和活动星系核的细分类。结合决策树集成分类算法可提高模型的解释性。采用深度学习自动学习光谱的特征表达可以减少人工特征工程带来的误差和复杂性,充分利用未标注数据,同时提高模型的泛化能力。本项目研究成果可应用于LAMOST星系光谱分类,补充目前LAMOST数据发布中星系细分类的缺失,且算法可扩展到类似的光谱分类问题。
本项目主要研究应用机器学习对SDSS、LAMOST巡天获得的星系光谱进行特征表示学习和自动分类。星系光谱分类是研究星系形成和演化的基础,在巡天光谱的数量级,人工分类无法完成,需要自动高效的分类方法。本项目探索了利用自监督学习自动提取星系光谱的特征并对星系光谱进行分类,设计并实现了用于对光谱数据进行无监督特征提取的一维卷积自编码器(CAE)网络,与传统的主成分分析(PCA)方法进行了对比。基于提取的特征建立星系光谱自动分类模型,对活动星系核、恒星形成星系、复合星系及其他普通星系光谱进行分类,对比了几种传统机器学习方法和深度神经网络的方法应用于SDSS和LAMOST的星系光谱数据的效果。实验表明,CAE通过卷积提取光谱特征比传统的PCA对光谱特征提取效果好,有针对性的监督训练可获得更好效果。总体来说,恒星形成星系的分类准确率较好,复合星系和其他普通星系的分类准确率相对较低,复合星系容易和恒星形成星系混淆,其他普通星系容易和活动星系核混淆。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于SSVEP 直接脑控机器人方向和速度研究
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
水氮耦合及种植密度对绿洲灌区玉米光合作用和干物质积累特征的调控效应
基于协同表示的图嵌入鉴别分析在人脸识别中的应用
空气电晕放电发展过程的特征发射光谱分析与放电识别
基于深度学习的高光谱图像分类方法研究
基于深度学习的小样本高光谱图像分类方法
基于深度学习算法的森林扰动类型遥感分类方法研究
面向高光谱数据分类的深度学习方法研究