A Hyperspectral Prediction Model for Organic Matter Content in Soil Developed from Loess-like Parent Material in Liaoning Province
-
摘要:目的 建立辽宁省黄土状母质发育土壤有机质含量的高光谱预测模型,以便快速获取土壤样品的有机质含量。方法 对省域内黄土状母质发育土壤进行了样品采集,获取样品有机质含量和高光谱数据;选择原始光谱及其一阶微分、二阶微分、倒数对数、倒数对数一阶微分、倒数对数二阶微分6种光谱变换数据作为自变量,与土壤有机质含量进行相关分析,选取特征波段,分别建立多元逐步线性回归(SMLR)、偏最小二乘回归(PLSR)和主成分回归(PCR)3种土壤有机质高光谱线性预测模型,并进行了支持向量机(SVM)方法的非线性模型拟合。结果 土壤有机质含量与其光谱反射率呈负相关关系,对光谱进行不同的数学变换,可以提高土壤有机质含量与光谱反射率的相关性,其中一阶微分和二阶微分的提升效果最佳;相同光谱数据在不同模型中建模精度存在显著差异,以原始光谱反射率一阶微分为自变量的PLSR模型精度最高,建模集和验证集的决定系数(R2)分别为0.958和0.976;3种线性方法建立的最佳预测模型的检验精度为:PLSR > SMLR > PCR。结论 PLSR模型是辽宁省黄土状母质发育土壤有机质含量的最佳高光谱预测模型,且基于特征波段的建模效果优于全波段;SVM非线性模型的预测精度较低。Abstract:Objective A hyperspectral prediction model for organic matter content of soil developed from loess-like parent material in Liaoning Province was established for rapid acquiring contents of soil organic matter (SOM).Method Samples were collected from soils developed from loess-like parent material, and their SOM contents and hyperspectral data were determined. The original spectra and its six spectral transformations of first-order differential, second-order differential, inverse logarithmic, inverse logarithmic first-order differential and inverse logarithmic second-order differential were selected as independent variables, to conduct correlation analysis with SOM content. The characteristic bands in the spectra data were selected, and three linear models for hyperspectral prediction of SOM content were developed by using multiple stepwise linear regression (SMLR), partial least squares regression (PLSR) and principal component regression (PCR), respectively. While nonlinear model fitting by support vector machine (SVM) was also performed.Results The SOM content was negatively correlated with spectral reflectance. The different mathematical treatments of the spectra could improve the correlation between SOM content and spectral reflectance, especial for the first-order differential and second-order differential treatments. the model accuracy of the same spectral in different models differed significantly, the PLSR model with the first-order differentiation of the original spectral reflectance as the independent variable had the highest accuracy, and the coefficients of determination (R2) of the modeling set and validation set were 0.958 and 0.976. The test accuracies of the best prediction models established by the three linear methods were: PLSR > SMLR > PCR.Conclusion The PLSR model was the optimal model for predicting the organic matter content of soil developed from loess-like parent material in Liaoning Province, and the model based on the characteristic bands was better than that based on full bands. The prediction accuracy of SVM nonlinear model was lower.
-
表 1 土壤有机质与不同光谱变换数据的相关分析结果
Table 1 Results of correlation analysis of soil organic matter with different spectral transform data
光谱变换
Spectral transform最大相关波段(nm)
Maximum correlation band相关系数
Correlation coefficientSG 742 ~ 777 −0.313** FD 1426 −0.537** SD 1417 ~ 1418 −0.539** RL 741 ~ 775 0.317** RLFD 1422 ~ 1423 0.466** RLSD 1415 ~ 1416 0.443** 注:** 在0.01水平上相关,SG— 原始光谱反射率;FD— 光谱反射率一阶微分;SD— 光谱反射率二阶微分;RL— 光谱反射率倒数的对数;RLFD— 光谱反射率倒数的对数的一阶微分;RLSD— 光谱反射率倒数的对数的二阶微分。下同。 表 2 土壤有机质含量多元逐步线性回归(SMLR)方法建模精度统计
Table 2 Model accuracy statistics of multiple stepwise linear regression (SMLR) method for soil organic matter content
光谱变换
Spectral
transform决定系数
Decision factor均方根误差RMSEP
Root mean
square error剩余预测偏差RPD
Residual Prediction
deviationRc2 Rv2 SG 0.191 0.100 10.326 1.050 FD 0.456 0.421 8.392 1.292 SD 0.682 0.721 5.833 1.858 RL 0.154 0.115 10.460 1.036 RLFD 0.369 0.436 8.376 1.294 RLSD 0.740 0.820 4.772 2.271 注:Rc2—建模集决定系数,Rv2—预测集决定系数。下同。 表 3 土壤有机质含量偏最小二乘回归(PLSR)方法建模精度统计
Table 3 Model accuracy statistics of partial least squares regression (PLSR ) method for soil organic matter content
光谱变换
Spectral transform建模集
Modeling set验证集
Validation setRc2 RMSEC Rv2 RMSEP RPD SG 0.678 4.845 0.523 7.591 1.094 FD 0.958 1.749 0.976 1.757 6.169 SD 0.897 2.731 0.883 2.731 3.969 RL 0.696 4.696 0.606 6.908 1.569 RLFD 0.902 2.674 0.881 3.869 2.802 RLSD 0.852 3.278 0.780 5.322 2.037 表 4 土壤有机质含量主成分回归法(PCR)建模精度统计
Table 4 Modeling accuracy statistics of principal component regression method (PCR) for soil organic matter content
光谱变换
Spectral transform建模集
Modeling set验证集
Validation setRc2 RMSEC Rv2 RMSEP RPD SG 0.484 6.124 0.300 9.177 1.181 FD 0.373 6.746 0.175 9.867 1.099 SD 0.336 6.942 0.140 10.060 1.077 RL 0.490 6.084 0.348 8.845 1.225 RLFD 0.283 7.215 0.206 9.705 1.117 RLSD 0.224 7.505 0.130 10.129 1.070 表 5 不同光谱变换对土壤有机质含量高光谱建模结果的影响
Table 5 Effect of different spectral transformations on hyperspectral modeling results of soil organic matter content
研究对象
Research object光谱变换
Spectral transform最优模型
Optimal model研究者
Researcher伊利诺伊州土壤 RLFD、RLSD RLFD-PLSR Krishnan等[29] 湖北省大治市矿业复垦地土壤 FD、SD、RL FD-SVM 沈强等[30] 辽河三角洲土壤 FD、RFD、LFD、CR CR-PLSR 李媛媛等[31] 黑龙江海伦市土壤 CARS CARS-RF 唐海涛等[32] 江苏中部土壤 RL、CR RL-SMLR 赵明松等[33] 辽宁省黄土状母质发育土壤 FD、SD、RL、RLSD、RLFD FD-PLSR 本研究 注:RFD—倒数一阶微分,LFD—对数一阶微分。 表 6 研究对象对土壤有机质含量高光谱建模结果的影响
Table 6 Effects of research object on the hyperspectral modeling results of soil organic matter content
研究区
Research
area研究对象
Research
object研究对象分类
Research object
classification样品数量(个)
Number of
samples最优模型
Optimal
model最优模型建模
决定系数
Optimal
model Rc2研究者
Researcher山东平度 农田土壤 土地利用类型 116 FD-BPNN 0.736 李雪等[9] 南疆阿瓦提、温宿、
和田、新和农田土壤 土地利用类型 261 SG-PLSR 0.835 张丽等[37] 浙江平湖 水稻土 土壤类型 89 RL-PLSR 0.945 程街亮[36] 黑龙江省 典型黑土 土壤类型 675 FD-SMLR 0.933 刘焕军等[34] 江西省 红壤 土壤类型 34 FD-PLSR 0.955 刘磊等[35] 澳大利亚 变性土、铁铝土、黏盘土、淋溶土、
碱土、灰壤、薄层土、钙积土土壤类型 1104 DWT-SVM 0.840 Viscarra Rossel等[10] 广东省 赤红壤、红壤、砖红壤、水稻土 土壤类型 75 FD-UCF 0.650 王婷等[40] 江西省、安徽宣城、定远 红黏土、红砂岩发育的水稻土、
红黏土发育的林地土壤、
冲积物发育的水田土壤母质类型 321 RL-PLSR 0.910 邬登巍等[39-40] 江西省 河流现代冲积物发育的潮土 母质类型 71 SD-PLSR 0.984 卓荦[41] 辽宁省 粗面岩质火山碎屑物发育土壤 母质类型 42 RLFD-PLSR 0.975 刘金宝等[42] 郑州邙山 黄土 母质类型 47 SD-PLSR 0.840 李双权等[43] 辽宁省 黄土状母质发育土壤 母质类型 192 FD-PLSR 0.958 本研究 表 7 波段选择对土壤有机质含量高光谱建模结果的影响
Table 7 Effect of band selection on the hyperspectral modeling results of soil organic matter content
研究对象
Research subject最优波段选择
Optimal band selection最优模型
Optimal model最优模型建模决定系数
Optimal model Rc2研究者
Researcher山西省复垦农田土壤 特征波段 RL-PLSR 0.950 南锋等[11] 山东省盐化潮土和滨海盐渍土 特征波段 FD-PLSR 0.891 Shugang Xie等[12] 东北典型黑土 特征波段 FD-PLSR 0.993 印影[13] 青海三江源区与湟水流域不同类型土壤 特征波段 FD-PLSR 0.862 肖云飞[14] 青海湟水流域表层土壤 特征波段 SCARS-RF 0.940 李冠稳等[15] 辽宁省黄土状母质发育土壤 特征波段 FD-PLSR 0.958 本研究 -
[1] 韩俊丽. 全球陆地黄土及黄土地貌成因探讨[J]. 阴山学刊: 自然科学版, 1998, 14(1): 53 − 56. [2] 张甘霖, 王秋兵, 等. 中国土系志·辽宁卷[M]. 北京: 科学出版社. 2019: 28 − 29. [3] 刘焕军, 张美薇, 杨昊轩, 等. 多光谱遥感结合随机森林算法反演耕作土壤有机质含量[J]. 农业工程学报, 2020, 36(10): 134 − 140. [4] 李晓萍, 梁哲军, 杨志国, 等. 土壤有机质测定方法的改进与探索[J]. 现代农业科技, 2021, 50(20): 155 − 157. [5] 鲍士旦. 土壤农化分析3版[M]. 北京: 中国农业出版社, 2000: 25 − 35. [6] 王 琼, 陈 兵, 戴建国, 等. Landsat8与国产卫星数据在表层土壤有机质反演中的对比研究[J]. 绿洲农业科学与工程, 2017, 3(3): 11 − 20. [7] 李厚萱, 王 翔, 于滋洋, 等. 不同测试条件对土壤有机质光谱预测模型精度的影响[J]. 土壤通报, 2020, 51(6): 1359 − 1365. [8] 刘焕军, 潘 越, 窦 欣, 等. 黑土区田块尺度土壤有机质含量遥感反演模型[J]. 农业工程学报, 2018, 34(1): 127 − 133. [9] 李 雪, 范仲卿, 高 涵, 等. 基于高光谱的土壤有机质快速检测模型构建[J]. 山东农业大学学报(自然科学版), 2021, 52(5): 833 − 839. [10] Viscarra Rossel R A, Behrens T. Using data mining to model and interpret soil diffuse reflectance spectra[J]. Geoderma, 2010, 158(1-2): 46 − 54. doi: 10.1016/j.geoderma.2009.12.025
[11] 南 锋, 朱洪芬, 毕如田. 黄土高原煤矿区复垦农田土壤有机质含量的高光谱预测[J]. 中国农业科学, 2016, 49(11): 2126 − 2135. [12] Shugang Xie, Fangjun Ding, Shigeng Chen, et al. Prediction of soil organic matter content based on characteristic band selection method[J]. Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy, 2022, 273(120949): 1386 − 1425.
[13] 印 影. 黑土有机质含量的高光谱估测模型研究[D]. 长春: 吉林大学, 2015. [14] 肖云飞. 青海省土壤有机质、全碳、全氮高光谱遥感估算研究[D]. 西宁: 青海师范大学, 2019. [15] 李冠稳, 高小红, 肖能文, 等. 特征变量选择和回归方法相结合的土壤有机质含量估算[J]. 光学学报, 2019, 39(9): 361 − 371. [16] 李卓群. 1959 ~ 2016年辽宁省农业气候资源的变化特征[J]. 新农业, 2018, 48(5): 4 − 8. doi: 10.3969/j.issn.1002-4298.2018.05.002 [17] 刘艳伟, 王淑莹, 焦忠帅, 等. 2000 ~ 2016年辽宁省NDVI时空变化及其与降水量的关系[J]. 排灌机械工程学报, 2021, 39(10): 1040 − 1045. [18] 彭玉魁, 张建新, 何绪生, 等. 土壤水分、有机质和总氮含量的近红外光谱分析研究[J]. 土壤学报, 1998, 35(4): 553 − 559. [19] 邓永鹏, 朱洪芬, 丁皓希, 等. 基于高光谱技术的退耕还林地年限判别[J]. 农业工程学报, 2022, 38(3): 66 − 74. [20] 芦永军, 张 军, 朴仁官, 等. 组合生成算法与多元线性回归相结合用于近红外光谱波长的优选[J]. 分析化学, 2004, 32(8): 1116 − 1119. [21] 郭 颖, 郭治兴, 刘 佳, 等. 亚热带典型区域水稻土氧化铁高光谱反演−以珠江三角洲为例[J]. 应用生态学报, 2017, 28(11): 3675 − 3683. [22] 谢远玉, 王培娟, 朱凌金, 等. 基于气象因子的赣南脐橙气候品质指标评价模型[J]. 生态学杂志, 2019, 38(7): 2265 − 2274. [23] 宁 娟, 丁建丽, 杨爱霞, 等. 基于高光谱与电磁感应技术的干旱区绿洲土壤含水量反演研究[J]. 干旱地区农业研究, 2018, 36(3): 258 − 265. [24] 郭 鹏, 李 婷, 张世熔, 等. 西河流域不同海拔区土壤有效钾的高光谱反演[J]. 土壤通报, 2019, 50(2): 274 − 281. [25] 胡 飞, 刘红亮, 万 能, 等. 湖北建始县建业镇土壤有机质光谱特征分析[J]. 资源环境与工程, 2020, 34(4): 615 − 619. [26] 李映雪, 朱 艳, 田永超, 等. 小麦冠层反射光谱与籽粒蛋白质含量及相关品质指标的定量关系[J]. 中国农业科学, 2005, 38(7): 1332 − 1338. [27] 阿依努尔·麦提努日, 麦麦提吐尔逊·艾则孜, 李新国. 基于地理加权回归模型的葡萄园土壤砷含量高光谱反演[J]. 环境监测管理与技术, 2021, 33(4): 45 − 48. [28] 史 舟. 土壤地面高光谱遥感原理与方法[M]. 北京: 科学出版社, 2014: 19 − 21. [29] Krishnan P, Alexander J D, Butler B J, et al. Reflectance Technique for Predicting Soil Organic Matter1[J]. Soil Science Society of America Journal, 1980, 44(6): 1282 − 1285. doi: 10.2136/sssaj1980.03615995004400060030x
[30] 沈 强, 张世文, 夏沙沙, 等. 基于支持向量机的土壤有机质高光谱反演[J]. 安徽理工大学学报(自然科学版), 2019, 39(4): 39 − 45. [31] 李媛媛, 李 微, 刘 远, 等. 基于高光谱遥感土壤有机质含量预测研究[J]. 土壤通报, 2014, 45(6): 1313 − 1318. [32] 唐海涛, 孟祥添, 苏循新, 等. 基于CARS算法的不同类型土壤有机质高光谱预测[J]. 农业工程学报, 2021, 37(2): 105 − 113. doi: 10.11975/j.issn.1002-6819.2021.2.013 [33] 赵明松, 谢 毅, 陆龙妹, 等. 基于高光谱特征指数的土壤有机质含量建模[J]. 土壤学报, 2021, 58(1): 42 − 54. [34] 刘焕军, 张 柏, 赵 军, 等. 黑土有机质含量高光谱模型研究[J]. 土壤学报, 2007, 44(1): 27 − 32. [35] 刘 磊, 沈润平, 丁国香, 等. 基于高光谱的土壤有机质含量估算研究[J]. 光谱学与光谱分析, 2011, 31(3): 762 − 766. [36] 程街亮. 土壤高光谱遥感信息提取与二向反射模型研究[D]. 杭州: 浙江大学, 2008. [37] 张 丽, 郝梦洁, 鲁新新, 等. 基于光谱数据的南疆农田土壤有机碳含量估算模型研究[J]. 塔里木大学学报, 2020, 32(4): 49 − 58. [38] 邬登巍, 张甘霖. 母质与土地利用类型对土壤光谱反演模型的影响[J]. 土壤, 2016, 48(1): 173 − 179. [39] 邬登巍, 张甘霖. 土壤有机质和母质特征对典型水稻土时间序列VNIR漫反射光谱的影响与解析[J]. 光谱学与光谱分析, 2015, 35(12): 3375 − 3381. [40] 王 婷, 刘振华, 彭一平, 等. 华南地区土壤有机质含量高光谱反演[J]. 江苏农业学报, 2020, 36(2): 350 − 357. doi: 10.3969/j.issn.1000-4440.2020.02.014 [41] 卓 荦. 基于高光谱遥感的土壤重金属空间分布研究[D]. 武汉: 武汉大学, 2010. [42] 刘金宝. 火山碎屑物发育土壤有机质含量的高光谱预测模型研究[D]. 沈阳: 沈阳农业大学, 2017. [43] 李双权, 马玉凤, 刘 勋, 等. 郑州邙山枣树沟黄土剖面常量元素含量的高光谱反演[J]. 自然资源遥感, 2021, 33(3): 121 − 129.