![地球科学中的大数据分析与挖掘算法手册](https://wfqqreader-1252317822.image.myqcloud.com/cover/574/33783574/b_33783574.jpg)
上QQ阅读APP看书,第一时间看更新
1.1.7 地球科学应用案例
以一个简单的林火风险预测为例,从一幅遥感影像中可以提取到植被的覆盖度类型,从空间数据库中查取过去一年中该地区的降水量,由数字高程模型(Digital Elevation Model,DEM)提取该地区的坡度图,应用关联规则算法得出发生山火的概率[10]。
首先,对已经得到的属性数据进行离散化处理,各属性的取值范围为植被覆盖度V[0,100]、坡度S[0,90]、降水量R[0,100]、山火发生概率F[1,10]。四维属性值的分割见表1-3~表1-6。
表1-3 植被覆盖度属性分割
![](https://epubservercos.yuewen.com/344980/18061422308241106/epubprivate/OEBPS/Images/3.jpg?sign=1739258271-pW9XQGipp0m1oprKfHGxH94vKWW1XXan-0-1da37a1aa2a7062ba7001c8346decfe9)
表1-4 坡度属性分割
![](https://epubservercos.yuewen.com/344980/18061422308241106/epubprivate/OEBPS/Images/4.jpg?sign=1739258271-0V1qDiJpK3cHcKbvb71t9V4E9MhPHfV5-0-e6bdce93cfefc231142161b89596b743)
表1-5 降水量属性分割
![](https://epubservercos.yuewen.com/344980/18061422308241106/epubprivate/OEBPS/Images/5.jpg?sign=1739258271-k1ejiOK9ypnO5QNt6W0I7NwgEJjiTIIm-0-71b5167821fc3708a4b4826d4dd18ca8)
表1-6 山火发生概率属性分割
![](https://epubservercos.yuewen.com/344980/18061422308241106/epubprivate/OEBPS/Images/6.jpg?sign=1739258271-J29dPWN0PuACH1iqlVxCz9F72F5CI4xk-0-10fada626995614e67d07ca2bacdfd52)
为了将关联规则用于遥感图像数据这类量化数据,首先应该将量化数据离散化,即需将图像数据转化为事务数据库的形式,事务数据库一般由事务的标识符和事务项集组成,在遥感图像中,每一个像素都代表一个事务,表1-7为图像数据转化为事务数据库形式的示例。
表1-7 事务数据库形式
![47855-00-041-1.jpg](https://epubservercos.yuewen.com/344980/18061422308241106/epubprivate/OEBPS/Images/47855-00-041-1.jpg?sign=1739258271-i4SfT8VPgmoV9GobQlIXIHDkdT0Ty4El-0-5a12fa0637fea02cc98ee9019c6c94f2)
假设最小支持度为50%,最小置信度为60%。经过属性分割的所有块将成为候选项集,分别计算它们在60 000次交易中出现的次数。表1-8为计算后的四维关联规则。
表1-8 四维关联规则
![47855-00-042-1.jpg](https://epubservercos.yuewen.com/344980/18061422308241106/epubprivate/OEBPS/Images/47855-00-042-1.jpg?sign=1739258271-Cypf35AXs3461AmkA2Acj94UIpViEclU-0-f65a917b7ecfb1f3379639b2e788107b)
从上述的例子来看,坡度高、降水量多容易发生山火;坡度低、降雨量低、植被覆盖率低的地区,发生山火的概率不是很大;对于植被覆盖率比较大、坡度大于35°、上一年平均降水量小于64 cm的地区,在空气干燥季节尤其要引起注意。