Journal Search Engine
Search Advanced Search Adode Reader(link)
Download PDF Export Citaion korean bibliography PMC previewer
ISSN : 1229-3857(Print)
ISSN : 2288-131X(Online)
Korean Journal of Environment and Ecology Vol.32 No.6 pp.686-697
DOI : https://doi.org/10.13047/KJEE.2018.32.6.686

Development of a Classification Method for Forest Vegetation on the Stand Level, Using KOMPSAT-3A Imagery and Land Coverage Map

Ji-Yong Song2, Jong-Chul Jeong3, Sang-Hoon Lee4*
2Dept. of Interdisciplinary Program in Landscape Architecture, Seoul National Univ., 1 Gwanak-ro, Gwanak-gu, Seoul 08826, Korea
3Dept. of Geographic Information Science, Namseoul Univ., 91 Daehak-ro, Seonghwan-eup,
Seobuk-gu, Cheonan 31020, Korea
4Dept. of Urban Design and Landscape Ecological Architecture, Hanyang Univ., 222, Wangsimni-ro, Seongdong-gu, Seoul, 04763, Korea
a 이 논문은 국토교통부 위성정보활용센터 설립운영사업의 연구비지원(18SIUE-B148326-01)에 의해 수행되었음.
* 교신저자 Corresponding author: 02-2220-0278, peter337@hanyang.ac.kr
26/11/2018 07/12/2018 14/12/2018

Abstract


Due to the advance in remote sensing technology, it has become easier to more frequently obtain high resolution imagery to detect delicate changes in an extensive area, particularly including forest which is not readily sub-classified. Time-series analysis on high resolution images requires to collect extensive amount of ground truth data. In this study, the potential of land coverage mapas ground truth data was tested in classifying high-resolution imagery. The study site was Wonju-si at Gangwon-do, South Korea, having a mix of urban and natural areas. KOMPSAT-3A imagery taken on March 2015 and land coverage map published in 2017 were used as source data. Two pixel-based classification algorithms, Support Vector Machine (SVM) and Random Forest (RF), were selected for the analysis. Forest only classification was compared with that of the whole study area except wetland. Confusion matrixes from the classification presented that overall accuracies for both the targets were higher in RF algorithm than in SVM. While the overall accuracy in the forest only analysis by RF algorithm was higher by 18.3% than SVM, in the case of the whole region analysis, the difference was relatively smaller by 5.5%. For the SVM algorithm, adding the Majority analysis process indicated a marginal improvement of about 1% than the normal SVM analysis. It was found that the RF algorithm was more effective to identify the broad-leaved forest within the forest, but for the other classes the SVM algorithm was more effective. As the two pixel-based classification algorithms were tested here, it is expected that future classification will improve the overall accuracy and the reliability by introducing a time-series analysis and an object-based algorithm. It is considered that this approach will contribute to improving a large-scale land planning by providing an effective land classification method on higher spatial and temporal scales.



KOMPSAT-3A 위성영상과 토지피복도를 활용한 산림식생의 임상 분류법 개발

송지용2, 정종철3, 이상훈4*
2 서울대학교 협동과정 조경학과 박사과정
3 남서울대학교 공간정보공학과 교수
4 한양대학교 도시설계・경관생태조경학과 조교수
a 이 논문은 국토교통부 위성정보활용센터 설립운영사업의 연구비지원(18SIUE-B148326-01)에 의해 수행되었음.

초록


오늘날 원격탐지기술의 발달로 인해, 산림지역과 같이 피복 분류작업이 난해한 지역을 비롯한 광범위한 지역에서의 세밀한 변화탐지를 위한 고해상도 위성영상 취득이 가능해졌다. 하지만, 고해상도 영상에 대한 시계열분석의 과정에서 많은 양의 지상 관측 데이터가 요구된다. 본 연구에서는 토지피복도를 지상 관측데이터로 활용한 위성영상 분류 방법의 가능성을 시험하였다. 연구대상지는 강원도 원주시이며, 산림지역과 시가화지역이 공존하는 공간이다. 연구 자료는 2015년 3월에 촬영된 KOMPSAT-3A 영상과 2017년도 토지피복도를 이용하여 분류를 시도하였다. 서포트벡터머신 (SVM)과 랜덤포레스트(RF)의 두 가지 상이한 화소기반 분류기법을 적용하여 대상지에 대한 피복분류의 분류정확도를 비교·분석하였으며, SVM 분석의 경우 다수 분석(Majority analysis)을 후속 진행하였다. 분석대상은 산림식생만 포함 한 지역과 연구대상지 전지역으로 구분하였고, 대상 면적이 협소한 습지는 분석과정에서 제외하였다. 분류 결과는 오차 행렬의 전체 정확도가 두 가지 분류대상에 대해 RF 기법이 SVM 기법보다 더 나은 것으로 나타났다. 산림지역만을 대상으로 한 경우, RF 기법이 SVM 기법에 비해 18.3% 높은 값을 나타낸 반면, 전체지역을 대상으로 한 경우는 둘 사이의 간격이 5.5%로 줄어들었다. SVM 기법에 다수 분석 (Majority analysis)을 추가로 실시한 경우, 1% 정도의 정확도 향상이 나타났다. RF 기법은 산림지역의 활엽수를 분석해 내는데 상당히 효과적이었지만, 다른 대상에 대해서는 SVM 기법이 더 나은 결과를 나타내었다. 본 연구는 고해상도 단일시기 영상에 대한 화소 기반의 분류기법을 시험한 것으로, 추후 시계열분석 및 객체기반 분류기법의 추가적인 적용으로 향상된 정확도와 신뢰도를 얻을 수 있을 것으로 판단된다. 이 연구의 방법론은 시공간적으로 고해상도 분석결과를 제공함으로써, 대면적의 토지계획에 유용할 것으로 기대된다.



    Ministry of Land, Infrastructure and Transport
    18SIUE-B148326-01

    서 론

    인공위성 영상자료를 이용하면 도시 전체나 국토 전반과 같은 넓은 지역을 효과적으로 관리하고 분석할 수 있기 때 문에 대면적의 관리나 계획 분야에서 유용하게 사용되고 있다(Kim and Lee, 2018;Ku, 2011;Kim et al., 2010;Park et al., 2018). 특히 산림과 같이 접근성이 떨어지는 지역의 관리에 있어서는 매우 유용하게 활용되고 있다(Tomppo and Katila, 1991;Voigt et al., 2007;Jung et al., 2012).

    우리나라의 경우, 1999년 12월에 발사된 아리랑 1호 위 성(KOMPSAT-1; 공간해상도 6.6m)을 시작으로 2015년 3월에 발사된 아리랑 3A(KOMPSAT-3A; 공간해상도 0.55m)에 이르면서 위성영상기술이 급격히 향상되었으며, KOMPSAT-3A는 AEISS-A 센서를 통해 촬영한, 현재 우 리나라가 자체 개발한 위성 중 가장 높은 공간해상도의 위 성영상을 제공한다(Yong et al., 2016). 최근에는 인공위성 에 탑재되는 센서의 발전으로 공간해상도와 더불어 분광해 상도 및 방사해상도가 고도화된 영상의 취득과 이용이 매 우 용이해졌다(Lee et al., 2010). 특히 표현 가능한 화소 값의 범위가 65,536(64K)가지로 확장되면서 영상의 화소 구분이 세밀해졌고, 산림지역의 세밀한 분석을 위한 시도 도 증가하고 있다(Park et al., 2013;Choi et al., 2015). 일반적으로 위성영상을 이용하여 토지피복을 분석할 경우 산림은 하나의 대분류군으로 취급한다. 따라서 아리랑 2호 (1 ~ 4m 공간해상도)급의 위성영상을 이용하여 대상지역 내에서 산림지역을 분류해내는 분석정확도는 90% 이상으 로 높게 나타났지만(Zhu and Blumberg, 2002;Oh et al., 2010), 중분류 이하 단위에서 산림을 세분화하는 분류는 단일영상으로 한계가 있기 때문에, 위성영상 기반의 국가 공간정보를 고도화하는데 제한요소로 작용하고 있다(Choi et al., 2015).

    위성영상의 감독분류 시, 훈련데이터의 수집은 중요한 요소 중의 하나이지만, 고해상도의 영상분석의 검증을 위 해서는 상당히 많은 지상실측자료의 수집이 필요하다. 또 한 국가 전체를 연구대상지로 하는 것과 같이 대규모 대상 지에 관한 연구를 수행하는 경우에도 실측자료 수집을 위 한 시간과 비용을 고려하여, 일반적으로 최소한의 표본점 과 기수집된 자료를 분석에 이용한다. 이러한 방법은 자료 의 균일성과 동질성에 대한 맹점을 내포하게 된다. 따라서, 고해상도의 위성영상을 대면적의 연구대상지에 효과적으 로 이용하기 위해서는 대면적의 지상실측자료(Ground truth)를 효과적으로 수집할 수 있는 방법이 마련되어야 한다.

    토지피복도는 환경부 주관으로 우리나라 전체를 대상으 로 지상의 토지피복상태에 대한 정보를 주기적으로 수집, 종합하여 나타낸 것으로 약 5년마다 갱신된다. 이러한 국가 공간정보로부터 원격탐사자료의 검증을 위한 지상실측자 료를 추출하여 활용하는 방안에 대한 선행 연구가 거의 없 기 때문에(Choi et al., 2015), 본 연구에서 활용가능성을 시험해 보고자 하였다.

    현재 위성영상 분석을 위한 감독분류기법으로 널리 사용 되고 있는 것으로 서포트벡터머신(Support Vector Machine; SVM) 분류기법과 랜덤포레스트(Random Forest; RF) 분류 기법이 있다. SVM 기법은 입력된 값들 사이의 거리를 최대 로 하는 경계면을 찾는 방법을 사용합니다(Sim et al., 2009). SVM 기법은 일반적으로 분류성능이 뛰어난 것으로 평가되는 반면, 커널함수(Kernel function)의 설정 등 부가 적인 작업이 필요하며, 해당 설정에는 RBF(Radial Basis Function), S상(Sigmoid), 선형(Linear), 다항식(Polynomial) 함수가 있다. RF의 분류자는 입력된 벡터값과 독립적으로 샘플링된 벡터값을 사용하며 여러 개의 나무의사결정자들 의 조합으로 구성되어 있고, 각 나무의사결정자들은 입력 된 벡터값의 분류시에 가장 빈도수가 높은 클래스를 선택 하도록 한다(Breiman, 1999). RF에서는 추가적인 설정 작 업이 없고, 분류 결과의 획득이 빠르다는 장점이 있다. 이 러한 두 가지 화소 기반의 분류기법은 서로 다른 유형끼리 만나는 경계면이 명확하게 구분되지 않는 경우에 특히 효 과적이라는 공통점이 있기 때문에 산림지역 내에서의 불규 칙한 형태를 갖는 단위를 분류해 내기에 적합한 것으로 판 단되었다.

    본 연구는 우리나라 국토의 63% 정도를 차지하고 있는 산림 식생에 대한 분석을 전국적인 수준에서 고도화하기 위한 실험의 시작단계로서 다시기 영상을 이용한 시계열분 석을 효과적으로 수행할 수 있는 효과적인 입력자료 생성을 주목적으로 하였다. 이를 위하여 아리랑-3A호(KOMPSAT- 3A)의 영상분류를 가시광선 영역에 한정하여서 앞서 언급 한 두 가지 서로 다른 감독분류기법으로 시도하고, 토지피 복도를 지상실측자료로 활용하는 방법론의 유효성을 시험 해 보고자 하였다.

    연구방법

    1. 연구대상지

    본 연구에서는 아리랑 3A호(KOMPSAT-3A)의 고해상 도 위성영상을 바탕으로 산림지역의 피복 분류를 분석하기 위해 시가화 지역의 녹지가 산림식생지역과 혼재되어 있는 강원도 원주시 중심부 일대를 연구대상지로 선정하였다 (Figure 1).

    원주시는 대한민국 강원도 서남부(위도 37° 21' 5", 경도 127° 56' 43")에 위치하고 있으며, 지형은 동고서저의 형태 로 폭이 좁은 수역이 존재하고, 수역의 주변부에 걸쳐 내륙 습지도 포함한다. 또한, 지리적 특성상, 침엽수림과 활엽수 림이 혼재되어 분포하고 있어 건조 지역과 자연 지역이 혼 재되어 있다.

    2. 자료의 전처리

    1) K3A 위성영상의 전처리

    본 연구에서 사용하는 아리랑 3A호(KOMPSAT-3A) 위 성 영상은 2015년 3월에 강원도 원주시 일대를 촬영한 것 으로. 매 화소(Pixel)마다 0에서 65535까지의 범위 값을 보인다. 따라서 영상을 분석하기에 앞서 원본 영상을 16비 트(unsigned integral type)형태로 변환하여 저장하였다. 감 독분류 분석진행 과정에 앞서 영상자료의 4가지 분광밴드 (근적외선 밴드(NIR), 적색(Red), 녹색(Green), 청색(Blue)) 중 예비실험을 통하여 식생지역 내에서의 차별성이 높은 3개의 밴드를 선별하였다. 연구대상지인 강원도 원주시 일 대의 위성영상에서 확인한 산림식생 분류에 따른 식생지역 관심영역(Region of Interest: ROI)의 샘플을 표시하였다 (Figure 2).

    2) 토지피복도의 이용

    KOMPSAT-3A 위성영상의 분류작업 시 비교대상이 되는 벡터 자료로서 환경부에서 제작 및 관리하는 2017년 버전의 세분류 토지피복도를 선택하였다. 2010년 이후의 토지피복도는 아리랑 2호 영상을 사용하여 1m급의 공간 해상도를 바탕으로 제작되었으며, 이는 2000년에 사용된 Landsat TM(30m 공간해상도) 영상보다 매우 세밀한 정 보를 제공한다. 다음의 Table 1은 토지피복도의 대분류 및 중분류 항목들을 본 연구의 목적에 맞게 재분류한 결 과이다.

    본 연구에서는 토지피복도의 분류항목간의 경계에서 발 생하는 불확실성을 줄이기 위해 ArcGIS 10.1(ESRI, Inc., USA)을 이용하여 토지피복도에서 각 분류별 경계 안쪽으 로 25m의 버퍼를 설정하여 훈련자료를 샘플링 하였다. 이 버퍼는 예비실험을 통하여 버퍼가 증가할수록 분석정확도 는 높아지지만, 전체 샘플(Sample)의 크기가 감소하면서 자 료의 양과 질적인 부분에 영향이 있는 것을 발견하고, 이를 바탕으로 결정되었다. 연구대상지의 대분류군 중 ‘습지’의 경우, 25m 버퍼 설정 시, 해당 면적이 과다하게 줄어 훈련자 료의 샘플링이 불가능하였기에, 본 연구에서는 분석대상에 서 제외하였다.

    3. 자료 분석

    1) KOMPSAT-3A 위성영상의 감독분류

    ENVI 5.3에서 제공하는 SVM 분류자를 이용하여 KOMPSAT-3A 위성영상을 감독분류하였다. 위성영상 내 의 픽셀로 이루어진 분류 집단 사이 값의 간격을 최대로 만들어주는 가상의 경계면을 기준으로 집단을 분리하였다 (Wu et al., 2004). 그리고 이 값과 비교하기 위해 ‘R’의 패키지 중 하나인 RF 분류자를 이용하여 변환된 위성영상 자료에 대한 감독분류를 진행하였다. RF 분류기법에서 표 본추출은 다양한 피복분류 중에서 중복을 허용하여 임의 의 실측자료 선택을 통해 각 분류군 별로 관심 영역(ROI) 내에서 이루어지는데, 이는 SVM 분류기법과 유사한 방식 이다.

    그러나 기계적인 반복 학습을 통해 의사결정트리(Decision tree)로부터 분석결과를 도출하는 과정은 SVM 분류기법과 차별된 부분이다. RF 분류기법은 복잡하고 노이즈가 많은 자료를 분석할 때 유용하지만, 연속적인 데이터자료 분석에 있어서 정확도가 떨어진다는 한계점도 있다(Arun et al., 2016). 본 연구에서 활용하는 고해상도 영상의 피복 분류에 적합한 SVM 알고리즘의 커널함수 설정을 찾아내기 위해 RBF 커널함수와 다항식 커널함수(Polynomial)를 테스트하 였고, 이로부터 얻은 결과를 비교하여 산림식생지역의 분류 분석 시 정확도가 높게 나타난 RBF 커널함수를 선택하였 다. SVM 분류기법에 적합한 커널함수 설정을 위해서 선행 연구(Kang et al., 2013)에서 다루었던 SVM 분류 커널함수 설정을 참고하여 적용하였다. 그리고 ENVI 5.3에서 SVM 분류완료 후에 다수분석(Majority analysis)을 추가로 실시 하여 소수의 독립된 픽셀들을 인근의 커다란 집단에 귀속시 켜, 비논리적인 값의 출현을 억제하여 노이즈를 줄이고자 하였다(Choi et al., 2015). 다음으로 RF 분류에서는 패키지 내의 알고리즘을 이용하여 오차행렬(Confusion matrix)을 직접 산출하였다.

    2) 정확도 분석

    감독분류에서 사용하지 않은 독립적인 훈련자료를 이용 하여 감독분류에 의한 결과를 평가하였다. 토지피복도를 기반으로 한 실측값 대비 감독분류를 거쳐 예측된 값을 오 차행렬로 정리하였다. 예측정확도는 오차행렬을 통해 산출 된 카파상관계수(Kappa coefficient)와 전체정확도(Overall accuracy)의 두 가지 값으로 표현하였다. 카파상관계수의 경우 0.8 ~ 1.0이면 분류가 최고로 잘 되었음, 0.6 ~ 0.8은 분류가 매우 잘 되었음, 0.4 ~ 0.6은 분류가 잘 되었음, 0.2 ~ 0.4는 분류가 합당한 수준임을 의미하며, 0 ~ 0.2는 분류 가 불완전함을, 마지막으로 0 이하는 분류가 제대로 되지 않았음을 의미한다(Landis et al., 1977 ; Ortiz et al., 1997). 자료분석에 대한 과정을 도식화하면 다음과 같다 (Figure 3).

    결 과

    1. 위성영상의 감독분류 결과

    1) 산림식생 만의 감독분류

    토지피복도의 산림지역 중 중분류군에서 구분된 활엽수 림과 침엽수림을 대상으로 감독분류한 분석결과는 다음과 같다(Table 2).

    산림지역 분류의 경우 혼효림은 침엽수와 활엽수의 혼재 정도에 따라 다양한 양상을 나타내는 관계로 제외한 상태에 서 활엽수림과 침엽수림만 존재한다는 가정 하에 감독분류 를 실시하였다. 통상적으로 산림식생을 분류하는 경우 겨울 철 영상을 많이 활용하는데 이는 활엽수와 침엽수의 차이를 극대화하기 위한 것으로 혼효림을 배제하는 과정을 통해 산림 분류를 더욱 효과적으로 진행할 수 있다는 장점이 있 다. SVM 분류기법에 의한 분석을 진행한 결과, 분류정확도 는 55.0%(카파 계수: 0.1)에서 55.9%(카파 계수: 0.1)로 산 출되어 낮은 수준의 산림 경관 패턴 예측이 가능한 것으로 나타난 반면, RF 분류기법에 의한 분석의 결과, 분류정확도 는 74.2%(카파 계수: 0.0)를 나타냈다. 또한 SVM 기법에 의한 분류는 활엽수와 침엽수에 대한 정확도가 비슷한 수준 을 유지한 반면, RF 기법은 활엽수에 대한 상당히 높은 수 준의 정확도와 침엽수에 대한 상당히 저조한 정확도를 동시 에 보여주었다. 카파 상관계수를 볼 때, 두 가지 분류 방법 (SVM, RF) 모두 산림식생의 예측에서 불완전한 수준의 분 류정확도에 머물렀다.

    2) 전체 분류군에 대한 감독분류

    산림 이외의 분류군과 함께 감독분류를 시행할 경우의 차이를 테스트하기 위하여, 연구대상지의 토지피복도에서 대분류로 나뉘는 시가화 건조지, 농지, 초지, 나지, 수체와 산림지역의 세분류군인 활엽수림과 침엽수림 및 혼효림에 대해 버퍼 내부의 지역에서 샘플링한 공간자료를 분석한 결과는 아래의 Table 3와 같았다.

    SVM 분류기법의 예측정확도는 43.2%(카파 계수: 0.4) 에서 다수분석 예측정확도 46.7%(카파 계수: 0.4)를 나타내 어 산림지역에만 국한된 분석 결과보다 정확도가 낮게 나왔 다. 동일한 버퍼설정에서 다수분석에 의한 분석 결과를 아 래 표로 나타내었으며(Table 4), 마지막으로 RF 분류기법 에 의한 분류정확도는 다음 표와 같다(Table 5).

    감독분류의 결과, 산림지역과 비산림지역은 분류정확도 와 카파 상관계수(Kappa coefficient)에 있어서 명확한 차이 가 있었다. 먼저 비산림지역을 포함한 전체 지역의 분류정 확도는 SVM 분류기법에 의한 분석결과가 RF 분류기법에 의한 분석결과보다 낮은 것으로 나타났지만, 카파 상관계수 에서 있어서는 더 높은 신뢰도를 보였다. 세부적인 분류군 확인 결과, RF 분류기법은 활엽수림에서 분류정확도가 가 장 높았고 다음으로 농지, 침엽수림, 혼효림의 순으로 분류 정확도가 높게 측정됨으로써 주로 농지를 포함한 산림식생 의 피복분류에 있어서 높은 성능을 발휘하였다. 한편 SVM 분류기법은 혼효림의 분류에 있어서는 정확도가 매우 낮았 고 시가화 건조지역과 나지 등의 다른 분류까지 비교적 균 일한 예측정확도가 나타나 산림과 도심지역을 함께 분석하 는 경우에 적합한 것으로 판단되었다.

    본 연구의 주요 대상인 산림지역 내에서도 침엽수림, 활 엽수림, 그리고 혼효림 간의 분류에 있어서 분석기법의 차 이에 따른 정확도의 차이를 확인할 수 있었다. 혼효림은 정 의상 침엽수와 활엽수가 공생하면서 각각 일정한 비율(25% 이상 75%미만) 혼재되어있는 숲으로서, 화소 기반 피복분 류에서 정확도를 낮추는 요인으로 작용하였는데, 이는 고해 상도 위성영상 특성상 높은 민감도에 의한 것으로 판단되었 다(Choi et al., 2015). 활엽수와 침엽수의 분류정확도를 비 교하면, SVM 분류기법에서는 활엽수림과 침엽수림의 분류 정확도 차이가 크지 않았지만, RF 분류기법에서는 활엽수 의 분류 정확도가 침엽수의 분류 정확도보다 약 20배나 높 게 나타남으로서, 식생의 생태적 특성이 분류 정확성에 상 당한 영향을 미치는 것으로 판명되었다. 즉, 위성영상이 촬 영된 3월에는 침엽수에 비해 활엽수의 잎이 상대적으로 충분치 않은 상황이기 때문에 두 집단 사이에 차이가 극명 한 것으로 판단되었다. 산림지역을 제외한 나머지 지역에서 실제 농지가 예측된 농지와 일치하는 비율이 높게 나타난 점에서 잎이 없는 수목과 농지, 그리고 나지 사이에서도 수 목과 수목이 아닌 것을 구별할 수 있는 것으로 나타나, 화소 기반의 분류알고리즘의 유효성이 있는 것으로 판단되었다.

    3) 밴드별 디지털 넘버(DN) 값의 평균 및 표준편차

    본 연구에서는 RGB 밴드의 조합을 대상으로 분류분석을 진행하였다. 하지만, 영상의 각 화소는 총 4가지 밴드별에 대한 0에서 65535까지의 디지털 넘버(DN)를 나타내었고, 습지를 제외한 모든 토지피복 분류군에 대하여 DN 값의 평 균(Figure 4)과 표준편차(Figure 5)를 그래프로 나타내었다.

    DN 값의 평균치가 서로 가까울 경우, 분류분석이 난해하 고, DN 값의 평균치가 큰 폭으로 차이가 날 경우, 분류분석 이 용이하다는 특성을 활용한다면, 각각의 분류군 별로 분 류 성능이 좋은 분광밴드의 조합을 가시적으로 확인한 후에 분석작업을 수행할 수 있다(Park et al., 2013). 분류군별로 분광밴드를 다르게 적용한다는 것은 작업 속도를 더디게 할 수도 있지만, 분석의 효과 측면에서는 월등한 것으로 판 단된다(Lim et al., 2016;Park et al., 2013; Vikas et al., 2015). 본 연구에서는 식생내의 분류를 위해 RGB 밴드 영 역에 주목하였지만, DN 값의 평균과 표준편차가 근적외선 밴드 영역에서 큰 폭으로 변화하는 것(Figure 4; Figure 5) 은 산림식생과 건조환경의 분류에 효과적일 것으로 판단되 었다. SVM과 RF 분류기법에 의한 최종적인 분류결과는 아래의 Figure 6와 같다.

    2. 감독분류 결과 평가

    연구대상지에 대한 감독분류 결과를 정리해보면, 연구대 상지 주변 경관 전체를 대상으로 한 감독분류의 전체 예측정 확도는 SVM 분류 알고리즘 적용 시 약 43%에서 47%까지 였으며, RF 분류 알고리즘 적용 시 약 52% ~ 53% 수준이었 다. 그리고 이 중 산림지역만을 대상으로 이에 속하는 개체 군(활엽수림, 침엽수림)에 대한 예측정확도는 SVM 분류기 법 적용 시 약 55% ~ 56%, RF 분류기법 적용 시 약 74% 수준으로 산출되어, 전체 분류군을 대상으로 감독분류한 결 과보다 높은 정확도를 나타내었다(Table 2. ~ Table 5.).

    밴드별 DN 값에 대한 영상분석 결과에서는 나지와 시가 지의 DN 평균값이 높게 나타났는데, 이것은 해당 분류군이 모든 밴드 영역에 걸쳐 태양광에 대한 반사율이 높기 때문인 것으로 판단되었다. 같은 맥락에서 숲에서는 빛의 상당 부분 이 흡수되어 다른 피복분류군에 비해 RGB를 비롯한 근적외 선 밴드 영역에 이르기까지 밝기가 낮게 측정되었다. 시가화 지역과 나지는 적색(Red)과 녹색(Green) 파장 영역에서 편 차가 높게 나타났는데, 개발지역에서는 토지 피복의 종류가 복잡 다양하여 일정치 않은 조건을 형성하기 때문인 것으로 판단되었다(Vikas et al., 2015). 산림의 경우 침엽수와 활엽 수 구분 간의 차이가 명확하지만, 활엽수와 혼효림을 비교할 때 편차가 비슷한 수준이므로 두 분류 상호 간 분류결과의 오차가 클 수 있으며, 시가화 지역과 나지 분류에서도 상호 간 평균 DN 값과 편차의 변화양상이 유사하므로 건물과 공지의 구분이 용이하지 않을 것으로 판단되었다.

    고 찰

    본 연구에서는 고해상도의 아리랑-3A호(KOMPSAT-3A) 영상을 대상으로 토지피복도를 지상실측자료로 활용하여 토지피복, 특히 산림식생에 대한 감독분류를 시험하였다. 연구결과, 고해상도 위성영상의 경우 현재 활발하게 이용되 고 있는 화소 기반 분류기법 간에 정확도의 차이가 존재하 므로 위성영상 활용을 위한 분류기법의 선택에 따른 분류정 확도의 차이도 상당할 것으로 판단되었다.

    SVM 분류기법은 일정 수준의 분류 오차를 허용함으로 써 서로 다른 집단 사이의 경계를 부드럽게 하여 분류정확 도를 높여준다는 특징이 있으며, 복잡하고 노이즈가 많은 자료를 분석할 때 유용한 측면이 있는데, 본 연구에서 산림 및 다른 개발지가 혼재된 대상지를 분류하는데 안정적인 결과를 나타내었다(Chapelle et al., 1999;Scholkopf et al., 1999;Zhu and Blumberg, 2002). 침엽수와 활엽수를 비롯 한 식생별 분류에 있어서 높은 정확도를 보이며 매개변수의 설정이 필요하지 않아 처리속도가 빠르다는 장점 Ghamisi et al.(2015)과 침엽수의 세분류 시에는 그림자와의 구분에 있어서 분류 오차가 크다는 단점 Hayes et al.(2014)을 함께 가지고 있는 RF 분류기법은 본 연구대상지에서 활엽수의 분류에 편향적으로 효과적이라는 결과를 나타내었다. 계절 적으로 활엽수의 생리활동이 시작되기 전임에도 산림과 비 산림지역의 분류에 효과적이었고, 침엽수 대비 분류정확도 에서 뚜렷한 차이를 나타냄으로써, 앞으로의 분류정확도 고 도화에 기여하는 바가 클 것으로 판단되었다. 전체정확도의 관점에서는, 연구 대상을 산림영역에 한정시킬 경우, SVM 분류기법과 비교하여 RF 분류기법이 정확도 면에서 좀 더 효과적인 것으로 판단되었다. 그러나 산림 이 외의 다른 토 지피복의 분류까지 고려한 경우, 분류 방법에 따른 분류정 확도의 차이가 감소하였기 때문에, 다양한 분류군을 포함한 지역을 대상으로 할 때, 분류기법을 탄력적으로 선택할 필 요가 있는 것으로 판단되었다.

    분류정확도를 향상시키기 위해서는 분류정확도가 낮았 던 분류군에 대한 특성을 파악하는 것이 필요하다. 식생지 역과 농지의 경우는 계절의 변화에 따른 변동이 두드러지기 때문에 시계열분석이 효과적일 것으로 판단된다(Kim et al., 2011;Lee, 2009). 또한, 수체도 계절에 따라 면적과 깊이가 변하므로, 시계열분석에 의한 효과를 볼 수 있다. 실제로 이번 연구에 사용된 영상은 3월에 촬영된 것으로 시기적으로 수체의 분광 값을 판별하는 데 있어서 불확실성 이 컸을 것으로 판단된다. 따라서 계절에 따른 식생의 반응 차이 등을 분석에 활용하기 위해서는 동일한 지역에 대한 다시기의 영상을 확보하여 시계열분석을 진행하는 것이 요 구된다. 또한, 식생지역에 있어서는 활엽수와 침엽수 및 수 종에 따라 분광밴드에 대한 반응이 차이가 나기 때문에 고 해상도 영상이면서 가시광선영역 이 외의 다양한 분광밴드 를 활용하여 식생과 관련된 지수들을 분류작업 초기에 적용 한다면 좀 더 안정적인 분석이 가능할 것으로 판단된다. 또 한 피복분류결과의 활용성을 고려하여 침엽수를 상록침엽 수와 낙엽침엽수 임분으로 구분할 수 있는 방안의 모색도 필요한 것으로 판단된다.

    본 연구에서는 원주시를 연구대상지로 한정하여 화소기 반의 분류기법과 토지피복도기반의 지상관측자료를 이용 하여 산림식생을 분류해 본 결과, 전반적으로 분류결과의 정확도는 충분히 높지 않았다(Ortiz et al., 1997). 하지만, 산림의 생태적인 특성을 고려한 시계열분석과 식생군집의 특성을 단위로 지정한 객체기반 분류기법을 함께 적용한다 면, 더욱 향상된 결과를 도출할 수 있을 것으로 판단되었다 (Lee et al., 2018;Li et al., 2016; Soe et al., 2011).

    앞으로 토지피복도와 같은 공간정보가 더욱 정밀하고 정 교하게 제작되고 유지 및 관리될 수 있다면, 본 연구에서 시도한 방식으로 대면적의 공간계획도 예전보다 효과적으 로 진행할 수 있을 것으로 판단된다. 본 연구의 방법론은 산지개발에 따른 산림 경관의 세밀한 변화를 위성영상의 분석만을 통하여 정량화하는 연구에도 활용될 수 있을 것으 로 기대된다. 본 연구의 결과는 국토의 절반 이상을 차지하 고 있는 산림생태계에 대한 세밀하고 효과적인 관리 방안을 마련하는데 도움이 될 것으로 기대된다.

    감사의 글

    본 연구는 국토교통부 위성정보활용센터 설립운영사업 의 연구비지원(18SIUE-B148326-01)에 의해 수행된 것임.

    Figure

    KJEE-32-686_F1.gif

    Geographical location and administrative area of the study area: Wonju-si, Gangwon-do, South Korea.

    KJEE-32-686_F2.gif

    Samples for classification and validation of imagery classification in this study: Two vegetation classes including broad-leaved forest and coniferous forest within the study area - coniferous forest in green; and broad-leaved forest in purple.

    KJEE-32-686_F3.gif

    Diagram of procedures on data preparation and classification of land cover focusing on forest, using high resolution-remotely sensed data (KOMPSAT-3A) in conjunction with Land coverage map.

    KJEE-32-686_F4.gif

    Mean and standard deviation of digital number in land coverage classifications by a SVM classifier, showing four bands – 1: Red; 2: Green; 3: Blue; 4: Near infrared; and eight classes - 100: urban or built-up area; 200: agriculture area; 310: broad-leaved forest; 320: coniferous forest; 330: mixed forest; 400: grassland; 600: bare ground: 700: water body

    KJEE-32-686_F5.gif

    Mean and standard deviation of digital number in land coverage classifications by a SVM classifier with Majority analysis, showing four bands – 1: Red; 2: Green; 3: Blue; 4: Near infrared; and eight classes - 100: urban or built-up area; 200: agriculture area; 310: broad-leaved forest; 320: coniferous forest; 330: mixed forest; 400: grassland; 600: bare ground: 700: water body

    KJEE-32-686_F6.gif

    Results from classification of forest and other land covers by (a) SVM algorithm and (b) RF algorithm: 100 - urban or built-up areas; 200 - agricultural areas; 310 - broad-leaved forests; 320 - coniferous forests; 330 - mixed forests; 400 - grassland; 600 - bare ground; and 700 - water body.

    Table

    Classification codes used for this analysis, originated and modified from the Land coverage map.

    A series of confusion matrixes as the results of supervised classification derived from KOMPSAT-3A image classification on forested areas within the study area. (Pixel value)

    A confusion matrix resulted from land cover classification for the whole classes in the study area, using a SVM classifier.

    A confusion matrix resulted from land cover classification for the whole classes in the study area, using a SVM classifier with Majority analysis.

    A confusion matrix resulted from land cover classification for the whole classes in the study area, using RF algorithm.

    Reference

    1. Breiman, L. (1999) Random forests—random features, Technical Report 567, Statistics Department, University of California, Berkeley.
    2. Chapelle, O. , P. Haffner and V.N. Vapnik(1999) Support vector machines for histogram-based image classification . IEEE Transactions on Neural Networks10(5): 1055-1064.
    3. Choi, J.Y. , S.H. Lee, S.A. Lee, S.Y. Ji and P.S.H. Lee(2015) Applicability of supervised classification for subdividing forested areas using SPOT-5 and KOMPSAT-2 data . The Korea Society of Environmental Restoration Technology18(2): 89-104. (in Korean with English abstract)
    4. Ghamisi, P. , J.A. Benediktsson and S. Phinn(2015) Land-cover classification using both hyperspectral and LiDAR data . International Journal of Image and Data Fusion6: 189-215.
    5. Hayes, M. , S.N. Miller and M.A. Murphy(2014) High-resolution landcover classification using Random Forest . Remote Sensing Letters5: 112-121.
    6. Jung, M. , S.H. Lee, E. Chang and S. Hong(2012) Method of Monitoring Forest Vegetation Change based on Change of MODIS NDVI Time Series Pattern . Journal of Korea Spatial Information Society20(4): 47-55. (in Korean with English abstract)
    7. Kang, N.Y. , S.Y. Go and G. S. Cho(2013) A comparative study on suitable SVM kernel function of land cover classification using KOMPSAT-2 imagery . The Korea Society for Geospatial Information System21(2): 19-25. (in Korean with English abstract)
    8. Kim, H.O. , J.M. Yeom and Y. S. Kim(2011) The multi-temporal characteristics of spectral vegetation indices for agricultural land use on RapidEye satellite imagery . Korea Aerospace Research Institute10(1): 149-155. (in Korean with English abstract)
    9. Kim, S.J. and Y.G. Lee(2018) Present Status and Future Prospect of Satellite Image Uses in Water Resources Area . Korean Journal of Ecology and Environment51(1): 105-123. (in Korean with English abstract)
    10. Kim, T.H. , K.H. Kim, G.B. Nam, J.H. Shim, W.J. Choi and M. H. Cho(2010) Development of Natural Disaster Damage Investigation System using High Resolution Spatial Images . Korea Spatial Information Society12(1): 57-65. (in Korean with English abstract)
    11. Ku, C.Y. (2011) A Study on Managing and processing the Images with Different Spatial Resolution for the Systemic Land Cover Classification . The Korean Association of Professional Geographers45(3): 375-386. (in Korean with English abstract)
    12. Kulkarni, A.D. and B. Lowe(2016) Random Forest Algorithm for Land Cover Classification. International Journal on Recent and Innovation Trends . In Computing and Communication4(3): 58-63.
    13. Landis, J.R. and G.G. Koch(1977) The measurement of observer agreement for categorical data . Biometrics33: 159-174.
    14. Lee, . G. , J.H. You,Y.G. Yu and H. J. Lee(2018) Establish of Parallel Object Based Classification Process and Extraction of Spatial Objects Using KOMPSAT-3A Satellite Image , Proceeding of 2018 Symposium of the Korean Society for Geospatial Information Science, pp. 93-94. (in Korean with Englishabstract)
    15. Lee, J. , J.H. Ru and Y.G. Yu(2010) Extracting High Quality Thematic Information by Using High-Resolution Satellite Imagery . The Korea Society for Geospatial Information System18(1): 73-81. (in Korean with English abstract)
    16. Lee, S.H. (2009) Adaptive Reconstruction of NDVI Image Time Series for Monitoring Vegetation Changes . The Korean Society of Remote Sensing25(2): 95-105. (in Korean with English abstract)
    17. Li, M. , L. Ma, T. Blaschke, L. Cheng and D. Tiede(2016) A systematic comparison of different object-based classification techniques using high spatial resolution imagery in agricultural environments . International Journal of Applied Earth Observation and Geoinformation49: 87-98.
    18. Lim, Y.S. , Y.D. Eo and M.W. Pyeon(2016) Experiments of Individual Tree and Crown Width Extraction by Band Combination Using Monthly Drone Images . The Korean Society for Geospatial Information Science24(4): 67-74. (in Korean with English abstract)
    19. Mittal, V. , D. Singh and L.M. Saini(2015) A critical analysis of EM based fusion of different polarization data for effect on land cover classification . Advances in Space Research56(6): 1094-1105.
    20. Myint, S.W. , P. Gober, A. Brazel, S. Grossman-Clarke and Q. Weng(2011) Per-pixel vs. object-based classification of urban land cover extraction using high spatial resolution imagery . Remote Sensing of Environment115(5): 1145-1161.
    21. Oh, C.Y. , S.Y. Park, H.S. Kim, Y.W. Lee and C. U. Choi(2010) Comparison of Landcover Map Accuracy Using High Resolution Satellite Imagery . The Korean Association of Geographic Information Studies13(1): 89-100. (in Korean with English abstract)
    22. Ortiz, M.J. , A.R. Formaggio and J.C.N. Epiphanio(1997) Classification of croplands through integration of remote sensing GIS and historical database . International Journal of Remote Sensing18(1): 95-105.
    23. Park, J.G. , S.Y. Go and G.S. Cho(2013) Vegetation Classification using KOMPSAT-2 Imagery and High-resolution airborne imagery in Urban Area . Journal of the Korean Society for Geospatial Information Science21(4): 21-27. (in Korean with English abstract)
    24. Park, J.J. , S.W. Oh, K.A. Park, M.S. Lee, J.C. Jang and M.J. Lee(2018) A methodology of ship detection using high-resolution satellite optical image . Journal of the Korean Earth Science Society39(3): 241-249. (in Korean with English abstract)
    25. Scholkopf, B. , S. Mika, C.J.C. Burges, P. Knirsch, K.-R. Muller, G. Ratsch and A. J. Smola(1999) Input space versus feature space in Kernel-based methods . IEEE Transactions on Neural Networks10(55): 1000-1016.
    26. Sim, W.S. , S.Y. Sung and C. K. Cheng(2009) Performance Analysis of Support Vector Machine Using Kernel Function. Proceeding of 2009 Symposium of the Institute of Electronics Engineers of Korea, pp. 796-797. (in Korean with English abstract)
    27. Tomppo, E. and M. Katila(1991) Satellite image-based national forest inventory of Finland , Proceeding of IGARSS 1991 Symposium of Geoscience and Remote Sensing Symposium - Remote Sensing: 3rd Global Monitoring for Earth Management, pp. 1141-1144.
    28. Voigt, S. , T. Kemper, T. Riedlinger, R. Keifl, K. Scholte and H. Mehl(2007) Satellite image analysis for disaster and crisis-management support . IEEE Transactions on Geoscience and Remote Sensing45(6): 1520-1528.
    29. Wu, T.F. , C.J. Lin and R.C. Weng(2004) Probability estimates for multi-class classification by pairwise coupling . Journal of Machine Learning Research5: 975-1005.
    30. Yong, S.S. , G.S. Kang and H.P. Heo(2016) Current Status and Future Prospects of Satellite Payloads Technology . Korean Society for Aeronautical and Space Sciences44(8): 710-717. (in Korean with English abstract)
    31. Zhu, G. and D. G. Blumberg(2002) Classification using ASTER data and SVM algorithms; The case study of Beer Sheva, Israel . Remote Sensing of Environment80: 233-240.