· 오션은 해양쓰레기에 관한 연구성과물, 교육홍보물 등 많은 자료를 제작하여 보급하고 있습니다.
· 아래의 자료는 반드시 출처를 밝히고 사용하시기 바랍니다.
  • 제 390회 세미나: 수환경에서 플라스틱 쓰레기를 감지, 분류, 정량화하는 머신 러닝 프로그램(APLASTIC-Q)

  • 20.11.24
    조회수 158
첨부파일

이종수
(사)동아시아바다공동체 오션 연구원
jongsulee@osean.net



수환경에서 플라스틱 쓰레기를 감지, 분류, 정량화하는 머신 러닝 프로그램(APLASTIC-Q)




이 논문은 제 390회 오션 정기 세미나에서 다룬 것으로 드론으로 얻은 이미지를 분석하여 수환경의 플라스틱을 정량화하는 연구를 소개하고 있다.


원문
Mattis Wolf, Katelijn van den Berg, Shungudzemwoyo P. Garaba, Nina Gnann, Klaus Sattler, Frederic Stahl, Oliver Zielinski, 2020. Machine learning for aquatic plastic litter detection, classification and quantification (APLASTIC–Q). Environmental Research Letters:119.199.74.77 on 08/10/2020 at 01:19)


요약
다량의 미관리 플라스틱 폐기물은 환경을 오염시키고 지구의 건강을 위협한다. 이와 같이 바다에서 발견되는 막대한 양의 플라스틱 폐기물은 육지에서 시작된다. 이들은 강, 수로 및 하구를 통해 바다로 향한다. 이 논문에서는 부유 및 해안 플라스틱 쓰레기를 탐지하고 정량화하는 합성곱 신경망 네트워크에 기반한 머신 러닝 알고리즘을 제시하였다. 수중 플라스틱 쓰레기 탐지기 및 정량화 시스템 (APLASTIC–Q)이 개발되었고, 캄보디아의 항공 조사에서 얻은 매우 높은 지리 공간 해상도 이미지를 사용하여 훈련되었다 (~ 5 픽셀 / cm = 0.002m / 픽셀). APLASTIC–Q는 두 개의 머신 러닝으로 구성되어 있다: (i) 플라스틱 쓰레기 검출기 (PLD–CNN) 및 (ii) 플라스틱 쓰레기 정량화기기 (PLQ–CNN). 플라스틱 검출기는 표적물을 물, 모래, 초목 및 플라스틱 쓰레기로 구분하며 83% 정확도를 가진다. 또한 쓰레기의 개수를 임계값을 기준으로 높거나 낮은 수준(쓰레기-많음, 쓰레기-적음)으로 제공해 준다.


플라스틱 쓰레기 정량화기기는 각 클래스에서 쓰레기 항목을 더욱 세분하여 개수를 센다: 물병, 스티로폼, 통, 상자, 그릇, 신발, 폴리스티렌 포장, 컵, 직물, 소형 또는 대형 운반 가방. 플라스틱 쓰레기의 종류와 양은 정책 입안자, 시민, 다른 사적 공적 이해관계자들에게 의사 결정에 시급히 필요한 정보를 제공해 준다.


유사정량화는 쓰레기가 쌓여 있는 경우 아래 놓인 물체가 있다는 경고와 함께 이미지에 제시된 물체의 수를 자동 계수하는 것에 기반한다. 과학적 증거를 기반으로 한 머신 러닝 알고리즘은 트롤 조사, 현장 캠페인 및 더 나은 플라스틱 쓰레기의 성상 조사를 위한 정화 활동에 보완책이 될 수 있다. APLASTIC–Q는 빠르게 적응할 수 있는 쉬운 스마트 알고리즘으로 항공, 높은 고도의 의사 위성 또는 우주 임무에서 부유 또는 표착된 해변 플라스틱 쓰레기를 빠르게 자동으로 정량화할 수 있다.


주요 내용

● 연구 소개
플라스틱 오염은 ‘사악한 환경 문제’로 전 세계 강에서 수백만 톤의 플라스틱 쓰레기가 바다로 배출되고 있다. 아시아 국가의 하천 시스템은 상당한 양의 플라스틱을 바다로 운반한다고 보고되고 있다. 이러한 플라스틱으로 오염된 수로는 국지적인 건강 및 환경 문제를 야기할 뿐만 아니라 녹색 경제에 대한 전 지구적 위협을 제기한다. 플라스틱과의 싸움은 강에서 이루어지거나 수생 환경에 도달하기 전에 이루어져야 한다.


플라스틱 쓰레기 오염과 관련된 고급 자동화 모니터링 전략에 대한 사회의 관심이 증가하고 있다. 이미 머신 러닝 알고리즘과 결합된 원격 감지 기술은 플라스틱 쓰레기 분포에 대한 과학적 지식을 발전시키고 트롤 조사부터 수치 시뮬레이션에 이르기까지 격차를 해소하는 역할에 앞장서 왔다. 무인 항공 시스템(UAS)과 해안선과 해변에서 매우 높은 지리 공간 해상도로 촬영한 위성 이미지는 해변에 표착된 플라스틱 쓰레기를 모니터링하는 데 유용한 것으로 나타났다. 촬영한 이미지를 사용한 최첨단 머신 러닝 알고리즘이 플라스틱 쓰레기의 자동 정량화하고 식별하는 데 사용될 잠재적인 응용 분야에 대해 평가되고 있다.


이 연구에서는 APLASTIC-Q를 개발하여 드론 이미지의 쓰레기를 식별하고 정량화하였다. 우리는 이를 다른 드론 이미지용 해양쓰레기 감지 시스템과 비교하였다.


● 항공촬영
항공 조사는 2019년 10월 캄보디아 프놈펜, 시아누크 빌, 씨엠립에서 20MP RGB 이미징 센서가 장착된 DJI 4 Phantom Pro photography UAS를 사용하여 이루어졌다. 조사 장소에서 플라 스틱 쓰레기가 부유하거나, 초목에 갇혀 있거나, 해변에 표착, 또는 플라스틱 강 카펫을 형성하는 것으로 관찰되었다. 이미지는 고도 6m에서 촬영되었으며 충분히 넓은 영역에서 충분한 물체 해상도 (길이> 2.5cm)를 제공해 주었다.


● 플라스틱 쓰레기 알고리즘의 쓰레기 식별 및 정량화
항공 조사에서 수집된 트루 컬러 RGB(red green blue) 이미지는 100 x 100 x 3 픽셀과 50 x 50 x 3 픽셀의 타일로 분할되었다. 플라스틱 쓰레기 탐지기 (PLD–CNN) 알고리즘은 100 x 100 x 3 픽셀 타일을 분석하는 데 사용되었다. 타일의 다양한 대상을 (i) 물, (ii) 초목, (iii) 쓰레기-적음, (iv) 쓰레기-많음, (v) 모래 또는 (vi) 기타로 구별하도록 훈련되었다. 물체가 3개 미만인 타일은 쓰레기-낮음으로 정의되고 항목이 3개 이상 있는 타일은 쓰레기-많음으로 표시되었다. PLQ–CNN은 쓰레기가 있는 것으로 강조 표시된 타일만 평가했다. 이 타일 내에서 PLQ–CNN은 구별하고 개별 쓰레기 항목을 열거하도록 추가로 훈련되었다. PLQ– CNN은 총 18개의 클래스를 출력했으며 캔, 종이 상자, 비닐 봉지, 병, 컵, 캐니스터, 폴리스티렌 포장, 신발, 스티로폼, 끈 및 직물을 포함한다.


● 신경망 네트워크 아키텍처
모델링은 코어 당 2 개의 스레드, 1.6GHz의 클럭 속도 및 8GB 랜덤 액세스 메모리를 사용하는 Intel® 쿼드 코어 i5 8250U 프로세서에서 실행되었다. PLD–CNN 및 PLQ–CNN은 학습 타일의 크기가 각각 100 x 100 x 3 픽셀과 50 x 50 x 3 픽셀로 다른 점을 제외하고는 유사한 아키텍처를 가지고 있다. 이것은 4 개의 2D 컨볼루션 신경망 레이어로 구성된다. 처음 두 개의 2D 컨볼루션 레이어는 32 개의 3 x 3 커널로 구성되었고 마지막 두 개의 2D 컨볼루션 레이어은 64개의 3 x 3 커널로 구성되었다. 각각의 2D 컨볼루션 레이어 뒤에는 드롭 아웃 신경망 레이어 앞에 2 x 2 최대 풀링 레이어가 있다(드롭 아웃 비율 = 25 %). 완전히 연결된 조밀한 신경망 레이어는 아키텍처를 완성하며, 첫 번째 레이어는 512개의 유닛으로 구성되어 있으며 그 뒤에 드롭 아웃 신경망 레이어가 있다(드롭 아웃 비율 = 50 %). 두 번째 조밀한 신경망 레이어에는 클래스 수와 일치하는 유닛이 있고 PLD–CNN의 경우 6개의 유닛이, PLQ–CNN의 경우 18 개의 유닛을 가지고 있다. 훈련 목적으로, 각 클래스를 대체하지 않고 타일의 80 %를 무작위로 샘플링한 다음 나머지 20%를 사용하여 알고리즘을 테스트했다.


결과
● 데이터 세트에서 쓰레기 등급 분포
PLD–CNN 데이터 세트는 6892개의 타일로 구성되었으며, 많은 양의 플라스틱 쓰레기가 포함된 총 1905개의 타일은 쓰레기 많음으로 그룹화되었다. PLQ–CNN의 데이터 세트에는 6026개의 타일이 있다. 가장 많은 타일(878)에서 플라스틱 병이 발견되었으며, 그 다음으로 비닐 봉지, 스티로폼 및 폴리스티렌 포장이 그 뒤를 이었는데 이들은 최소 400 개의 타일에서 발견되었다.


● PLD-CNN 및 PLQ-CNN의 성능 평가
PLD–CNN에서 얻은 통계는 0.67 이상의 정밀도로 부유하거나 표착 해변 쓰레기를 분류하는 데 뛰어난 적용력을 보여 주었다.

각 쓰레기에 대해 PLD–CNN 알고리즘은 대상을 물, 초목, 모래, 플라스틱 쓰레기로 구분하는데 있어 우수한 정확도와 최소 0.55의 F1 점수로 수행하였다. 결합된 두 ‘오염’클래스에 대해서 정확도는 0.92로 높았다. 검출률도 이와 유사했으며 일반적으로 ‘기타’(0.45) 및 쓰레기 적음 (0.52)을 제외한 모든 등급에서 0.9보다 높았다. 두 플라스틱 등급의 전체 검출률은 0.77이며, 이는 이미지에서 플라스틱의 많은 부분이 감지되었음을 나타낸다. 또한 플라스틱으로 오염된 타일은 정확도 0.92와 검출률 0.77을 보여주었다. ‘기타’로 분류된 등급이 낮은 검출률이나 정확도를 보일 경우 대상 수가 적거나 시나리오에서 무시할 수 있는 것으로 간주되었다.


● 다른 머신 러닝 기술과의 비교
PLD-CNN과 PLQ-CNN 둘 다 인공위성 이미지를 통한 인공 해양 쓰레기 연구에서 조사된 다른 머신 러닝 기술보다 훨씬 더 나은 성능을 발휘했다. PLD-CNN은, 두 번째로 성능이 좋은 방사형 기저 커널을 사용하는 SVM 머신 러닝 기술보다 전체 정확도가 5% 더 높았다. PLQ-CNN은 두 번째로 우수한 머신 러닝 알고리즘을 18% 능가했다.


● 다른 자동 해양 쓰레기 탐지 시스템과의 비교
PLD-CNN의 정밀도, 재현율 및 F1 점수에 대한 가중 평균 메트릭스는 현재 최고 성능의 자동 플라스틱 감지 시스템보다 0.04 (정밀도), 0.03 (재현율) 및 0.02 (F1 –점수)만큼 높다. 또한 문헌의 다른 작업과 비교할 때 이 연구에 사용할 수 있는 샘플 수가 더 많다. 그럼에도 불구하고 언급된 연구들의 셋팅이 다르므로(비행 고도가 6 ~ 20 미터 범위이고 카메라 해상도가 12 ~ 20MP) 이러한 비교를 주의해서 살펴보아야 한다.


● 플라스틱 쓰레기 모니터링에서 머신 러닝에 대한 전망
PLD–CNN 및 PLQ–CNN 구성 요소로 구성된 새로운 APLASTIC–Q 시스템은 높은 정밀도로 쓰레기 물체를 식별하고 정량화할 수 있다. 오염된 타일에서 PLQ–CNN은 5가지 주요 오염 물질 등급 (i) 플라스틱 봉투–대형, (ii) 플라스틱봉투–소형, (ii) 플라스틱 병, (iv) 폴리스티렌 포장 및 (v) 스티로폼을 감지할 수 있었다. 이 상위 5개 쓰레기 항목은 조사 중에 수집된 이미지에서 매우 흔했다. 협력한 과학 현장 조사 및 정화 노력으로 보완된 APLASTIC–Q 시스템의 결과는 정책 입안자와 이해 관계자가 자연 환경을 오염시키는 문제가 있는 플라스틱 유형을 정확히 찾아내는 데 중요한 벤치 마크 정보를 생성할 수 있다.


이전의 연구에서 그림자 또는 표면이 반사되어 반짝거리는 물체로 신경망을 훈련시키는 것은 문제가 있는 것으로 간주되었다. 따라서 최적의 기상 조건과 최저 시야각에서 이미지를 수집하여 반짝이는 물체와 그림자를 방지하는 것이 좋다. 향후 조사에서 APLASTIC–Q 시스템을 더 잘 훈련시키기 위해 더 많은 데이터를 제공하여 세계 여러 지역에서 정확도와 향후 적용을 개선할 것으로 예상된다.


 결론
쓰레기로 덮힌 면적 및 개수 측면에서 부유 및 표착된 해변 플라스틱 쓰레기를 합리적으로 잘 수행하는 새로운 기계 학습 시스템을 제시했다. 자동화된 탐지 및 정량화 알고리즘은 트롤, 현장 조사, 정화 및 수치 분포 솔루션 등에서의 계수를 보완하는 모니터링 전략에 도움을 준다. APLASTIC-Q의 최종 제품을 결합함으로써 우리는 정책 입안자, 시민을 포함한 이해 관계자의 의사 결정 및 입법에 중요한 과학적 증거 기반 지식에 가치를 더 할 뿐만 아니라 푸른 행성의 건강을 개선할 수 있다고 믿는다.

  목 록