• 연안 정보 한 데 모아 새로운 가치 창출

  • 22.10.29
    조회수 139
첨부파일
기사1_thum.jpg

연안 정보 한 데 모아 새로운 가치 창출

: 연안 빅데이터 플랫폼 구축 3년 사업 24개 기관 참여

홍선욱 (사)동아시아바다공동체 오션 대표 sunnyhong@osean.net

특집
동아시아바다공동체 오션(이하 오션)은 2022년부터 2024년까지 과학정보통신부와 한국지능정보사회진흥원이 발주한 새로운 연구사업에 참여하고 있다. 오션은 해양쓰레기에 대한 데이터를 생산, 가공, 해석하고, 대안을 찾아 건강하고 안전한 바다를 만드는 일을 해왔는데, 이제 새로운 세계에 발을 들여 놓게 되었다. 상세한 내용을 3회에 걸쳐 싣는다.

① 연안 정보 한 데 모아 새로운 가치 창출
② 선박의 운항과 생태계를 위협하는 해양쓰레기 빅데이터
③ 연안 빅데이터 플랫폼 런칭

연안이라는 핵심어와 관계된 정보에는 어떤 것이 있을까? 연안 재난재해, 연안 기후변화, 연안 자연환경변화, 연안 안전운항, 연안 위험시설, 연안 침식, 연안 오염, 연안 레저와 관광, 연안 에너지 등 아주 다양한 정보들이 있다. 그렇다면 그러한 정보는 어디에 있을까? 각종 홈페이지, 보고서, 논문, 방문센터 등에서 제공하는 정보들은 다양한 형태, 수준, 주제로 되어 있다. 원하는 정보를 얻기 위해 우리는 많은 곳을 헤매고 있다. 그것이 때로는 즐거운 놀이일 수 있지만 때로는 정보의 홍수에서 허우적대다 결국 초기 목적을 잃고 방황하기 일쑤다. 기관, 단체별로 따로 제공하거나 관리하는 정보들은 유형이 제각각, 개별적, 수직적, 제한적이다. 통합해서 사용할 수 없는 것들이 많다. 이런 정보들을 한 곳에 모으고 이리저리 조합하며 융합과 가공을 거친 뒤 일목요연하게, 그리고 무제한으로 공급된다면 어떻게 될까? 하나의 데이터에서 볼수 없는 새로운 가치를 탄생시켜, 혁신적인 데이터 기반 서비스 상품이 개발된다. 현재 다양한 종류의 빅데이터 기술은 지적 정보산업의 필수요소로 정치, 사회, 문화, 경제, 과학기술 등의 각 분야에 활용되고 있다. 클릭 한 번으로 엄청난 양의 데이터가 세계를 오고 갈 수 있는 만큼 데이터 세상의 발전과 확산 속도는 매우 빠르며 상상하지 못했던 가치를 창출하고 있다. 바로 4차 산업혁명이다.

빅데이터가 한 곳에 모였다 흩어지는 매개점인 ‘플랫폼’은 이미 우리 일상에 깊이 들어와 있다. 쇼핑, 검색, 에스엔에스, 영상컨텐츠, 모빌리티 등에서 우리는 이미 자유롭게 빅데이터 플랫폼에 정보를 제공하기도 하고 구매, 이용하기도 한다. 한국지능정보사회진흥원(NIA)은 2020년부터 금융, 환경, 문화, 교통, 헬스케어, 유통과 소비, 통신, 중소기업, 지역경제, 산림, 소방안전, 스마트치안, 해양수산, 농식품, 라이프로그, 디지털산업혁신 등 16개 분야에서 빅데이터 플랫폼을 열어 서비스하고 있다(www.bigdata-map.kr).




▲ 빅데이터 플랫폼(www.bigdata-map.kr)의 개방데이터 내용과 정보

올해부터는 ‘연안’이라는 분야에서도 그러한 플랫폼 구축 사업이 3년간 추진된다. 한국해양과학기술원 빅데이터센터를 주축으로 총 24개의 공공기관(4개), 대학(3개), 기업(16개), 비영리기관(1개)이 참여하여 운영될 예정이다. 7월 12일 부산에 위치한 한국해양과학기술원 본원 행정동에서 착수보고회를 가지면서 본격 사업이 시작되었는데, 향후 3년간 총 10개의 센터가 연안 재난재해, 연안 기후변화, 연안 자연환경변화, 연안 안전운항, 연안 위험시설, 연안 침식, 연안 오염, 연안 레저와 관광, 연안 에너지 정보를 종합하고, 연간 150여 종, 3년간 450여 종의 데이터를 선별, 가공하여 유통할 계획이다. 연안분야 빅데이터 플랫폼에서 유료 혹은 무료로 제공되는 데이터는 국민들의 재해, 안전, 환경 피해를 줄이고, 레저 활동이나 수산업, 해운 물류, 제조, 관측업 등에 쓰일 수 있을 것이다.



▲ 22년 NIA 연안 빅데이터 플랫폼 및 센터 구축 착수/중간보고회(사진: KIOST)

올해 연안분야 빅데이터 플랫폼은 연안 데이터 경제 활성화를 통한 사회현안 해결 新데이터 산업 육성이라는 비전 아래 다음과 같은 목적에 부합되는 사업을 설계하고 12월 초 첫 개방을 계획하고 있다.
1. 연안재난·재해 데이터의 체계적인 수집·통합·유지관리체계 마련, 2. 공공과 민간의 데이터 결합을 통한 데이터 가치화 및 생태계 조성, 3. 수요자 중심 데이터 제공 및 가치 있는 빅데이터 활용서비스 체계 제공, 4. 새로운 수요창출을 위한 선순환적 플랫폼 구축, 빅데이터 기반의 산업‧경제 생태계 활성화로 4차 산업혁명 및 지능정보시대 도래에 따른 연안재난 및 안전에 대한 국가적 대응체계 기반 마련


▲ 연안분야 빅데이터 플랫폼 구축의 비전, 목표, 목적(출처:KIOST)

연안분야 빅데이터 플랫폼은 공공데이터와 민간데이터 센터 간 융·복합, 분석 및 가공을 통한 소비자 중심의 고부가가치 데이터 생산 및 혁신서비스 등을 제공할 예정이다. 데이터의 메타정보 표준화, 품질제고 및 관리, 공융합 과정을 거치면서 재탄생된 빅데이터는 각 분야의 전문가 뿐만 아니라 일반인도 쉽고 편하게 온라인에서 구매할수 있는 마켓플레이스를 제공한다. B2B, B2C 등의 다양한 거래관계를 통하여 이용될 것이며, 수요자의 요구에 맞춰 기술지원, 인력교육도 병행한 빅데이터 활용 서비스 지원도 진행할 예정이다.

약 120만개 파일로 구성된 150여개 종류의 연안 분야 빅데이터 개방
연안분야 빅데이터 플랫폼에 참여한 10개의 센터에서 제공될 총 데이터 종류는 약 150개, 총 파일수는 약 120만로 다음과 같은 핵심데이터를 제공할 예정이다. 각 센터의 기관들은 다년간 각 분야별로 축적된 연구실적에서 생산되었거나 신규로 생산할 데이터를 정제·가공하여 개방할 예정이다.

1.국립해양조사원센터(국가해양관측)
- 수행기관명 : ㈜전략해양, ㈜유에스티21
- 센터 소개 : 다양한 연안 관련 연구·정책 결정 등의 기초 데이터 활용을 위한 데이터 셋 구축·지원
- 주요데이터(핵심데이터): 관할해역 종합 해양조사·해양공간 정보, 해양예측·해양안전 기본 정보

2.국립수산과학원센터(수산환경·해어황)
- 수행기관명 : 국립수산과학원, 해봄데이터㈜, 경북대학교
- 센터소개 : 다양한 해양수산 재난 관련 속보, 어장환경정보 제공을 통해 공공기관 및 기업의 의사결정 지원정보 제공
- 주요데이터(핵심데이터): 실시간연근해 어장환경, 해어황, 수산재해모니터링, 무인수중드론 연안관측, 초분광드론영상

3.인하대학교산학협력단센터(연안환경변화)
- 수행기관명 : 인하대학교 산학협력단, 인천 항만공사
- 센터 소개 : 해양 조사 자료 및 수치 모델을 융합하여 지역 현안 및 연안 해양 안전성 증대에 기여할 수 있는 수요자 중심의 자료 생산 및 제공
- 주요데이터(핵심데이터) : 연안 해수 물성 조사 자료 & 수치모델을 융합한 2차 가공 자료

4.해양정보기술센터(연안재해)
- 수행기관명 : ㈜해양정보기술, ㈜해안해양기술
- 센터 소개 : 악기상 연안 위험도 분석을 위한 빅데이터 분석 및 정보제공
- 주요데이터(핵심데이터) : 지진·폭풍해일, 해상풍, 파랑, 월파, 미래태풍 정보 데이터 등

5.비엔티센터(연안기후변화)
- 수행기관명 : ㈜비엔티, 네이버시스템㈜
- 센터 소개 : 기후변화 대응을 위한 인공위성 기반 표층수온 분석자료 생산 및 배포
- 주요데이터(핵심데이터) : 해외 10개 인공위성센터의 SST 기반, 30년 기준 SST Anomaly

6.오셔닉센터(연안위험구역)
- 수행기관명 : ㈜오셔닉, ㈜엔지스
- 센터 소개 : 연안 이용객 사고위험도 높은 지역 상세지형 데이터와 실시간 연안수위 데이터 생산·제공
- 주요데이터(핵심데이터) : 연안위험구역 상세지형 데이터, 실시간 연안수위 데이터

7.지오스토리센터(연안위험시설)
- 수행기관명 : 지오스토리샌터
- 센터 소개 : ㈜지오스토리, ㈜Cway7
- 주요데이터(핵심데이터) : 지상 라이다 연안침식 모니터링, 수중 지하 시설물 데이터 등

8.일렉오션센터(연안오염)
- 수행기관명 : (주)일렉오션, (사)동아시아바다공동체 오션
- 센터 소개 : 연안 환경오염에 영향을 미치는 기후변화 분석 및 해양쓰레기 데이터 개방
- 주요데이터(핵심데이터) : 해상풍 기후평균값/아노말리, 선박항행/환경피해 위협쓰레기

9.지오시스템리서치센터(연안침식)
- 수행기관명 : ㈜지오시스템리서치
- 센터 소개 : 연안침식 관련 자료 수집/분석/가공 및 연안침식에 영향을 주는 해양관련 정보제공
- 주요데이터(핵심데이터): 연안침식, 해양(해수순환, 파랑)재분석장, 재해위험지구, 태풍/해일관련 자료

10.엔에스원소프트센터(연안안전운항)
- 수행기관명 :엔에스원소프트센터
- 센터 소개 : 연안 중소형 선박의 안전지원을 위한 데이터 생산
- 주요데이터(핵심데이터): LTE M 선박 운항분석데이터, 갯골 데이터, 여객선 항적데이터, IoT 기반 선박운항데이터, VDR 기반의 선박 운항 데이터 등

연안분야 빅데이터 플랫폼의 홍보채널 친구추가하면
파이선 기초부터 인공지능 교육과정까지 다양한 이벤트 참여 가능

연안분야 빅데이터 플랫폼은 블로그, 페이스북, 유튜브 채널을 만들어 잠재적인 수요자에게 홍보하고 연안분야 빅데이터를 활용할 수 있는 네트워크 및 생태계 거버넌스에 힘쓰고 있다. 홍보채널에서는 플랫폼내 참가한 연안분야 센터들의 소개와 함께 빅데이터 응용과 활용에 이용할 수 있는 파이션 기초부터 인공지능까지 빅데이터 분석에 필요한 교육과정 일정도 마련되어 있다. 이외에 데이터 융합을 통한 웹서비스 아이디어 공모전, 각종 연안분야 빅데이터 행사 정보, 이웃추가 참여 이벤트도 진행되고 있다. 좀 더 자세한 일정과 내용은 아래 연안분야 빅데이터 플랫폼 홍보채널에 접속하면 알 수 있다.


▲ (블로그) https://blog.naver.com/bigdatacoast


▲ (페이스북) https://www.facebook.com/profile.php?id=100086970302818


▲ (유투브) https://www.youtube.com/channel/UCSmbd3i_dBcUY1o1QeKETMg

연안분야 빅데이터 플랫폼 구축에 사용되는 용어 및 약어 설명

데이터 파일 관련 용어
NetCDF(Network Common Data Form) :
해양, 기상, 대기 등 과학기술 분야에서 다차원 과학 데이터(변수)를 저장 및 접근하기 위한 데이터 포맷 형태

CSV(Comma-Separated Values) :
쉼표(,)로 구분한 텍스트 데이터 및 텍스트 파일. 표의 형태를 직관적으로 나타내는 간단한 형식이라 이해하기 쉬우며 다른 복잡한 파일 포맷에 비해 CSV는 기초적인 문자열 조립만으로 읽거나 쓸 수 있기 때문에 가장 호환성이 쉬운 포맷 형태

데이터 관리 용어
데이터 표준화 :
시스템별로 산재해 있는 데이터 정보 요소에 대한 명칭, 정의, 형식, 규칙에 대한 원칙을 수립하여 적용하는 것을 의미. 데이터 표준화 작업은 데이터의 정확한 의미를 파악할 수 있게 해주며 데이터에서 관리되는 주요 대상에는 용어, 단어, 도메인, 코드가 있음.

도메인(Domain) :
데이터 관리 대상에서 도메인이란 속성에 대응하는 컬럼에 대한 데이터 타입과 길이를 의미하고, 데이터 표준화 측면에서 매우 중요한 요소

메타데이터 :
데이터에 관한 정보를 구조화된 데이터로, 다른 데이터를 설명해 주는 데이터. 대량의 정보 가운데에서 찾고 있는 정보를 효율적으로 찾아내거나 이용하기 쉽게 일정한 규칙에 따라 목록화한 데이터를 말함. 어떤 데이터 즉 구조화된 정보를 분석, 분류하고 부가적 정보를 추가하기 위해 그 데이터 뒤에 함께 따라가는 정보를 말하며, 속성정보라고도 함

데이터베이스관리시스템(Database Management System, DBMS):
방대한 데이터를 운용하기 위한 데이터베이스의 틀을 만들고, 검색하고 저장할 수 있는 기능을 가진 관리 시스템으로 응용된 프로그램이 접근가능한 인터페이스, 장애 복구 기능, 보안성 유지 등도 지원한다. 대표적인 관리 시스템으로 엑세스, 오라클, 인포믹스 등이 있음.

데이터베이스 품질관리 응용프로그램:
데이터의 단어, 용어, 도메인을 기준과 규칙에 따라 정의하거나 기존 표준사전과 데이터모델을 제공할 수 있는 표준관리 시스템이나 데이터내에 존재하는 오류 데이터, 테이블과 컬럼의 구조적인 문제점, 표준을 준수하지 않는 컬럼 등을 검출하고 진단할 수 있는 품질관리시스템 등이 있음. 상용프로그램으로 전자의 경우에는 S-META(Smart-Metadata), 후자의 경우에는 SDQ(Smart Data Quality) 등이 있음

  목 록