01. 데이터 활용과 데이터 시대의 도래
그리스어인 ‘판데모스(Pandemos)’에서 유래된 ‘펜데믹(Pandemic)’은 ‘모두(Everyone)’을 의미하는 ‘판(Pan)’과 ‘인구(Population)’을 의미하는 ‘데모스(Demos)’가 결합된 용어로 모든 인류에게 영향을 미치는 고통적인 상황을 의미한다. 코로나19 팬데믹은 감염병의 파급력처럼 경제, 문화, 의료, 교육 등 사회 전반에 큰 영향을 주었으며 특히 비대면과 언택트 환경을 위한 디지털 전환(Digital Transformation)으로의 전환이 빠르게 진행되었다. 이러한 디지털 전환은 클라우드, 사물인터넷, 인공지능, 빅데이터 등의 4차 산업혁명 핵심기술 발전을 통해 디지털 경제와 데이터 경제 가속화를 위한 성장동력을 확보할 수 있게 되었다.
[그림 1] 데이터 시대의 발전요인 및 기대효과
분산 컴퓨팅, 고성능 컴퓨팅, 인메모리(In-Memory)기술 발전은 유연한 인프라 환경구성을 가능하게 하여 실시간으로 발생하는 대용량의 데이터를 분석하고 활용하는 플랫폼 비즈니스를 통해 플랫폼 파워의 가치를 증명함으로써 오픈 이노베이션과 디지털 자이언트, 스크링쿨러 이코노미 등 다양한 산업발전에 기여하고 있다. 이러한 산업발전의 원동력은 디지털 생태계 전반에서 발생되는 데이터가 핵심이라고 할 수 있다.
전 세계적인 코로나 확산을 방지하기 위해 감염병 예방을 위한 사전대응과 확진자 경로추적의 사후대응 관점에서 디지털 데이터의 활용이 급증하고 있다. 먼저 사전대응 측면에서는 안면인식이나 발열체크, 마스크 착용여부 등을 인지하는데 데이터를 활용되고 있으며, 사후대응 측면에서는 신용카드 사용정보 및 휴대전화 위치추적 등을 기반으로 대규모 발병지역 분석 및 확진자 동선을 파악하는 역학조사 과정에서 디지털화된 사용자 행위 데이터인 디지털 흔적(Digital Dust)의 활용사례가 폭발적으로 증가하고 있다. 이와 같이 디지털 흔적은 단순히 질병관리 차원의 활용을 넘어 불확실한 비즈니스 환경에서 새로운 가치창출을 통한 기업의 레질리언스(Resilience)확보를 위한 대응전략으로 활용되고 있다.
디지털 전환으로 발생되는 데이터들은 산업간의 융합과 협업(Collaboration)의 촉매제로 빅데이터 활용에 따른 가치창출에 대한 기대를 높이고 있다. 글로벌 리서치 업체 가트너에서도 ‘2021 전략기술 트렌드’를 통해 이러한 시대적 흐름을 반영하고 있다. 기술발전의 주요 목적은 결국 ‘인간 중심성(People Centricity)’인 관점에서 바라보고 활용해야 하며, 사용자에게 제공되는 서비스나 인프라는 ‘위치 독립성(Location independence)’인 기술특성을 바탕으로 ‘탄력적인 전달(Resilient delivery)’을 수행함으로써 독립적인 기술발전을 넘어 상호연계와 의존적 관계를 강화할 수 있는 ‘조합적 혁신(Combinatorial Innovation)’을 통해서 구현 가능하다는 점을 강조하고 있다.
2019
|
2020
|
2021
|
핵심 트렌드
|
전략기술
|
핵심 트렌드
|
전략기술
|
핵심 트렌드
|
전략기술
|
Intelligent
지능화
|
Autonomous
Things
사물 자동화
|
People-Centric
인간 중심성
|
Hyperautomation
초자동화
|
People
Centricity
인간
중심성
|
Internet of
Behaviors
행동 인터넷
|
Augmented
Analytics
증강 분석
|
Multiexperience
멀티 경험
|
Total
Experience
전체 경험
|
AI-Driven
Development
인공지능 기반 개발
|
Democratization
민주화
|
Privacy-Enhancing
Computation
프라이버시 강화 컴퓨팅
|
Digital
디지털화
|
Digital Twin
디지털 트윈
|
Human
Augmentation
휴먼 증강
|
Location
independence
위치
독립성
|
Distributed
Cloud
분산 클라우드
|
Empowered
Edge
강화된 엣지
|
Transparency
and Traceability
투명성과 추적성
|
Anywhere
Operations
어디에서나 운영
|
Immersive
Experience
몰입 경험
|
Smart spaces
스마트 공간
|
The
Empowered Edge
강화된 엣지
|
Cybersecurity
Mesh
사이버보안 메시
|
Mesh
메시
|
Blockchain
블록체인
|
Distributed
Cloud
분산 클라우드
|
Resilient
delivery
탄력적인 전달
|
Intelligent composable business
지능형 구성 비즈니스
|
Smart Spaces
스마트 공간
|
Autonomous
Things
사물 자동화
|
AI
Engineering
인공지능 공학
|
Privacy and
Ethics
디지털 윤리와
개인정보보호
|
Practical
Blockchain
실용적인 블록체인
|
Hyperautomation
초자동화
|
Quantum
Computing
양자 컴퓨팅
|
AI Security
Ai 보안
|
Combinatorial
Innovation
조합적 혁신
|
[표 1] 3년간 가트너 전략기술 트렌드 분석 (출처 : Gartner, 「Gartner top strategic technology trends for 2021」)
불과 몇 년 전만 하더라도 지능화(Intelligent), 디지털화(Digital), 스마트 공간(Smart Space)등을 통해 인공지능, 디지털트윈, 휴먼증강, 블록체인 등을 강조하며 독립적인 기술발전에 주목하였으나 사회 디지털 인프라 구축 확대 및 기술 성숙도 향상에 따라 플랫폼을 통한 산업과 기술간의 연계로 가치가 창출되면서 ‘연계의 중요성’에 주목하게 되었다. 빅데이터 수집과 저장의 지리적 유연성을 확보할 수 있는 ‘분산 클라우드(Distributed Cloud)’로 필요한 시점 즉시에 자원을 활용하고 반환할 수 있는 ‘인프라 확장성(Auto Scaling)’을 토대로 사람의 행동식별을 통해 특정행동을 유도하기 위한 목적으로 활용되는 ‘행동 인터넷(IoB, Internet of Behaviors)’의 활용은 데이터 마이닝, 인공지능 기술들의 발전과 결합되어 데이터 기반(Data Driven)의 의사결정을 제공할 수 있게 된다.
데이터 기반으로 비즈니스 운영에 필요한 최적의 조직 모듈 구성을 통해 비즈니스 민첩성과 변동성을 확보함으로써 ‘조합가능한 지능형 비즈니스(Intelligent composable business)’를 구현할 수 있게 되고 이를 통해 유연한 조직으로 저비용∙고효율의 비즈니스 운영환경을 확보할 수 있게 되는 것이다. 모듈화된 조직구성을 통해 데이터 분석을 통한 개인맞춤형 서비스를 제공할 수 있는 근간은 비즈니스 활동의 새로운 가치창출과 성장동력으로 활요될 수 있게 된다. 이번 호에서는 데이터 시대를 구동하는 ‘21세기의 원유’인 데이터를 활용한 경제적∙사회적 가치의 극대화 방안과 국내 데이터 생태계 활성화를 위한 현주소를 분석해보고 데이터 활용을 통한 국내 데이터 경제의 발전전망과 고려사항에 대해서 살펴보고자 한다.
02. 데이터 시대의 데이터 활용방안
1) 데이터 시대의 핵심 데이터 유형
석탄과 철이 산업혁명을 이끌었던 것과 같이 차세대 산업혁명은 IoT, IIoT, 센서, 소셜미디어 등을 통해 수집된 거대한 데이터 집합이자 이를 수집하고 분석할 수 있는 기술이나 아키텍처를 의미하는 빅데이터를 통해 새로운 시대를 열어가고 있다. 빅데이터는 정보제공주체에 따라 △ 정부데이터, △ 빅데이터, △ 오픈데이터의 3가지로 분류할 수 있다. 먼저 정부데이터는 국가기관, 지방자치단체, 공공기관에서 법령으로 정한 목적하에 취득 및 관리하고 있는 데이터베이스를 전자적 방식으로 처리하는 데이터를 의미하며, 「공공기관의 정보공개에 관한 법률」 및 「저작권법」 등의 관련 법률에 의거하여 공개여부가 결정되게 된다.
기존 데이터 관리도구의 한계를 넘어 수십 테라바이트 이상의 대량의 정형데이터 또는 비정형 데이터 등의 집합을 의미하는 빅데이터는 데이터로부터 가치를 도출하여 유의미한 패턴을 발견하여 의사결정을 할 수 있는 통찰력을 확보할 수 있게 된다. 미국의 FAANG(Facebook, Amazon, Apple, Netflix, Google)와 중국의 BATH(Baidu, Alibaba, Tencent, Huawei)와 같은 글로벌 ICT기업들이 플랫폼 비즈니스 강화를 위해 서비스 사용자들의 통해 확보된 독점적인 데이터를 활용하여 큐레이팅 서비스에 접목하여 수익창출 및 비즈니스 영역확대가 가능해 짐에 따라 빅데이터가 주목받게 되었다.
[그림 2] 데이터 제공 주체별 데이터 특성 (출처 : 서울연구원, 「서울시 공공빅데이터 활성화방안」 내 ‘빅데이터, 오픈데이터, 정부데이터에 따른 유형과 특징’ 일부 재구성)
공공데이터나 빅데이터가 공공의 이익이나 수익창출에 활용되는 것에 반해 오픈 데이터의 경우 다수의 사용자에게 비영리적 목적으로 데이터를 제공하여 도시문제 해결이나 사회현상 등의 분석을 통한 가치창출을 위한 목적을 위해 주제나 형식에 따라 오픈데이터 공유플랫폼을 통해 자유롭게 공개 및 활용 가능한 데이터들을 의미한다. 예측모델 및 데이터 분석 대회를 통해 데이터 분석의 가치공유 및 데이터셋을 공유하는 캐글(Kaggle)이외에도 국내에서는 SKT 빅데이터허브, 네이버 데이터랩 등을 통해 데이터 생태계가 조성되고 있다.
데이터 생태계 조성을 위해서는 데이터 셋이라는 소프트웨어 이외에도 데이터 분석을 위한 하드웨어도 중요한 요소다. GPU, TPU, 뉴로모픽(Neuromorphic), CUDA/OpenCL등의 하드웨어 발전과 병렬 컴퓨팅을 통해 컴퓨팅 파워부족의 문제를 해결하고 클라우드 컴퓨팅을 통한 위치 독립성(Location independence)을 바탕으로 유연한 인프라 환경은 빅데이터의 6V(Volume, Velocity, Variety, Value, Veracity, Variability)를 주도하였으며 데이터 기반의 플랫폼 비즈니스를 통해 국가적∙사회적 측면으로 데이터 활용에 기여하고 있다.
구분
|
수익창출
및 매출증대
|
비용절감
및 효율성 향상
|
고용창출
및 신기술 개발
|
정부관점
(Benefit to
Government)
|
•경제활동 증대에 따른
세수 증가
•고부가가치 정보판매∙공유를 통한 수익창출
|
•데이터 거래비용 감소
•연결데이터(Linked Data)를 통한 서비스 효율성 향상
|
•신규비즈니스를 통한 일자리 창출
•기업가 정신 촉진
|
민간관점
(Benefit to
Private Sector)
|
•새로운 비즈니스 기회창출
|
•공공데이터의 자료변환에 투입되는 비용절감
•정확한 정보 기반의 의사결정 개선
|
•숙련된 인력확보
(Data Scientist)
•비숙련된 도메인 기반 분석인력 확보
(Citizen data scientist)
|
[표 2] 공공데이터의 경제적 가치 분석 (출처 : Capgemini Consulting, 「The Open Data Economy Unlocking Economic Value by Opening Government and Public Data」)
「Data-Driven Innovation through Open Government Data」의 ‘The open government data value generation framework’에 따르면 데이터 가치(Data Value)는 크게 금전적 이득을 제공하는 경제적 가치(Economical Value)와 사회문제를 해결하는 사회적 가치(Social Value)로 분류할 수 있다. 데이터를 통해 경제적 가치를 획득하기 위해서는 데이터를 취급하는 정보관리시스템의 개선 및 통합을 통해 데이터 재사용성 향상 및 정보 접근성을 제공하는 효율성(Efficiency)과 신규 비즈니스를 창출하는 혁신성(Innovativeness)을 제공할 수 있게 된다.
사회적 가치를 제공하기 위해서는 공공 데이터의 특성에 기반하여 제도적 안정화를 통한 투명성(Transparency)과 도시문제 해결과제의 시민참여를 증대하는 참여성(Participation)의 가치를 제공하게 된다. 이처럼 데이터의 활용은 수익창출 및 매출증대, 비용절감 및 효율성 향상, 고용창출 및 신기술 개발 등의 관점에서 긍정적인 영향을 끼치며 국가와 민간분야의 발전에 기여하고 있다.
2) 빅데이터를 이용한 데이터 활용현황
데이터 제공방식(스크러빙, API, 크롤링), 데이터 제공주체(공공, 민간, 일반), 데이터 규모(TB, PB, EB, ZB단위의 데이터), 데이터 형태(정형, 반정형, 비정형) 등에 따라서 활용방식이나 활용범위(공개, 비공개)가 달라짐에 따라 정부데이터, 빅데이터, 오픈데이터 등 다양한 형식의 데이터를 활용하기 위해서는 데이터 생명주기에 따른 데이터 활용전략과 생태계 조성 위한 제도적∙기술적 지원이 필요하다.
FAANG이나 BATH와 같은 글로벌 ICT기업의 플랫폼 효과(Network Effect)와 코로나19로 인한 언택트 환경 가속화로 데이터 기반의 플랫폼 비즈니스의 시장점유율이 빠른 속도로 증가하면서 데이터 분석을 통한 마케팅 활용사례 역시 증가추이를 보이고 있다. 데이터 기반의 결과를 토대로 4P(Promotion, Place, Product, Price)마케팅 기법에 접목하면서 보다 낮은 비용으로 운영 효율성을 향상키시고 고객맞춤형 서비스를 강화되면서 플랫폼 서비스의 락인효과(Lock-in)를 통해 시장지배력을 향상시킬 수 있게 되었다.
[그림 3] 국내 데이터산업 활성화 전략 (출처 : 과학기술정보통신부, 「데이터산업 비전 및 추진전략」)
데이터를 통한 시장지배력을 강화하기 위해서는 데이터 가치사슬의 전주기를 기반으로 데이터 산업 환경 조성을 위한 제도적 지원과 플랫폼 인프라를 통한 글로벌 경쟁력 제고가 중요하다. 이를 위해서는 정부차원의 법제도적 지원과 데이터 분석 원천기술 획득을 위한 재정적 지원을 통한 R&D강화가 그 무엇보다 중요하다. 정부에서도 국내 데이터산업 활성화를 위해 과학기술정보통신부에서 [그림 3]과 같이 「데이터 산업 비전 및 추진전략」을 통해 데이터 산업 육성을 위한 기반을 조성하고 이용제도의 패러다임을 전환함으로써 플랫폼 구축과 제도적 안정화를 도모하고 있다.
빅데이터를 이용한 데이터 생태계 조성 및 시장 활성화를 위한 활동을 PEST관점으로 분석해 보면 민간협력을 통한 종합적인 데이터 경제가 활성화 되고 있다는 사실을 알 수 있다. 특히 팬데믹으로 인한 저성장∙양극화 심화에 따라 위기극복과 글로벌 경제선도를 위한 국가발전전략의 일환인 「한국판 뉴딜 2.0」을 시작으로 국내 데이터 경제는 급물살을 타기 시작했다.
△ 데이터 수집을 강화하기 위해 제조, 의료, 에너지, 금융, 행정 등 ‘공공∙민간 데이터 수집’과 ‘SOC 디지털화’를 추진하였으며, △ 수집된 데이터를 축적하고 가공하기 위해 ‘AI학습용 데이터 구축’ 및 ‘분야별 빅데이터 플랫폼 구축’, ‘국가 통합 데이터 지도’, ‘데이터 표준화 및 품질제고’를 수행하였다. 축적된 데이터는 바우처 사업을 통한 다양한 산업분야에서 활용할 수 있도록 제공되고 있다. 한국판 뉴딜 2.0이외에도 데이터 3법, 마이데이터 실증사업, 데이터 플래그십, 중소기업 빅데이터 분석 활용 지원 등의 제도적 기반을 토대로 재정지원 및 기술강화에 앞장서고 있다.
민간에서는 오픈 이노베이션을 통해 데이터 산업 패러다임을 정비하고 데이터 기반의 통찰력을 통해 시장을 선점할 수 있는 킬러 컨텐츠를 확보하여 시장지배력을 강화하고, 개인정보 오남용이나 데이터 유출사고 대응절차 강화를 통해 사용자 보호 및 정보보호 활동을 통해 데이터 활용과 안전성 보장이라는 상충관계(Trade-Off)의 적정수준을 유지하는 데이터 활용전략을 운영하고 있다. 보안이 확보된 데이터 활용을 하기 위해서는 데이터 제공자 및 데이터 소비자 등 데이터 이해관계자들간의 관계분석 및 요구사항을 토대로 데이터 컴플라이언스를 수립해야 한다.
구분
|
활용현황
|
주요특징
|
상세내용
|
정책
측면
|
한국판 뉴딜
2.0
|
•코로나19로 인한 경기침체와 일자리 충격 극복위한 국가발전전략
•한국판 뉴딜 1.0(2+1+1체제)발표 1년 후 2.0(3+1체제)로 개편
|
△ 디지털뉴딜(비대면 인프라 고도화, 초연결 신산업 육성), △ 그린뉴딜(탄소중립 추진기반 구축), △ 휴먼뉴딜(청년정책, 격차해소), △ 지역균현뉴딜
|
데이터3법
|
•개인정보보호 일원화를 통해 개인정보, 가명정보 명확화 및 마이데이터산업과 빅데이터 활용근거 마련
|
△ 개인정보보호법(개인정보보호강화, 감독기구 독립성, 가명정보도입) , △ 정보통신망법(개인정보 거버넌스 정비), △ 신용정보법(마이데이터 활성화, 개인정보 자기결정권 강화)
|
마이데이터
|
•정보주체 중심의 개인데이터 활용체계 확립위한 데이터주권 패러다임
|
△ 마이데이터 생태계 구축(마이데이터사업자, 마이데이터 중계기관, 데이터전문기관, 데이터거래소), △ 마이데이터 실증서비스
|
데이터
바우처
|
•데이터기반 서비스 개발, 분석 등에 필요한 데이터 구매 또는 가공(일반/AI)서비스를 전문기업으로부터 제공받을 수 있도록
지원하는 제도
|
△ 데이터 구매 바우처(데이터 구매비용지원), △ 데이터 가공 바우처(맞춤형 데이터 처리 가공 비용지원)
|
경제
측면
|
비즈니스
신뢰성 및
유연성 확보
|
•데이터 기반 의사결정을 통한 의사결정 신뢰성 확보, 실시간 분석환경통한 시장대응력 확보
•리스트 예측 및 신속대응, 비즈니스프로세스 개선 및 TCO절감
|
△ FAANG(Facebook, Amazon, Apple, Netflix, Google),
BATH(Baidu, Alibaba, Tencent, Huawei)등 글로벌ICT기업의 데이터 기반 플랫폼 비즈니스 강세
|
규제
샌드박스
|
•신기술과 신서비스의 시장진출기회 제공 위한 ‘선(先)허용-후(後)규제’
|
△ 규제 신속확인(30일 이내), △ 임시허가(법령정비 지연), △ 실증특례(2+2내 법령정비)
|
사회
측면
|
SMART-X
고도화
|
•스마트시티, 스마트팩토리, 스마트홈, 스마트그리드, 스마트헬스케어 등 사회문제 해결
|
△ 자율사물(Autonomous Things), 디지털 트윈(Digital
Twin), 스마트 공간(Smart
Spaces) 기술을 결합한 데이터
생태계 구성
|
시민 데이터
과학자
|
•고수준의 데이터 분석 전문지식 없이 자신의 전문지식과 결합하여 현장전문 데이터 분석
|
△ 리빙랩(Living Lab)통한 도시문제 해결, △ 시민참여형 도시문제 해결 및 정책개선
|
기술
측면
|
빅데이터
분석 기술
|
•데이터 생애주기에 따라 데이터를 수집, 분석하는 프레임워크 및
기술
•KDD, CRISP-DM, SEMMA등 방법론을 통한
데이터 활용
|
△ 데이터 수집(크롤링, OpenAPI), △ 데이터 저장∙처리(Data Lake, HDFS, Elastic Search, MapReduce), △ 데이터 분석(데이터마이닝, 시각화)
|
데이터
플랫폼
|
•「데이터 플랫폼 발전전략」 통해 국가 차원의 데이터 플랫폼 확충 및 연계강화와 데이터 전주기
플랫폼 구현 지원
|
△ 분야별 대표 데이터 플랫폼 확충 및 통합 연계, △ 데이터 거래∙유통 기반 강화, △ 데이터 분석∙활용 생태계 조성, △ 데이터 통합∙관리 체계 마련
|
4차 산업혁명
관련기술
|
•인공지능, 데이터 마이닝, 반도체 등 기술 고도화
|
△ AI메모리 반도체, 초고속 컴퓨팅, 미래 모빌리티 등 원천기술 연구
|
[표 3] 빅데이터 생태계 활성화를위한 PEST관점별 데이터 활용현황 분석
3) 빅데이터 플랫폼 활성화를 통한 데이터 활용강화
데이터 활용을 극대화하기 위해서는 빅데이터 생명주기에 따른 데이터 수집, 저장, 분석, 활용, 파기의 과정을 관리할 수 있는 빅데이터 플랫폼 중심의 운영이 필요하다. 빅데이터 플랫폼은 데이터 구조 및 거버넌스를 기반으로 데이터 연계 및 공유를 수행할 수 있는 가상환경으로 혁신적인 비즈니스 프로세스를 창출할 수 있는 비즈니스 생태계를 의미한다.
파이프라인 비즈니스는 자산이나 자원을 독점 소유하여 통제기반으로 규모의 경제를 통해 가치사슬을 극대화 하였다면, 플랫폼 비즈니스는 소비자(Buyer, User, Consumer)와 제공자(Seller, Broker, Producer)의 네트워크(Connect)환경과 반복적인 피드백을 수행하는 프로세스를 통해 자원을 조정(Orchestration, Redistribution)함으로써 생태계 전체의 가치를 극대화하는 성장동력을 구축하게 된다.
구분
|
단면(Single Side) 플랫폼
|
양면(Two Side) 플랫폼
|
다면(Multi Side) 플랫폼
|
사업형태
|
기반형 플랫폼
(기반인프라를 통해
지속적인
부가 서비스 판매)
|
매개형 플랫폼
(교차 네트워크 효과,
Cross
Network Effect)
|
융합형 플랫폼
(하드웨어 및 소프트웨어
등을
통해 단독 생태계 구성)
|
사업자 역할
|
중개자형(Match) 플랫폼
|
관중동원형(Audience
Builders) 플랫폼
|
비용 절감형(Cost
Minimizers) 플랫폼
|
제휴자 역할
|
통합 플랫폼
|
제품 플랫폼
|
양면 플랫폼
|
수익모델
|
거래중개 수수료 플랫폼
|
광고 플랫폼
|
기반 보급 후 파생상품
|
[표 4] 플랫폼 비즈니스 유형 (출처 : 포스코경영연구소, 「제조업의 기술활용 플랫폼 전략」)
「제조업의 기술활용 플랫폼 전략, 포스코경영연구원」에 따르면 플랫폼 비즈니스는 크게 3가지 유형으로 △ 사업자가 중개자형(Match Makers)역할을 통해 거래 중개수수료로 수익을 확보하는 단면(Single Side) 플랫폼, △ 사업자가 관중동원자형(Audience Builder)역할을 통해 광고수수료로 수익을 확보하는 양면(Two Side) 플랫폼, △ 사업자가 플랫폼 기반을 보급 후 파생상품 및 서비스를 제공하여 수익을 확보하는 다면(Multi Side)플랫폼으로 분류할 수 있다.
플랫폼 비즈니스 수익모델 상당수는 플랫폼 구성원들 사이에서 발생하는 거래(Transaction)를 통해 발생하는 중개 수수료로 수익을 창출하기 때문에 강력한 네트워크 효과로 승자독식구조의 시장경제를 보이기 시장지배력이 있는 플랫폼 제공자에게 정보가 집약되는 현상이 발생되게 된다. 플랫폼 제공자는 플랫폼을 통해 수집된 정보(데이터)를 토대로 플랫폼 종송적 환경구축이 가능해지면서 빅데이터를 통한 가치창출을 도출할 수 있는 플랫폼 환경이 데이터 경제의 핵심요소라고 할 수 있다.
[그림 4] 민관 협력기반 데이터 플랫폼 발전 전략 및 제도적 지원 (출처 : 과학기술정보통신부)
국내에서도 데이터 활용의 핵심경쟁력인 플랫폼의 협력과 활성화 방안을 논의하기 위해 지난 10월 과학기술정보통신부는 ‘제1차 민‧관 데이터 플랫폼 발전협의체’를 개최하였다. 데이터 산업발전에 중요한 요소인 양질의 데이터 부족문제 해소 및 데이터 생명주기 지원을 위해 2019년부터 구축 및 운영하고 있는 ’16개 분야 빅데이터 플랫폼’의 효율성을 강화하여 ‘통합 데이터지도 서비스’를 운영하고 있다. 민‧관 분야의 ‘데이터 플랫폼 발전협의체’, 실무협의에서는 데이터 플랫폼간의 유기적인 협력 및 상호협력방안 수립을 위한 데이터 표준화의 필요성과 이종 데이터 플랫폼간의 연계방안에 대한 논의를 하였으며, 이를 통해 데이터 결합과 시너지 창출의 중요성을 다시 한번 강조했다.
[그림 5] 빅데이터 분석 플랫폼 프레임워크
데이터기반으로 상황을 판단하고 합리적인 의사결정을 도출하기 위해서는 ‘[그림 5] 빅데이터 분석 플랫폼 프레임워크’와 같은 분석 플랫폼 구조를 통해 데이터 분석을 수행해야 한다. 데이터의 수집, 저장, 분석, 활용의 프로세스를 수행하는 데이터 생명주기에 따라 데이터 경제 활성화 및 데이터 주권강화를 위해서는 데이터 거버넌스가 필요하다. △ 데이터 원칙, 절차, 데이터 관리 조직 운영 등에 대한 데이터 전략, △ 데이터 표준, 데이터 프로세스 및 프레임워크,품질, 모델링, 메타데이터, 프라이버시 보호 및 보안을 위한 데이터 아키텍처, △ 데이터 품질관리 및 메타정보 관리 등을 위한 데이터 관리를 기반으로 데이터 거버넌스를 수립하면 보다 안정적인 플랫폼 구축과 운영이 가능하다. 구축된 빅데이터 분석 플랫폼은 금융, 의료, 교통, 통신, 문화, 환경, 산림 등 다양한 산업분야별로 통계분석, 시각화 등을 통해 다양한 산업분야에서 활용이 가능하게 된다.
03. 데이터 시대의 발전전망 및 고려사항
지금까지 데이터 생명주기에 따른 생태계 조성이 새로운 비즈니스 발굴 및 가치창출의 목적일 때 산업전반에 미치는 영향을 알아보았다. 그리고 데이터를 활용하기 위해서 데이터 제공주체에 따른 데이터 유형과 빅데이터 플랫폼을 기반으로 PEST관점의 데이터 활용방안을 살펴보았다. 교통, 금융, 도시, 에너지, 의료 등 다양한 산업분야에서 교통혼잡 원인분석 및 교통사고 원인 분석 서비스, 보험사기 분석 및 맞춤형 금융서비스, 지능형 CCTV기반 보안서비스, 에너지 공급제어 및 관리 서비스, 환자별 맞춤 진단 및 치료서비스 등 편의성과 안전성, 정확성, 효율성 향상을 위한 목적으로 데이터는 다양하게 활용하고 있다.
데이터 경제 활성화를 추진하기 위해서는 정부의 데이터 관련 정책지원과 데이터 수집, 가공, 저장, 분석, 활용을 위한 기반기술 발전을 토대로 고객 맞춤형 서비스로 민간 데이터 비즈니스를 강화하고 오픈데이터 및 오픈데이터 플랫폼을 통한 시민참여를 증대시켜 데이터가 사회적 공유자원으로서의 가치 극대화를 위한 논의의 장을 활성화하는 것이 중요하다. 이를 위해서는 정책적인 관점에서는 「한국판 뉴딜 2.0」의 실증사업을 통해 공공데이터 개방 및 마이데이터 확대를 통해 데이터 활용에 따른 이해관계자간의 데이터 이용으로 인한 수익분배 문제와 개인정보 활용 시 정보제공에 따른 동의문제, 개인정보 유출사고 및 대응을 위한 단체교섭권 부여 등에 대한 논의를 해야한다.
데이터3법 시행으로 가명정보와 익명정보의 개념이 도입되면서 데이터 활용시장은 변곡점을 맞이하게 되었다. 개인정보의 가명처리는 비식별화(익명화)기술을 통해 생성되는 정보를 의미하게 된다. 통계, 암호화, 삭제, 가명화, 해부화, 일반화, 무작위화, 재현 데이터 등 ISO/IEC 20889(비식별화 국제표준)에서 명시하는 비식별화 처리기술을 적용한 가명정보는 프라이버시 보호모델(레코드 연결공격, 속성연결공격, 테이블연결공격, 확률론적 공격)을 이용한 재식별 가능성을 판단하여 사용여부가 결정되게 된다. 비식별화 기술 이외에도 암호화된 상태에서 데이터 연산 및 분석이 가능하도록 하는 차세대 암호방식인 동형암호(Homomorphic Encryption)를 적용하거나 데이터 필터링 및 등급화를 통해 활용데이터의 제한을 수행할 수 있게 된다. 가장 중요한 것은 데이터 생명주기에 따른 Privacy by Design 적용방안과 이를 토대로 데이터 활용 시에 발생되는 Action Plan에 대한 고려가 필요하게 된다.
구분
|
발전방향
|
고려사항
|
정책
|
•「한국판 뉴딜2.0」활성화 위한 재정지원
강화
- 3+1체제(디지털뉴딜, 그린뉴딜, 휴먼뉴딜,
지역균형뉴딜)통한 선제적∙능동적 선도국가
도약발판마련
•이해충돌방지를 위한
선제적 제도마련 : 관련 규제완화 및 보완
통해 데이터 기반 신성장동력 확대
•마이데이터 활성화 : 이해관계자(정보주체, 정보제공자, 정보수신자)간의 산업 생태계
활성화 및 민간 수요 적극 지원
|
•개인정보 보호 협치(거버넌스 정비)
- 국∙내외 개인정보 컴플라이언스 충돌 대응
- 데이터 이용수익권과
단체교섭권 부여
•국민 편익증대 실증사업 확대를 통한
성과도출
- 의료·공공·금융·교통·생활소비 등 4개 분야 8개 마이데이터 실증서비스 과제 선정(2021.06)
|
기술
|
•데이터 플랫폼 연계기술 강화
- API, Plug-In, DCAT(Data Catalog Vocabulary), LOD(Linked Open Data)
•데이터 익명화 :
ISO/IEC20889, PPDM, 프라이버시 보호모델(k-익명성, l-다양성, t-근접성, m-유일성)
•데이터 암호화 : 동형암호(부분동형암호, 준동형암호, 완전동형암호), 양자암호
•데이터 필터링 및 등급분류 : 필터링 대상 명확화 및
데이터 등급 세분화
|
•개인정보 활용에 따른
역기능 대응
- 프라이버시 보존기술(PETs,
Privacy Enhancing Technologies) 강화
- 데이터 생명주기에 따른 Privacy by
Design 준수
•재식별 문제 발생 시 처리
프로세스 고려
- 가명정보처리 적정성
검토 및 최소한의 정보 활용여부 검토 통해 가명처리 수준 판단
|
산업
|
•맞춤형 서비스를 통한
고객생애주기(CLV)향상
- 데이터 기반의 Mass
Customization 및 비스포크(Bespoke) 전략을 토대로
기업경쟁력 강화
- 데이터 분석으로 CAPEX/OPEX 최소화로 ROI증대
•신산업 생태계 활성화 : 민∙관협력을 통해 데이터 중개서비스 및 유통 플랫폼 확대
|
•데이터 분석으로 인한
역기능 보완
- 콜드 스타트(Cold
start), 에코챔버
(Echo Chamber), 필터버블((filter
bubble)등 편향성 강화이슈 대응
•이종 데이터간 결합으로 인한 동의문제 및 수익공유 문제 협의필요
•지적재산권 보호 및
정보주체 권리 배제로 인한 무임승차 논란 대응방안 수립
|
사회
|
•오픈데이터 플랫폼을 통한
시민참여 확대
- 시민 참여단과 지역 테크노파크 연계를 통한
도시문제해결 및 상호작용 강화 (리빙랩 데이터 보안)
•회적 공유자원으로서의 가치 논의 확대
|
•공공데이터 활용한 사회적 가치 및 영향도 고려
•오픈플랫폼 내 개인정보 관리수준 자가진단 방안 수립
|
[표 5] 데이터 시대 활성화를 위한 발전방향 및 고려사항
04. 마무리
2020년 팬데믹 위기극복을 위한 국가발전전략 「한국판 뉴딜1.0」은 추진 1주년을 맞아 기존 디지털 뉴딜 및 그린 뉴딜에 휴먼 뉴딜을 포함하여 3대 주요정책을 포함한 「한국판 뉴딜2.0」을 발표하였다. 2025년까지 한국판 뉴딜의 총사업비를 기존 대비 60조이상 확대된 220조를 투자하여 경제양극화 환경 속에서 포용과 혁신을 위한 새로운 전략들이 제시되었다. 「한국판 뉴딜1.0」이 수행된 지난 1년은 재정투자와 제도개선을 통해 민간참여와 투자확대를 유도함으로써 국가 신성장동력을 마련할 수 있는 마중물 역할을 수행하였다.
디지털 뉴딜의 일환으로 빅데이터 플랫폼 구축과 인공지능 학습용 데이터 구축∙개발, 비대면 바우처 등은 디지털 혁신의 마중물 역할을 수행하였으며, ‘국가공간정보기본법‘, ‘디지털집현전법’, ‘데이터기본법‘등의 디지털 기술확대 및 데이터 활용을 위한 주요입법정책수행으로 제도적 기반을 마련할 수 있게 되었다. 제도적∙기술적지원을 통한 초석 마련으로 디지털 생태계 조성과 비ICT분야의 디지털 전환 가속화로 인해 데이터댐 사업들을 통한 데이터 사업 활성화 및 신성장동력 확보가 가능함에 따라 데이터 경제를 위한 경제∙사회 체질개선의 신호탄이 되었다.
메타버스, 디지털트윈, 지능형 로봇, 클라우드, 블록체인, 사물인터넷, 기타핵심기술(차세대 양자인터넷 구축, AI신뢰성 확보, 디지털역기능 대응)등 초연결 신산업 육성과 공공∙민간 데이터 활용 촉진을 통해 D.N.A(Data, Network, AI)생태계가 강화되게 될 것이다. 물론 데이터 활용과 생태계 조성을 통한 가치창출을 위해서는 정보주체의 자기결정권 확보 방안과 개인정보 관련 국∙내외 법제도 현황에 따른 대응전략을 수립을 위한 관리적∙기술적 관점으로 데이터 거버넌스 체계 수립 등의 문제해결에도 노력이 수반되어야 한다.
메타데이터를 포함하여 내∙외부에서 수집된 데이터를 데이터 플랫폼을 통해 결합 및 융합함으로써 데이터 기반의 의사결정 인텔리전스(Data-Driven Decision Intelligence)를 통해 데이터 생명주기에 기반한 데이터 생태계 조성 및 활성화를 바탕으로 글로벌 데이터 경제 선도국가로의 도약을 기대해 본다.
05. 참고자료
1) Gartner Top Strategic Technology Trends for 2021
2) Data-Driven Innovation through Open Government Data
3) 서울시 공공빅데이터 활성화방안, 2019, 서울연구원
4) 2020 데이터산업 현황조사, 과학기술정보통신부
5) 민·관 협력 기반 데이터 플랫폼 발전전략(2021.06), 관계부처 합동
6) 플랫폼 전략을 논하다(4) : 플랫폼과 양면시장 전략에 대한 고찰
https://verticalplatform.kr/archives/3586