보안정보

전문화된 보안 관련 자료, 보안 트렌드를 엿볼 수 있는
차세대 통합보안관리 기업 이글루코퍼레이션 보안정보입니다.

인공지능(AI)과 정보보안

2016.10.05

18,022

 

 

 

 

1. 인공지능(AI) 기술의 발전

 

 시기

주요 내용

1940년

뉴런의 기능 및 작용과 명제 논리에 대한 연구로부터 인공지능의 개념 등장

1950년

Dartmouth Conference를 통해 인공지능이 정의되고 학문으로 연구되기 시작

 

Allan Turing이 '기계가 생각할 수 있는가?'라는 질문을 던진 '기계와 지능' 논문 발표

1980년

과거 이론화 되었던 개념들의 해법(역전파 알고리즘 등)이 등장 하면서 인공지능이 다시 각광 받기 시작


일본에서 5세대 컴퓨터 프로젝트, 영국에서 앨비(Alvey) 프로젝트를 시작하였으며, 대규모 지식의 표현이 핵심 주제로 자리 잡음

1990년

하드웨어가 기술의 발전을 따라가지 못하면서 기술의 성장이 둔화되었으나 그 과정에서 퍼지 논리와 같은 방법들이 제안되었음

 

1997년 세계 체스 챔피언인 개리 카스파로프가 슈퍼컴퓨터 '딥 블루(Deep Blue)'에게 패하며 화제가 됨

2000년대

~ 현재

기계학습과 패턴인식 기술이 발달하면서 인공지능이 실제 생활에 본격적으로 적용되기 시작


딥 러닝이 등장하여 이미지인식과 음성 인식에 큰 성과를 나타내기 시작


2011년 제퍼디 퀴즈쇼에서 최고의 퀴즈 챔피언인 브래드 루터와 켄 제닝스가 컴퓨터에게 패함


2016년 바둑프로그램 알파고에 바둑 챔피언 이세돌이 패하며 또 다시 인공지능 기술이 주목 받게 됨​

  

[표 5-1] 인공지능 기술 발전 경과 (미래부 기술영향평가 결과, 2015)

 


2. 인공지능(AI) 기술 용어

 

인공지능에는 다음과 같은 기술이 있다.


 ▣ 머신 러닝(Machine learning)
- 인공 지능의 한 분야로, 컴퓨터가 학습할 수 있도록 하는 알고리즘과 기술을 개발하는 분야로 훈련 데이터를 통해 새로운 데이터에 대한 예측 값을 제시하거나 주어진 데이터를 잘 설명하는 모델을 학습하는 방법이다.


▣ 귀납적 학습 (Inductive learning)
- 기계학습의 한 방법으로 찾고자 하는 개념에 대한 사례들과 그 개념에 대해 잘 알려진 반례들로부터 일반적인 개념을 이끌어내는 학습방법이다.


▣ 패턴인식 (Pattern recognition)
- 일반적으로 기계학습과 유사한 의미로 사용되며, 주어진 데이터에서 규칙이나 특성을 찾아내는 방법론들을 통칭한다. 기계학습이 주로 인공지능에서 예측 성능을 높이는 것에 집중한다면, 패턴 인식은 데이터를 가장 잘 설명하거나 시각화 할 수 있는 방법을 찾는데 집중한다.


▣ 딥 러닝 (Deep learning)
– 다량의 데이터로부터 데이터의 특징을 가장 잘 설명하는 표현을 추출하여 단순하고 낮은 수준에서 높은 수준의 개념을 학습함으로써, 모델의 예측 성능을 높이는 기계학습 방법론의 집합이다.


3.  머신 러닝(Machine learning)

 

‘컴퓨터를 학습시킬 수 있는가?’ 라는 질문에서 시작된 머신 러닝은 인공지능 기술의 한 분야이다. 인공지능이 인간과 같은 사고를 하는 컴퓨팅, 즉 사람처럼 행동하게 하는 모든 것을 총칭한다면, 머신 러닝은 데이터를 분석하여 특성과 패턴 등을 발견해 학습 모델을 구축하는 기술이다. 과거에는 공격자들의 공격 기법이 다양하지 않았으며, 침입탐지 및 공격분석 시스템만으로도 효과적으로 방어할 수 있어 정보보안 분야에 머신 러닝은 크게 이슈 되지 않았지만 최근에는 다양한 변종 패턴과 넘쳐나는 데이터 양으로 인해 정보보안 분야에서도 인공지능, 즉 머신 러닝 기술이 주목 받고 있다. 그렇다면 정보보안 분야에서 머신 러닝을 어떻게 활용 할 수 있는지 생각해볼 필요가 있다.

 

1)  악성코드 분석

복잡한 난독화 알고리즘과 정교한 구조를 가진 악성코드라도 결국은 시스템 파괴, 정보탈취 등과 같은 목적을 가지고 있다. 샌드박스 환경에서 악성코드를 실행한 뒤 행위정보를 수집하여 악성코드의 특성을 파악하는 방식에 머신 러닝을 결합한다면 단순히 특정 시스템 콜의 호출 및 작업 수행의 유무로 악성코드를 분류하고 분석하는 것이 아니라 이러한 정보들을 데이터화 한 뒤 벡터 공간에 그린 후 군집화와 분류 기법을 이용하여 특성을 분석할 수 있다. 군집화를 통해 판단을 원하는 대상 파일이 대표적인 악성코드의 행위 유형에서 얼마나 벗어나 있는지 판단하거나 머신 러닝을 통해 만들어 둔 악성코드 분류 모델에 대상 파일의 행위 정보를 대입하여 악성코드 유형을 판단하는 것도 가능하다.

 

2)  소프트웨어 취약점 분석

취약점 분석과 머신 러닝을 결합하려는 연구 또한 다양하게 진행되어 왔다. 초기 연구들은 공개 데이터베이스의 정보를 이용해 머신 러닝을 수행하였다. 하지만 대부분 연구들이 실제 소프트웨어에 존재하는 취약점을 찾는 것보다 익스플로잇의 사용과 배포 등과 관련된 타임 라인 분석과 취약점 연관 키워드 분석에 초점을 맞췄다. 구문 트리(Syntax tree)를 활용해 프로그래밍 패턴을 식별하고 이를 바탕으로 머신 러닝을 수행해 새로운 취약점을 자동으로 찾아내는 실용적인 연구(Vulnerability Extrapolation: Assisted Discovery of Vulnerabilities using Machine Learning) 또한 선행된 바 있다.

머신 러닝의 높은 정확도를 위해서는 충분한 양의 데이터가 수집 되어야 한다. 하지만 소프트웨어 취약점의 경우 공개 데이터베이스를 통해 수집할 수 있는 정보에는 한계가 있고, 컴파일 된 바이너리를 분석하는 경우 프로그래밍 언어와 코딩 방식, 컴파일러의 종류에 따라 많은 변수가 존재하므로 모든 변수를 계산하여 머신 러닝을 이용해야 할 것이다.


3)  디지털 포렌식
머신 러닝을 이용하여 파일 조각만으로도 해당 파일이 어떠한 형식을 가지고 있는지 판별해 내는 연구 (CarveML: application of machine learning to file fragment classification)가 있다. 그리고 많은 양의 데이터에서 디지털 증거를 수집해야 하는 경우에 머신 러닝 기법 활용이 가능하다. 대용량의 데이터를 그대로 사용하는 것이 아니라 데이터를 대표할 수 있는 특징 정보를 추출하거나 데이터를 변환하는 과정을 통해 부하를 줄인 뒤 적절한 학습 알고리즘을 사용하여 빠르고 정확하게 유효한 정보를 얻을 수 있다.

 


4. 인공지능(AI)에 대한 보안업체와 정부의 관심


국내의 인공지능에 대한 관심과 준비는 이제 출발단계이다. 국내 보안업체들이 인공지능(AI), 사물인터넷(IoT), 클라우드 분야 신사업 확대에 박차를 가하고 있다. 이 분야는 글로벌 기업들의 새로운 격전지가 될 정도로 높은 성장성으로 주목 받는다. 매일 새로운 위협이 100만개 이상 출몰하고 있고 보안 솔루션을 우회하면서 적법한 권한을 획득해 목적한 바를 달성하는 정교한 사이버공격 환경에서는 지능적인 위협탐지와 분석, 대응, 예측을 위해 보안 분야에서도 필요한 기술이 인공지능 기술이다.


국내 보안관리 전문기업인 A사는 통합보안관리(SIEM, Enterprise Security Management) 분야에서 기반을 다져온 빅데이터 기반의 정교한 상관분석 엔진 역량을 바탕으로 비즈니스 인텔리전스(BI, Business Intelligence) 및 데이터 웨어하우스(DW, Data Warehouse) 영역으로의 진입을 노리고 있다. 다양한 엔드포인트로부터 유입되는 비정형 데이터가 급증하고 있는 만큼, 이를 통해 수집된 정보를 미래예측 모델에 적용하여 새로운 서비스 모델을 찾아내는 전략이다.


B사는 ‘왓슨(Watson)’으로 대표되는 인공지능 분야 투자에 오랜 기간 주력해 왔으며 최근에는 이를 인지 컴퓨팅이라는 의미의 ‘코그너티브 컴퓨팅(Cognitive Computing)’이라는 용어를 사용하면서 관련사업을 강화하고 있다. ‘코그너티브 컴퓨팅’은 모든 디지털 애플리케이션, 제품, 프로세스, 시스템 등에 사고 능력(이해, 추론, 학습)이 구현된다는 것이 핵심이다. 이를 바탕으로 각 산업영역은 혁신과 가치 있는 서비스를 제공할 수 있다는 기대효과를 내세운다.
국내에 잘 알려진 C사 또한 100억원 투자유치에 성공하여 보안 인공지능 개발에 사용할 계획이라고 밝혔다.


이처럼 국내 여러 보안업체들이 인공지능 기술에 관심을 가지고 연구하여 기술을 발전시켜 나아가고 있다. 보안업체 뿐만 아니라 정부에서도 관심을 나타내고 있다.
지난 3월, 산업부는 AI 산업 확산을 위해 추진단에 산업기술진흥 및 사업화 촉진기금 등에서 연간 200억원을 지원하고 지원분야도 보안서비스, 스마트공장 등 여타 응용분야까지 확대하겠다고 밝혔다. 미래창조과학부는 2016년 대통령 업무보고에서도 지능정보기술연구소 설립을 비롯해 플래그십 프로젝트 등 연구에 300억원 예산을 사용하겠다는 내용을 보고한 바 있다. 특히, 미래부는 지능정보기술 발전에 적극적으로 나서고 있다.

 


5. 인공지능에 대한 오해와 과제

 

지난 3월, 이세돌과 알파고의 대결 이후 대중들에게 인공지능 기술이  먼 미래가 아닌 가깝게 와 닿은 계기가 된 것이 사실이다. 인공지능과 관련된 자료를 찾고 여러 세미나와 강좌가 열리고 많은 기업과 공공기관들이 인공지능을 어떻게 도입하고 활용할 지 논의가 이루어 지고 있다. 그러나 급작스럽게 관심이 집중 된 인공지능과 머신 러닝에 대해서는 얼마나 잘 설명되고 이해되고 있는지는 짚어볼 필요가 있다. 전용준 리비젼 컨설팅 대표는 인공지능에 대한 오해를 크게 세가지로 분류 하였다.


첫째, “딥 러닝이 바로 인공지능이다.”, 알파고에 적용된 딥 러닝이 바로 인공지능이라는 단순한 등식이 생겨났다. 딥 러닝은 ‘인공신경망(Artificial Neural Networks)’이라는 모델링 방식 일종으로 인공지능의 전체가 아니다.


둘째, “머신 러닝’은 사람과 같은 방식으로 이루어진다.”, 인공지능이라는 이름을 붙이면서 은연중에 프로그램을 의인화 시키려는 경우가 많다. 우리가 기계라고 부르는 프로그램은 데이터가 많으면 똑똑해 보이는 결과를 보인다. 규칙을 사용하는 방식에서는 규칙이 많으면 역시 더 좋은 결과를 제공한다. 프로그램이 조합해 사용할 수 있는 데이터나 규칙을 추가해주는 것이 바로 기계 입장에서의 학습이다.


셋째, “강한 인공지능이 일자리를 빼앗아간다.”, 강한 인공지능이 아니라도 자동화된 프로그램에 의한 계산은 충분히 사람 이상으로 지능적일 수 있다. 그리고 이미 우리 생활에서 그런 부분들은 얼마든 접할 수 있다. 이 같은 측면에서 본다면, 어쩌면 특이점은 이미 지난 것인지도 모른다. 단, 모든 영역에서 인간의 지능을 추월했다고 할 수 없고, 또 사람과 같은 방식이나 의미에서 지능을 추월했다고도 할 수 없어 보인다.


우리나라 인공지능 기술·산업의 소관 부처인 미래창조과학부와 산업통상자원부가 따로 지원 대책을 쏟아 내고 있다. 미래부에서 "지능정보기술을 미래 산업으로 지목하고 민간 주도 연구소 설립 등 다양한 산업육성 정책을 추진하고 있다"며 "산업부의 간담회와 추진단에 대해서는 우리와 교감이 없었다"고 밝혔으며, 산업부에서도 "인공지능에 대한 전 국민적 관심이 증가하고 있는 가운데 인공지능 기술 발전 현황을 점검하고 산업화를 촉진하기 위한 정책방향 논의를 진행했다."라며 "미래부와 사전 교감은 없었지만 미래부가 기초기술 쪽에 집중한다면 산업부는 더욱더 사업자들과 연관이 있는 분야에 대한 정책을 마련하기 위한 것"이라고 전했다. 하지만 미래부가 출범시킨 전담팀 역시 기술개발보다는 산업적 측면에서 사업자들의 목소리를 더 듣기 위한 팀이라는 점에서 미래부와 산업부가 비슷한 행보를 보이고 있다.


이렇게 중구난방식 대책보다는 하나로 통합된 컨트롤 타워를 세워 체계적인 대책 수립과 인공지능 기술이 어떤 기술인지 제대로 된 세미나나 교육 등이 필요하며 정보보안 분야에서는 인공지능과 관련된 많은 연구를 통하여 현재 기술보다 한 단계 발전된 기술로 신·변종 악성코드 분석 및 위험성 판단 등 정보보안 분야에 적용되어 보안 관리체계 유지에 투자하는 지금의 시간과 노력, 자원을 좀 더 효율적으로 운영될 수 있기를 기대해 본다.
 

 

6. 참고 자료


[1]  지능정보기술연구원, www.airi.kr
[2]  소프트웨어정책연구소, 인공지능 기술과 정보보안
[3] ITL 사이버보안 연구보고서, 머신 러닝과 정보보안
[4] 미래창조과학부 – 2015 기술영향평가 (인공지능 기술)
[5] 인공지능기술 보안분야 활용, 디지털데일리
[6] 알파고, 사이버보안에 새로운 기회 제공, 보안뉴스
[7] Assisted Discovery of Vulnerabilities using Machine Learning
[8] Vulnerability Extrapolation: Assisted Discovery of Vulnerabilities using Machine Learning
[9] 컴퓨터월드, [전문가 기고] 머신러닝과 인공지능에 대한 치명적 오해
[10] AI 정책 미래부-산업부 주도권 경쟁 관련기사, www.fnnews.com