본 블로그의 내용은 ML 백서(click)를 기반으로 작성되었으며, 그 내용은 지니안 인사이츠 E(Genian Insights E, 이하 인사이츠) 솔루션이 악성코드의 탐지를 위해 사용하는 머신러닝에 대하여 소개합니다. 이와 더불어 딥러닝 등 새로운 기술 및 제품에 대한 이해를 높이는 것을 그 목적으로 합니다. 보다 자세한 사항을 알고 싶으신 분들은 ML 백서를 클릭해주세요.
Ⅰ. Introduction
2016년 3월, 구글의 알파고(AlphaGo)와 이세돌의 대결은 인공지능(AI, Artificial Intelligence, 이하 ‘AI’)에 대한 가능성과 두려움을 심어주었습니다. 그로부터 1년 반 후 구글은 알파고 제로(Zero)를 선보이며, 알파고와의 대국에서 전승을 거두었습니다. 더욱 놀라운 사실은 알파고 제로의 학습방법에 있습니다. 알파고는 기보(棋譜)를 반복적으로 학습하였지만, 알파고 제로는 바둑의 규칙을 기반으로 스스로 학습이 이루어졌기 때문입니다. 더 이상 사람의 지도감독(Supervised) 없이 스스로 강화학습(Reinforcement Learning)을 통해 바둑의 기본 지식을 깨달아 알파고의 실력을 크게 뛰어 넘는 수준에 이르게 되었습니다.
이제 알파고의 확장가능성이 주목을 받고 있습니다. 바둑이 아닌 다양한 분야에서 AI와 머신러닝(ML, Machine Learning, 이하 ‘ML’)이 적용될 수 있다는 가능성을 충분히 보여주었기 때문입니다. 이를 정보보안 분야에 적용한다면 어떨까요?
현재 ML은 정보보안 분야에서도 큰 역할을 수행하고 있습니다. 이미 악성코드 탐지 기술에 활용하여 지능형 지속 위협(APT, Advanced Persistent Threat) 및 랜섬웨어(Ransomware) 등을 탐지하고 차단합니다. 또한 네트워크 및 사용자의 행위를 모니터링하고 이상행위를 감지하여 사전에 보안위협을 예방하고 있습니다.
시만텍(Symantec), IBM왓슨(Watson), 다크트레이스(DARKTRACE) 등 많은 기업들은 이러한 가능성을 바탕으로 이미 AI, ML을 적용한 기술을 선보이거나 대규모 투자를 진행하고 있습니다.
Ⅱ. Machine Learning의 이해
ML을 이해하기 위해서는 먼저 AI와 ML 그리고 딥러닝의 관계를 이해할 필요가 있습니다. 이들의 관계를 쉽게 도식화한 내용은 백서 2페이지(click)에서 확인하실 수 있습니다.
1. 인공지능(AI, Artificial Intelligence)
AI는 오래 전 등장한 개념입니다. 당시에는 인간의 지능과 유사한 특성을 갖는 컴퓨터를 꿈꾸었습니다. 사고력을 지닌 인간처럼 생각하는 General AI를 목표로 하였습니다. 그러나 많은 기술적 어려움에 직면하면서 실현되지 못하였습니다. 현재는 이미지를 분류하거나 얼굴을 인식하는 등의 특정 작업에서 인간 이상으로 처리할 수 있는 수준의 Narrow AI의 범주에 있다고 할 수 있습니다.
2. 머신러닝(ML, Machine Learning): 좁지만 구체화된 AI
ML은 AI를 구현하는 구체적인 접근방식이라고 할 수 있습니다. ML은 알고리즘을 이용하여 데이터를 분석하고, 학습하며 이를 바탕으로 판단이나 예측을 진행합니다. 즉 구체적인 방향이나 지침을 대량의 데이터와 알고리즘을 통해 학습하는 방식입니다.
3. 딥러닝(DL, Deep Learning): 심층학습, 현재까지 가장 뛰어난 ML
딥러닝은 인공신경망(ANN, Artificial Neural Networks)을 기반으로 하는 ML의 한 분야 입니다. 기술적 한계를 극복하고 GPGPU(General-Purpose computing on Graphics Processing Units) 등 하드웨어의 발전 그리고 빅데이터와 함께 비약적인 성장을 이루게 됩니다. 최근 영상처리 및 음성인식 분야에서 딥러닝에 대한 연구가 활발히 진행되고 있습니다.
Ⅲ. Machine Learning의 학습과 정보보안 적용
ML은 학습하는 방식에 따라 ①지도학습(Supervised Learning), ②비지도학습(Unsupervised Learning), ③강화학습(Reinforcement Learning)으로 구분할 수 있습니다. 머신러닝의 학습방법을 자세하게 비교한 표는 백서 3페이지(click)에서 확인하실 수 있습니다.
정보보안 분야에서도 ML의 연구 및 적용이 활발하게 이루어 지고 있습니다. 스팸 필터링(Spam Filtering)은 지도학습이 적용된 가장 대표적인 사례라고 할 수 있습니다. 이외에도 학습방법과 특징에 따라 사용자 행위 분석(UBA, User Behavior Analytics), 이상행위 탐지(Anomaly Detection), 악성코드 탐지(Malware Detection), 인증(행위분석을 통한 개인 식별), 보안관제, 포렌식 등 광범위한 분야에서 연구 및 적용이 진행되고 있습니다.
최근 APT 및 랜섬웨어 등 지능형 위협이 기하급수적으로 증가함에 따라 패턴 기반의 Anti-Virus 제품 군의 탐지 및 대응능력이 한계에 다다르고 있습니다. 이를 해결하기 위해서 필요한 것은 무엇일까요?
이러한 질문에 대한 해답, ‘머신러닝을 이용한 악성코드 탐지의 새로운 변화 ② ML과 새로운 플레이어의 등장’을 다음 편에서 소개 합니다. 많이 기대해주세요!!!
참조 URL
인사이츠E ML 백서
인사이츠E 제품소개서
인사이츠E 브로셔
인사이츠E 데이터시트
인사이츠E XBA 백서
함께 보면 좋은 글
새로운 세상이 온다 ② 머신러닝과 신규 플레이어의 등장