Technological Deep Dive

How to Get into the Tech

Data Science Basic/Machine Learning

[ML] #1 Introduction to Machine Learning

mju-bilab 2024. 11. 18. 00:15

인공지능과 머신러닝

인공지능에 관심이 있다면, 머신러닝(Machine Learning), 딥러닝(Deep Learning), 생성형 AI(Generative AI), 초거대 AI 등 다양한 키워드를 많이 들어봤을 것입니다. 본 글에서는 인공지능과 머신러닝에 대한 소개와 기본적인 개념 그리고 머신러닝 기법의 분류 체계를 이야기하고자 합니다. 

인공지능(Artificial Intelligence; AI) 정의

인간의 지적능력을 컴퓨터로 구현하는 과학기술로서, ① 상황을 인지하고, ② 이성적·논리적으로 판단 및 행동하며, ③ 감성적·창의적인 기능을 수행하는 능력까지 포함(인공지능 국가전략, 2019)

 

인공지능의 등장 이후 시간의 흐름에 따라 전문가 시스템(Experts System)머신러닝(Machine Learning)으로 분류되었으며, 최근 딥러닝(Deep Learning)생성형 AI(Generative AI)가 머신러닝의 하위 집합으로 등장하는 기술적 진보를 이루어 냈습니다. 

인공지능과 머신러닝, 딥러닝, 그리고 생성형 AI의 관계(source: TTA, 2023)
AI ⊃ ML ⊃ RL ⊃ DL (source: suanlab)

  • 전문가 시스템: 기계에게 전문가가 직접 판단기준을 입력하여 지성을 부여하는 접근법으로 전문가의 판단과정과 유사하게 동작
    • 보통 규칙을 기반(rule-based)으로 의사결정을 생성
      • 전문가가 판단을 내리는 기준을 규칙으로 만들고(If-then format) 인공지능은 설정된 규칙에 따라 주어진 사실에 대해 추론하고 의사결정을 내림
      • 이를 인공지능의 두 번째 부흥기를 이끈 대표적인 기호주의 모형(symbolic AI)이라고 함 
    • 추론구조가 직관적이고 어떻게 그러한 결론에 도달하였는지 확인하기가 편하다는 장점이 있으나, 규칙의 변경사항과 새로운 규칙에 대해 지속적인 유지보수가 필요
  • 기계학습: 데이터를 활용하여 기계가 스스로 판단기준을 만들어 지성을 구축하는 방식으로 인공지능을 구현하며 변화되는 데이터에 적응할 수 있다는 장점이 있음
    • 기계가 데이터를 통하여 판단기준을 학습하고 의사결정을 생성
      • 기계학습 알고리즘은 데이터를 통해서 판단기준 및 추론구조를 스스로 만들도록 설계되며, 데이터를 생성하는 시스템이 변경된 경우 추가 학습을 통해 판단기준을 업데이트 할 수 있음
      • 퍼셉트론(perceptron)은 딥러닝의 기초모형으로써 대표적인 연결주의 모형(connectionoism AI)이라고 함
      • 퍼셉트론의 핵심은 올바른 입력값을 받았을 때만 출력신호를 내보내도록 입력요소별 가중치를 조정하는 것이며, 데이터를 통해 최적 가중치를 찾게 됨(학습)
    • 인공신경망은 다수의 퍼셉트론을 연결하여 만든 네트워크로, 사람의 신경망이 신경세포들로 이루어진 것과 유사

머신러닝 기법과 분류

머신러닝은 학습 데이터의 특성과 목적에 따라 크게 지도학습(supervised learning), 비지도학습(unsupervised learning), 강화학습(reinforcement learning)으로 구분

머신러닝 학습 유형(source: 4차산업혁명과 정보통신의 이해)

  • 지도학습: 학습을 위한 입력데이터(input)와 각 데이터에 대응되는 정답(label)을 주고 학습을 시켜 새로운 입력데이터를 주었을 때 올바른 답을 내도록 설계 
    • 회귀모형: 출력값이 수치형(numeric), 선형회귀모형, 다항회귀, 비모수회귀 등
    • 분류모형: 출력값이 범주형(categorical), 의사결정나무, 로지스틱회귀, 인공신경망, 서포트 벡터 머신 등

  • 비지도학습: 입력데이터만은 가지고 입력데이터의 특성에 따라 데이터를 유사한 그룹으로 구분하여 묶을 수 있도록 설계, 도출된 그룹의 특성을 파악하여 유용한 정보를 추출
    • 군집화모형: 어떤 대상들을 구분하여 그룹을 만들어나가는 것으로, K-means 클러스터링, Gaussian mixture model 등
    • 연관모형: 서로 연관된 특징을 찾아내는 것으로, 주로 추천과 관련된 부분에 연관규칙(association rule)이 사용
    • 변환모형: 데이터를 새롭게 표현하여 사람이나 다른 기계가 원래 데이터보다 쉽게 해석할 수 있도록 만드는 것으로, 주성분분석, 오토인코더 등
  • 강화학습: 데이터가 처음부터 주어지지 않고 기계의 행동에 따라 데이터와 보상을 획득하며 이를 기반으로 더 나은 보상을 얻기 위해 적절한 행동을 학습하도록 설계
    • 에이전트(agent)가 어떠한 환경(simulation) 안에서 현재 상태(state)를 관찰함으로써 데이터를 얻고, 이에 따라 행동(action)을 선택하면 환경의 상태가 변화(state transition)하며 에이전트에게 보상(reward)을수여하는 방식으로 문제를 설정
    • 에이전트는 환경으로부터 받을 수 있는 보상을 최대화하기 위해 적절한 행동을 학습(reinforcement) 

머신러닝 기법의 구분(source: European Commision)
머신러닝 기법의 구분과 활용 영역(source: https://www.wordstream.com/blog/ws/2017/07/28/machine-learning-applications)

'Data Science Basic > Machine Learning' 카테고리의 다른 글

[ML] #2 회귀분석: Linear Regression  (1) 2024.11.19