Technological Deep Dive

How to Get into the Tech

2024/11 9

[TA] #2 문장과 문서는 어떻게 숫자로 표현할 수 있을까? - BoW, DTM, TF-iDF

* This content is based on the article written by Ji Ho Park and Gichang Lee* This content is based on the lecture content of Prof. Pilsung Kang요약1. 단어를 표현하는 방법은 크게 국소 표현과 분산 표현으로 나눌 수 있으며, 빈도 기반 표현은 국소 표현에 해당합니다.2. 주제 분류 혹은 문서 검색과 같은 작업에서는 단어의 순서가 중요하지 않습니다. 3. 희소 표현은 많은 저장 공간과 높은 계산 복잡도를 요구합니다. 4. TF-iDF는 단어의 중요도를 고려한 단어 표현 방법으로 문서 검색에서 좋은 성능을 보입니다.  본 포스팅에서는 단어의 집합인 문장과 문서를 숫자로 표현하는 가장 간단한 방법..

The Rise of AI Agents: AI 에이전트가 온다

요약생성형 AI의 등장으로, 필요한 업무를 스스로 찾아내 결과물을 도출하는 'AI 에이전트(AI Agent)' 시대가 도래함AI Agent는 사람의 개입 없이 환경과 상호작용하며 자율적으로 작업을 수행하는 지능형 소프트웨어 시스템에이전트 설계의 핵심 구성 요소는 외부 환경, 센서, 액추에이터 및 성능 측정(선택적)빅테크 기업들은 AI 에이전트 시장을 선점하기 위해 개방형 혹은 폐쇄형 모델을 공개AI Agent란?AI Agent 정의 및 기본 개념사실, AI 에이전트는 완전히 새로운 개념이 아닙니다. 스마트(인공지능) 스피커의 초기 형태는 이미 우리 생활 속에 AI 에이전트의 존재를 보여주었습니다. 아주 간단한 명령을 통해 일상 생활의 편리성을 극대화하겠다는 목표로 출시됐으나, 음성 인식을 포함한 자연어 ..

[Andrew Ng] Neural Networks & Deep Learning | Week 2 (part 1)

*This review content is based on course "Deep Learning Specilazation" provided by prof. Andrew NgNeural Network BasicsBinary classification (이진 분류)이진 분류는 규칙에 따라 집합의 요소를 두 그룹 중 하나로 분류하는 작업Binary classification is defined as the process of assigning an individual to one of two categories based on a series of attributes - source: ScienceDirect.com 특정 사진을 입력하였을 때, 고양이인지 아닌지를 판단하는 프로그램을 만든다고 생각해봅시다. ..

[ML] #2 회귀분석: Linear Regression

회귀분석(Regression Analysis)이란 통계학에서 전통적으로 많이 사용되던 분석 방법으로, 관찰된 여러 데이터를 기반으로 각 변수간의 관계를 모델링하고 이에 대한 적합도를 측정하는 방법입니다. 그 중 선형 회귀(Linear Regression)와 로지스틱 회귀(Logistic Regression)는 비슷한 이름을 가지고 있지만, 사용되는 상황과 목적이 매우 다르다는 것을 본 글을 통해 전달하고자 합니다.  회귀분석에서 사용되는 변수는 다음과 같습니다. 독립 변수(예측/설명 변수): 영향을 미칠 것으로 예상되는 변수종속 변수(기준/반응 변수): 영향을 받을 것으로 예상되는 변수먼저, 다음의 회귀분석 사례(source: https://aws.amazon.com/ko/compare/the-diffe..

[TA] #1 언어 그리고 통계적 의미론(statistical semantics)의 아이디어

*This content is based on the article written by Ji Ho Park and Gichang Lee요약1. 언어의 가장 기본이 되는 단어는 일반적으로 벡터(vector)로 표현되며, 문서는 이러한 단어들의 집합 형태로 나타낼 수 있음2. 컴퓨터가 언어를 이해하기 위해서는 확인하는 가장 기본적인 지표는 단어의 빈도수(word frequency)임3. 분포 의미론(distributional hypothesis): 비슷한 맥락에 등장하는 단어들은 유사한 의미를 지니는 경향이 있음 이를 바탕으로 '빈도(frequency)'를 '의미(semantic meaning)'로 변환할 수 있음을 설명하고자 합니다. 컴퓨터에게 언어는 어떤 의미일까?언어의 사전적 정의는 다음과 같습니다. ..

[ML] #1 Introduction to Machine Learning

인공지능과 머신러닝인공지능에 관심이 있다면, 머신러닝(Machine Learning), 딥러닝(Deep Learning), 생성형 AI(Generative AI), 초거대 AI 등 다양한 키워드를 많이 들어봤을 것입니다. 본 글에서는 인공지능과 머신러닝에 대한 소개와 기본적인 개념 그리고 머신러닝 기법의 분류 체계를 이야기하고자 합니다. 인공지능(Artificial Intelligence; AI) 정의인간의 지적능력을 컴퓨터로 구현하는 과학기술로서, ① 상황을 인지하고, ② 이성적·논리적으로 판단 및 행동하며, ③ 감성적·창의적인 기능을 수행하는 능력까지 포함(인공지능 국가전략, 2019) 인공지능의 등장 이후 시간의 흐름에 따라 전문가 시스템(Experts System)과 머신러닝(Machine Lea..

ATL 1.0: 인공지능 기술 수준 정의

*This review content is based on the paper entitled "ATL 1.0: 인공지능 기술 수준 정의" published by ETRI요약1. 인공지능 기술은 좁은 인공지능(ANI), 일반 인공지능(AGI), 슈퍼 인공지능(ASI)의 세 가지로 구분되며, 각 수준에 따라 성능과 기능의 차이가 존재2. 본 연구에서 제시하는 ATL 1.0은 인공지능 기술 수준을 1단계부터 6단계까지 정의하며, 각 단계별 주요 기술 요소를 제시3. 기술 수준은 단일 분야의 전문가 수준을 넘어 다양한 분야의 지식 통합으로 확장 가능성을 가짐→ 상위 단계로 갈수록 인간의 개입이 줄어들 것으로 추정A 20-year roadmap for AI research 2019년 AAAI(Association..

The AI Revolution

*This review content is based on the report entitled "The AI Revolution" published by COATUE https://www.coatue.com/blog/perspective/ai-the-coming-revolution-2023요약COATUE는 2023년 11월 16일 약 115페이지 분량의 리포트를 발간 → 인공지능(AI)은 인터넷과 모바일에 이어 인류의 삶을 개선할 수 있는 새로운 기술로 부상→ Open-source는 AI 혁명의 핵심적인 역할을 하지만 모든 오픈 소스가 동등하게 개방적이지는 않음→ AI는 기술 스택을 변화시키고 있으며, 다양한 분야에서 AI의 진화와 그에 따른 기회가 발굴되고 있음Where we are in AI toda..