*This review content is based on the report entitled "The AI Revolution" published by COATUE https://www.coatue.com/blog/perspective/ai-the-coming-revolution-2023
요약
COATUE는 2023년 11월 16일 약 115페이지 분량의 리포트를 발간
→ 인공지능(AI)은 인터넷과 모바일에 이어 인류의 삶을 개선할 수 있는 새로운 기술로 부상
→ Open-source는 AI 혁명의 핵심적인 역할을 하지만 모든 오픈 소스가 동등하게 개방적이지는 않음
→ AI는 기술 스택을 변화시키고 있으며, 다양한 분야에서 AI의 진화와 그에 따른 기회가 발굴되고 있음
Where we are in AI today
"생성형 AI 기반의 기술 혁신은 접근성, 확산 속도 측면에서 기존 기술들과는 전혀 다른 전개 양상"
- 2022년 11월 30일 출시된 openAI의 ChatGPT는 출시 5일 만에 100만 명의 사용자, 약 두 달 만에 사용자 약 1억 명에 도달하는 전무후무한 기록을 세웠으며, 이는 역사상 가장 빠른 속도로 확산된 애플리케이션으로 기록
- 시장조사업체 IDC는 초거대 AI를 포함한 전 세계 AI 시장 규모가 '24년 5,543억 달러(약 700조 원)에 달할 것으로 내다봤으며, 국내 AI 시장 역시 '24년 3조 662억 원 규모로 예상되며, 2023년부터 연평균 14.9% 성장하여 '27년까지 4조 4,636억 원 규모에 이를 전망
- 다양한 산업에서 AI 채택을 가속화하는 가운데, 생성형 AI를 통한 새로운 비즈니스 기대 수요 등이 AI 시장 성장을 가속화
AI could break through the hype and improve our world
"AI는 다른 하이프사이클과는 다르다"
- COATUE는 다음과 같이 AI 하이프사이클을 3단계로 구분하여 특성을 정리
- ① Value accrual misaligned with investment
- AI 모델 계층에 존재하는 플레이어들에게 AI 전체 투자금액의 60%가 쏠려있으나 현재 명확한 승자가 없음
- 이는 1990년대 인터넷 시장을 선점하기 위해 공격적으로 투자했던 닷컴 버블 사태를 연상시킴
- ② Overestimating timeline & capabilities of technology
- 자율주행자동차의 경우 5단계 자율주행의 도입이 늦어지면서 초기에 높은 기대감에 높은 밸류로 투자한 회사들은 손해를 보고 있음
- 하지만, AI는 트랜스포머 이후 5년 만에 실제로 숙련된 사용자가 AI와 협력할 수 있는 시스템을 구축했음
- ③ Lack of widespread utility due to maturity of technology
- 양자컴퓨팅은 이론상으로 매우 유망한 기술임에도 불구하고, 현실 세계에서 유의미한 실용적 가치를 보이지 못하고 있음
- 그러나 AI는 이미 많은 산업 분야, 업무 영역에서 생산성의 향상을 보이고 있음
- GitHub Copilot을 사용하는 개발자는 작업을 50% 더 빠르게 완료하고, AI는 한 기업의 고객 지원 비용을 최대 95%까지 절감했으며, BCG 연구에서는 AI가 지원하는 지식 업무의 품질이 40% 향상되는 것으로 나타남
We believe open-source is the lifeblood of AI
"기술의 공개(오픈소스) vs. 개발의 규제(폐쇄형)"
- 빅테크 진영 중 선발 주자인 오픈AI와 구글은 폐쇄 전략을 취하고 있는 반면 후발 주자로 나선 메타는 오픈소스 모델을 들고 나왔음
- 오픈AI는 MS와 협력을 강화하며 연구 중심에서 상업화로 운영 방식을 전환
- 규제의 필요성: "AI 모델은 현재도 매우 강력하며 점점 더 강해지고 있다. 어느 시점에는 마음만 먹으면 이를 이용해 엄청난 피해를 입히는 것이 아주 쉬워질 것" - 일리야 수츠케버(오픈AI의 공동 창립자)
- 구글은 언어모델 팜(PaLM)을 비용 지불 등 협의가 있을 때만 제한적으로 정보를 공개하고 있는데 이전에 트랜스포머 모델을 완전 오픈소스로 내놓으며 AI 생태계 발전을 뒷받침하던 과거와 정반대되는 행보
- 신뢰성 확보: "LLM은 한계가 있고 라마와 같은 AI 개발에 대한 오픈소스 접근 방식은 기술에 대한 신뢰뿐만 아니라 혁신 생태계를 육성하기 위해 필요하다" - 얀 르쿤(메타의 AI 과학자)
AI가 오픈소스로 보급됨으로써 악용되는 것도 우려되나, 오늘날 AI의 발전은 오픈소스에서 이루어지고 있다
오픈소스 기술은 독점 시스템을 따라잡거나 능가하여 혁신과 발전의 순환을 만들 수 있는 잠재력을 가지고 있으며 아마존, 엔비디아를 포함한 많은 빅테크 기업들이 오픈소스에 대한 강력한 지지를 보여주고 있다
- 클레멘트 딜랑크(허깅페이스 CEO)
- 많은 빅테크 기업들은 점차 폐쇄형 전략으로 선택: 오픈소스는 향후 비즈니스 모델이 불명확하며, SOTA 수준을 위해선 막대한 비용을 투자해야 하고, 중단기적 실적이 중요한 기업들은 수익화가 가능한 폐쇄형으로 움직일 것으로 예상
AI is transforming the tech ecosystem
- AI 밸류체인은 크게 1) 하드웨어, 2) 클라우드 플랫폼, 3) AI 모델, 4) AI 개발자 도구, 5) AI 응용프로그램으로 구성
AI Models
- 지난 50년간 기업들은 CPU와 소프트웨어를 통해 더 빠르게 계산하는 컴퓨터를 개발해왔음
- 그러나 향후 50년은 GPU와 AI 모델을 통해 인간 지능을 뛰어넘는 초지능을 가진 두뇌를 개발하는 것에 초점
- 모델의 성능은 크게 두 가지로 결정: 1) 파라미터(Parameter) 수와 2) 데이터
- 파라미터 수는 연산 비용과 연동되어 있으므로 파라미터 수를 늘리는 방식은 당분간은 대기업의 영역
- 데이터는?
- 데이터는 크게 4가지로 나눌 수 있는데, 1) publicly available data, 2) proprietary data, 3) synthetic data, 4) user feedback data 이 또한 대기업이 우위에 있을 수 밖에 없음
- 대기업은 proprietary data를 독점적으로 구매할 수 있는 자본력이 있고,
- synthetic data를 연구하고 최적의 방법으로 반영할 수 있는 capability가 있으며,
- user feedback data를 효율적으로 대량 취합할 수 있는 플랫폼이 있음
- 모델을 개선하는 방법에는 모델 평가, 엣지 AI, 멀티 모달, 신규 아키텍처 등 다양한 방법이 존재하지만 이 또한 대기업의 영역일 것으로 예상
Cloud, Data center, and Semiconductors
- 오늘날 AI는 모델 사이즈에 따라 보다 극한적으로 연산을 요구하고 있기에, GPU에 대한 수요가 급증하고 있으며 이는 곧 더 비싼 서버를 의미
- 사용자가 많아질 경우, 회사는 AI 모델에 대한 비용 효율화, 안정적인 모델 인스턴스 scale-up, 성능 문제(latency issue) 등을 해결해줄 수 있는 인퍼런스 서빙 서비스가 필요
- 현재는 GPU 효율/비용 문제를 해결하기 위해 많은 자본이 하드웨어 개발쪽으로 편향
- AI 모델의 "워크로드를 적합하게 분산"하여 GPU 자원을 더 효율적으로 사용하게 해주는 소프트웨어 쪽으로도 기회가 있을 것으로 예상
- 배터리 가격이 떨어져 전기차를 현실화 하고, DNA sequencing 비용이 내려와 헬스케어를 혁신한 것처럼 학습/추론 비용은 소프트웨어 혁신을 통해 계속 떨어질 것이며, 이러한 저비용화는 인공지능을 보다 상용화하는데 성공하여 사용량을 늘릴 것으로 예상
Developer Tools
- ML Ops가 ML 모델을 생성하는데 초점을 맞추었다면, LLM Ops는 생성형 AI를 운영하는 것에 초점
- LLM Ops가 LLM의 전체 운영 과정을 관리한다면, Vector DB는 LLM이 생성한 벡터 데이터를 효율적으로 저장하고 검색하는 역할
- Vector DB는 대량의 벡터 데이터에서 빠르게 유사한 항목을 찾을 수 있기 때문에 효율적인 검색 기능을 가능하게 하며 이미지 검색, 추천 시스템 등에 활용되고 있음
Applications
- 향후 하드웨어, 인프라가 안정적으로 구축되고 나면 model layer가 아닌 application 영역에서 더 많은 기회가 발생할 것으로 예상
- Uber와 Airbnb가 그랬듯이 우리가 상상하지 못하는 "behavioral shift"을 발생시키는 서비스가 가장 성공적인 애플리케이션으로 자리잡게 될 것
COATUE view: the best of AI is yet to come
Data center → Everywhere
- On-device AI는 latency issue를 해결해줄 수 있는 가장 근본적인 접근
- 스마트폰을 포함하여 다양한 디바이스에 자체 LLM 모델을 탑재하게 될 것
Public data → Private data
- 모두가 접근가능하고, 활용할 수 있는 데이터를 학습하여 만들어진 AI가 아닌 Proprietary data를 점유한 기업들의 특화된 모델이 새로운 유즈케이스로 등장하게 될 것
Unimodality → Multimodality
- 단일 모달리티의 데이터만을 사용하는 접근법은 복잡한 실제 세계의 문제를 해결하는 데 한계가 있기 때문에, 여러 형태의 데이터나 입력 방식을 동시에 처리하고 통합하는 멀티 모달리티 접근은 다음과 같은 장점을 가짐:
- 더 풍부한 정보 처리
- 인간의 인지 방식 모방
- 더 자연스러운 상호작용
- 멀티 모달리티는 AI 시스템의 능력을 크게 확장시키고 있으며, 자율주행, 의료 진단, 가상/증강 현실 등 다양한 영역에서 더욱 발전할 것으로 예상됨
'Business Insights > Industry·Market·Technology' 카테고리의 다른 글
온디바이스 AI (4) | 2024.12.02 |
---|---|
The Rise of AI Agents: AI 에이전트가 온다 (4) | 2024.11.25 |
ATL 1.0: 인공지능 기술 수준 정의 (3) | 2024.11.17 |