- Published on
Artificial Intelligence 개론
- Authors
- Name
- sulmo
AI -> ML -> Deep Learning -> Generative AI
위와 같은 포함관계를 가지고 있다.
학습 방식
ML (Machine learning) 기계 학습
ML은 기계가 학습할 수 있게 만드는 방법을 이해하고 구축하는 일종의 AI.
기계학습 모델 구축 방식
데이터 수집 및 준비, 적절한 알고리즘 선택, 준비된 데이터를 기반으로 모델 훈련, 테스트 및 반복을 통한 성능 평가
데이터 수집 및 준비 과정
ML 모델의 성능은 훈련에 사용되는 데이터 품질에 비례(GIGO, 가비지인 가비지 아웃: 부적절한 데이터는 부적절한 결과를 가져옴)
훈련 시, 사용하는 데이터 종류
레이블 지정 데이터 : 데이터의 정답을 가지고 있음
레이블 비지정 데이터 일반적인 용도로 미래예측의 정확도를 올리는 레이블 지정 데이터를 사용하는 케이스가 많다. 하지만 자기지도, 준지도 학습에서는 비지정 데이터가 필요
정형 데이터 : 테이블이나 시계열 데이터
비정형 데이터 : 텍스트(기사, 문서 등등), 이미지
ML 훈련 방식
컴파일된 데이터로 ML 알고리즘을 돌린다. 학습 방식은 크게 3가지가 있음.
지도 학습
레이블 지정 데이터를 기반으로 알고리즘을 훈련. 새로운 입력 데이터의 출력을 예측할 수 있는 매핑 함수를 배우는 것이 목표.
비지도 학습
레이블 미지정 데이터로 학습하는 알고리즘. 입력 데이터 내에 내재된 패턴, 구조 또는 관계를 발견하는 것이 목표.
강화 학습(RL)
기계에 성능 점수(지침으로서)와 훈련 데이터의 일부에만 레이블이 지정되는 반지도 학습이 제공됩니다. 피드백은 작업에 대한 보상 또는 페널티의 형태로 제공되며, 기계는 이 피드백을 통해 학습하면서 차츰 의사 결정을 개선합니다.
사용 방식(모델)
추론 : 모델이 학습한 정보를 사용하여 예측을 수행하거나 의사를 결정하는 프로세스
추론에는 두가지 방식이 있다.
일괄 추론
컴퓨터가 이미지나 텍스트와 같은 대량의 데이터를 가져와 한꺼번에 분석하고 일련의 결과를 제공하는 것
실시간 추론
들어오는 새 정보에 대응하여 컴퓨터가 신속하게 결정을 내려야 할 때 사용됩니다. 챗봇이나 자율 주행 자동차와 같이 즉각적인 의사 결정이 중요한 애플리케이션에서 사용.
추론방식이 학습엔 큰 영향이 없다. 보통 두 추론 방식을 다 사용하며, 일부 한가지 추론 방식을 위한 모델 학습을 진행하는 경우도 있긴함.
Deep Learning
인간 두뇌의 연결 방식과 유사한 뉴런 및 시냅스 개념을 사용
신경망
수많은 노드가 연결하여 신경망과 같은 구조를 만든다. 이런 구조에서 노드들은 계층을 구성한다. 입력 계층 하나, 하나 이상의 은닉 계층, 출력 계층 하나로 구성된다.
사례를 신경망에게 보여주면 신경망은 노드 간의 연결을 조정하여 패턴을 식별 이 과정을 통해 학습 완료 후 완전히 새로운 고객 데이터를 살펴보고 고객이 무엇을 구매할지 또는 어떻게 행동할지 예측이 가능해진다.
딥러닝 분야
딥러닝에서 큰 혁신과 변화를 가져온 대표 분야를 간단히 설명
컴퓨터 비전
컴퓨터가 디지털 이미지와 비디오를 해석하고 이해할 수 있게 해주는 인공 지능 분야
자연어 처리(NLP)
컴퓨터와 인간 언어 간의 상호 작용을 다룸. 딥 러닝은 NLP에서 상당한 발전을 이루어 텍스트 분류, 감정 분석, 기계 번역, 언어 생성과 같은 작업을 가능해 짐.
생성형 AI (Generative AI)
딥 러닝을 사용하여 구축된 모델을 재훈련이나 미세 조정 없이 적용. 딥러닝의 일종
ML은 오래전부터 존재, 생성형 AI덕에 최근 투자가 활발히 시작 됨.
FM(Foundation Model)
인터넷 규모의 데이터로 사전 훈련된 모델
라이프사이클
- 레이블 미지정 데이터를 사용합니다. (웹상의 거의 모든 데이터)
- 사전훈련: ML처럼 지도, 비지도, 강화학습같은 패턴 없이 자가 지도 학습(데이터 내부 구조를 활용하여 레이블을 자동으로 생성)을 진행합니다. 이러한 사전 훈련진행 후 추가 데이터로 다시 사전 훈련을 진행하여 지속적으로 이해도 및 일반화 능력을 향상시킵니다.
- 최적화: 프롬프트 엔지니어링, 검색 증강 생성(RAG), 태스크별 데이터 미세 조정과 같은 기술을 통해 최적화
- 평가 : 모델을 미세 조정하든 사전 훈련된 기성품 모델을 사용하든, 그 다음 논리적 단계는 모델을 평가
대표 모델
LLM(대규모 언어 모델) - 텍스트
토큰/임베딩 및 벡터 두가지 작동 방식으로 구현된, 변환기 기반 LLM은 사람과 유사한 텍스트를 이해하고 생성할 수 있는 모델
확산 모델 - 이미지
순수 노이즈 또는 임의의 데이터로 시작하는 딥 러닝 아키텍처 시스템 일관된 출력을 얻을 때까지 이 노이즈에 의미 있는 정보를 점진적으로 추가
노이즈를 추가, 제거 하는 프로세스를 통해 학습
다중 모달 모델 - 여러 데이터
모델 출력 최적화
파운데이션 모델 수명 주기의 핵심은 최적화 단계
프롬프트 엔지니어링
- 모델의 지침 역할
- 고객이 원하는 결과로 모델의 동작을 안내하는 방법을 제공
미세 조정
- 지침 미세 조정은 모델이 특정 지침에 어떻게 대응해야 하는지 보여주는 예제를 사용합니다. 프롬프트 튜닝은 일종의 지침 미세 조정입니다.
- 인간 피드백 기반 강화 학습(RLHF) 은 인간의 피드백 데이터를 제공하며, 결과적으로 인간의 선호도에 더 잘 맞는 모델이 생성됩니다.
검색 증강 생성
도메인 관련 데이터를 컨텍스트로 제공하여 해당 데이터를 기반으로 응답을 생성 - 전문 지식용