이런 것을 배울 수 있어요
LoRA/QLoRA로 제한된 GPU에서 LLM을 효율적으로 Fine-tuning할 수 있습니다
DPO로 모델의 응답 품질과 안전성을 향상시킬 수 있습니다
vLLM으로 초고속 LLM 추론 서버를 구축하고 운영할 수 있습니다
강의 소개
오픈소스 LLM(Llama 3, Mistral, Gemma)을 자신의 도메인 데이터로 Fine-tuning하여 특화 AI 모델을 만듭니다.
LoRA, QLoRA로 GPU 메모리를 최소화하면서 고품질 Fine-tuning을 수행하고, DPO, RLHF로 모델의 성격과 응답 스타일을 원하는 대로 조정합니다.
Hugging Face Hub에 모델을 공개하고, vLLM으로 초고속 추론 서버를 구축하는 전 과정을 다룹니다.
수강 전 알아두세요
- •PyTorch 중급 이상, Transformer 아키텍처 이해
- •GPU 환경 필요 (A100 권장, Colab Pro 사용 가능)
- •Hugging Face Transformers 기초 경험
태그
#Fine-tuning#LoRA#QLoRA#Llama 3#vLLM