LLM 25일 완성
python · 25일 코스 · 입문부터 시작
Day 1: AI 핵심 용어 총정리
입문AI, ML, DL의 차이부터 파라미터, 에포크, 손실함수까지 핵심 용어를 한눈에 정리합니다
Day 2: 자연어 처리(NLP) 기초 용어
입문토큰, 코퍼스, 임베딩, 어텐션 등 NLP 핵심 용어를 예제와 함께 정리합니다
Day 3: 토큰화와 임베딩 이해
입문BPE, WordPiece 알고리즘과 Word2Vec 개념을 이해하고 tiktoken으로 실습합니다
Day 4: Transformer 아키텍처 완벽 이해
중급Transformer의 인코더/디코더 구조, Self-Attention, FFN, 정규화를 도식으로 설명합니다
Day 5: Attention 메커니즘 심화
중급Q/K/V, Scaled Dot-Product, Multi-Head Attention, 위치 인코딩을 numpy로 직접 구현합니다
Day 6: LLM이란? 대규모 언어모델의 원리
중급스케일링 법칙, 사전학습, 파라미터 규모별 특징, 창발적 능력까지 LLM의 본질을 파악합니다
Day 7: OpenAI GPT 시리즈
중급OpenAI 최신 모델군 선택 기준과 Responses API 중심 사용법, 비용 확인 방법을 정리합니다
Day 8: Claude 시리즈 (Anthropic)
중급Claude 최신 모델군 선택 기준과 Constitutional AI 개념, Anthropic Messages API 사용법을 살펴봅니다
Day 9: Meta Llama 시리즈
중급Llama 계열의 발전 흐름을 이해하고, 최신 공개 모델을 로컬에서 실행해봅니다
Day 10: 오픈소스 LLM 생태계 총정리
중급Qwen, DeepSeek, Phi, Yi와 한국어 모델 SOLAR, EXAONE까지 오픈소스 LLM을 총정리합니다
Day 11: 멀티모달 모델
고급상용/오픈소스 멀티모달 모델군으로 이미지와 텍스트를 함께 처리하는 방법을 다룹니다
Day 12: Hugging Face 소개와 생태계
입문Hub, Spaces, Transformers, Datasets, PEFT 등 Hugging Face 생태계를 한눈에 살펴봅니다
Day 13: Transformers 라이브러리 시작하기
입문Hugging Face Transformers 설치부터 pipeline()으로 텍스트 분류, 감성분석, 번역, 요약까지 한번에 체험합니다.
Day 14: 텍스트 생성 실전
중급model.generate()의 핵심 파라미터를 이해하고 temperature, top_p, top_k 등 생성 전략을 비교 실습합니다.
Day 15: Tokenizer 심화
중급encode/decode, 특수 토큰, padding/truncation 전략부터 chat_template과 apply_chat_template()까지 깊이 다룹니다.
Day 16: 프롬프트 엔지니어링
중급Zero-shot, Few-shot, Chain-of-Thought 기법과 구조화 출력(JSON), 실전 프롬프트 팁 10가지를 배웁니다.
Day 17: RAG 파이프라인 구축
고급LangChain과 ChromaDB로 문서 로딩부터 검색 증강 생성(RAG)까지 전체 파이프라인을 구축합니다.
Day 18: 파인튜닝 개념과 전략
중급Full Fine-Tuning과 Parameter-Efficient FT의 차이, 파인튜닝 vs 프롬프팅 의사결정 기준을 정리합니다.
Day 19: LoRA와 QLoRA 이해
고급LoRA(Low-Rank Adaptation)의 원리와 rank/alpha 파라미터, QLoRA의 4bit 양자화 결합 방식을 코드로 배웁니다.
Day 20: PEFT 라이브러리 실전
고급PEFT 라이브러리로 LoraConfig 설정, 타겟 모듈 선택, 학습 가능 파라미터 확인, 모델 저장과 로드를 실습합니다.
Day 21: 파인튜닝 데이터셋 준비
중급Alpaca 형식과 ShareGPT 형식의 데이터셋 구조, 데이터 수집/정제/검증 방법, datasets 라이브러리 활용법을 배웁니다.
Day 22: SFT(Supervised Fine-Tuning) 실전
고급trl 라이브러리의 SFTTrainer로 실제 학습을 실행하고, wandb 모니터링과 체크포인트 관리를 다룹니다.
Day 23: 양자화(Quantization) 가이드
고급FP32부터 INT4까지 정밀도 비교, GGUF/AWQ/GPTQ 포맷, bitsandbytes와 llama.cpp 양자화 방법을 다룹니다.
Day 24: 로컬 모델 서빙
중급Ollama, vLLM, Text Generation WebUI, llama.cpp로 LLM을 로컬에서 서빙하고 성능을 비교합니다.
Day 25: 미니 프로젝트 — 나만의 AI 어시스턴트
고급30일간 배운 모든 것을 통합하여 모델 선택부터 파인튜닝, RAG, 서빙, Gradio UI까지 완성합니다.