import ollama# 한국어 성능 비교 테스트korean_prompts = [ "한국의 사계절 특징을 각각 한 문장으로 설명해주세요.", "'가는 말이 고우면 오는 말이 곱다'라는 속담의 의미를 설명해주세요.", "조선시대 과거 시험 제도에 대해 간략히 설명해주세요.",]models_to_test = ["llama3.1:8b", "qwen2.5:7b", "gemma2:9b"]for prompt in korean_prompts: print(f"\n질문: {prompt}") print("=" * 60) for model_name in models_to_test: try: response = ollama.chat( model=model_name, messages=[{"role": "user", "content": f"한국어로 답해주세요. {prompt}"}], ) answer = response["message"]["content"][:150] print(f" [{model_name}] {answer}...") except Exception: print(f" [{model_name}] 모델 미설치")
오픈소스 LLM 트렌드 정리
트렌드
설명
소형 모델 강세
Phi-3, Gemma 2 등 3~9B 모델이 13B급 성능 달성
MoE 확산
DeepSeek, Mixtral 등 효율적인 MoE 모델 증가
코딩 특화
DeepSeek-Coder, CodeLlama 등 코딩 전문 모델
다국어 강화
Qwen, EXAONE 등 비영어권 언어 성능 향상
라이선스 완화
Apache 2.0, MIT 등 상업 사용 가능 라이선스 확대
오늘의 연습문제
Qwen 2.5 7B를 Ollama로 설치하고, 한국어 코딩 질문 3개를 보내보세요. Llama 3.1 8B와 비교하여 어떤 모델이 더 나은지 평가하세요.
SOLAR 모델의 DUS(Depth Up-Scaling) 기법이 무엇인지 조사하고, 일반적인 모델 확장 방법과 비교해보세요.
본인의 프로젝트에 가장 적합한 오픈소스 모델을 선택하고 그 이유를 정리해보세요. (태스크, 예산, 하드웨어, 언어 요구사항 고려)