Posts
기술 글, 회고, 그리고 생각들
Chain of Thought (CoT): 단계별 추론의 시작
2026년 2월 1일Let's think step by step - LLM에게 생각하는 과정을 보여주는 것만으로 성능이 2배 향상됩니다
ai
ai-agent
llm
chain-of-thought
4 min readDeepSeek-R1: 오픈소스 추론 모델
2026년 2월 1일OpenAI o1과 유사한 성능을 달성한 오픈소스 모델. 특히 R1-Zero는 순수 강화학습만으로 추론 능력이 자동 출현
ai
ai-agent
llm
deepseek
5 min readOpenAI o1: 내부 추론 토큰의 혁명
2026년 2월 1일기존 모델과 달리 사고 과정을 노출하지 않고, 내부적으로 깊은 추론 후 결과만 출력하는 '생각하는' AI
ai
ai-agent
llm
openai
6 min readReAct: 추론과 행동의 결합
2026년 2월 1일Reasoning + Acting - 생각한 후 도구를 사용하고, 결과를 관찰하는 순환 구조
ai
ai-agent
llm
react
5 min read