이종관

Posts

기술 글, 회고, 그리고 생각들

Test-Time Compute Scaling: 추론 시간 최적화

2026년 2월 1일

훈련이 아닌 추론 시점에서 더 많은 계산 자원을 사용하여 성능을 향상시키는 새로운 패러다임

agent
AI Agent#13
test-time-compute
reasoning
scaling
6 min read

DeepSeek-R1: 오픈소스 추론 모델

2026년 2월 1일

OpenAI o1과 유사한 성능을 달성한 오픈소스 모델. 특히 R1-Zero는 순수 강화학습만으로 추론 능력이 자동 출현

agent
AI Agent#12
deepseek
reasoning
open-source
5 min read

OpenAI o1: 내부 추론 토큰의 혁명

2026년 2월 1일

기존 모델과 달리 사고 과정을 노출하지 않고, 내부적으로 깊은 추론 후 결과만 출력하는 '생각하는' AI

agent
AI Agent#11
openai
reasoning
inference
6 min read

Reflexion: 실패로부터 배우는 에이전트

2026년 2월 1일

실패한 시도를 언어로 분석하고 메모리에 저장하여, 다음 시도에서 같은 실수를 반복하지 않습니다

agent
AI Agent#3
reflexion
self-improvement
reasoning
5 min read

ReAct: 추론과 행동의 결합

2026년 2월 1일

Reasoning + Acting - 생각한 후 도구를 사용하고, 결과를 관찰하는 순환 구조

agent
AI Agent#2
react
tool-use
reasoning
5 min read

Chain of Thought (CoT): 단계별 추론의 시작

2026년 2월 1일

Let's think step by step - LLM에게 생각하는 과정을 보여주는 것만으로 성능이 2배 향상됩니다

agent
AI Agent#1
chain-of-thought
reasoning
prompting
5 min read

Tree of Thought (ToT): 다중 경로 탐색

2026년 1월 28일

하나의 경로만 따라가지 않고, 여러 가능한 경로를 동시에 탐색하여 최적의 해결책을 찾습니다

agent
AI Agent#6
tree-of-thought
reasoning
planning
5 min read