카테고리 & 태그
주제별로 글을 찾아보세요. 검색과 태그 필터를 함께 쓸 수 있습니다.
7 results · filtered by "개발"필터 초기화
2026.02.01
Test-Time Compute Scaling: 추론 시간 최적화
훈련이 아닌 추론 시점에서 더 많은 계산을 투입하여 성능을 끌어올리는 패러다임
개발#agent#test-time-compute#reasoning
6 min read →
2026.02.01
DeepSeek-R1: 오픈소스 추론 모델
OpenAI o1과 유사한 성능을 달성한 오픈소스 모델. 특히 R1-Zero는 순수 강화학습만으로 추론 능력이 자동 출현
개발#agent#deepseek#reasoning
7 min read →
2026.02.01
OpenAI o1: 내부 추론 토큰의 혁명
기존 모델과 달리 사고 과정을 노출하지 않고, 내부적으로 깊은 추론 후 결과만 출력하는 '생각하는' AI
개발#agent#openai#reasoning
7 min read →
2026.02.01
Reflexion: 실패로부터 배우는 에이전트
실패를 언어로 분석하고 메모리에 저장하여 같은 실수를 반복하지 않는 자기 개선 기법
개발#agent#reflexion#self-improvement
5 min read →
2026.02.01
ReAct: 추론과 행동의 결합
Reasoning + Acting - 생각한 후 도구를 사용하고, 결과를 관찰하는 순환 구조
개발#agent#react#tool-use
6 min read →
2026.02.01
Chain of Thought (CoT): 단계별 추론의 시작
Let's think step by step - 일부 대형 모델의 복잡한 추론 성능을 크게 높인 프롬프팅 기법
개발#agent#chain-of-thought#reasoning
5 min read →
2026.01.28
Tree of Thought (ToT): 다중 경로 탐색
하나의 경로가 아닌 여러 경로를 동시에 탐색하여 최적의 해결책을 찾는 추론 기법
개발#agent#tree-of-thought#reasoning
5 min read →