재귀 — 문제를 자기 자신으로 푼다

재귀는 자기 자신을 거울로 삼아 문제를 푸는 기법이다. 반복문이 “어떻게” 처리할지를 명시한다면, 재귀는 “무엇이” 해결책인지를 정의한다.

이 포스트에서 다루는 내용

재귀의 구조: Base Case와 Recursive Case
수학적 귀납법으로 재귀 알고리즘의 올바름을 증명하는 방법
팩토리얼, 피보나치, 하노이의 탑 — 재귀적 사고 훈련
단순 재귀의 지수적 폭발과 메모이제이션
재귀 트리와 마스터 정리로 복잡도 분석

재귀란 무엇인가

재귀(Recursion) 란 함수가 자기 자신을 호출하여 문제를 해결하는 기법이다. 핵심 아이디어는 큰 문제를 더 작은 동일한 구조의 하위 문제로 분해하는 것이다.

올바른 재귀 함수는 반드시 두 부분을 포함해야 한다.

구성 요소	설명
Base Case (기저 사례)	더 이상 재귀 호출 없이 직접 답을 반환하는 경우
Recursive Case (재귀 사례)	문제를 더 작은 하위 문제로 분해하고 재귀 호출

Base Case 없는 재귀는 무한히 자기 자신을 호출하다 스택 오버플로(Stack Overflow) 로 종료된다. Recursive Case가 문제를 실제로 더 작게 만들지 않아도 같은 결과가 발생한다.

재귀가 올바르게 종료하는 조건

Base Case가 반드시 존재해야 한다.
모든 Recursive Case에서 하위 문제의 크기가 엄격하게 감소해야 한다.
유한 번의 감소 후 반드시 Base Case에 도달해야 한다.

팩토리얼

$n! = n \times (n-1) \times (n-2) \times \cdots \times 1, \quad 0! = 1$

이를 재귀적으로 정의하면:

$n! = \begin{cases} 1 & n = 0 \\ n \times (n-1)! & n \ge 1 \end{cases}$

def factorial(n: int) -> int:
    # Base Case
    if n == 0:
        return 1
    # Recursive Case
    return n * factorial(n - 1)

실행 흐름 (factorial(4)):

factorial(4)
  = 4 * factorial(3)
        = 3 * factorial(2)
              = 2 * factorial(1)
                    = 1 * factorial(0)
                                = 1       ← Base Case
                    = 1 * 1 = 1
              = 2 * 1 = 2
        = 3 * 2 = 6
  = 4 * 6 = 24

복잡도 분석:

점화식: $T(n) = T(n-1) + O(1)$

이를 전개하면:

$T(n) = T(n-1) + c = T(n-2) + 2c = \cdots = T(0) + nc = O(n)$

시간 복잡도: $O(n)$ , 공간 복잡도: $O(n)$ (콜 스택 깊이)

수학적 귀납법으로 재귀 증명하기

재귀 알고리즘의 구조는 수학적 귀납법의 구조와 완벽히 대응한다. 이 대응을 이해하면, 재귀 알고리즘의 올바름을 엄밀히 증명할 수 있다.

수학적 귀납법	재귀 알고리즘
기저 사례 (Base Case)	Base Case: 직접 답을 반환
귀납 가정 (Inductive Hypothesis)	“하위 재귀 호출이 올바르다”는 가정
귀납 단계 (Inductive Step)	Recursive Case: 하위 결과를 조합해 현재 답 생성

재귀 알고리즘의 올바름을 증명하는 핵심 통찰은 이것이다.

귀납 가정을 신뢰하라. factorial(n-1)이 올바른 결과를 반환한다고 가정한다. 그 위에서 현재 단계가 올바른지를 보이면 된다.

예제: factorial(n)의 올바름 증명

명제 $P(n)$ : factorial(n)은 $n!$ 을 올바르게 반환한다. ( $n \ge 0$ )

Base Case ( $P(0)$ ): factorial(0)은 1을 반환한다. $0! = 1$ 이므로 성립.

Inductive Step: $P(k)$ 가 참, 즉 factorial(k) $= k!$ 이라고 가정한다. ( $k \ge 0$ )

factorial(k+1)을 실행하면 $(k+1) \ge 1$ 이므로 Recursive Case가 수행된다.

factorial(k+1)
  = (k+1) * factorial(k)     ← 코드의 return n * factorial(n-1)
  = (k+1) * k!               ← 귀납 가정: factorial(k) = k!
  = (k+1)!                   ← 팩토리얼 정의

따라서 $P(k+1)$ 이 참이다. 강한 귀납법에 의해 모든 $n \ge 0$ 에 대해 $P(n)$ 이 성립한다. $\square$

예제: binary_search의 올바름 증명 (강한 귀납법)

이진 탐색을 귀납법으로 증명할 때는 강한 귀납법을 사용한다. 탐색 범위의 크기 $m = \text{right} - \text{left} + 1$ 에 대한 귀납법이다.

명제 $P(m)$ : 크기 $m$ 의 정렬된 부분 배열에서 이진 탐색은 올바르게 동작한다.

Base Case ( $m = 0$ ): left > right이면 루프 진입 없이 -1 반환. target이 없으므로 올바르다.

Inductive Step: 크기 $< m$ 인 모든 배열에서 올바르다고 가정한다. 크기 $m$ 인 배열에서:

arr[mid] == target → 올바르게 반환.
arr[mid] < target → 오른쪽 절반(크기 $\lfloor m/2 \rfloor < m$ )에서 탐색. 귀납 가정에 의해 올바르다.
arr[mid] > target → 왼쪽 절반(크기 $\lfloor (m-1)/2 \rfloor < m$ )에서 탐색. 귀납 가정에 의해 올바르다.

모든 경우에 올바르므로 $P(m)$ 이 성립한다. $\square$

피보나치와 지수적 폭발

$F(n) = \begin{cases} 0 & n = 0 \\ 1 & n = 1 \\ F(n-1) + F(n-2) & n \ge 2 \end{cases}$

def fib_naive(n: int) -> int:
    if n <= 1:
        return n
    return fib_naive(n - 1) + fib_naive(n - 2)

직관적으로 깔끔해 보이지만, 이 구현은 심각한 문제를 갖는다. fib(5)를 계산해 보자.

fib(5)
  fib(4)
    fib(3)
      fib(2)
        fib(1) = 1
        fib(0) = 0
      fib(1) = 1
    fib(2)         ← fib(2) 중복 계산!
      fib(1) = 1
      fib(0) = 0
  fib(3)           ← fib(3) 중복 계산!
    fib(2)
      fib(1) = 1
      fib(0) = 0
    fib(1) = 1

fib(5) 재귀 호출 트리 — fib(3) 2회, fib(2) 3회 중복 계산 발생

fib(n)을 계산하는 데 필요한 호출 횟수를 $T(n)$ 이라 하면:

$T(n) = T(n-1) + T(n-2) + O(1)$

$T(n)$ 은 피보나치 수열 자체와 같은 성장률을 가지며, $T(n) = O(\phi^n)$ ( $\phi \approx 1.618$ , 황금비)이다. 이는 $O(2^n)$ 과 같은 지수적 성장이다.

$n = 50$ 일 때: $2^{50} \approx 10^{15}$ 번 호출 → 컴퓨터 수십 년 소요.

해결책: 메모이제이션

이미 계산한 결과를 저장해 두고 재사용한다.

def fib_memo(n: int, memo: dict = None) -> int:
    if memo is None:
        memo = {}
    if n in memo:
        return memo[n]        # 캐시 히트
    if n <= 1:
        return n
    memo[n] = fib_memo(n - 1, memo) + fib_memo(n - 2, memo)
    return memo[n]

각 $F(k)$ 를 정확히 1번만 계산한다. 시간 복잡도: $O(n)$ , 공간 복잡도: $O(n)$ .

# Python 표준 라이브러리 활용
from functools import lru_cache

@lru_cache(maxsize=None)
def fib(n: int) -> int:
    if n <= 1:
        return n
    return fib(n - 1) + fib(n - 2)

하노이의 탑

세 개의 기둥(A, B, C)과 크기가 모두 다른 $n$ 개의 원판이 있다. 처음에 모든 원판이 A 기둥에 크기 순으로 쌓여 있다.

규칙:

한 번에 원판 하나만 이동할 수 있다.
큰 원판을 작은 원판 위에 올릴 수 없다.

A에서 C로 모든 원판을 옮기는 알고리즘은 다음과 같다.

$\text{hanoi}(n, A \to C) = \text{hanoi}(n-1, A \to B) + \text{move}(A \to C) + \text{hanoi}(n-1, B \to C)$

def hanoi(n: int, source: str, target: str, aux: str) -> None:
    """
    n개의 원판을 source에서 target으로 aux를 이용해 옮긴다.
    """
    if n == 1:
        print(f"원판 1: {source} → {target}")
        return
    # 1단계: 위의 n-1개를 보조 기둥으로 이동
    hanoi(n - 1, source, aux, target)
    # 2단계: 가장 큰 원판을 목적지로 이동
    print(f"원판 {n}: {source} → {target}")
    # 3단계: n-1개를 보조 기둥에서 목적지로 이동
    hanoi(n - 1, aux, target, source)

# 실행
hanoi(3, 'A', 'C', 'B')

점화식:

$T(n) = 2T(n-1) + 1, \quad T(1) = 1$

전개하면:

$T(n) = 2T(n-1) + 1 = 2(2T(n-2) + 1) + 1 = 4T(n-2) + 3 = \cdots = 2^{n-1}T(1) + (2^{n-1} - 1) = 2^n - 1$

$T(n) = \Theta(2^n)$

$n = 64$ 일 때 필요한 이동 횟수: $2^{64} - 1 \approx 1.8 \times 10^{19}$ 회. 초당 1회 이동한다면 약 5800억 년이 걸린다.

재귀 트리 분석

재귀 호출의 구조를 트리로 시각화하면 총 수행 시간을 직관적으로 분석할 수 있다.

병합 정렬(Merge Sort)의 점화식: $T(n) = 2T(n/2) + O(n)$

병합 정렬 재귀 트리 — 각 레벨 비용 cn, 총 O(n log n)

트리의 깊이: $\log_2 n$
각 레벨의 총 작업량: $n$
전체 작업량: $n \times \log_2 n = O(n \log n)$

마스터 정리

$a \ge 1$ , $b > 1$ 인 상수에 대해 점화식이 다음 형태이면:

$T(n) = aT\!\left(\frac{n}{b}\right) + f(n)$

마스터 정리(Master Theorem)로 $T(n)$ 의 점근적 해를 구할 수 있다.

직관적 이해: $n^{\log_b a}$ 는 재귀 트리에서 리프 노드의 총 비용이고, $f(n)$ 은 각 레벨의 분할/병합 비용이다. 둘 중 어느 쪽이 지배적인가에 따라 해가 결정된다.

Case 1: 리프 비용이 지배

$f(n) = O(n^{\log_b a - \varepsilon}), \quad \varepsilon > 0 \implies T(n) = \Theta(n^{\log_b a})$

Case 2: 균형 (동등)

$f(n) = \Theta(n^{\log_b a}) \implies T(n) = \Theta(n^{\log_b a} \cdot \log n)$

Case 3: 분할/병합 비용이 지배

$f(n) = \Omega(n^{\log_b a + \varepsilon}), \quad \varepsilon > 0,\; af(n/b) \le cf(n) \implies T(n) = \Theta(f(n))$

마스터 정리 적용 예시

점화식	$a$	$b$	$n^{\log_b a}$	$f(n)$	케이스	결과
$T(n) = 2T(n/2) + n$	2	2	$n^1 = n$	$n$	Case 2	$\Theta(n \log n)$
$T(n) = 4T(n/2) + n$	4	2	$n^2$	$n$	Case 1	$\Theta(n^2)$
$T(n) = T(n/2) + n$	1	2	$n^0 = 1$	$n$	Case 3	$\Theta(n)$
$T(n) = 9T(n/3) + n^2$	9	3	$n^2$	$n^2$	Case 2	$\Theta(n^2 \log n)$
$T(n) = 2T(n/2) + n^2$	2	2	$n$	$n^2$	Case 3	$\Theta(n^2)$

병합 정렬 검증: $a=2$ , $b=2$ → $n^{\log_2 2} = n^1 = n = f(n)$ → Case 2 → $T(n) = \Theta(n \log n)$ O

재귀 vs 반복

재귀와 반복문은 표현력이 동등하다. 모든 재귀는 반복문으로 변환할 수 있고, 그 역도 성립한다.

비교 항목	재귀	반복
코드 간결성	문제 구조가 재귀적이면 훨씬 간결	상태 관리를 직접 해야 함
가독성	수학적 정의와 1:1 대응	명시적 루프 제어
공간 복잡도	콜 스택 $O(d)$ ( $d$ : 재귀 깊이)	일반적으로 $O(1)$
적합한 문제	트리, 그래프, 분할 정복	단순 반복, 배열 순회
주의사항	스택 오버플로 위험	—

재귀가 빛나는 문제는 문제 자체가 재귀적 구조를 가질 때다. 트리 순회, 분할 정복, 동적 프로그래밍의 원형은 재귀로 표현하는 것이 가장 자연스럽다.

핵심 정리

재귀는 반드시 Base Case와 크기가 감소하는 Recursive Case를 가져야 올바르게 종료한다.
재귀 알고리즘의 올바름은 수학적 귀납법으로 증명한다. Base Case = 기저 사례, Recursive Case = 귀납 단계, 귀납 가정 = "하위 호출이 올바르다"는 신뢰다.
단순 재귀 피보나치는 $O(2^n)$이다. 메모이제이션으로 중복 계산을 제거하면 $O(n)$이 된다.
하노이의 탑은 $T(n) = 2T(n-1) + 1 = 2^n - 1 = \Theta(2^n)$이다. 이 하한은 더 개선할 수 없다.
마스터 정리: $T(n) = aT(n/b) + f(n)$의 해는 $n^{\log_b a}$와 $f(n)$의 크기 비교로 결정된다.

다음 포스트

정렬 알고리즘 — 비교 기반 정렬의 모든 것 — 삽입 정렬, 병합 정렬, 힙 정렬, 퀵 정렬의 동작 원리와 복잡도를 분석한다. 비교 기반 정렬의 하한이 $\Omega(n \log n)$임을 결정 트리로 증명한다.