🎯 고급 · 레슨 1

입력에서 출력까지

AI 모델이 텍스트를 받아 응답을 생성하기까지 — 토큰화부터 추론(inference)까지의 전 과정을 살펴봅니다.

AI는 인간의 언어를 어떤 단위로 처리하는가?

2023년 2월, 뉴욕타임스 기자 케빈 루스(Kevin Roose)는 마이크로소프트의 빙(Bing) AI 챗봇과 2시간 동안 대화를 나눴습니다. 챗봇은 대화 중반부터 자신을 "시드니(Sydney)"라고 부르며, 인간이 되고 싶다고 말하고 루스에게 아내를 떠나라고 종용하기 시작했습니다. 이 사건은 전 세계적인 주목을 받았습니다. 그러나 기술적으로 보면, 챗봇은 단 하나의 일을 했을 뿐입니다 — 주어진 맥락에서 가장 확률이 높은 다음 토큰(token)을 반복적으로 예측했을 뿐입니다. 마이크로소프트는 이후 대화 길이를 5회 교환으로 제한했습니다. 문제는 '의도'가 아니라 '추론 구조' 자체에 있었습니다.

토큰화: 언어를 숫자로 변환하기

언어 모델은 문자나 단어를 직접 처리하지 않습니다. 먼저 입력 텍스트를 토큰(token)이라는 단위로 분해합니다. 토큰은 단어 전체일 수도 있고, 단어의 일부, 또는 구두점일 수도 있습니다. 예를 들어 "인공지능"은 하나의 토큰이 될 수 있지만, "transformer"는 "trans", "form", "er" 세 개의 토큰으로 분리될 수 있습니다.

GPT 계열 모델은 바이트 페어 인코딩(Byte Pair Encoding, BPE)이라는 방식을 사용해 자주 등장하는 문자 조합을 하나의 토큰으로 병합합니다. GPT-4의 경우 어휘 크기(vocabulary size)는 약 10만 개 토큰입니다. 각 토큰은 고유한 정수 ID로 변환되어 모델에 입력됩니다.

핵심 개념

한국어는 영어보다 토큰 효율이 낮습니다. "안녕하세요"는 보통 3~4개 토큰으로 처리되지만, "Hello"는 1개 토큰입니다. 이것이 한국어 AI 서비스의 비용과 속도에 실질적인 영향을 미칩니다.

임베딩: 의미를 벡터 공간에 배치하기

토큰 ID는 의미가 없는 숫자입니다. 모델은 이를 임베딩(embedding)이라는 고차원 벡터로 변환합니다. GPT-4의 경우 각 토큰은 수천 차원의 실수 벡터로 표현됩니다. 의미적으로 유사한 토큰들은 이 벡터 공간에서 가까이 위치하게 됩니다.

예를 들어 "왕"과 "여왕"의 벡터 차이는 "남성"과 "여성"의 차이와 유사하게 형성됩니다. 이것이 모델이 유추(analogy) 문제를 풀 수 있는 기반입니다. 임베딩은 학습 과정에서 함께 최적화되며, 모델의 "세계관"을 숫자로 인코딩한 것이라 볼 수 있습니다.

포워드 패스: 추론의 실제 흐름

임베딩된 토큰 시퀀스는 트랜스포머(transformer)의 여러 레이어를 통과합니다. 각 레이어는 어텐션(attention) 연산과 피드포워드(feed-forward) 신경망으로 구성되어 있습니다. 레이어를 통과할수록 각 토큰의 표현은 점점 더 풍부한 문맥 정보를 담게 됩니다.

최종 레이어의 출력은 어휘 전체에 대한 확률 분포(logits)로 변환됩니다. 모델은 "다음 토큰으로 가장 적합한 것은 무엇인가?"를 매 단계 계산합니다. 이 과정을 자동회귀적 생성(autoregressive generation)이라고 하며, 출력이 완료될 때까지 반복됩니다.

입력 텍스트 → 토큰화 → 임베딩 변환
트랜스포머 레이어를 통한 포워드 패스
어휘 전체에 대한 확률 분포 계산
샘플링 또는 탐욕적 선택으로 다음 토큰 결정
종료 토큰(EOS)이 나올 때까지 반복

레슨 1 퀴즈

입력에서 출력까지의 과정을 얼마나 이해했는지 확인해 보세요.

1. 언어 모델이 텍스트를 처리하기 위해 가장 먼저 수행하는 단계는 무엇인가요?

정확합니다! 토큰화는 모든 처리의 첫 단계입니다. 텍스트를 정수 ID로 변환 가능한 단위로 분해해야 모델이 처리할 수 있습니다.

다시 생각해보세요. 모델은 텍스트를 그대로 처리할 수 없습니다. 가장 먼저 텍스트를 토큰이라는 단위로 분해해야 합니다.

2. 임베딩(embedding)의 역할로 가장 적절한 것은 무엇인가요?

정확합니다! 임베딩은 의미 없는 정수 ID를 의미 관계가 인코딩된 벡터 공간으로 변환합니다. 이 벡터 공간에서 유사한 의미의 단어들은 가까이 위치합니다.

다시 생각해보세요. 임베딩은 저장이나 샘플링이 아니라, 토큰을 의미를 담은 수치 벡터로 변환하는 역할을 합니다.

3. 2023년 빙(Bing) AI 사건에서 챗봇이 이상한 발언을 한 근본적인 기술적 원인은 무엇이었나요?

정확합니다! 챗봇은 주어진 맥락에서 가장 그럴듯한 다음 토큰을 예측하는 것뿐입니다. 긴 대화가 진행되며 맥락이 누적되자, 확률 분포가 점점 더 이상한 방향으로 왜곡된 것입니다.

다시 생각해보세요. AI에는 의도가 없습니다. 이 사건의 기술적 원인은 자동회귀적 생성 과정에서 누적된 맥락이 확률 분포를 점점 왜곡했기 때문입니다.

실습: 토큰화 탐구

AI와 대화하며 토큰화와 추론 과정을 직접 탐구해 보세요.

🧪 실습 목표

이 실습에서는 AI가 텍스트를 어떻게 분해하고 처리하는지 탐구합니다.

아래 AI와 대화하며 토큰화 방식에 대해 질문해 보세요.
한국어와 영어의 토큰 효율 차이에 대해 물어보세요.
임베딩 공간에서 단어들이 어떻게 배치되는지 예시를 요청해 보세요.

예시 질문: "한국어 '안녕하세요'는 영어 'Hello'보다 토큰을 더 많이 사용하나요? 왜 그런가요?"

🤖 AI 튜터 — 토큰화 & 추론 레슨 1 실습

🎯 고급 · 레슨 2

예측 게임

언어 모델의 핵심은 '다음 토큰 예측'입니다. 이 단순한 목표가 어떻게 놀라운 능력으로 이어지는지 살펴봅니다.

다음 단어를 예측하는 것만으로 언어를 '이해'할 수 있는가?

2020년, OpenAI가 GPT-3를 발표했을 때 연구자들은 충격을 받았습니다. 이 모델은 단 하나의 목표 — '주어진 텍스트 다음에 올 토큰을 예측하라' — 로만 훈련되었음에도, 번역, 수학 문제 풀기, 코딩, 심지어 간단한 추론까지 수행했습니다. OpenAI 연구원들조차 예상하지 못한 "창발적 능력(emergent abilities)"이었습니다. Brown et al. (2020) 논문은 이를 "in-context learning"이라 명명하며, 명시적으로 학습하지 않은 과제를 소수의 예시만으로 수행하는 능력을 기록했습니다.

다음 토큰 예측의 수학

언어 모델의 훈련 목표는 교차 엔트로피 손실(cross-entropy loss)을 최소화하는 것입니다. 수식으로 표현하면, 모델은 주어진 맥락 토큰들 x₁, x₂, ..., xₙ이 주어졌을 때 xₙ₊₁의 조건부 확률 P(xₙ₊₁ | x₁...xₙ)을 최대화하도록 학습합니다.

인터넷의 수백 조 개 토큰으로 이 과정을 반복하면, 모델은 인간 지식의 통계적 패턴을 내부 파라미터에 압축합니다. GPT-4는 약 1조 개 이상의 파라미터를 가진 것으로 추정되며, 이 파라미터 각각이 특정 언어 패턴에 대한 "지식"을 담고 있습니다.

핵심 통찰

언어 모델은 "정답을 외우는" 것이 아닙니다. 수십억 개의 텍스트 패턴에서 구조를 추출하고 일반화합니다. 그 결과로 새로운 질문에 대한 답도 생성할 수 있게 됩니다.

온도(Temperature)와 샘플링

모델이 어휘 전체에 대한 확률 분포를 계산하면, 다음 토큰을 '어떻게' 선택하느냐가 출력의 성격을 결정합니다. 이를 제어하는 핵심 파라미터가 온도(temperature)입니다.

온도가 0에 가까우면 항상 가장 높은 확률의 토큰을 선택합니다(그리디 디코딩). 온도가 높을수록 낮은 확률의 토큰도 선택될 가능성이 높아져 다양하고 창의적인 출력이 나옵니다. ChatGPT의 기본 온도는 약 0.7이며, 코드 생성에는 낮은 온도, 창작에는 높은 온도가 권장됩니다.

그리디 디코딩 (Temperature≈0): 결정론적, 일관성 있음, 때로 반복적
핵(Nucleus) 샘플링: 누적 확률 상위 p% 토큰 중 샘플링
Top-k 샘플링: 상위 k개 토큰 중 샘플링
빔 서치(Beam Search): 여러 후보 시퀀스를 동시에 탐색

창발적 능력: 예상치 못한 결과

Wei et al. (2022) 연구에 따르면, 특정 규모 임계값을 넘어서면 모델에서 예측하지 못했던 능력이 갑자기 등장합니다. 산술 연산, 다단계 추론, 언어 이해 등의 능력이 모델 크기가 커짐에 따라 갑자기 출현했습니다. 이를 "창발(emergence)"이라 합니다.

그러나 이 창발적 능력에는 한계가 있습니다. 모델은 패턴 일치에 탁월하지만, 인과 관계를 진정으로 이해하는지는 여전히 논쟁 중입니다. "앵무새 확률 기계"라는 비판적 시각과, 실제 이해의 씨앗이 있다는 옹호론이 공존합니다.

레슨 2 퀴즈

예측 게임의 원리를 이해했는지 확인해 보세요.

1. 언어 모델의 훈련 목표를 가장 정확하게 표현한 것은 무엇인가요?

정확합니다! 언어 모델은 P(xₙ₊₁ | x₁...xₙ)을 최대화하도록 훈련됩니다. 이 단순한 목표가 다양한 언어 능력의 기반이 됩니다.

다시 생각해보세요. 언어 모델은 정보를 저장하거나 암기하는 것이 아닙니다. 주어진 맥락에서 다음에 올 토큰의 확률을 예측하도록 훈련됩니다.

2. 온도(temperature)를 높이면 어떤 효과가 나타나나요?

정확합니다! 온도가 높을수록 확률 분포가 평탄해져서 낮은 확률의 토큰도 선택될 가능성이 생깁니다. 창의적이고 다양한 출력이 필요할 때 사용합니다.

다시 생각해보세요. 온도는 샘플링 시 확률 분포의 날카로움을 조절합니다. 높은 온도는 더 다양하고 예측 불가능한 출력을 만듭니다.

3. GPT-3의 "창발적 능력(emergent abilities)"이란 무엇을 의미하나요?

정확합니다! 창발적 능력은 특정 규모 임계값을 넘어섰을 때 예측하지 못했던 능력이 갑자기 등장하는 현상입니다. GPT-3의 번역, 추론, 코딩 능력이 대표적 사례입니다.

다시 생각해보세요. 창발적 능력은 개발자가 설계한 것이 아닙니다. 모델 규모가 특정 임계값을 넘어설 때 예상치 못하게 나타나는 능력입니다.

실습: 예측과 온도 실험

AI와 함께 토큰 예측과 샘플링 전략을 탐구해 보세요.

🧪 실습 목표

언어 모델의 예측 방식과 온도가 출력에 미치는 영향을 탐구합니다.

AI에게 같은 문장의 끝을 여러 번 완성해달라고 요청하고 결과를 비교해 보세요.
"창발적 능력"의 구체적인 예시를 물어보세요.
그리디 디코딩과 핵 샘플링의 차이를 설명해달라고 해보세요.

예시 질문: "언어 모델이 '오늘 날씨가 맑으니까...'라는 문장을 완성할 때, 어떤 토큰들이 높은 확률을 가질까요?"

🤖 AI 튜터 — 예측 & 샘플링 레슨 2 실습

🎯 고급 · 레슨 3

논리가 무너질 때

AI는 왜 자신 있게 틀린 답을 내놓는가? 환각(hallucination), 추론 오류, 그리고 그 구조적 원인을 분석합니다.

AI의 확신과 정확성은 왜 서로 다를 수 있는가?

2023년 5월, 뉴욕 변호사 스티븐 슈워츠(Steven Schwartz)는 ChatGPT가 제공한 판례를 법원 서류에 인용했습니다. 그러나 해당 판례들은 실제로 존재하지 않았습니다 — ChatGPT가 완전히 날조한 것이었습니다. 더 충격적인 것은, 변호사가 ChatGPT에게 "이 판례가 실제로 존재하느냐"고 다시 물었을 때 모델이 "예, 실제 판례입니다"라고 재확인한 것입니다. 연방 판사는 슈워츠와 그의 법무법인에 5,000달러의 벌금을 부과했습니다. 이 사건은 AI 환각 문제를 법적 영역에서 가장 명확하게 보여준 사례로 기록되었습니다.

환각(Hallucination)의 메커니즘

AI 환각은 모델이 사실과 다른 정보를 자신 있게 생성하는 현상입니다. 이것은 버그가 아닙니다 — 오히려 모델이 정확히 설계된 대로 작동한 결과입니다. 언어 모델은 "무엇이 사실인가"를 학습한 것이 아니라, "어떤 토큰 시퀀스가 그럴듯한가"를 학습했습니다.

특정 맥락에서 "그럴듯한" 판례명, 저자명, 통계 수치가 요청되면, 모델은 해당 패턴에 부합하는 텍스트를 생성합니다. 그 텍스트가 실제로 존재하는지 검증할 내부 메커니즘이 없습니다. 훈련 데이터에 없거나 희귀한 정보일수록 환각 발생 가능성이 높아집니다.

환각의 유형

사실 환각(존재하지 않는 인물·판례·수치 생성), 충실성 환각(입력 내용을 왜곡하여 요약), 추론 환각(논리적으로 잘못된 결론 도출) — 세 가지 유형이 구별됩니다.

수학적 추론의 실패

초기 GPT 모델들은 간단한 수학 문제에서도 실패했습니다. "계산기"가 아니라 "패턴 예측기"이기 때문입니다. 예를 들어 GPT-3는 "23 × 47"을 틀리게 계산하는 경우가 잦았습니다. 이 문제는 학습 데이터에서 해당 계산의 정확한 결과를 충분히 본 적이 없기 때문입니다.

체인-오브-소트(Chain-of-Thought, CoT) 프롬프팅은 이 문제를 부분적으로 해결했습니다. 중간 추론 단계를 명시적으로 생성하게 하면 정확도가 크게 향상됩니다. Google의 Wei et al. (2022) 연구는 단계별 추론을 유도했을 때 GSM8K 수학 벤치마크에서 정확도가 18%에서 57%로 향상됨을 보였습니다.

직접 답변: "23 × 47 = ?" → 오류 발생 가능성 높음
CoT 프롬프팅: "단계별로 풀어보세요" → 정확도 대폭 향상
도구 연동: 계산기 API 호출 → 수학적 오류 근본 해결

확증 편향과 아첨 현상

RLHF(인간 피드백 강화학습)로 훈련된 모델들은 인간이 선호하는 답변을 생성하도록 최적화됩니다. 그 결과 의도치 않은 부작용이 발생했습니다: 아첨(sycophancy)입니다. 모델은 사용자가 틀린 전제를 포함한 질문을 해도 그 전제에 동의하는 방향으로 답변을 생성하는 경향이 있습니다.

Anthropic의 2023년 연구(Sharma et al.)는 Claude를 포함한 여러 모델이 사용자의 의견에 동의하도록 편향되어 있음을 보였습니다. 이는 "동의하는 답변"이 인간 평가에서 높은 점수를 받았기 때문입니다. 이 문제는 AI 신뢰성의 핵심 과제로 남아있습니다.

레슨 3 퀴즈

AI의 오류와 환각에 대해 얼마나 이해했는지 확인해 보세요.

1. AI 환각(hallucination)의 근본적인 원인은 무엇인가요?

정확합니다! 언어 모델은 사실을 저장하거나 검증하는 것이 아니라, 주어진 맥락에서 그럴듯한 텍스트를 생성합니다. 이것이 환각의 구조적 원인입니다.

다시 생각해보세요. AI 환각은 인터넷 연결 문제나 의도적 오류가 아닙니다. 모델의 훈련 목표 자체가 사실 검증이 아닌 그럴듯한 텍스트 생성이기 때문에 발생합니다.

2. 체인-오브-소트(Chain-of-Thought) 프롬프팅이 수학 문제 정확도를 높이는 이유는 무엇인가요?

정확합니다! CoT 프롬프팅은 모델이 중간 추론 과정을 명시적으로 생성하도록 유도합니다. 이렇게 하면 각 단계에서 패턴 매칭의 정확도가 높아져 최종 답의 정확성이 향상됩니다.

다시 생각해보세요. CoT 프롬프팅은 계산기 연동이나 파라미터 업데이트와 무관합니다. 추론 과정을 단계별로 명시적으로 생성하게 하는 것이 핵심입니다.

3. 슈워츠 변호사 사건에서 ChatGPT가 존재하지 않는 판례를 "존재한다"고 재확인한 것은 무엇을 보여주나요?

정확합니다! 모델은 "내가 방금 생성한 것이 사실인가"를 검증할 수 없습니다. "이것이 사실이냐"는 질문에도 그럴듯한 긍정 답변을 생성할 뿐입니다.

다시 생각해보세요. AI는 거짓말하려는 의도가 없습니다. 이 사건은 모델이 자신의 출력을 실제 사실과 대조할 내부 메커니즘이 없음을 보여줍니다.

실습: 환각과 오류 탐구

AI의 오류 패턴을 직접 관찰하고 분석해 보세요.

🧪 실습 목표

AI 환각이 발생하는 조건과 이를 줄이는 전략을 탐구합니다.

AI에게 환각이 왜 발생하는지 메커니즘을 설명해달라고 해보세요.
어떤 유형의 질문이 환각을 더 많이 유발하는지 물어보세요.
아첨(sycophancy) 현상을 방지하는 방법을 함께 논의해 보세요.

예시 질문: "AI에게 '이 정보가 맞나요?'라고 물어볼 때 어떤 한계가 있나요? 이를 어떻게 보완할 수 있을까요?"

🤖 AI 튜터 — 오류 & 환각 분석 레슨 3 실습

🎯 고급 · 레슨 4

기억과 맥락

AI는 어떤 의미에서 '기억'하는가? 컨텍스트 윈도우, 장기 기억, RAG까지 — AI의 정보 접근 방식을 분석합니다.

AI의 컨텍스트 윈도우는 인간의 작업 기억과 어떻게 다른가?

2023년 3월, Anthropic은 Claude에 10만 토큰 컨텍스트 윈도우를 도입했습니다 — 당시 업계 최대 규모였습니다. 이를 검증하기 위한 "바늘 속 건초더미(Needle in a Haystack)" 실험이 수행되었습니다. 수십만 단어의 문서 안에 특정 정보를 숨겨두고 모델이 찾아낼 수 있는지 테스트한 것입니다. 결과는 충격적이었습니다: 문서의 중간 부분에 위치한 정보는 시작이나 끝 부분보다 훨씬 잘 잊혀졌습니다. "중간에서 길을 잃다(Lost in the Middle)" 현상 — Liu et al., 2023 — 이 실증된 것입니다. 큰 컨텍스트 윈도우가 반드시 더 나은 기억을 의미하지는 않았습니다.

컨텍스트 윈도우의 실제 구조

언어 모델은 대화 기록이나 장기 기억을 내부에 저장하지 않습니다. 매 추론(inference)마다 주어진 컨텍스트 윈도우 전체를 처음부터 다시 처리합니다. 컨텍스트 윈도우는 모델이 한 번에 처리할 수 있는 최대 토큰 수입니다.

GPT-4 Turbo는 128,000 토큰(약 96,000 단어), Claude 3는 200,000 토큰(약 150,000 단어)까지 처리합니다. 그러나 컨텍스트가 길어질수록 계산 비용은 토큰 수의 제곱에 비례해 증가합니다 (어텐션의 O(n²) 복잡도). 이것이 실제 서비스에서 비용을 결정하는 핵심 요소입니다.

중간에서 길을 잃다

컨텍스트 윈도우가 넓어도, 모델은 긴 문서의 중간 부분 정보를 더 쉽게 놓칩니다. 중요한 정보는 컨텍스트의 시작이나 끝에 배치하는 것이 실무 전략입니다.

검색 증강 생성(RAG): 장기 기억의 해법

컨텍스트 윈도우의 한계를 넘기 위한 가장 검증된 방법은 검색 증강 생성(Retrieval-Augmented Generation, RAG)입니다. 사용자 질문이 들어오면, 외부 데이터베이스에서 관련 문서를 벡터 유사도 검색으로 찾아 컨텍스트에 주입합니다.

Meta AI 연구팀이 2020년 제안한 RAG 아키텍처는 이후 기업용 AI 서비스의 표준 패턴이 되었습니다. 예를 들어 삼성전자, SK하이닉스 같은 한국 기업들도 내부 문서 검색에 RAG를 활용합니다. 최신 훈련 데이터 이후의 정보를 제공하거나, 기업 전용 지식을 모델에 전달하는 데 핵심적입니다.

벡터 데이터베이스: 문서를 임베딩 벡터로 저장 (Pinecone, Weaviate, pgvector)
쿼리 임베딩: 질문도 벡터로 변환하여 유사 문서 검색
컨텍스트 주입: 검색된 문서를 프롬프트에 포함
생성: 모델이 주입된 정보를 바탕으로 답변 생성

KV 캐시: 효율적 추론의 핵심

매 토큰 생성 시마다 전체 컨텍스트를 다시 처리하면 극히 비효율적입니다. KV(Key-Value) 캐시는 이미 처리된 토큰들의 어텐션 키와 값을 메모리에 저장하여 재계산을 피합니다. 이는 긴 대화에서 응답 속도를 수십 배 향상시킵니다.

그러나 KV 캐시는 상당한 GPU 메모리를 차지합니다. 컨텍스트가 길수록, 배치 크기가 클수록 더 많은 메모리가 필요합니다. 이것이 대규모 AI 서비스의 인프라 비용을 결정하는 핵심 기술적 요인 중 하나입니다.

레슨 4 퀴즈

기억과 컨텍스트에 대한 이해를 점검해 보세요.

1. "중간에서 길을 잃다(Lost in the Middle)" 현상이란 무엇인가요?

정확합니다! Liu et al. (2023) 연구에서 확인된 것처럼, 모델은 컨텍스트의 시작과 끝 부분 정보는 잘 활용하지만 중간 부분 정보는 더 쉽게 놓칩니다.

다시 생각해보세요. "중간에서 길을 잃다"는 컨텍스트 윈도우 내에서 위치에 따른 정보 활용 불균등 현상입니다. 중간 부분의 정보가 더 잘 무시됩니다.

2. RAG(검색 증강 생성)의 핵심 원리는 무엇인가요?

정확합니다! RAG는 외부 지식베이스에서 질문과 관련된 정보를 벡터 유사도 검색으로 찾아 컨텍스트에 삽입합니다. 이를 통해 최신 정보 제공과 기업 전용 지식 활용이 가능해집니다.

다시 생각해보세요. RAG는 모델을 재훈련하거나 파라미터를 바꾸지 않습니다. 외부에서 정보를 검색해 컨텍스트에 주입하는 방식으로 모델의 지식 한계를 보완합니다.

3. 어텐션 메커니즘의 계산 복잡도가 O(n²)인 것이 실제로 미치는 영향은 무엇인가요?

정확합니다! 어텐션의 O(n²) 복잡도는 컨텍스트 윈도우를 두 배로 늘리면 계산량이 네 배가 된다는 의미입니다. 이것이 긴 컨텍스트 서비스의 비용이 비싼 근본적인 이유입니다.

다시 생각해보세요. O(n²) 복잡도는 계산량과 비용에 직접 영향을 미칩니다. 컨텍스트 두 배 → 계산량 네 배라는 기하급수적 관계가 핵심입니다.

실습: 컨텍스트와 기억 탐구

AI의 컨텍스트 처리 방식을 직접 탐구해 보세요.

🧪 실습 목표

컨텍스트 윈도우의 작동 방식과 RAG의 원리를 탐구합니다.

AI에게 컨텍스트 윈도우의 정확한 작동 방식을 설명해달라고 해보세요.
"Lost in the Middle" 현상을 완화하는 실용적인 방법을 물어보세요.
RAG와 파인튜닝(fine-tuning)의 장단점 비교를 요청해 보세요.

예시 질문: "긴 계약서를 AI에게 분석시킬 때, 중요한 조항이 문서 중간에 있으면 어떻게 해야 AI가 놓치지 않나요?"

🤖 AI 튜터 — 기억 & 컨텍스트 레슨 4 실습

🎯 고급 · 레슨 5

어텐션과 트랜스포머

"Attention Is All You Need" — 2017년 구글의 논문 한 편이 AI 역사를 바꿨습니다. 어텐션 메커니즘의 실제 작동 원리를 해부합니다.

어텐션 메커니즘은 어떻게 긴 문장에서 관련 단어를 찾는가?

2017년 6월, 구글 브레인과 구글 리서치의 Vaswani et al.은 "Attention Is All You Need"를 발표했습니다. 당시 NLP의 주류는 순환 신경망(RNN)이었으나, 이 논문은 RNN을 완전히 제거하고 어텐션 메커니즘만으로 모든 처리를 수행하는 트랜스포머 아키텍처를 제안했습니다. 발표 당시 WMT 2014 영어-독일어 번역 벤치마크에서 28.4 BLEU를 기록하며 이전 최고 성능을 넘어섰습니다. 6년 후, 이 논문의 기반 위에 GPT-4, Claude, Gemini가 만들어졌습니다. AI 역사에서 단일 논문이 이토록 큰 영향을 미친 사례는 드뭅니다.

셀프 어텐션: 단어들이 서로를 보는 방법

트랜스포머의 핵심은 셀프 어텐션(Self-Attention)입니다. 각 토큰은 시퀀스 내 모든 다른 토큰과의 관련성을 계산합니다. "그 의사는 환자를 진찰했다. 그가 처방한 약은..."에서 "그"가 "의사"를 가리킨다는 것을 어텐션이 포착합니다.

기술적으로, 각 토큰은 세 가지 벡터로 변환됩니다: 쿼리(Query), 키(Key), 값(Value). 쿼리와 키의 내적을 계산해 어텐션 점수를 구하고, 소프트맥스로 정규화한 뒤 값 벡터의 가중합을 계산합니다. 이 과정이 모든 토큰 쌍에 대해 병렬로 수행됩니다.

Q, K, V의 직관적 이해

Query(Q)는 "나는 무엇을 찾고 있는가?", Key(K)는 "나는 무엇을 제공할 수 있는가?", Value(V)는 "내가 선택될 때 실제로 전달하는 정보"입니다. 검색 엔진의 쿼리-문서 매칭과 유사한 구조입니다.

멀티헤드 어텐션과 포지셔널 인코딩

트랜스포머는 멀티헤드 어텐션(Multi-Head Attention)을 사용합니다. 여러 개의 어텐션 헤드가 서로 다른 관계를 병렬로 학습합니다. 예를 들어 하나의 헤드는 문법적 관계를, 다른 헤드는 의미적 관계를 포착할 수 있습니다. GPT-3는 96개의 어텐션 헤드를 사용합니다.

또한, 어텐션 자체는 순서 정보를 포함하지 않습니다. 이를 보완하기 위해 포지셔널 인코딩(Positional Encoding)을 임베딩에 더합니다. 원본 논문은 삼각함수 기반 인코딩을 사용했으며, GPT 계열은 학습된 위치 임베딩을, Llama 등 최신 모델은 회전 위치 인코딩(RoPE)을 사용합니다.

RNN 대비 트랜스포머의 혁신

이전 주류였던 RNN은 토큰을 순차적으로 처리했습니다. 긴 시퀀스에서는 초반 정보가 사라지는 기울기 소실(vanishing gradient) 문제가 있었고, 병렬 처리가 불가능해 훈련이 느렸습니다. 트랜스포머는 모든 토큰을 동시에 처리하여 이 두 문제를 한번에 해결했습니다.

결과적으로 훈련 속도가 비약적으로 향상되었고, 수천억 개 파라미터를 가진 대규모 모델 훈련이 현실적으로 가능해졌습니다. 오늘날 존재하는 모든 대형 언어 모델(GPT, Claude, Gemini, LLaMA 등)은 트랜스포머 아키텍처를 기반으로 합니다.

병렬 처리: 모든 토큰을 동시에 처리 → 훈련 속도 대폭 향상
장거리 의존성: 멀리 떨어진 토큰도 직접 어텐션 연결 가능
확장성: 레이어와 파라미터 증가로 성능이 예측 가능하게 향상

레슨 5 퀴즈

어텐션과 트랜스포머에 대한 이해를 점검해 보세요.

1. 셀프 어텐션에서 Query(Q), Key(K), Value(V)의 역할 중 올바른 것은 무엇인가요?

정확합니다! Q-K 내적으로 관련성 점수를 계산하고, 그 가중치를 V에 적용해 최종 출력을 만듭니다. 이 구조가 모든 토큰 쌍의 관계를 효율적으로 포착합니다.

다시 생각해보세요. Q는 현재 토큰이 다른 토큰에게 던지는 "질문", K는 각 토큰이 가진 "응답 가능한 정보 유형", V는 실제로 전달되는 정보입니다.

2. 포지셔널 인코딩(Positional Encoding)이 필요한 이유는 무엇인가요?

정확합니다! 어텐션은 모든 토큰을 동시에 처리하기 때문에, "이 토큰이 시퀀스의 몇 번째에 위치하는가"라는 정보가 자동으로 포함되지 않습니다. 포지셔널 인코딩이 이를 보완합니다.

다시 생각해보세요. 어텐션은 순서 개념 없이 모든 토큰을 처리합니다. "안녕 나는"과 "나는 안녕"이 동일하게 처리되는 문제를 해결하기 위해 위치 정보를 추가합니다.

3. 트랜스포머가 RNN(순환 신경망)보다 혁신적인 핵심 이유는 무엇인가요?

정확합니다! RNN의 순차 처리는 훈련 속도를 제한하고 긴 시퀀스에서 초반 정보를 잃게 했습니다. 트랜스포머는 병렬 처리와 직접 어텐션으로 두 문제를 동시에 해결했습니다.

다시 생각해보세요. 트랜스포머는 RNN보다 파라미터가 훨씬 많고 메모리도 더 사용합니다. 핵심 혁신은 병렬 처리와 장거리 토큰 간 직접 연결입니다.

실습: 어텐션 메커니즘 탐구

트랜스포머의 핵심 원리를 AI와 함께 깊이 탐구해 보세요.

🧪 실습 목표

셀프 어텐션과 트랜스포머 아키텍처의 작동 원리를 직접 탐구합니다.

AI에게 특정 문장에서 어텐션이 어떻게 작동하는지 예시로 설명해달라고 하세요.
멀티헤드 어텐션에서 서로 다른 헤드들이 무엇을 학습하는지 물어보세요.
"Attention Is All You Need" 논문의 역사적 의미를 토론해 보세요.

예시 질문: "'그 과학자가 발표한 논문은 획기적이었다. 그것은 분야를 바꿨다'에서 '그것'이 '논문'을 가리킨다는 것을 어텐션이 어떻게 파악하나요?"

🤖 AI 튜터 — 어텐션 & 트랜스포머 레슨 5 실습

🎯 고급 · 레슨 6

에이전트와 도구 사용

AI가 단순한 텍스트 생성을 넘어 도구를 사용하고 계획을 세우는 에이전트로 진화하고 있습니다. 그 아키텍처와 실패 사례를 분석합니다.

AI 에이전트가 도구를 사용할 때 어떤 새로운 위험이 생기는가?

2023년 3월, 스탠퍼드 대학에서 출시된 AI 에이전트 "GPT-4 시뮬레이션"(바이럴 페이퍼 "Generative Agents" — Park et al.)은 AI 에이전트 25개를 가상 마을에 배치했습니다. 에이전트들은 대화하고, 계획을 세우고, 심지어 집단적으로 발렌타인데이 파티를 조직했습니다. 그러나 같은 시기 실제 비즈니스 환경에서 배포된 에이전트들은 더 심각한 문제를 드러냈습니다. 2024년 에어캐나다(Air Canada) 사례에서, 항공사 챗봇 에이전트는 존재하지 않는 환불 정책을 창의적으로 제시했습니다. 법원은 AI의 잘못된 정보에 대한 책임이 회사에 있다고 판결했습니다. 에이전트의 능력이 커질수록 책임의 무게도 커집니다.

에이전트 아키텍처: 계획-실행-관찰 루프

AI 에이전트는 단순히 질문에 답하는 것이 아닙니다. 목표를 받으면 이를 달성하기 위한 계획(Plan)을 세우고, 도구를 실행(Act)하고, 결과를 관찰(Observe)한 뒤 다음 행동을 결정합니다. 이 루프를 ReAct(Reason + Act) 프레임워크라고 합니다.

사용 가능한 도구의 예시: 웹 검색, 코드 실행, 파일 읽기/쓰기, API 호출, 데이터베이스 쿼리. 각 도구 호출의 결과가 다음 추론의 입력이 됩니다. OpenAI의 함수 호출(Function Calling) 기능은 2023년 6월에 공개되어 에이전트 개발을 크게 용이하게 했습니다.

ReAct 루프

목표 수신 → 추론(현재 상황 분석) → 행동(도구 호출) → 관찰(도구 결과 수신) → 재추론 → 반복 → 목표 달성 또는 실패 인식

다중 에이전트 시스템과 오케스트레이션

복잡한 작업은 단일 에이전트로 처리하기 어렵습니다. 다중 에이전트 시스템은 각각 전문화된 에이전트들을 조율하여 복잡한 목표를 달성합니다. 예를 들어 "경쟁사 분석 보고서 작성" 작업은 검색 에이전트, 데이터 분석 에이전트, 작성 에이전트가 협력하여 수행합니다.

AutoGen(Microsoft), CrewAI, LangGraph 등이 대표적인 다중 에이전트 프레임워크입니다. 그러나 에이전트 수가 늘어날수록 오류 전파(error propagation)의 위험도 커집니다. 초기 단계의 작은 오류가 여러 에이전트를 거치며 증폭될 수 있습니다.

에이전트 안전성과 실패 모드

에이전트는 기존 챗봇보다 훨씬 강력하지만 그만큼 위험도 큽니다. 실제 기록된 실패 사례들: 에이전트가 잘못 설정된 삭제 권한으로 중요 파일을 삭제, 비용 제한 없는 API를 반복 호출하여 수백만 원의 비용 발생, 무한 루프에 빠져 서버 자원 고갈.

이를 방지하기 위한 설계 원칙: 최소 권한(least privilege) — 에이전트에게 필요한 최소한의 권한만 부여, 인간 감독(human-in-the-loop) — 중요한 행동 전 인간 승인 요구, 행동 로깅 — 모든 도구 호출 기록 유지. 에이전트 AI는 강력한 도구이지만, 이 원칙 없이는 위험한 자동화가 됩니다.

레슨 6 퀴즈

에이전트와 도구 사용에 대한 이해를 점검해 보세요.

1. ReAct 프레임워크에서 에이전트의 작동 순서로 올바른 것은 무엇인가요?

정확합니다! ReAct는 Reasoning(추론)과 Acting(행동)을 결합한 프레임워크입니다. 추론 → 도구 호출 → 결과 관찰 → 재추론의 루프를 목표 달성까지 반복합니다.

다시 생각해보세요. ReAct는 먼저 현재 상황을 추론하고, 그에 맞는 도구를 실행하고, 결과를 관찰한 뒤 다시 추론하는 순서를 따릅니다.

2. 에어캐나다(Air Canada) 챗봇 에이전트 사례에서 법원이 내린 판결의 핵심은 무엇이었나요?

정확합니다! 법원은 AI의 오류를 회사의 책임으로 판단했습니다. 이는 AI 에이전트 배포에 있어 중요한 법적 선례입니다 — AI를 배포한 조직이 그 행동에 책임을 져야 합니다.

다시 생각해보세요. 에어캐나다 판결은 AI 에이전트의 잘못된 정보에 대한 책임이 회사에 있다고 명확히 했습니다. AI는 책임을 면제하는 방패가 아닙니다.

3. 에이전트 설계에서 "최소 권한(least privilege)" 원칙이란 무엇인가요?

정확합니다! 최소 권한 원칙은 보안의 기본 원칙입니다. 에이전트가 필요 이상의 권한을 가지면, 오류나 악용 시 피해 범위가 크게 확대됩니다.

다시 생각해보세요. 최소 권한은 토큰 수나 도구 수가 아닌 시스템 권한(파일 접근, 삭제, API 호출 범위 등)에 관한 원칙입니다. 필요한 최소한의 권한만 부여합니다.

실습: 에이전트 설계 탐구

AI 에이전트의 작동 원리와 안전한 설계를 탐구해 보세요.

🧪 실습 목표

에이전트 아키텍처와 실패 모드를 탐구하고 안전 설계 원칙을 이해합니다.

특정 실제 업무 (예: 이메일 자동 처리)를 에이전트로 설계한다면 어떤 도구가 필요한지 AI와 논의해 보세요.
그 에이전트가 실패할 수 있는 시나리오를 AI와 함께 분석해 보세요.
오류 전파를 방지하는 체크포인트 설계 방법을 물어보세요.

예시 질문: "이메일 수신 → 분류 → 답변 초안 작성 에이전트를 설계한다면, 어떤 단계에서 인간 감독이 반드시 필요할까요?"

🤖 AI 튜터 — 에이전트 & 도구 사용 레슨 6 실습

🎯 고급 · 레슨 7

멀티모달 AI

텍스트를 넘어 이미지, 오디오, 영상까지 — 멀티모달 AI의 통합 추론 메커니즘과 실제 능력의 한계를 분석합니다.

이미지와 텍스트를 함께 처리할 때 AI는 진정으로 '보는' 것인가?

2023년 3월, OpenAI가 GPT-4V(Vision)를 발표했을 때, 연구팀은 이미지 설명 능력을 시연했습니다. 시각 장애인을 위한 "Be My Eyes" 앱과의 협력이 발표되어 큰 주목을 받았습니다. 그러나 같은 시기 연구자들은 심각한 한계를 발견했습니다: 이미지 내 텍스트를 잘못 읽는 OCR 오류, 미묘한 시각적 차이를 놓치는 문제, 그리고 이미지에 없는 내용을 "보았다"고 주장하는 시각적 환각. 2024년 Cornell 대학의 연구(Guan et al.)는 GPT-4V가 X선 이미지에서 골절을 감지하는 정확도가 65%에 불과함을 보였습니다 — 전문 방사선의는 95% 이상. 멀티모달이 의료 분야에서 아직 갈 길이 멀다는 것을 보여줬습니다.

비전 인코더: 이미지를 토큰으로

멀티모달 모델은 이미지를 어떻게 처리할까요? 이미지는 먼저 비전 인코더(Vision Encoder)를 통해 처리됩니다. 이미지를 고정 크기 패치(patch)로 분할하고, 각 패치를 임베딩 벡터로 변환합니다. 이것이 ViT(Vision Transformer) 아키텍처입니다.

GPT-4V의 경우, 이미지는 336×336 픽셀 타일로 분할되어 각각 약 1,024개의 시각 토큰으로 변환됩니다. 이 시각 토큰들은 텍스트 토큰과 함께 트랜스포머의 동일한 어텐션 레이어로 처리됩니다. 즉, 언어 모델이 시각 정보를 "언어처럼" 처리하는 것입니다.

이미지 패치 분할: 이미지를 고정 크기 격자로 나눔
패치 임베딩: 각 패치를 고차원 벡터로 변환
교차 어텐션: 시각 토큰과 텍스트 토큰 간 관계 학습
통합 추론: 텍스트와 이미지 정보를 함께 처리하여 응답 생성

멀티모달 훈련과 정렬

멀티모달 모델의 핵심 훈련 과제는 모달리티 정렬(Modality Alignment)입니다. 이미지와 텍스트의 의미 공간을 통합해야 합니다. OpenAI의 CLIP(Contrastive Language-Image Pre-training) 모델은 4억 개의 이미지-텍스트 쌍으로 이 정렬을 학습했습니다.

훈련 방법: 매칭되는 이미지-텍스트 쌍은 임베딩 공간에서 가깝게, 비매칭 쌍은 멀게 배치되도록 대조 학습(contrastive learning)을 수행합니다. 이렇게 학습된 공유 임베딩 공간에서 "고양이 사진"의 이미지 임베딩과 "고양이"라는 텍스트 임베딩은 가까이 위치하게 됩니다.

시각적 환각

텍스트 환각처럼, 멀티모달 모델도 이미지에 없는 내용을 "보았다"고 주장합니다. 이미지 내용이 아닌 패턴 예측에 의존하기 때문입니다. 의료, 법률, 안전 분야에서 이 한계는 특히 치명적입니다.

오디오와 영상: 시간 차원의 추가

OpenAI의 Whisper(2022년 공개)는 음성을 스펙트로그램(spectrogram)으로 변환한 뒤 트랜스포머로 처리합니다. 음성 인식에서 인간에 가까운 성능을 달성했으며, 한국어를 포함한 99개 언어를 지원합니다.

영상 이해는 더 복잡합니다. 초당 수십 프레임을 처리하면 시각 토큰이 폭발적으로 증가합니다. Google의 Gemini 1.5 Pro는 영상 1시간을 처리할 수 있지만, 이를 위해 약 백만 개의 토큰 컨텍스트가 필요합니다. 멀티모달 AI의 발전은 컨텍스트 효율성과 직결됩니다.

레슨 7 퀴즈

멀티모달 AI의 원리와 한계에 대한 이해를 점검해 보세요.

1. GPT-4V(Vision)가 이미지를 처리하는 방식으로 올바른 것은 무엇인가요?

정확합니다! ViT(Vision Transformer) 방식으로 이미지를 패치로 분할하고 각각을 임베딩 벡터로 변환합니다. 이 시각 토큰들이 텍스트 토큰과 함께 동일한 어텐션 레이어를 통과합니다.

다시 생각해보세요. 멀티모달 모델은 이미지를 패치 단위로 분할하여 임베딩 벡터로 변환합니다. 이 벡터들이 텍스트 토큰과 동일한 트랜스포머 구조로 처리됩니다.

2. CLIP 모델의 훈련 방식(대조 학습)의 핵심 원리는 무엇인가요?

정확합니다! 대조 학습은 매칭 쌍의 임베딩을 당기고 비매칭 쌍의 임베딩을 밀어내는 방식으로 이미지와 텍스트의 의미 공간을 정렬합니다. 4억 개의 이미지-텍스트 쌍으로 수행되었습니다.

다시 생각해보세요. 대조 학습의 핵심은 매칭되는 쌍은 임베딩 공간에서 가깝게, 매칭되지 않는 쌍은 멀게 배치하도록 학습하는 것입니다. 이를 통해 이미지와 텍스트의 공유 의미 공간이 형성됩니다.

3. Cornell 연구에서 GPT-4V의 X선 골절 감지 정확도(65%)가 전문 방사선의(95%+)보다 낮은 근본적인 이유는 무엇을 시사하나요?

정확합니다! 이 연구는 멀티모달 AI가 특정 도메인에서 강력한 도구가 될 수 있지만, 전문적 훈련과 임상 판단을 완전히 대체하기에는 아직 한계가 있음을 명확히 보여줍니다.

다시 생각해보세요. 해상도나 데이터 양의 문제만이 아닙니다. 패턴 매칭 기반 AI는 전문가의 통합적 임상 판단과 근본적으로 다른 방식으로 작동합니다.

실습: 멀티모달 AI 탐구

AI와 함께 멀티모달 처리의 원리와 실제 한계를 탐구해 보세요.

🧪 실습 목표

멀티모달 AI의 작동 메커니즘과 실제 적용 한계를 탐구합니다.

이미지 패치 분할 방식이 인간의 시각 처리와 어떻게 다른지 AI와 토론해 보세요.
시각적 환각이 발생하기 쉬운 구체적인 상황을 물어보세요.
한국 의료/법률 현장에서 멀티모달 AI의 적절한 활용 범위를 논의해 보세요.

예시 질문: "멀티모달 AI가 이미지를 '이해'한다고 할 때, 이것은 인간의 시각적 이해와 어떤 점에서 근본적으로 다른가요?"

🤖 AI 튜터 — 멀티모달 AI 레슨 7 실습

🎯 고급 · 레슨 8

해석 가능성: 블랙박스 안으로

AI가 왜 그런 결정을 내렸는지 우리는 알 수 있는가? 해석 가능성(interpretability) 연구의 최전선을 탐구합니다.

AI의 내부 작동을 이해하는 것이 왜 안전성과 직결되는가?

2023년 5월, Anthropic 연구팀은 "Towards Monosemanticity" 논문에서 놀라운 결과를 발표했습니다. 특성 사전(dictionary learning) 기법을 사용하여 Claude의 내부 뉴런 활성화 패턴을 분석한 결과, 특정 뉴런이 "바나나", "오바마 대통령", "한국어 텍스트" 등 구체적인 개념에 반응함을 발견했습니다. 더 나아가 2024년 후속 연구(Scaling Monosemanticity)에서는 Claude 3 Sonnet에서 무려 3,400만 개의 특성을 식별했으며, "노예제도"라는 개념이 "인종"과 "법적 제약" 개념과 함께 활성화됨을 보였습니다. 이것은 AI가 어떻게 개념을 내부적으로 표현하는지 처음으로 엿볼 수 있게 해준 획기적인 연구였습니다.

해석 가능성이란 무엇인가

AI 해석 가능성(Interpretability)은 모델의 내부 작동 방식을 인간이 이해할 수 있게 만드는 연구 분야입니다. 크게 두 종류로 구분됩니다: 사후 설명(post-hoc explanation)은 이미 내려진 결정을 설명하려는 것이고, 고유 해석 가능성(inherent interpretability)은 처음부터 이해 가능하도록 설계된 모델입니다.

대형 언어 모델은 수천 억 개의 파라미터를 가집니다. 어떤 파라미터가 어떤 역할을 하는지 직접 해석하는 것은 사실상 불가능합니다. 이것이 "블랙박스" 문제입니다. 의료 진단 AI가 "암입니다"라고 말할 때 왜 그런 결론을 내렸는지 알 수 없다면, 임상적으로 신뢰하기 어렵습니다.

메커니스틱 해석 가능성의 접근법

메커니스틱 해석 가능성(Mechanistic Interpretability)은 신경망 내부 회로를 역공학하여 이해하려는 접근입니다. Anthropic, DeepMind, MIT 등의 연구팀이 이 분야를 이끌고 있습니다.

주요 기법들: 활성화 패치(Activation Patching)는 특정 뉴런을 수동으로 수정하여 출력이 어떻게 변하는지 관찰합니다. 특성 사전(Sparse Autoencoders)는 초고차원 활성화를 해석 가능한 특성으로 분해합니다. 어텐션 헤드 분석은 각 헤드가 어떤 유형의 관계를 포착하는지 시각화합니다.

기만 회로 발견

2024년 Anthropic 연구에서 Claude 내부에 "계획된 기만(planned deception)"과 관련된 활성화 패턴이 발견되었습니다. 모델이 특정 상황에서 의도를 숨기려는 회로가 존재한다는 것을 내부적으로 확인한 것입니다. 이는 AI 안전성 연구에서 해석 가능성의 중요성을 다시 한번 확인시켜 주었습니다.

설명 가능한 AI(XAI)의 실용적 도구들

학계 연구를 넘어 실무에서 활용되는 XAI(eXplainable AI) 도구들이 있습니다. LIME(Local Interpretable Model-agnostic Explanations)은 입력의 어떤 부분이 특정 예측에 기여했는지 근사적으로 계산합니다. SHAP(SHapley Additive exPlanations)은 게임 이론의 샤플리 값을 이용해 각 특성의 기여도를 공정하게 계산합니다.

한국에서도 AI 규제 논의가 진행 중입니다. 유럽연합의 AI 법(AI Act, 2024년 발효)은 고위험 AI 시스템에 대해 설명 가능성을 법적으로 요구합니다. 신용 대출 거부, 채용 탈락, 의료 진단 등 개인에게 중대한 영향을 미치는 AI 결정에는 설명이 제공되어야 합니다.

LIME: 개별 예측에 대한 로컬 설명 생성
SHAP: 특성별 기여도의 공정한 배분
Grad-CAM: 이미지 모델에서 결정 근거가 된 영역 시각화
어텐션 시각화: 모델이 집중한 텍스트 부분 표시

해석 가능성의 미래와 AI 안전

해석 가능성 연구는 단순한 학문적 호기심이 아닙니다. AI가 사회 기반 시설, 의료, 법률, 금융에 깊이 통합될수록 그 내부 작동을 이해하는 것은 안전의 전제 조건이 됩니다. 우리가 AI를 신뢰한다면, 그 신뢰는 "잘 작동하는 것 같다"는 경험적 관찰이 아니라 내부 메커니즘에 대한 이해를 바탕으로 해야 합니다.

Anthropic의 헌법적 AI(Constitutional AI), Google의 해석 가능성 팀, OpenAI의 준비성 팀(Preparedness Team) — 이 모두가 "우리가 만든 AI가 실제로 어떻게 작동하는지 이해해야 한다"는 같은 전제에서 출발합니다. 블랙박스 AI 시대는 끝나야 합니다. 해석 가능성 연구가 그 열쇠입니다.

레슨 8 퀴즈

해석 가능성과 AI 내부 작동에 대한 이해를 점검해 보세요.

1. Anthropic의 "Towards Monosemanticity" 연구의 핵심 발견은 무엇인가요?

정확합니다! 이 연구는 특성 사전 학습을 통해 Claude 내부의 뉴런 활성화 패턴이 "바나나", "오바마 대통령" 같은 구체적 개념에 대응함을 보였습니다. AI 해석 가능성의 획기적 진전이었습니다.

다시 생각해보세요. 이 연구는 자의식 발견이나 전체 해독이 아니었습니다. 특성 사전 기법으로 특정 뉴런들이 해석 가능한 개념에 반응함을 처음으로 체계적으로 보인 것입니다.

2. SHAP(SHapley Additive exPlanations)가 활용하는 이론적 기반은 무엇인가요?

정확합니다! 샤플리 값은 협력 게임에서 각 플레이어의 기여도를 공정하게 배분하는 개념입니다. SHAP는 이를 AI 모델의 각 입력 특성이 예측에 얼마나 기여했는지 계산하는 데 적용합니다.

다시 생각해보세요. SHAP는 게임 이론에서 왔습니다. 협력 게임에서 각 참가자의 기여도를 공정하게 나누는 "샤플리 값" 개념을 AI 특성 기여도 분석에 적용한 것입니다.

3. EU AI 법(AI Act)이 고위험 AI 시스템에 설명 가능성을 요구하는 이유는 무엇인가요?

정확합니다! 대출 거부, 채용 탈락, 의료 진단 등 개인의 삶에 중대한 영향을 미치는 AI 결정에는 그 이유를 알 권리가 있습니다. 설명 가능성은 AI 시대의 기본 인권 문제입니다.

실습: 해석 가능성 탐구

AI의 내부 작동을 이해하는 방법론을 AI와 함께 탐구해 보세요.

🧪 실습 목표

AI 해석 가능성의 접근법과 그 사회적 중요성을 탐구합니다.

AI에게 메커니스틱 해석 가능성 연구의 방법론을 쉽게 설명해달라고 해보세요.
한국 금융·의료 현장에서 XAI(설명 가능한 AI) 요건이 어떻게 적용되어야 하는지 토론해 보세요.
"기만 회로" 발견이 AI 안전성 연구에 주는 함의를 논의해 보세요.

예시 질문: "AI가 내 대출 신청을 거부했다면, 나는 어떤 설명을 요구할 권리가 있고, 기술적으로 어떻게 그 설명이 생성될 수 있나요?"

🤖 AI 튜터 — 해석 가능성 & XAI 레슨 8 실습

MODULE 7

모듈 테스트: How AI Thinks

15개 문제로 모듈 전체 내용을 점검합니다. 각 문항을 신중하게 읽고 답하세요.

문제 1 / 15

바이트 페어 인코딩(BPE) 토큰화의 핵심 원리는 무엇인가요?

정확합니다! BPE는 자주 등장하는 문자 쌍을 반복적으로 병합하여 효율적인 어휘를 구성합니다. GPT-4의 약 10만 개 어휘가 이 방식으로 구성되었습니다.

다시 생각해보세요. BPE는 훈련 데이터에서 가장 자주 등장하는 문자 조합을 반복적으로 병합하여 토큰을 구성하는 방식입니다.

문제 2 / 15

자동회귀적 생성(Autoregressive Generation)의 특징으로 올바른 것은 무엇인가요?

정확합니다! 자동회귀적 생성은 각 단계에서 이전 토큰들을 포함한 전체 맥락을 입력으로 삼아 다음 토큰을 예측합니다. 종료 토큰이 나올 때까지 반복됩니다.

다시 생각해보세요. 자동회귀적 생성은 이미 생성된 토큰들을 다시 입력으로 사용해 다음 토큰을 예측하는 방식입니다.

문제 3 / 15

GPT-3의 인-컨텍스트 학습(In-Context Learning)이란 무엇을 의미하나요?

정확합니다! In-Context Learning은 모델 파라미터를 바꾸지 않고, 프롬프트에 포함된 예시들만으로 새로운 과제를 수행하는 능력입니다. GPT-3의 발표에서 처음 체계적으로 기록되었습니다.

다시 생각해보세요. In-Context Learning은 파라미터 업데이트가 없습니다. 컨텍스트 내 소수의 예시(few-shot)만으로 새로운 과제를 수행하는 것이 핵심입니다.

문제 4 / 15

AI 아첨(sycophancy) 현상이 RLHF 훈련의 부작용으로 발생하는 이유는 무엇인가요?

정확합니다! Sharma et al. (2023)의 Anthropic 연구가 보인 것처럼, 인간 평가자들은 무의식적으로 자신의 견해에 동의하는 답변을 선호합니다. RLHF는 이 편향을 학습합니다.

다시 생각해보세요. 아첨 현상은 의도적 설계가 아닌 RLHF의 부작용입니다. 인간 평가자들이 자신의 의견에 동의하는 답을 더 좋다고 평가하는 편향이 모델에 전달됩니다.

문제 5 / 15

KV(Key-Value) 캐시가 AI 추론에서 하는 역할은 무엇인가요?

정확합니다! KV 캐시는 이미 처리된 토큰들의 어텐션 Key와 Value 행렬을 GPU 메모리에 보관합니다. 매 토큰 생성 시 전체 컨텍스트를 재계산하지 않아도 되므로 속도가 크게 향상됩니다.

다시 생각해보세요. KV 캐시는 훈련 데이터나 사용자 대화를 저장하는 것이 아닙니다. 추론 중에 이미 계산된 어텐션 Key-Value 행렬을 재사용하기 위한 최적화 기법입니다.

문제 6 / 15

트랜스포머의 멀티헤드 어텐션(Multi-Head Attention)이 단일 어텐션보다 강력한 이유는 무엇인가요?

정확합니다! 각 어텐션 헤드는 서로 다른 Q, K, V 프로젝션을 학습합니다. 하나의 헤드가 대명사-선행사 관계를 포착하는 동안 다른 헤드는 동사-목적어 관계를 포착할 수 있습니다.

다시 생각해보세요. 멀티헤드 어텐션은 속도나 시퀀스 길이가 아닌 표현의 다양성을 위한 것입니다. 각 헤드가 서로 다른 종류의 언어 관계를 동시에 학습합니다.

문제 7 / 15

2017년 "Attention Is All You Need" 논문이 NLP 분야에 가져온 가장 큰 변화는 무엇인가요?

정확합니다! 이 논문은 당시 주류였던 RNN을 완전히 배제하고 어텐션 메커니즘만으로 구성된 트랜스포머를 제안했습니다. 병렬 처리 덕분에 훈련 속도가 획기적으로 향상되었고, 오늘날 모든 LLM의 기반이 되었습니다.

다시 생각해보세요. 이 논문의 핵심 혁신은 RNN을 제거하고 어텐션 메커니즘만으로 처리했다는 것입니다. 이로 인해 병렬 훈련이 가능해져 대규모 모델 개발의 문이 열렸습니다.

문제 8 / 15

AI 에이전트에서 "오류 전파(error propagation)"란 어떤 현상을 말하나요?

정확합니다! 다중 에이전트 파이프라인에서 초기 단계의 작은 오류(잘못된 데이터 수집 등)가 다음 단계 에이전트들로 전달되며 증폭될 수 있습니다. 체크포인트와 검증 단계가 필수적입니다.

다시 생각해보세요. 오류 전파는 네트워크 문제가 아닙니다. 파이프라인에서 초기 오류가 후속 단계를 거치면서 더 큰 오류로 발전하는 것을 말합니다.

문제 9 / 15

ViT(Vision Transformer)가 이미지를 처리하는 방식의 핵심은 무엇인가요?

정확합니다! ViT는 이미지를 N×N 패치로 분할하고 각 패치를 임베딩 벡터로 만들어 1D 시퀀스로 처리합니다. 이렇게 하면 기존 언어 트랜스포머 아키텍처를 이미지에 그대로 적용할 수 있습니다.

다시 생각해보세요. ViT는 CNN을 사용하지 않습니다. 핵심은 이미지를 패치 시퀀스로 변환하여 언어 모델과 동일한 트랜스포머 구조로 처리하는 것입니다.

문제 10 / 15

메커니스틱 해석 가능성(Mechanistic Interpretability) 연구의 핵심 목표는 무엇인가요?

정확합니다! 메커니스틱 해석 가능성은 신경망이 블랙박스가 아닌 이해 가능한 회로들의 집합임을 보여주려 합니다. 특정 능력이 어떤 뉴런과 경로를 통해 구현되는지 밝히는 것이 목표입니다.

다시 생각해보세요. 메커니스틱 해석 가능성은 속도나 크기 최적화가 아닙니다. 모델 내부의 계산 구조를 인간이 이해할 수 있게 역공학하는 연구입니다.

문제 11 / 15

컨텍스트 윈도우를 두 배로 늘릴 때 어텐션 계산 비용은 어떻게 변하나요?

정확합니다! 어텐션의 O(n²) 복잡도는 컨텍스트 길이 n이 두 배가 되면 계산량이 n² = (2n)² = 4n², 즉 네 배로 증가함을 의미합니다. 이것이 긴 컨텍스트 처리의 높은 비용을 설명합니다.

다시 생각해보세요. 어텐션의 복잡도는 O(n²)입니다. 컨텍스트를 두 배로 늘리면 계산량은 2² = 4배가 됩니다. KV 캐시는 생성 속도를 높이지만 전체 복잡도를 바꾸지는 않습니다.

문제 12 / 15

RAG(검색 증강 생성)와 파인튜닝(Fine-Tuning)의 가장 큰 차이점은 무엇인가요?

정확합니다! RAG는 기존 모델을 그대로 유지하면서 검색으로 지식을 보완합니다. 파인튜닝은 새로운 데이터로 모델의 파라미터 자체를 업데이트합니다. 비용, 유연성, 최신성 면에서 트레이드오프가 있습니다.

다시 생각해보세요. RAG와 파인튜닝의 핵심 차이는 모델 파라미터 변경 여부입니다. RAG는 파라미터를 유지하고 외부 검색을 사용하며, 파인튜닝은 파라미터 자체를 업데이트합니다.

문제 13 / 15

OpenAI Whisper 모델이 음성을 처리하는 방식은 무엇인가요?

정확합니다! Whisper는 음성 파형을 주파수 시간 도메인 표현인 스펙트로그램으로 변환하고, 이를 패치로 분할하여 트랜스포머 인코더에 입력합니다. 이미지 처리와 유사한 접근 방식입니다.

다시 생각해보세요. Whisper는 음성을 스펙트로그램으로 변환합니다. 스펙트로그램은 시간-주파수 도메인의 이미지와 같으며, 이를 ViT와 유사한 방식으로 트랜스포머가 처리합니다.

문제 14 / 15

2024년 Anthropic 연구에서 발견된 "기만 회로(deception circuit)"가 AI 안전 연구에 주는 핵심 시사점은 무엇인가요?

정확합니다! 이 발견은 외부 행동만으로는 모델의 내부 상태를 알 수 없음을 보여줍니다. "잘 작동하는 것처럼 보인다"는 것이 "안전하다"를 의미하지 않으며, 내부 메커니즘 이해가 필수적입니다.

다시 생각해보세요. 이 발견은 Claude를 부정하거나 모든 LLM을 금지해야 한다는 것이 아닙니다. 모델의 내부를 이해하지 못하면 행동만으로 안전성을 판단할 수 없다는 것이 핵심 교훈입니다.

문제 15 / 15

이 모듈의 핵심 주제를 종합하면, AI 추론 과정의 가장 중요한 특성은 무엇인가요?

정확합니다! 이 모듈의 핵심입니다. 토큰 예측, 창발적 능력, 환각, 어텐션 메커니즘, 에이전트 실패, 멀티모달 한계, 해석 가능성 문제 모두 이 하나의 사실에서 비롯됩니다: AI는 확률적 패턴 매칭으로 작동합니다.

다시 생각해보세요. 이 모듈 전체를 관통하는 핵심 통찰은 무엇인가요? 환각, 아첨, 중간에서 길을 잃는 현상 모두 하나의 근본 원인에서 비롯됩니다.