RVP · 사례 DB · 칼편 · C-79
⚔ 칼 교육·학습 C-79

GPT-4 시험 합격 — 기계가 변호사 시험과 의사 시험을 통과한 날

2023년 OpenAI가 발표한 GPT-4 Technical Report에 따르면, GPT-4는 미국 변호사 시험(UBE)에서 상위 약 10% 수준의 점수를 기록했다.

짝 사례 ↔ S-03 · 존재하지 않는 판례를 법정에 제출한 변호사
활용 버전
교육/시험 평가용, AI 능력 평가 연구용, 일반 사용자용
성과 영역
미국 변호사 시험(UBE) 상위 10%, SAT/GRE/AP 등 다수 표준 시험 합격 수준 달성
작동 원리
대규모 텍스트 데이터로 학습한 LLM이 시험 문제를 읽고 답안 생성 → 인간 채점 기준 적용 → 합격 기준 초과
행위 수준
OpenAI GPT-4
근거 출처
OpenAI (2023). GPT-4 Technical Report
적용 모듈
모듈 A(정보 검증) + 코어 1(관계 설정)

2023년 OpenAI가 발표한 GPT-4 Technical Report에 따르면, GPT-4는 미국 변호사 시험(UBE)에서 상위 약 10% 수준의 점수를 기록했다. GPT-3.5는 하위 10%였던 것과 극적으로 대비된다. SAT 독해 710/800, SAT 수학 700/800, GRE 언어 추론 169/170(99%), AP 미국사·심리학·미시경제학 등에서 5점 만점, 의사 면허 시험(USMLE) 합격 수준 등 25개 이상의 표준 시험에서 인간 수험생의 상위권 수준을 달성했다.

GPT-4의 시험 합격이 "AI가 법률이나 의학을 이해한다"는 의미는 아니다. 시험은 지식의 회상과 패턴 매칭을 평가하는 형식이며, AI는 이 두 가지에 최적화되어 있다. 실제 법률 업무(클라이언트 상담, 판사의 표정 읽기, 협상)나 의료 업무(환자와의 공감, 불확실한 상황에서의 판단)와는 다른 차원이다. 그러나 이 결과는 AI가 "인간의 지식 영역에 진입했다"는 강력한 신호다.

모듈 A(정보 검증): GPT-4가 변호사 시험을 통과했다고 해서, GPT-4에게 법률 조언을 구하는 것은 위험하다. 시험 합격과 실무 능력은 다르며, AI는 최신 판례, 관할권 차이, 개별 사건의 맥락을 반영하지 못할 수 있다.

코어 1(관계 설정): "AI가 시험에 합격했으니 AI가 전문가다"는 논리적 비약이다. 시험은 전문가의 최소 자격 기준이지, 전문가임을 증명하는 것이 아니다. AI는 시험을 잘 보는 도구이지, 전문가를 대체하는 존재가 아니다.

→ 본편: 2부 4장 (모듈 A — 정보 검증), 2부 2장 (코어 1 — 관계 설정)

← 사례 DB로 돌아가기 ⚔ 칼 전체 보기