⚔ 칼 과학·연구 C-35

AlphaGeometry — AI가 국제수학올림피아드 금메달 수준으로 기하학을 풀다

2024년 Nature에 발표된 AlphaGeometry는 2000~2022년 IMO 기하 문제 30문항 중 25문항을 풀어, 금메달리스트의 평균 수준에 근접했다.

각주용 정리

활용 버전: 수학/교육용, AI 추론 연구용, 일반 사용자용
성과 영역: 국제수학올림피아드(IMO) 기하 문제에서 금메달리스트 수준의 풀이 능력 달성
작동 원리: 신경 언어 모델이 보조 구성점(auxiliary point) 후보 생성 → 기호 추론 엔진(DDAR)이 논리적 증명 완성
행위 수준: DeepMind AlphaGeometry
근거 출처: Trinh et al. (2024). Nature, 625, 476-482
적용 모듈: 모듈 A(정보 검증) + 코어 1(관계 설정)

성공 팩트

2024년 Nature에 발표된 AlphaGeometry는 2000~2022년 IMO 기하 문제 30문항 중 25문항을 풀어, 금메달리스트의 평균 수준에 근접했다. 기존 최고 시스템은 10문항밖에 풀지 못했다. AlphaGeometry의 핵심은 두 가지 시스템의 결합이다. 신경 언어 모델이 "이 점을 추가해보면 어떨까?"라는 직관적 아이디어(보조 구성점)를 제안하고, 기호 추론 엔진(DDAR)이 그 아이디어를 수학적으로 엄밀하게 증명한다. 직관의 AI와 논리의 AI가 협업하는 구조다. 학습에는 인간의 풀이 데이터를 사용하지 않았고, 1억 개의 합성 정리-증명 쌍을 AI가 스스로 생성해 학습했다.

시너지의 본질

수학의 난제를 푸는 데는 두 가지 능력이 필요하다. "어디를 파야 할지 감을 잡는 직관"과 "파기 시작하면 한 줄도 빠짐없이 논리적으로 연결하는 엄밀함." 인간 수학자는 두 가지를 한 뇌에서 수행하지만, AlphaGeometry는 이를 두 개의 전문화된 AI로 분리했다. 직관은 틀릴 수 있지만, 검증기가 틀린 직관을 걸러낸다. 이 구조는 FunSearch(C-32)와 동일한 패턴이다.

모듈 시너지

모듈 A(정보 검증): AlphaGeometry의 성공 비결은 기호 추론 엔진이라는 '완벽한 검증기'가 존재했기 때문이다. 수학은 증명이 맞는지 틀리는지를 기계적으로 확인할 수 있는 드문 영역이다. 일상의 대부분 문제에서는 이런 완벽한 검증기가 존재하지 않으므로, AI의 출력을 더욱 신중하게 검토해야 한다.
코어 1(관계 설정): AI가 IMO 문제를 풀었다고 해서 AI가 수학을 "이해한다"고 결론 내려서는 안 된다. AlphaGeometry는 기하학의 의미를 이해한 것이 아니라, 패턴을 탐색하고 규칙을 적용한 것이다. "풀 수 있다"와 "이해한다"는 다르다.

방패 연결

방패 편 S-53(AI가 써 준 가짜 논문으로 채운 공직자의 연수 보고서) — AI가 생성한 텍스트를 검증 없이 제출한 사례. AlphaGeometry에서 검증기가 없었다면, AI가 생성한 "증명"은 그럴듯하지만 논리적으로 틀린 가짜 증명이 될 수 있었다. 검증 없는 AI 출력은 어떤 영역에서든 위험하다.

S-53

→ 본편: 2부 4장 (모듈 A — 정보 검증), 2부 2장 (코어 1 — 관계 설정)

근거 출처 전체 보기 →

← 사례 DB로 돌아가기 ⚔ 칼 전체 보기