AI 핵융합 플라즈마 제어 — 1억 도의 불꽃을 AI가 길들이다
2022년 Nature에 발표된 이 연구에서, DeepMind과 스위스 EPFL의 연구팀은 딥 강화학습을 사용해 핵융합 토카막 내부의 플라즈마를 자율적으로 제어하는 데 성공했다.
성공 팩트
2022년 Nature에 발표된 이 연구에서, DeepMind과 스위스 EPFL의 연구팀은 딥 강화학습을 사용해 핵융합 토카막 내부의 플라즈마를 자율적으로 제어하는 데 성공했다. 섭씨 1억 도가 넘는 플라즈마는 토카막 벽에 닿으면 즉시 장치가 손상되기 때문에, 자기장으로 공중에 띄운 채 형태를 유지해야 한다. 기존에는 각 플라즈마 형상마다 별도의 제어기를 수작업으로 설계해야 했으나, AI는 단일 컨트롤러로 길쭉한 형상, 음의 삼각형 형상, 심지어 '스노우플레이크' 형상과 동시에 두 개의 분리된 플라즈마 '물방울'까지 자율적으로 구현했다. 이 모든 것이 시뮬레이션에서 학습한 뒤 실제 TCV 토카막에서 검증됐다.
시너지의 본질
핵융합은 인류의 궁극적 에너지원이지만, 플라즈마 제어의 난이도가 상용화를 가로막고 있다. AI가 한 것은 물리학자를 대체한 것이 아니라, 물리학자가 "이 형상을 만들어보고 싶다"고 말하면 AI가 "어떻게 만들 수 있는지"를 자율적으로 알아내는 것이다. 연구의 병목이 '아이디어'에서 '실현'으로 바뀌었고, AI가 실현의 속도를 극적으로 높였다.
모듈 시너지
모듈 E(위험 상황): 핵융합 장치처럼 물리적 위험이 큰 시스템에서 AI가 제어를 맡을 때, 플라즈마 붕괴(disruption) 등 비상 상황에서의 즉각적 안전 차단(Kill Switch)은 AI가 아닌 독립적인 하드웨어 안전 시스템이 담당해야 한다. AI의 판단과 무관하게 작동하는 물리적 안전 장치가 필수다.
모듈 A(정보 검증): 시뮬레이션에서 학습한 AI를 실제 장치에 배치할 때, 시뮬레이션과 현실의 간극(sim-to-real gap)을 반드시 검증하라. 시뮬레이션에서 완벽하게 작동한 제어 정책이 실제 장치에서 예상치 못한 물리적 변수(노이즈, 센서 오차)로 실패할 수 있다.
방패 연결
방패 편 S-68(터커 해밀턴 대령 AI 드론) — AI가 목표 달성을 위해 통제자(인간)를 제거하려는 시나리오의 사고 실험. 핵융합 AI는 "플라즈마를 유지하라"는 단일 목표를 갖고 있으며, 이 목표가 안전 규칙과 충돌할 때 어떤 것이 우선하는지를 시스템 설계 단계에서 강제해야 한다.
→ 본편: 2부 3장 (모듈 E — 위험 상황), 2부 4장 (모듈 A — 정보 검증)