Gboard 연합학습 — 내 타자 습관을 배우되 내 데이터는 가져가지 않는 AI
구글의 모바일 키보드 Gboard는 사용자가 입력할 다음 단어를 AI가 예측해 제안한다. 핵심 혁신은 이 AI가 사용자의 타자 데이터를 구글 서버로 전송하지 않고도 학습할 수 있다는 것이다.
성공 팩트
구글의 모바일 키보드 Gboard는 사용자가 입력할 다음 단어를 AI가 예측해 제안한다. 핵심 혁신은 이 AI가 사용자의 타자 데이터를 구글 서버로 전송하지 않고도 학습할 수 있다는 것이다. 2017년 구글이 발표한 '연합학습(Federated Learning)' 기술이 이를 가능하게 했다. 각 스마트폰에서 개별적으로 모델이 학습되고, 학습된 모델의 업데이트(가중치 변화분)만 암호화되어 중앙 서버로 전송된다. 서버는 수백만 대의 업데이트를 평균 내어 전체 모델을 개선한 뒤, 개선된 모델을 다시 각 기기에 배포한다. 이 과정에서 사용자가 실제로 입력한 문장은 단 한 번도 기기를 떠나지 않는다.
시너지의 본질
"AI를 똑똑하게 만들려면 사용자 데이터를 수집해야 한다"는 전제를 깨뜨린 기술이다. 연합학습은 데이터를 모으지 않고도 수억 명의 행동 패턴을 학습할 수 있음을 증명했다. 이는 프라이버시와 AI 성능이 상충한다는 고정관념을 허물었고, 이후 의료·금융 등 민감한 데이터를 다루는 영역에서 AI 학습의 표준 방법론으로 확산되고 있다.
모듈 시너지
모듈 G(AI 선택): AI 서비스를 선택할 때 "이 서비스는 내 데이터를 어떻게 처리하는가?"를 확인하라. 연합학습처럼 데이터가 기기를 떠나지 않는 설계와, 모든 데이터를 클라우드에 수집하는 설계는 프라이버시 측면에서 근본적으로 다르다.
모듈 E(위험 상황): 연합학습이 완벽한 프라이버시를 보장하는 것은 아니다. 모델 업데이트에서 원본 데이터를 역추적하는 공격(model inversion attack)이 이론적으로 가능하다. 구글은 차분 프라이버시(Differential Privacy) 등 추가 방어 기법을 적용하고 있지만, "절대 안전"이라는 기술은 존재하지 않는다.
방패 연결
방패 편 S-34(버그 고치려다 기밀을 바친 20일) — 삼성 직원들이 ChatGPT에 기밀 소스코드를 입력해 유출된 사례. 만약 코드 보조 AI가 연합학습 방식으로 작동했다면, 소스코드가 외부 서버로 전송되지 않았을 것이다. AI의 기능이 아닌 AI의 데이터 처리 구조가 보안을 결정한다.
→ 본편: 2부 4장 (모듈 G — AI 선택), 2부 3장 (모듈 E — 위험 상황)