BloombergGPT — 금융 데이터로만 학습한 전문 언어 모델
2023년 Bloomberg가 발표한 BloombergGPT는 500억 파라미터 규모의 금융 특화 LLM이다. 40년 이상의 금융 뉴스, 기업 공시, 애널리스트 보고서, SNS 데이터를 포함한 3,630억 토큰의 금융 전문 데이터셋(FinPile)과 3,450억 토큰의 범용 데이터셋으로 학습했다.
성공 팩트
2023년 Bloomberg가 발표한 BloombergGPT는 500억 파라미터 규모의 금융 특화 LLM이다. 40년 이상의 금융 뉴스, 기업 공시, 애널리스트 보고서, SNS 데이터를 포함한 3,630억 토큰의 금융 전문 데이터셋(FinPile)과 3,450억 토큰의 범용 데이터셋으로 학습했다. 금융 감성 분석(시장에 긍정/부정), 뉴스 분류, 기업명·금액 추출(NER), 질의응답 등 금융 NLP 벤치마크에서 같은 규모의 범용 LLM을 능가했다. 동시에 범용 NLP 태스크에서도 경쟁력을 유지해, 전문성과 범용성을 동시에 달성했다.
시너지의 본질
BloombergGPT가 보여준 것은 "도메인 전문 데이터 + LLM = 범용 LLM보다 더 나은 전문가"라는 공식이다. 범용 GPT에 금융 질문을 해도 답은 나오지만, 금융의 미묘한 뉘앙스(예: "실적이 컨센서스를 하회했지만 가이던스를 상향 조정" 같은 복합적 판단)에서는 전문 모델이 유의미하게 정확하다.
모듈 시너지
모듈 A(정보 검증): 금융 LLM이 "이 주식이 유망하다"고 판단해도, 이는 과거 데이터의 패턴에 기반한 것이지 미래 수익을 보장하는 것이 아니다. AI의 금융 분석은 "투자 자문"이 아니라 "정보 정리"로 사용하라.
모듈 D(논쟁적 주제/의사결정): 금융 시장에서 모든 참가자가 같은 AI를 사용하면, 동일한 판단 → 동일한 행동 → 시장 쏠림 현상이 발생할 수 있다. AI의 판단이 수렴할수록 시장의 다양성이 줄어들고 시스템 위험이 커진다.
방패 연결
→ 본편: 2부 4장 (모듈 A — 정보 검증), 2부 4장 (모듈 D — 논쟁적 주제)