KNOWLEDGE
Claude-3, GPT와 차이점은?
GPT는 우리에게 굉장히 익숙한 거대언어모델(LLM)이다. 그런데 최근 Anthropic社에서 출시한 ‘클로드 3(Claude-3)’이 인기를 얻고 있다. 오늘은 찻잔 속의 태풍일지, 진짜 태풍일지 간단히 알아보도록 한다.
1. 개요
Anthropic은 ‘Open AI’ 출신의 인물들이 나와 창업한 스타트업이다. 다만 Open AI와는 다르게 공익기업을 표방하고 있으며, 현시점에서는 GPT 모델과 비교되고 있는 Claude-3를 올해(2024년) 2월에 출시한 상태다. Claude-3는 모델별로 Haiku, Sonnet, Opus로 나뉜다. Haiku는 ‘GPT-3.5 터보(Turbo)’와 ‘GPT-4’ 사이 성능을 보이고 있으며, Sonnet은 GPT-4와 영역별로 잘하는 부분이 차이가 나는데, GPT에 비해 대학원 추론과 코딩 및 다국어 수학 같은 언어적 추론에서는 Sonnet이 강하고 이해력과 수학 문제 해결의 경우 GPT가 앞선다. 마지막으로 Opus의 경우 벤치마크 기준으로 GPT-4를 넘어섰고 평균 점수는 3.7점이 더 높다. 특히 Opus는 코딩점수에 있어서 GPT-4보다 20점 가까이 차이가 난다.
Claude-3가 GPT보다 뛰어나다고 언급되는 점은 작문과 연관된 능력과 다국어에 대한 이해도이다. 특히 한국어 부분에 있어서 한문이 섞여 있는 동양고전도 어느 정도 해석이 되며, 인터넷 속어나 조선 시대 이전의 고어나 방언이 아닌 이상 한국어 문체의 이해 능력이 GPT-4보다는 높다고 전해진다.
2. 실제로 사용해보니
Claude3 무료 버전으로 개인정보 보호법에 관해 물어보았다. 입력한 프롬프트는 ‘한국의 개인정보 보호법을 회사의 인사 채용에 적용하려고 하는데, 가장 주의해야 할 점을 알려줘’였다. 먼저 Claude의 경우 6가지 정도를 주의해야 한다고 이야기했고, 어떤 조항을 참조해야 하는지 물어보자 15조와 22조를 중요하게 보고 있었다. 같은 질문을 GPT-4에 물어보자 9가지 정도를 유의해야 한다고 했는데, 해당 방법에는 법 조항이 아닌 GPT가 고려하는 내용이 광범위하게 들어갔다는 점이다. Claude와 동일하게 어떤 조항을 봐야 하는지 물어보자 15조부터 39조까지 광범위하게 보아야 한다고 설명했다. 이런 점을 미루어 보았을 때, Claude의 경우 무료 버전이기는 하지만 GPT보다 조금 더 사용자의 입력값을 우선순위로 따르는 것처럼 보이고 GPT의 경우 광범위한 영역을 자동으로 언급하는 것으로 보인다. 따라서 작문과 같은 조금 더 정확한 출력이 요구된다면 Claude를, 영감을 얻길 원한다면 GPT를 사용하면 될 것으로 생각한다.
글‧사진 / 김도현