Claude API vs Claude Pro Max — 실제 비용 계산과 선택 기준
지난달 Anthropic API 청구서를 열었을 때, $1,247이 찍혀 있었어요. Sonnet을 매일 코드 리뷰에 돌리고 Opus로 문서 작업을 맡기다 보니 어느새 이 정도가 됐더라고요. "Max 구독으로 바꾸면 $100로 끝나는 거 아냐?"라는 생각이 들었지만, 막상 계산해보니 전혀 달랐습니다. 이 글에서는 실제 토큰 사용량 기반으로 손익분기점을 계산하는 방법을 공유할게요. 월 $1k 이상 쓰는 개발자라면 구독 전환이 무조건 이득이 아니라는 걸 알게 될 거예요.
API 요금제 — 토큰 단가를 먼저 파악하세요
Claude API는 입력 토큰과 출력 토큰을 따로 세서 청구합니다. Sonnet 3.5 기준으로 입력은 $3/MTok, 출력은 $15/MTok이에요 (출처: Anthropic API 요금제 공식 페이지). Opus는 훨씬 비싸서 입력 $15, 출력 $75입니다. 제가 5월에 돌린 작업을 보면 Sonnet 입력 230만 토큰, 출력 45만 토큰이 나왔어요. 계산하면 $(230 \times 3 + 45 \times 15) / 1000 = $7.65$죠. 하루치 비용입니다.
문제는 출력 토큰이 예상보다 빠르게 쌓인다는 거예요. 코드 전체를 생성하거나 긴 문서를 요약할 때는 출력이 입력의 2배를 넘기기도 합니다. 입력 10만, 출력 20만이면 Sonnet 기준 $(10 \times 3 + 20 \times 15) / 1000 = $3.3$인데, 하루 10번만 돌려도 $33이에요. 한 달이면 $990입니다.
토큰 카운트를 정확히 추적하려면 API 응답의 usage 필드를 로그로 남겨두세요. OpenAI tiktoken 라이브러리로 사전 추정도 가능하지만, 실제 청구는 Anthropic 자체 토크나이저 기준이라 5~10% 차이가 날 수 있어요.
구독 요금제 — 사용량 제한이 숨어 있습니다
Claude Pro는 월 $20, Max는 $100입니다 (출처: Claude Pro/Max 구독 요금 정책). 무제한처럼 보이지만 실제로는 'rate limit'이라는 제한이 있어요. Max 기준으로 Opus 하루 최대 500회, Sonnet 1000회 정도로 알려져 있는데, 공식 문서에 명시된 숫자는 아니고 사용자 커뮤니티 보고 기반입니다. 제가 Max 무료 체험 기간에 써봤을 때는 Sonnet을 하루 600회 넘게 쓰자 "capacity reached" 메시지가 떴어요.
또 하나 중요한 건, 구독은 웹 인터페이스로만 쓸 수 있다는 점이에요. API 키를 받아서 자동화 스크립트에 연결하거나 CI/CD 파이프라인에 넣을 수 없습니다. 매번 브라우저 열어서 복붙해야 하죠. 저처럼 GitHub Actions에서 코드 리뷰를 자동으로 돌리는 경우엔 구독이 아예 선택지가 안 됩니다.
Stack Overflow 2024 AI 도구 비용 조사를 보면, 월 500회 이상 LLM을 쓰는 개발자 중 API 사용자가 구독 대비 평균 32% 저렴하다고 응답했어요 (출처: Stack Overflow 2024 AI 도구 비용 조사). 자동화 워크플로우를 구축한 경우 API가 압도적으로 유리하다는 뜻이죠.
손익분기점 계산 — 월 청구액으로 판단하세요
손익분기점을 계산하려면 한 달 동안 쓴 총 토큰 수를 먼저 파악해야 합니다. 제 경우 5월 전체 사용량은 Sonnet 입력 720만, 출력 135만 토큰이었어요. 비용은 $(720 \times 3 + 135 \times 15) / 1000 = $23.7$입니다. Max $100보다 훨씬 싸네요. 그럼 구독이 이득일까요? 아니에요.
제가 놓친 건 자동화 가치였어요. API로 돌리면 GitHub PR마다 자동 리뷰가 붙고, 커밋 메시지 생성, 테스트 케이스 작성까지 스크립트로 처리됩니다. 이걸 구독으로 바꾸면 매번 수동으로 복붙해야 해요. 시간당 $50로 환산하면 하루 30분 소요 = 월 $400 손실입니다. API 비용 $24 + 자동화 유지 = 총비용 $24이지만, 구독 전환 시 $100 + 수동 작업 $400 = $500이 돼요.
반대로 월 $1,500 이상 쓰는 경우를 봅시다. Opus를 하루 100만 토큰(입출력 합산) 수준으로 돌리면 한 달에 $(15 + 75) \times 100 \times 30 / 1000 = $270,000 / 1000 = $2,700$이 나와요. 이 경우 Max $100이 압도적으로 저렴하죠. 단, rate limit에 걸리지 않는다는 전제가 필요합니다. 하루 500회 제한을 넘으면 결국 API를 병행해야 해요.
제가 3개월 동안 API 청구액 추이를 추적해봤더니 흥미로운 패턴이 보였어요. 3월 $87, 4월 $152, 5월 $1,247로 급증했는데, 원인은 Opus 사용량이었습니다. 3월엔 Sonnet만 썼고, 4월부터 Opus를 주 2회 문서 작업에 투입했어요. 5월엔 거의 매일 Opus를 돌렸죠. 입력 토큰은 비슷했지만(월 700만~800만), 출력 토큰이 3월 120만에서 5월 180만으로 늘었고, Opus 비중이 10%에서 45%로 뛰었습니다. 결국 모델 선택과 출력 길이가 청구액을 좌우한다는 걸 확인했어요.
제가 쓰는 기준은 이래요. API 월 청구액 $50 미만 → API 유지, $50~$500 → 자동화 필요 여부로 판단, $500 이상 → Max + API 병행. 자동화가 필수라면 어차피 API는 남겨둬야 합니다.
실제 선택 시나리오 — 제 사례로 정리해볼게요
제 워크플로우는 이렇습니다. 아침에 슬랙 봇이 전날 PR 요약을 보내주고, 점심에 문서 초안을 Opus로 생성하고, 저녁에 코드 리뷰를 Sonnet으로 돌립니다. 월 청구액은 $80~$120 사이예요. Max $100이 저렴해 보이지만, 자동화를 포기할 순 없어서 API를 그대로 씁니다.
동료 한 명은 주로 브라우저에서 Claude를 대화형으로 쓰는데, 하루 20~30회 정도예요. 이 경우 Pro $20이 API보다 훨씬 이득입니다. API로 환산하면 하루 입력 5만, 출력 3만 토큰 = $(5 \times 3 + 3 \times 15) / 1000 = $0.6$, 월 $18 정도라 비슷해 보이지만, 토큰 추적 부담 없이 쓸 수 있다는 게 Pro의 장점이죠.
또 다른 팀원은 Opus를 하루 200만 토큰씩 써서 월 $3,000 넘게 나왔어요. 이 경우 Max $100 + rate limit 초과분 API 병행이 최적입니다. 실제로 전환했더니 $100 + $800 = $900으로 줄었다고 하더라고요.
캐싱 기능을 활용하면 비용을 더 줄일 수 있습니다. 저는 코드 리뷰 프롬프트에 프로젝트 컨텍스트 50만 토큰을 매번 넣었는데, Anthropic Prompt Caching을 적용하니 두 번째 호출부터 캐시 히트로 입력 토큰이 90% 줄었어요. 하루 10회 리뷰 기준으로 입력 토큰이 500만에서 50만으로 떨어졌고, 월 비용이 $(500 \times 3) / 1000 \times 30 = $45$에서 $(50 \times 3) / 1000 \times 30 = $4.5$로 감소했습니다. 캐싱 TTL은 5분이라 배치 작업에 특히 유리해요. 출처는 공식 페이지에서 확인하세요. 변동될 수 있으니까요.
배치 API도 고려할 만합니다. 제가 야간 문서 생성 작업 100건을 배치로 몰아서 돌렸더니, 동기 API 대비 50% 할인이 적용됐어요. 입력 $3/MTok이 $1.5/MTok으로 떨어진 거죠. 단, 응답 시간이 평균 12시간 걸려서 실시간 워크플로우엔 못 써요. 야간 리포트나 주간 요약처럼 시간 여유가 있는 작업에만 쓸 만합니다.
정리하면, 대화형·탐색 작업 → 구독, 자동화·배치 작업 → API, 대량 사용 → 둘 다입니다. 월 청구액만 보지 말고, 얼마나 자동화에 의존하는지를 먼저 따져보세요. 요금·플랜은 공식 페이지에서 확인하세요. 변동될 수 있으니까요.
관련해서 API 토큰 추적 자동화 방법이나 구독 rate limit 우회 팁은 다음 글에서 다뤄볼게요.