가입과 동시에 비용이 청구되나요?

아니요. 무료 크레딧이 제공되며, 무료 크레딧이 소진되기 전까지 어떠한 청구도 발생하지 않습니다. 별도 약정도 없습니다.

하나의 계정에 API Key를 여러 개 만들 수 있나요?

네. 프로젝트별·환경별로 여러 키를 발급해 사용할 수 있으며, 키마다 라벨을 지정해 사용량을 구분 추적할 수 있습니다.

이미 보유한 API Key가 있다면 그대로 활용할 수 있나요?

네. BYOK(Bring Your Own Key) 기능으로 보유 중인 API Key를 등록해 그대로 사용할 수 있습니다.

특정 Provider 장애 시에는 어떻게 처리되나요?

자동 폴백 기능이 활성화되어 있으면 사전 정의된 대체 프로바이더로 즉시 전환되어 서비스 중단을 최소화합니다.

AI가 답변에 실패하는 경우에도 과금되나요?

아니요. ZCI(Zero Completion Insurance) 정책이 적용되어, 실패한 요청은 과금되지 않습니다.

지원 모델은 계속 추가되나요?

네. 새로운 모델·Provider는 지속적으로 추가됩니다. 모델이 추가되어도 기존 코드 수정 없이 즉시 호출할 수 있습니다.

내가 원하는 AI 모델을
한 곳에서 자유롭게

Claude · Gemini · Qwen · Llama · DeepSeek 등
LLM Router는 여러 AI 모델을 연결해
상황에 맞는 모델을 고르고, 장애 시 즉시 전환합니다.

무료 크레딧으로 시작하기

POST /v1/chat/completions

// 1. Single endpoint, any provider — OpenAI 호환 const res = await client.chat.completions.create({ model: "cafe24/auto", // or "claude-sonnet-4-6" messages: [{ role: "user", content: "..." }] })

// → routed to openai/gpt-4o-mini in 940ms res.model → "gpt-4o-mini-2024-07-18" res.extra_fields.provider → ⚡ openai res.extra_fields.resolved_model_used → "gpt-4o-mini" res.extra_fields.latency → 940 // 토큰·원화 비용은 자동 집계 → 대시보드/사용량에서 확인

100+

지원 모델

15+

지원 모델 패밀리

Multi

멀티 Provider 라우팅

Auto

자동 Fallback

Claude

Gemini

Qwen

Llama

DeepSeek

GLM

Gemma

Seed

Nemotron

Mistral

GPT-OSS

MiMo

Kimi

Hunyuan

Phi

Step

MiniMax

Ling

MythoMax

Solar

Claude

Gemini

Qwen

Llama

DeepSeek

GLM

Gemma

Seed

Nemotron

Mistral

GPT-OSS

MiMo

Kimi

Hunyuan

Phi

Step

MiniMax

Ling

MythoMax

Solar

AI 도입 후 마주하는 문제를 해결합니다.

이제는 모델 선택, 비용 관리, 장애 대응까지 한 곳에서 관리할 수 있습니다.

모델 바꿀 때마다 코드 수정

Claude, Gemini, Qwen, Llama, DeepSeek...
모델마다 다른 연동 방식 때문에
테스트와 유지보수 시간이 늘어납니다.

하나의 API로 여러 모델을 호출

매일 쏟아지는 AI 모델

눈만 뜨면 매일 새로운 모델이 출시...
비싼 모델만 쓰면 비용 부담, 저렴한 모델은 품질 부족.
작업 · 트래픽에 따라 최적 모델 선택에 힘이 듭니다.

Auto Router가 프롬프트 분석해 최적 모델 선택

AI 장애가 곧 서비스 중단

하나의 AI 모델에 모든 서비스 연동...
혹시 AI 모델에 문제가 생기면 어쩌지.
서비스가 중단될까봐 불안합니다.

장애 감지 시 즉시 다른 AI 프로바이더로 전환

이런 분들께 추천합니다.

빠른 AI, 정확한 AI, 끊김없는 안정적인 운영이 모두 필요한 곳.

무중단 안정성

CS · 고객 응대

쓰던 AI가 갑자기 느려지거나 멈춰도 다른 AI로 자동 전환되어 고객 상담이 끊기지 않아요.문의가 몰리는 시간에도 안정적으로 답변을 이어갈 수 있어, 24시간 운영되는 챗봇이나 상담 어시스턴트에 적합해요.

운영 비용 절감

쇼핑몰 · 운영 자동화

상품 설명은 더 똑똑한 AI로, 단순 문의 분류나 리뷰 요약은 저렴한 AI로 나눠 쓸 수 있어요.작업에 맞는 AI를 자동으로 선택해 쇼핑몰 운영 시간과 비용을 함께 줄일 수 있어요.

유연한 모델 운영

AI 서비스 · 앱 빌더

AI 사주 채팅, AI 상담, AI 튜터, AI 캐릭터챗처럼 AI 기반 서비스를 운영할 때 적합해요.무료 이용자는 비용 효율적인 모델로, 유료 이용자는 고성능 모델로 연결해 비용과 서비스 품질을 함께 관리할 수 있어요.

비용 효율

콘텐츠 · 마케팅

초안 작성과 요약은 저렴한 AI로 빠르게 만들고, 광고 문구나 최종 카피는 더 좋은 AI로 다듬을 수 있어요.콘텐츠 제작 속도는 높이고, 꼭 필요한 부분에만 고성능 AI를 사용해 비용을 아낄 수 있어요.

보안·거버넌스

엔터프라이즈 · 금융

조직에서 사용할 수 있는 AI 모델을 미리 정하고, 누가 얼마나 사용했는지 기록으로 남길 수 있어요.보안과 관리 기준이 중요한 업무에서도 AI 사용 현황을 확인하며 안전하게 운영할 수 있어요.

업무 효율

교육 · 연구

수업 자료 요약이나 수준별 설명은 빠른 AI로, 논문 분석이나 연구 아이디어 정리는 성능 좋은 AI로 처리할 수 있어요.교육과 연구 업무에 맞게 AI를 나눠 써서 자료 준비 시간을 줄이고 결과물 품질을 관리할 수 있어요.

AI Agent로 자동화 작업이 가능합니다.

반복 업무를 처리하고, 중요한 맥락은 기억하는 나만의 AI 비서가 생깁니다.

자동화 에이전트

오픈클로 OpenClaw

새벽 CS 문의 1차 자동 응대
매출·광고·ROAS 자동 집계 브리핑
품절·재고 부족 상품 자동 감지 알림
예약·노쇼 리마인드 자동 발송
SNS·블로그 콘텐츠 예약 발행 자동화

오픈클로 바로가기

기억·성장 에이전트

헤르메스 에이전트 Hermes Agent

브랜드 톤 기억해 상세·기획전 문구 생성
상담 히스토리 이어받아 응대
채널 톤·과거 게시물 기억해 일관된 콘텐츠 작성
단골 고객 구매 이력 기억해 맞춤 상품 추천
반품·클레임 이력 축적해 반복 원인 분석

헤르메스 에이전트 바로가기

데모가 아닌, 프로덕션을 위한 설계.

비용·성능·안정성을 동시에 만족시키는 통합 LLM 인프라.

100+ Models, 1 SDK

Claude, Gemini, Qwen, Llama, DeepSeek, Mistral, MiniMax 등 — 주요 패밀리를 동일한 호출로 사용합니다.

claude-sonnet-4-6

gemini-3.1-pro

qwen3-72b

llama-3.3

deepseek-v3

glm-4.5

Auto Router

프롬프트를 분석하여 코딩·추론·번역·창작 등 유형을 자동 판별하고 최적 모델을 선택합니다.

PROMPT"React 무한 스크롤 코드 만들어줘"

코딩 추론 번역 창작

코딩 감지 → claude-sonnet-4-6

Provider Routing

비용·속도·처리량 등 원하는 기준에 맞춰 프로바이더 우선순위를 설정할 수 있습니다.

price

latency

throughput

balanced

Auto Fallback

장애·타임아웃 시 사전 정의된 대체 경로로 즉시 전환합니다. 실패한 호출은 과금되지 않습니다.

qwen3-72b

→

llama-3.3-70b

→

deepseek-v3

Preset

Primary 모델, System Prompt, Sampling, 다단계 Fallback 체인을 하나로 묶어 저장합니다. 호출은 한 줄, 조정은 콘솔에서. 코드 재배포 ZERO.

# 호출은 단 한 줄 client.chat( model=@preset/cs-bot, messages=msgs, )

cs-bot

primaryqwen3-72b

fallbackllama-3.3→deepseek-v3→mistral-large

temp0.3 · top_p 0.9

block✕ azure · ✕ groq

Managed Cache

Semantic Cache를 통해 LLM 호출 자체를 스킵해 토큰 비용을 절감하고, 응답은 ms 단위로 반환합니다.

Q"환불 처리는 어떻게 하나요?"

SEMANTIC HIT0 tokens · 8ms

Q"환불은 어떻게 받나요?"

SEMANTIC HIT0 tokens · 6ms

Q"교환 정책 알려줘"

MISS → LLM1,247 tokens · 1.4s

Privacy & 거버넌스

로그 및 모델에 전달되는 데이터의 민감 정보 자동 마스킹을 제공합니다.

✓PII Mask 적용

✓로그 마스킹

✓모델 전달 데이터 마스킹

BYOK

보유 중인 LLM 모델 키를 그대로 등록합니다. BYOK 모드로 비용을 직접 통제할 수 있습니다.

OOpenAI · sk-...active

AAnthropic · sk-ant-...active

BGoogle · AIzaSy...active

Realtime Dashboard

요청·비용·토큰 추이, 모델별 비용 비중, 성공/실패 비율을 한 화면에서 확인합니다. 요청 단위 상세 로그까지 제공합니다.

requests / 24h

128.4k +12%

cost / 24h

₩64,200 −8%

Playground & 비교 테스트

모델을 코드 없이 테스트합니다. 서비스에 가장 적합한 모델을 선택할 수 있습니다.

qwen3-72bFASTEST

TTFT286ms

throughput148 t/s

cost₩16

llama-3.3-70b

TTFT412ms

throughput92 t/s

cost₩24

무료 크레딧으로 먼저 시작하세요.

가입 즉시 1,000 크레딧을 제공하고, 월 기본료 없이 사용한 만큼만 차감됩니다.

가입 즉시 1,000 크레딧 무료 지급

1,000 크레딧 가입 시 무료 제공

월 기본료도, 약정도 없는 크레딧 종량제예요.
크레딧은 사용한 만큼만 차감됩니다.

무료 크레딧으로 시작하기

월 기본료·구독·약정 없음
입력·출력 토큰 단위로 정확히 차감
실패한 호출은 과금 제외 (ZCI)
카드 등록 시 자동 충전 지원
모든 요금 및 과금은 원화 기반
세금계산서 발행 지원

한 번의 요청, 최적 경로로 자동 라우팅.

step.01

Single request

OpenAI 호환 형식으로 단일 엔드포인트에 호출합니다.

POST /v1/chat/completions

step.02

Auto Router

프롬프트를 분석해 최적 모델을 선택합니다.

detected: 코딩 → claude-sonnet-4-6

step.03

Provider Routing

원하는 기준에 맞춰 프로바이더 우선순위를 적용합니다.

strategy=balanced

step.04

Auto Fallback

장애·타임아웃 시 사전 정의된 대체 경로로 즉시 전환합니다.

fallback → deepseek-v3

step.05

Unified response

표준화된 응답과 메타데이터를 함께 반환합니다.

cost: ₩4.20 · 412ms

자주 묻는 질문

LLM Router는 여러 AI 모델을 연결해주는 ‘AI 연결 허브’와 같습니다. 작업 내용에 따라 최적의 모델을 자동으로 고르게 할 수도 있고, 필요한 모델을 직접 선택할 수도 있습니다.
예를 들어 상품 설명 작성은 성능 좋은 AI로, 리뷰 요약이나 문의 분류는 빠르고 저렴한 AI로 처리할 수 있습니다. 가입하시면 콘솔로 바로 이동해 사용 가이드를 확인할 수 있습니다.
아니요. 서비스를 처음 가입하면 1,000 크레딧이 무료로 지급됩니다. 해당 크레딧을 다 사용하기 전까지는 청구가 발생하지 않고, 카드 등록이나 최소 약정도 필요하지 않습니다.
네. 목적별·프로젝트별로 여러 키를 발급해 사용할 수 있으며, 키마다 사용 이력 및 사용량 등을 확인할 수 있어 관리가 편리합니다.
자동 폴백을 설정해두면 멈추지 않습니다. 장애가 감지되는 즉시 대체 AI 프로바이더로 요청이 넘어가 서비스가 중단되지 않습니다.
아니요. 답변에 실패한 요청은 과금되지 않습니다. 에러가 나지 않고 정상적으로 답변이 출력된 경우에만 크레딧이 차감됩니다.
네. 새로운 AI 모델·프로바이더는 지속적으로 추가됩니다. 모델이 추가되어도 기존 코드 수정 없이 즉시 사용할 수 있습니다.
네. 기존에 보유하고 있는 AI 모델 계정의 API Key를 등록해 사용할 수 있습니다. 등록된 API Key가 먼저 사용되며, 사용량 소진 등으로 인해 호출 실패 시 카페24 LLM Router 크레딧에서 차감됩니다.

내가 원하는 AI 모델을
내가 필요한 곳에 사용해보세요.

무료 크레딧으로 시작하기

내가 원하는 AI 모델을한 곳에서 자유롭게

AI 도입 후 마주하는 문제를 해결합니다.

이런 분들께 추천합니다.

AI Agent로 자동화 작업이 가능합니다.

오픈클로 OpenClaw

헤르메스 에이전트 Hermes Agent

데모가 아닌, 프로덕션을 위한 설계.

무료 크레딧으로 먼저 시작하세요.

한 번의 요청, 최적 경로로 자동 라우팅.

Single request

Auto Router

Provider Routing

Auto Fallback

Unified response

자주 묻는 질문

내가 원하는 AI 모델을내가 필요한 곳에 사용해보세요.

내가 원하는 AI 모델을
한 곳에서 자유롭게

내가 원하는 AI 모델을
내가 필요한 곳에 사용해보세요.