인류애적인 클로드
-
Claude Opus 4.7
주요 추론, 긴 맥락, 아키텍처 및 전략 작업.
-
Claude Opus 4.6
안정적인 고품질 분석을 위한 이전 세대 Opus입니다.
-
Claude Sonnet 4.6
일일 드라이버 - 코딩, 쓰기 및 다단계 에이전트 루프.
-
Claude Sonnet 4.5 / 4
지원되는 워크로드에 대한 즉각적인 캐싱을 갖춘 Fast Sonnet 계층.
-
Claude Haiku 4.5
지연 시간이 짧은 초안, 분류 및 대용량 하위 작업.
오픈AI
-
GPT-5.5 / GPT-5.4 / GPT-5.2
일반 및 에이전트 워크로드를 위한 최신 GPT-5 제품군입니다.
-
GPT-4.1 & GPT-4o
프로덕션 에이전트를 위한 안정적인 다중 모드 채팅 및 도구 사용.
-
GPT-4o mini
요약 및 간단한 단계를 위한 비용 효율적인 라우팅입니다.
-
o3 / o3-pro / o3-mini / o4-mini
수학, 계획, 검증을 위한 추론 중심 모델입니다.
-
GPT-5.3 Codex & Codex mini
코드 생성, 리팩터링 및 리포지토리 인식 에이전트 기술.
구글 제미니
-
Gemini 2.5 Pro
장기 상황 조사 및 구조화된 추출.
-
Gemini 2.5 Flash
경쟁력 있는 토큰 요율로 처리량이 높은 에이전트 단계입니다.
-
Gemini 2.0 Flash
구문 분석, 태그 지정 및 일괄 작업을 위한 초고속 패스입니다.
개방형 및 전문 API
-
DeepSeek Chat & Reasoner
채팅 및 사고방식 스타일 작업에 대한 강력한 가치.
-
Mistral Large
다국어 상담사 팀을 위한 유럽 호스팅 옵션입니다.
-
Llama 3.3 70B
API를 통한 개방형 가중치 클래스 모델 - 프라이빗 GPU와 잘 어울립니다.
-
Grok 3
뉴스 및 소셜 모니터링 에이전트를 위한 실시간 지향 모델입니다.
-
Sonar Pro
연구 대리인을 위한 검색 기반 답변.
-
Command R+
RAG 친화적인 기업 채팅 및 검색 작업 흐름.
Model list and token economics evolve with provider releases. Your workspace shows live options when you assign a model to an agent; Digio Tokens debit from the same balance as in
pricing.
-
1
GPU 예약
VRAM, 지역 및 가동 시간(버스트 대 상시 켜짐)을 선택합니다. 무게를 위한 스토리지는 인스턴스와 함께 배송되거나 버킷에 마운트됩니다.
-
2
스택 배포
제공 이미지 또는 SSH를 시작하고 CUDA 드라이버를 설치하고 체크포인트를 로드합니다. 상태 확인을 통해 모델이 준비되었는지 확인합니다.
-
3
엔드포인트 등록
작업공간 설정에 기본 URL, API 키, 모델 ID를 추가하세요. Digio는 라이브로 전환하기 전에 대기 시간과 토큰 형식을 검증합니다.
-
4
상담원에게 할당
선택한 에이전트의 기본값으로 개인 모델을 선택하세요. 관리형 Claude/GPT 모델은 계속해서 나란히 사용할 수 있습니다.
GPU 임대 비용은 Digio 요금제 구독과 별도로 청구됩니다. 용량 계획, SLA, 기존 추론 클러스터에서의 마이그레이션에 대해서는 당사에 문의하세요.