# NinjaChat API

## Docs

- [Batch Requests](https://docs.ninjachat.ai/api-reference/endpoints/batch-requests.md): Send multiple requests in a single HTTP call. Each item is processed independently and billed as if it were a separate request to the corresponding endpoint.
- [Chat Completions](https://docs.ninjachat.ai/api-reference/endpoints/chat-completions.md): Generate AI text completions using 24 LLM models. Supports both standard and streaming responses. Cost varies by model tier — see the `model` parameter for pricing details.
- [Image Generation](https://docs.ninjachat.ai/api-reference/endpoints/image-generation.md): Generate images from text prompts using 6 different models. Supports text-to-image and image-to-image editing with a reference URL. Cost varies by model — from $0.03 to $0.10 per image.
- [Model Comparison (beta)](https://docs.ninjachat.ai/api-reference/endpoints/model-comparison-beta.md): Compare outputs from two different models on the same prompt. Returns both responses side-by-side with basic metadata. Pricing is based on the underlying models used.
- [Video Generation](https://docs.ninjachat.ai/api-reference/endpoints/video-generation.md): Start a video generation job. Supports 8 models. **$5.00/video:** `runway-gen4.5` (Runway flagship), `veo-3.1` (Google best quality). **$3.00/video:** `seedance-2` (default, uncensored, 5–15s), `kling-video` (motion quality, 5–10s), `google-veo-2` (fast cinematic, 5/6/8s), `veo-3.1-fast` (speed-opti…
- [Video Generation Status](https://docs.ninjachat.ai/api-reference/endpoints/video-generation-status.md): Check the status of a video generation job created by `POST /api/v1/video`. Poll this endpoint until `status` is `completed` or `failed`. Recommended polling interval: every 10–30 seconds. No additional charge for polling. Works with all video models.
- [Web Search](https://docs.ninjachat.ai/api-reference/endpoints/web-search.md): Search the web, academic papers, or news with an optional AI-generated answer that synthesizes the results. Cost: $0.05 per query.
- [Create API Key](https://docs.ninjachat.ai/api-reference/management/create-api-key.md): Create a new API key. You can have up to 5 active keys per account.
- [Credit Purchase History](https://docs.ninjachat.ai/api-reference/management/credit-purchase-history.md): List all credit purchases for the authenticated user, ordered by most recent first.
- [Estimate Request Costs](https://docs.ninjachat.ai/api-reference/management/estimate-request-costs.md): Estimate the cost of one or more planned API requests before sending them. Useful for budgeting and showing users a price quote.
- [List API Keys](https://docs.ninjachat.ai/api-reference/management/list-api-keys.md): List all your API keys with usage stats and billing info.
- [List Available Models](https://docs.ninjachat.ai/api-reference/management/list-available-models.md): List all available models, including capabilities, pricing tier, and recommended use cases. Supports filtering by tier, capability, and whether a model is virtual (auto/ensemble).
- [Per-Request Usage Logs](https://docs.ninjachat.ai/api-reference/management/per-request-usage-logs.md): Get granular per-request usage logs with filtering. Supports CSV export via format=csv.
- [Revoke API Key](https://docs.ninjachat.ai/api-reference/management/revoke-api-key.md): Revoke an API key. Revoked keys stop working immediately but remain visible in your key list.
- [Claude Haiku 4.5](https://docs.ninjachat.ai/api-reference/models/chat/claude-haiku-4-5.md): claude-haiku-4.5 — Anthropic's fastest model. $0.006/request.
- [Claude Opus 4.6](https://docs.ninjachat.ai/api-reference/models/chat/claude-opus-4-6.md): claude-opus-4.6 — Anthropic's most capable model. $0.030/request.
- [Claude Sonnet 4.5](https://docs.ninjachat.ai/api-reference/models/chat/claude-sonnet-4-5.md): claude-sonnet-4.5 — Anthropic's balanced coding model. $0.006/request.
- [Claude Sonnet 4.6](https://docs.ninjachat.ai/api-reference/models/chat/claude-sonnet-4-6.md): claude-sonnet-4.6 — Anthropic's best for code and complex tasks. $0.015/request.
- [DeepSeek V3](https://docs.ninjachat.ai/api-reference/models/chat/deepseek-v3.md): deepseek-v3 — DeepSeek's coding and math model. $0.003/request.
- [Gemini 2.5 Flash](https://docs.ninjachat.ai/api-reference/models/chat/gemini-2-5-flash.md): gemini-2.5-flash — Google's ultra-fast model. $0.003/request.
- [Gemini 2.5 Pro](https://docs.ninjachat.ai/api-reference/models/chat/gemini-2-5-pro.md): gemini-2.5-pro — Google's structured data analysis model. $0.006/request.
- [Gemini 3.1 Pro](https://docs.ninjachat.ai/api-reference/models/chat/gemini-3-1-pro.md): gemini-3.1-pro — Google's latest reasoning model. $0.006/request.
- [Gemini 3 Flash](https://docs.ninjachat.ai/api-reference/models/chat/gemini-3-flash.md): gemini-3-flash — Google's fast and affordable model. $0.003/request.
- [Gemini 3 Pro](https://docs.ninjachat.ai/api-reference/models/chat/gemini-3-pro.md): gemini-3-pro — Google's multi-modal reasoning model. $0.006/request.
- [GLM 5](https://docs.ninjachat.ai/api-reference/models/chat/glm-5.md): glm-5 — Zhipu's bilingual Chinese/English model. $0.003/request.
- [GPT-5](https://docs.ninjachat.ai/api-reference/models/chat/gpt-5.md): gpt-5 — OpenAI's general-purpose model. $0.006/request.
- [GPT-5 Mini](https://docs.ninjachat.ai/api-reference/models/chat/gpt-5-mini.md): gpt-5-mini — OpenAI's fast, lightweight model. $0.003/request.
- [Grok 4](https://docs.ninjachat.ai/api-reference/models/chat/grok-4.md): grok-4 — xAI's model with real-time knowledge. $0.006/request.
- [Kimi K2](https://docs.ninjachat.ai/api-reference/models/chat/kimi-k2.md): kimi-k2 — Moonshot's instruction-following model. $0.006/request.
- [Kimi K2.5](https://docs.ninjachat.ai/api-reference/models/chat/kimi-k2-5.md): kimi-k2.5 — Moonshot's advanced reasoning model. $0.006/request.
- [Llama 4 Maverick](https://docs.ninjachat.ai/api-reference/models/chat/llama-4-maverick.md): llama-4-maverick — Meta's multi-modal open-source model. $0.006/request.
- [Llama 4 Scout](https://docs.ninjachat.ai/api-reference/models/chat/llama-4-scout.md): llama-4-scout — Meta's multilingual open-source model. $0.003/request.
- [MiniMax M2.5](https://docs.ninjachat.ai/api-reference/models/chat/minimax-m2-5.md): minimax-m2.5 — MiniMax's creative writing model. $0.003/request.
- [Mistral Large](https://docs.ninjachat.ai/api-reference/models/chat/mistral-large.md): mistral-large — Mistral's multilingual model. $0.006/request.
- [Ninja 1](https://docs.ninjachat.ai/api-reference/models/chat/ninja-1.md): ninja-1 — NinjaChat's general-purpose model. $0.003/request.
- [o3-mini](https://docs.ninjachat.ai/api-reference/models/chat/o3-mini.md): o3-mini — OpenAI's reasoning and math specialist. $0.006/request.
- [QwQ 32B](https://docs.ninjachat.ai/api-reference/models/chat/qwq-32b.md): qwq-32b — Qwen's math and logic specialist. $0.003/request.
- [Uncensored AI](https://docs.ninjachat.ai/api-reference/models/chat/uncensored-ai.md): uncensored-ai — Unrestricted content generation. $0.003/request.
- [FLUX.1 Fill](https://docs.ninjachat.ai/api-reference/models/image/flux-1-fill.md): flux-1-fill — AI inpainting, outpainting, and image extension. $0.05/image.
- [FLUX.1 Pro Ultra](https://docs.ninjachat.ai/api-reference/models/image/flux-1-pro-ultra.md): flux-1-pro-ultra — Ultra-high resolution up to 4MP. $0.08/image.
- [FLUX.2 Flex](https://docs.ninjachat.ai/api-reference/models/image/flux-2-flex.md): flux-2-flex — Premium quality with exceptional detail. $0.08/image.
- [FLUX.2 Klein](https://docs.ninjachat.ai/api-reference/models/image/flux-2-klein.md): flux-2-klein — Fastest FLUX model, optimized for speed. $0.03/image.
- [FLUX.2 Pro](https://docs.ninjachat.ai/api-reference/models/image/flux-2-pro.md): flux-2-pro — Balanced quality, speed, and cost. $0.05/image.
- [FLUX Kontext Max](https://docs.ninjachat.ai/api-reference/models/image/flux-kontext-max.md): flux-kontext-max — Premium context-aware editing, maximum fidelity. $0.10/image.
- [FLUX Kontext Pro](https://docs.ninjachat.ai/api-reference/models/image/flux-kontext-pro.md): flux-kontext-pro — Context-aware image editing. $0.05/image.
- [Google Imagen 4](https://docs.ninjachat.ai/api-reference/models/image/google-imagen-4.md): google-imagen-4 — Google's photorealistic image model. $0.08/image.
- [Nano Banana](https://docs.ninjachat.ai/api-reference/models/image/nano-banana.md): nano-banana — Fast image generation for high-volume tasks. $0.03/image.
- [Nano Banana 2](https://docs.ninjachat.ai/api-reference/models/image/nano-banana-2.md): nano-banana-2 — Best value image generation with text rendering. $0.05/image.
- [Nano Banana Pro](https://docs.ninjachat.ai/api-reference/models/image/nano-banana-pro.md): nano-banana-pro — Professional asset production. $0.08/image.
- [Recraft V3](https://docs.ninjachat.ai/api-reference/models/image/recraft-v3.md): recraft-v3 — Design and illustration specialist. $0.08/image.
- [Seedream](https://docs.ninjachat.ai/api-reference/models/image/seedream.md): seedream — Realistic and artistic styles. $0.08/image.
- [Google Veo 2](https://docs.ninjachat.ai/api-reference/models/video/google-veo-2.md): google-veo-2 — Fastest generation with high visual quality. $3.00/video.
- [Google Veo 3 Fast](https://docs.ninjachat.ai/api-reference/models/video/google-veo-3-fast.md): google-veo-3-fast — Budget-friendly Veo with fast generation. $3.00/video.
- [Kling Video](https://docs.ninjachat.ai/api-reference/models/video/kling-video.md): kling-video — Superior motion quality and scene coherence. $3.00/video.
- [Runway Gen-4.5](https://docs.ninjachat.ai/api-reference/models/video/runway-gen4-5.md): runway-gen4.5 — Runway's flagship cinematic text-to-video. $5.00/video.
- [Runway Gen-4 Turbo](https://docs.ninjachat.ai/api-reference/models/video/runway-gen4-turbo.md): runway-gen4-turbo — Fast image-to-video for product demos. $3.00/video.
- [Seedance 2](https://docs.ninjachat.ai/api-reference/models/video/seedance-2.md): seedance-2 — Longest clips up to 15s with unrestricted content. $3.00/video.
- [Veo 3.1](https://docs.ninjachat.ai/api-reference/models/video/veo-3-1.md): veo-3.1 — Google's highest quality video generation. $5.00/video.
- [Veo 3.1 Fast](https://docs.ninjachat.ai/api-reference/models/video/veo-3-1-fast.md): veo-3.1-fast — Speed-optimized variant of Google's best model. $3.00/video.
- [Create Session](https://docs.ninjachat.ai/api-reference/sessions/create-session.md): Create a persistent conversation session. Use the returned session_id with the chat endpoint to maintain context across messages.
- [Delete Session](https://docs.ninjachat.ai/api-reference/sessions/delete-session.md): Permanently delete a session and its stored messages.
- [Export Session](https://docs.ninjachat.ai/api-reference/sessions/export-session.md): Export a session as JSON or Markdown.
- [Retrieve Session](https://docs.ninjachat.ai/api-reference/sessions/retrieve-session.md): Get the full message history and metadata for a session.
- [Authentication](https://docs.ninjachat.ai/authentication.md): Set up your API key and add it to every request.
- [Batch](https://docs.ninjachat.ai/batch.md): Send up to 20 prompts in one API call. They all run in parallel.
- [Budget Routing](https://docs.ninjachat.ai/budget-routing.md): Set a cost ceiling per request and get the best model within it.
- [Chat Completions](https://docs.ninjachat.ai/chat.md): Send messages to any model and get a response.
- [Model Compare](https://docs.ninjachat.ai/compare.md): Run one prompt against multiple models and get ranked results.
- [Ensemble](https://docs.ninjachat.ai/ensemble.md): Three models answer, a fourth synthesizes. Consensus-driven responses.
- [Error Handling](https://docs.ninjachat.ai/error-handling.md): Every error code, what it means, and what to do about it.
- [Cost Estimation](https://docs.ninjachat.ai/estimate.md): Check what a request will cost before you run it. Always free.
- [Fallback Chains](https://docs.ninjachat.ai/fallback-chains.md): Try models in sequence — if one fails or scores low, the next one runs.
- [Image Generation](https://docs.ninjachat.ai/image-generation.md): Generate images from text with 13 models via one endpoint.
- [NinjaChat API](https://docs.ninjachat.ai/index.md): One API key for GPT-5, Claude, Gemini, and 30+ more models.
- [Models](https://docs.ninjachat.ai/models.md): Quick guide to picking the right model for your use case.
- [Models](https://docs.ninjachat.ai/models-overview.md): Explore all available models on the NinjaChat API.
- [Pricing](https://docs.ninjachat.ai/pricing.md): Per-request pricing with no token counting. Every response includes its cost.
- [Quality Scoring](https://docs.ninjachat.ai/quality-scoring.md): Get a confidence score with every response. Auto-retry if it's too low.
- [Quickstart](https://docs.ninjachat.ai/quickstart.md): Get an API key and make your first request in under a minute.
- [Rate Limits](https://docs.ninjachat.ai/rate-limits.md): Limits per endpoint, response headers, and retry patterns.
- [Web Search](https://docs.ninjachat.ai/search.md): Search the web and get AI-synthesized answers with cited sources.
- [Sessions](https://docs.ninjachat.ai/sessions.md): Server-side conversation memory that persists for 7 days.
- [Smart Routing](https://docs.ninjachat.ai/smart-routing.md): Set model to auto and NinjaChat picks the best model for each prompt.
- [Streaming](https://docs.ninjachat.ai/streaming.md): Stream responses token-by-token over server-sent events.
- [Video Generation](https://docs.ninjachat.ai/video-generation.md): Generate videos from text or images. Async submit-and-poll workflow.

## OpenAPI Specs

- [openapi](https://docs.ninjachat.ai/openapi.json)

## Optional

- [Dashboard](https://www.ninjachat.ai/developers)
- [Playground](https://www.ninjachat.ai/developers/playground)