Help Center

Models

Bugfixes / Misc

Features

Token

Characters

veniceai

New Submission

Backlog

In Review

Planned

Up next

In Progress

Completed

Rejected

High Priority

Low Priority

New Model

Chat

History

Image

Support

Web Search

Backup / Sync

Staking Contract

Voice

Points

Settings

Code

Folders

Payment

Video

UI Design

Stickers

Merchandise

Censorship

Context Window

Social

Enhance Prompt

Plugin

File Upload

Upscale/Enhance

Edit Prompt

Language

Privacy

Venice Pro

System Prompts

Vision

LoRAs

Image Editing

Memory

Social Feed

Artifacts

Auto Mode

Blog

Incentive Fund

Agents

Model Deprecation

Credits

Library

Projects

Marketing

Here’s what Venice is working on next!

Next up

Roadmap

All completed and shipped community requested feature requests and improvements can be seen here.

Done

Shipped Features

Hey {name|there}! 👋

Currently, <a target="_blank" rel="noopener noreferrer nofollow" class="link" href="http://Venice.ai">Venice.ai</a>'s pricing model is optimized around API access, which creates unpredictable costs for developers using AI coding assistants (Claude Code, OpenCode, Crush, Kilo, VS Code extensions, etc.). This makes it difficult to justify Venice as a primary coding AI compared to alternatives like:<ul><li>Claude Pro/Max — flat monthly rate with coding access</li><li>OpenAI Codex/Copilot — predictable subscription pricing</li><li>Cursor — usage-included plans</li></ul>Developers want Venice's privacy-first, uncensored models for coding, but the API-cost model creates budget uncertainty, especially during heavy development sprints where token usage can spike dramatically.<div data-type="horizontalRule"><hr></div><h2>Proposed Solution</h2>Introduce a Venice Coding Plan — a flat-rate or tiered subscription that provides coding-focused access based on usage thresholds (messages/interactions per month) rather than raw API token costs.<h3>Plan Structure (Suggested Tiers)</h3><table style=""><colgroup><col><col><col><col></colgroup><tbody><tr><td colspan="1" rowspan="1">Tier</td><td colspan="1" rowspan="1">Rate</td><td colspan="1" rowspan="1">Usage</td><td colspan="1" rowspan="1">Target User</td></tr><tr><td colspan="1" rowspan="1">Coder</td><td colspan="1" rowspan="1">$20/mo</td><td colspan="1" rowspan="1">~2,000 coding interactions</td><td colspan="1" rowspan="1">Individual developers</td></tr><tr><td colspan="1" rowspan="1">Coder Pro</td><td colspan="1" rowspan="1">$60/mo</td><td colspan="1" rowspan="1">~8,000 coding interactions</td><td colspan="1" rowspan="1">Power users / small teams</td></tr><tr><td colspan="1" rowspan="1">Coder Team</td><td colspan="1" rowspan="1">$180/mo</td><td colspan="1" rowspan="1">~25,000 coding interactions</td><td colspan="1" rowspan="1">Teams with shared access</td></tr></tbody></table>Interactions = individual prompts/completions exchanged with the model through a coding assistant, regardless of token count.<div data-type="horizontalRule"><hr></div><h2>Key Requirements</h2><ol><li>API Compatibility — Must work seamlessly with popular AI coding tools via standard API endpoints (OpenAI-compatible format preferred for broadest compatibility):<ul><li>Claude Code</li><li>OpenCode</li><li>Crush</li><li>Kilo</li><li>VS Code (Continue, Cline, etc.)</li><li>Cursor</li><li>Aider</li><li>Any tool supporting OpenAI-compatible or Anthropic-compatible API schemas</li></ul></li><li>Predictable Billing — No surprise API charges. Usage is counted in interactions, not tokens. Overages either hard-stop or throttle (user-configurable) rather than charging per-token overages.</li><li>Model Access — Access to coding-optimized models (e.g., Qwen3-Coder, Kimi 2.5, GLM 5.1, Minimax 2.7, Venice's own fine-tuned coding model if available).</li><li>Streaming Support — Full streaming/SSE support for real-time code completion, which coding assistants require.</li><li>Context Window — Large context windows (128K+) to support codebase-aware completions and multi-file context injection.</li><li>Rate Limiting Transparency — Clear documentation on rate limits per tier so developers can benchmark against their workflow.</li></ol><div data-type="horizontalRule"><hr></div><h2>Value Proposition for Venice</h2><ul><li>Differentiation: No other uncensored, privacy-first platform offers a flat-rate coding plan. This captures developers leaving Claude/OpenAI over censorship or privacy concerns.</li><li>Predictable Revenue: Subscription revenue is more stable than variable API usage.</li><li>Ecosystem Lock-In: Developers who integrate Venice into their coding workflow become long-term subscribers.</li><li>Market Gap: Claude Code and Codex users frustrated by content filtering or privacy concerns have no credible flat-rate alternative — Venice fills this gap.</li></ul><div data-type="horizontalRule"><hr></div><h2>Why This Matters</h2>Developers are choosing Claude Max ($100/mo) or Copilot ($10-39/mo) because costs are predictable. Venice's current model forces developers to estimate token usage per sprint, which is unrealistic. A usage-tiered coding plan removes this friction while preserving Venice's core value proposition: private, uncensored AI that doesn't judge your codebase or questions.

Actualmente, el modelo de precios <a target="_blank" rel="noopener noreferrer nofollow" class="link" href="http://Venice.ai">de Venice.ai</a> está optimizado en torno al acceso a la API, lo que genera costes impredecibles para los desarrolladores que utilizan asistentes de programación basados en IA (Claude Code, OpenCode, Crush, Kilo, extensiones de VS Code, etc.). Esto hace que resulte difícil justificar el uso de Venice como principal IA de programación en comparación con alternativas como:<ul><li>Claude Pro/Max: tarifa plana mensual con acceso a la codificación</li><li>OpenAI Codex/Copilot: precios de suscripción predecibles</li><li>Cursor: planes con uso incluido</li></ul>Los desarrolladores quieren los modelos de Venice, que priorizan la privacidad y no están censurados, para la programación, pero el modelo de costes de la API genera incertidumbre presupuestaria, especialmente durante los sprints de desarrollo intensivos, en los que el uso de tokens puede dispararse drásticamente.<div data-type="horizontalRule"><hr></div><h2>Solución propuesta</h2>Introducir un Plan de Codificación de Venice: una suscripción de tarifa plana o por niveles que ofrezca acceso centrado en la codificación basado en umbrales de uso (mensajes/interacciones al mes) en lugar de en los costes brutos de los tokens de la API.<h3>Estructura del plan (niveles sugeridos)</h3><table style=""><colgroup><col><col><col><col></colgroup><tbody><tr><td colspan="1" rowspan="1">Nivel</td><td colspan="1" rowspan="1">Tarifa</td><td colspan="1" rowspan="1">Uso</td><td colspan="1" rowspan="1">Usuario objetivo</td></tr><tr><td colspan="1" rowspan="1">Programador</td><td colspan="1" rowspan="1">20 $/mes</td><td colspan="1" rowspan="1">~2000 interacciones de programación</td><td colspan="1" rowspan="1">Desarrolladores individuales</td></tr><tr><td colspan="1" rowspan="1">Coder Pro</td><td colspan="1" rowspan="1">60 $/mes</td><td colspan="1" rowspan="1">~8.000 interacciones de programación</td><td colspan="1" rowspan="1">Usuarios avanzados / equipos pequeños</td></tr><tr><td colspan="1" rowspan="1">Coder Team</td><td colspan="1" rowspan="1">180 $/mes</td><td colspan="1" rowspan="1">~25 000 interacciones de codificación</td><td colspan="1" rowspan="1">Equipos con acceso compartido</td></tr></tbody></table>Interacciones = indicaciones/complements individuales intercambiados con el modelo a través de un asistente de codificación, independientemente del recuento de tokens.<div data-type="horizontalRule"><hr></div><h2>Requisitos clave</h2><ol><li>Compatibilidad con API: debe funcionar a la perfección con las herramientas de programación de IA más populares a través de puntos finales de API estándar (se prefiere el formato compatible con OpenAI para una compatibilidad más amplia):<ul><li>Claude Code</li><li>OpenCode</li><li>Crush</li><li>Kilo</li><li>VS Code (Continue, Cline, etc.)</li><li>Cursor</li><li>Aider</li><li>Cualquier herramienta que admita esquemas de API compatibles con OpenAI o Anthropic</li></ul></li><li>Facturación predecible: sin cargos sorpresa por API. El uso se contabiliza en interacciones, no en tokens. Los excesos se detienen por completo o se limitan (configurable por el usuario), en lugar de cobrar por exceso de tokens.</li><li>Acceso a modelos: acceso a modelos optimizados para la programación (por ejemplo, Qwen3-Coder, Kimi 2.5, GLM 5.1, Minimax 2.7 y el modelo de programación ajustado de Venice, si está disponible).</li><li>Compatibilidad con streaming: compatibilidad total con streaming/SSE para la finalización de código en tiempo real, algo que requieren los asistentes de programación.</li><li>Ventana de contexto: ventanas de contexto amplias (más de 128 KB) para admitir autocompletado consciente del código base e inyección de contexto en varios archivos.</li><li>Transparencia en la limitación de tasas: documentación clara sobre los límites de tasa por nivel para que los desarrolladores puedan compararlos con su flujo de trabajo.</li></ol><div data-type="horizontalRule"><hr></div><h2>Propuesta de valor de Venice</h2><ul><li>Diferenciación: Ninguna otra plataforma sin censura y centrada en la privacidad ofrece un plan de programación de tarifa plana. Esto atrae a los desarrolladores que abandonan Claude/OpenAI por motivos de censura o privacidad.</li><li>Ingresos predecibles: Los ingresos por suscripción son más estables que el uso variable de la API.</li><li>Captura del ecosistema: los desarrolladores que integran Venice en su flujo de trabajo de programación se convierten en suscriptores a largo plazo.</li><li>Brecha de mercado: Los usuarios de Claude Code y Codex, frustrados por el filtrado de contenidos o las preocupaciones sobre la privacidad, no tienen una alternativa de tarifa plana creíble; Venice llena esta brecha.</li></ul><div data-type="horizontalRule"><hr></div><h2>¿Por qué...</h2>

Plan de tarificación basado en el uso para flujos de trabajo de desarrollo impulsados por IA

À l'heure actuelle, le modèle tarifaire <a target="_blank" rel="noopener noreferrer nofollow" class="link" href="http://Venice.ai">de Venice.ai</a> est axé sur l'accès à l'API, ce qui entraîne des coûts imprévisibles pour les développeurs utilisant des assistants de codage IA (Claude Code, OpenCode, Crush, Kilo, extensions VS Code, etc.). Il est donc difficile de justifier le choix de Venice comme principale IA de codage par rapport à des alternatives telles que :<ul><li>Claude Pro/Max — forfait mensuel avec accès au codage</li><li>OpenAI Codex/Copilot — tarification par abonnement prévisible</li><li>Cursor — forfaits incluant l'utilisation</li></ul>Les développeurs souhaitent disposer des modèles de Venice, axés sur la confidentialité et sans censure, pour le codage, mais le modèle de coûts basé sur l'API engendre une incertitude budgétaire, en particulier lors de sprints de développement intensifs où l'utilisation de jetons peut augmenter de manière spectaculaire.<div data-type="horizontalRule"><hr></div><h2>Solution proposée</h2>Lancer un forfait de codage Venice — un abonnement forfaitaire ou à plusieurs niveaux offrant un accès dédié au codage basé sur des seuils d'utilisation (messages/interactions par mois) plutôt que sur le coût brut des jetons API.<h3>Structure du forfait (niveaux suggérés)</h3><table style=""><colgroup><col><col><col><col></colgroup><tbody><tr><td colspan="1" rowspan="1">Niveau</td><td colspan="1" rowspan="1">Tarif</td><td colspan="1" rowspan="1">Utilisation</td><td colspan="1" rowspan="1">Utilisateur cible</td></tr><tr><td colspan="1" rowspan="1">Développeur</td><td colspan="1" rowspan="1">20 $/mois</td><td colspan="1" rowspan="1">~2 000 interactions de codage</td><td colspan="1" rowspan="1">Développeurs individuels</td></tr><tr><td colspan="1" rowspan="1">Coder Pro</td><td colspan="1" rowspan="1">60 $/mois</td><td colspan="1" rowspan="1">Environ 8 000 interactions de codage</td><td colspan="1" rowspan="1">Utilisateurs avancés / petites équipes</td></tr><tr><td colspan="1" rowspan="1">Coder Team</td><td colspan="1" rowspan="1">180 $/mois</td><td colspan="1" rowspan="1">Environ 25 000 interactions de codage</td><td colspan="1" rowspan="1">Équipes avec accès partagé</td></tr></tbody></table>Interactions = invites/compléments individuels échangés avec le modèle via un assistant de codage, quel que soit le nombre de jetons.<div data-type="horizontalRule"><hr></div><h2>Exigences clés</h2><ol><li>Compatibilité API — Doit fonctionner de manière transparente avec les outils de codage IA courants via des points de terminaison API standard (format compatible OpenAI préféré pour une compatibilité maximale) :<ul><li>Claude Code</li><li>OpenCode</li><li>Crush</li><li>Kilo</li><li>VS Code (Continue, Cline, etc.)</li><li>Cursor</li><li>Aider</li><li>Tout outil prenant en charge les schémas d'API compatibles avec OpenAI ou Anthropic</li></ul></li><li>Facturation prévisible — Pas de frais API surprise. L'utilisation est comptabilisée en interactions, et non en jetons. Les dépassements sont soit bloqués, soit limités (configurable par l'utilisateur) plutôt que facturés au jeton.</li><li>Accès aux modèles — Accès à des modèles optimisés pour le codage (par exemple, Qwen3-Coder, Kimi 2.5, GLM 5.1, Minimax 2.7, le modèle de codage finement ajusté de Venice s'il est disponible).</li><li>Prise en charge du streaming — Prise en charge complète du streaming/SSE pour la complétion de code en temps réel, indispensable aux assistants de codage.</li><li>Fenêtre de contexte — Grandes fenêtres de contexte (128 Ko+) pour prendre en charge les complétions tenant compte de la base de code et l'injection de contexte multi-fichiers.</li><li>Transparence de la limitation de débit — Documentation claire sur les limites de débit par niveau afin que les développeurs puissent les comparer à leur flux de travail.</li></ol><div data-type="horizontalRule"><hr></div><h2>Proposition de valeur pour Venice</h2><ul><li>Différenciation: aucune autre plateforme non censurée et axée sur la confidentialité ne propose de forfait de codage à tarif forfaitaire. Cela permet de capter les développeurs qui quittent Claude/OpenAI en raison de préoccupations liées à la censure ou à la confidentialité.</li><li>Revenus prévisibles: les revenus provenant des abonnements sont plus stables que ceux liés à l'utilisation variable des API.</li><li>Fidélisation à l'écosystème: les développeurs qui intègrent Venice dans leur flux de travail de codage deviennent des abonnés à long terme.</li><li>Lacune du marché: les utilisateurs de Claude Code et Codex, frustrés par le filtrage de contenu ou les préoccupations en matière de confidentialité, ne disposent d'aucune alternative forfaitaire crédible — Venice comble cette lacune.</li></ul><div data-type="horizontalRule"><hr></div><h2>Pourquoi...</h2>

Plan de tarification en fonction de l'utilisation pour les flux de travail de développement basés sur l'IA

Usage-Based Coding Plan for AI-Powered Development Workflows

hidden

Venice.ai

Usage-Based Coding Plan for AI-Powered Development Workflows

Proposed Solution

Plan Structure (Suggested Tiers)

Key Requirements

Value Proposition for Venice

Why This Matters

Subscribe to post

Subscribe to post

Tier	Rate	Usage	Target User
Coder	$20/mo	~2,000 coding interactions	Individual developers
Coder Pro	$60/mo	~8,000 coding interactions	Power users / small teams
Coder Team	$180/mo	~25,000 coding interactions	Teams with shared access