Help Center

Models

Bugfixes / Misc

Features

Token

Characters

veniceai

New Submission

Backlog

In Review

Planned

Up next

In Progress

Completed

Rejected

High Priority

Low Priority

New Model

Chat

History

Image

Support

Web Search

Backup / Sync

Staking Contract

Voice

Points

Settings

Code

Folders

Payment

Video

UI Design

Stickers

Merchandise

Censorship

Context Window

Social

Enhance Prompt

Plugin

File Upload

Upscale/Enhance

Edit Prompt

Language

Privacy

Venice Pro

System Prompts

Vision

LoRAs

Image Editing

Memory

Social Feed

Artifacts

Auto Mode

Blog

Incentive Fund

Agents

Model Deprecation

Credits

Library

Projects

Marketing

Here’s what Venice is working on next!

Next up

Roadmap

All completed and shipped community requested feature requests and improvements can be seen here.

Done

Shipped Features

Hey {name|there}! 👋

Rather than having multiple models with 32K context length, I think it would be more effective to have at least one coder model with an extended context length.For example, 'llama 3.2 3b' seems to have a good context length, but it's not particularly useful for code and math. On the other hand, 'llama 3.1 405b' has an 'ok' context length, but it becomes slow as the context grows.In contrast, 'qwen2.5-coder 32b' can handle up to 128K context length, but Venice is currently using 32K.My suggestion is: a) Increase the context length in the current 'qwen2.5-coder 32b' model. b) And/or consider adding a smaller version with a higher context length, such as 'qwen2.5-coder 7b'.

Anstatt mehrere Modelle mit 32K Kontextlänge zu haben, denke ich, dass es effektiver wäre, mindestens ein Codiermodell mit einer erweiterten Kontextlänge zu haben.Zum Beispiel scheint 'llama 3.2 3b' eine gute Kontextlänge zu haben, aber es ist nicht besonders nützlich für Code und Mathematik. Auf der anderen Seite hat 'llama 3.1 405b' eine 'ok' Kontextlänge, aber es wird langsam, wenn der Kontext wächst.Im Gegensatz dazu kann 'qwen2.5-coder 32b' mit bis zu 128K Kontextlänge umgehen, aber Venedig benutzt derzeit 32K.Mein Vorschlag ist:a) Erhöhe die Kontextlänge im aktuellen 'qwen2.5-coder 32b'-Modell.b) Und/oder erwäge eine kleinere Version mit einer höheren Kontextlänge, wie 'qwen2.5-coder 7b'.

Erhöhte Kontextlänge für Coder-Modelle

En lugar de tener múltiples modelos con 32K de longitud de contexto, creo que sería más efectivo tener al menos un modelo de codificador con una longitud de contexto extendida.Por ejemplo, llama 3.2 3b parece tener una buena longitud de contexto, pero no es particularmente útil para código y matemáticas. Por otro lado, 'llama 3.1 405b' tiene una longitud de contexto 'ok', pero se vuelve lento a medida que el contexto crece.En contraste, 'qwen2.5-coder 32b' puede manejar hasta 128K de longitud de contexto, pero Venecia está usando actualmente 32K.Mi sugerencia es: a) Aumentar la longitud del contexto en el actual modelo 'qwen2.5-coder 32b'. b) Y/o considerar la adición de una versión más pequeña con una mayor longitud de contexto, como 'qwen2.5-coder 7b'.

Aumento de la longitud del contexto para los modelos de codificación

<plutôt que="" d'avoir="" plusieurs="" modèles="" avec="" une="" longueur="" de="" contexte="" 32k,="" je="" pense="" qu'il="" serait="" plus="" efficace="" au="" moins="" un="" modèle="" codeur="" étendue.<="" p="">Par exemple, 'llama 3.2 3b' semble avoir une bonne longueur de contexte, mais il n'est pas particulièrement utile pour le code et les mathématiques. En revanche, 'qwen2.5-coder 32b' peut gérer jusqu'à 128K de longueur de contexte, mais Venice utilise actuellement 32K.Ma suggestion est la suivante:a) Augmenter la longueur du contexte dans le modèle actuel 'qwen2.5-coder 32b'.b) Et/ou envisager d'ajouter une version plus petite avec une longueur de contexte plus élevée, comme 'qwen2.5-coder 7b'.</plutôt>

Augmentation de la longueur du contexte pour les modèles de codage

Increasing Context Length for Coder Models

An Anonymous User

Venice.ai

Increasing Context Length for Coder Models

Subscribe to post

Subscribe to post