⚡ LLM Inference

Speed Calculator

Select your GPU, model, and quantization — get estimated tokens/sec and VRAM usage

🖥 GPU Hardware

Model

Search GPU…▼

VRAM

Select GPU

🧠 LLM Model

Model

Search model…▼

Parameters

Select model

Quantization

Select a GPU, VRAM, model, and parameters to see results