Install llama.cpp

Then:

llama-server -hf ngxson/Vintern-1B-v3_5-GGUF --chat-template vicuna

GGUF

Model size

0.6B params

Architecture

qwen2

Hardware compatibility

8-bit

Inference Providers NEW

This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for ngxson/Vintern-1B-v3_5-GGUF

Base model

Finetuned

Quantized

(3)

this model