Llama 3.3 70B Instruct

Llama 3.3 model with 70B parameters offering improved performance over 3.1 version

Parameters

700 B

Context

128,000 tokens

Released

Dec 6, 2024

Leaderboards

Average Score combining domain-specific Autobench scores; Higher is better

USD cent per average answer; Lower is better

Average Latency in Seconds; Lower is better

Llama 3.3 70B Instruct has a smaller context window than average (351k tokens), with a context window of 128k tokens.