Model: "llama-3.3-70b"

DeepSeek R1: o1-level open weights model and a simple recipe for upgrading 1.5B models to Sonnet/4o level

Meta Llama 3.3: 405B/Nova Pro performance at 70B price