Встречайте DeepSeek-V4 — китайцы снова пришли ломать рынок! 😮


Встречайте DeepSeek-V4 — китайцы снова пришли ломать рынок! 😮

Они выкатили сразу V4-Pro и V4-Flash, обе с контекстом в 1 миллион токенов и открытыми весами. Реализовали красиво: Mixture-of-Experts + новая схема внимания (сжатие + sparse), которая резко режет прожорливость. В итоге модель может жевать огромные контексты, но не сжигает серверную как раньше.

Что из интересного: — V4-Pro: 1.6T параметров (49B активных) — уровень топовых закрытых моделей; — V4-Flash: легче, быстрее, почти не уступает на простых задачах; — Агентность: open-source SOTA в coding-агентах; — Бенчи: рвёт open-source и дышит в спину GPT/Claude; — 1M токенов контекста теперь дефолт”.

И главное — цены: — Flash: ~$0.14 / $0.28 за млн токенов. — Pro: ~$1.74 / $3.48.

Попробовать можно здесь, а веса — тут. 👍

Links