Тут, поки ми спалl…
Тут, поки ми спали, стався інженерний прорив.
12M контекст
у 52 рази швидше
на 95% дешевше
І це не ще одна модель від OpenAI чи Anthropic
Мова йде про SubQ, як спроба переосмислити саму архітектуру трансформерів (то як працюють сучасні LLM).
Зараз всі LLM працюють за принципом чим більше контексту тим експоненційно збільшується вартість .
SubQ пропонує лінійний підхід. Вони прямо кажуть, що весь поточний AI стек (agents + RAG + orchestration) частково існує тільки тому, що контекст дорогий. І якщо вони зроблять те що обіцяють в прес релізі, то частина тулінгу просто стане не потрібною (хоча я в тому сумніваюсь).
Реальний результат покаже застосування моделі в продакшені. А поки чекаємо, можна записатись у лист очікування.

