Обзор
Groq разработал собственный чип LPU (Language Processing Unit) для ультрабыстрого inference LLM. Предоставляет бесплатный tier и коммерческий API. OpenAI-совместимый API с самой низкой latency на рынке.
Особенности
LPUUltra-fastStreamingFree tierJSON modeFunction callingTool use
Поддерживаемые модели
| Модель | Провайдер | Тип | Контекст | Input / 1M | Output / 1M |
|---|---|---|---|---|---|
| Llama 4 Maverick | Meta | LLM | 128K | $0.10 | $0.10 |
| Mixtral 8x7B | Mistral | LLM | 32K | $0.24 | $0.24 |
| Gemma 2 9B | LLM | 8K | $0.05 | $0.05 | |
| Whisper Large v3 | OpenAI | Audio | - | $0.001/min | - |
* Цены указаны за 1 миллион токенов (если не указано иное). Актуальные цены на сайте провайдера.
Отзывы
Отзывы пока загружаются. Будьте первым, кто оставит отзыв!