Обзор
Fireworks AI обеспечивает быстрый и дешевый inference для open-source моделей. Оптимизированный стек с поддержкой JSON mode, function calling и batch processing. Разрабатывают собственные модели Firefunction для function calling.
Особенности
Fast inferenceStreamingJSON modeBatch APIFunction callingFine-tuningEmbeddings
Поддерживаемые модели
| Модель | Провайдер | Тип | Контекст | Input / 1M | Output / 1M |
|---|---|---|---|---|---|
| Llama 4 Maverick | Meta | LLM | 1M | $0.20 | $0.60 |
| Mixtral 8x22B | Mistral | LLM | 64K | $0.50 | $0.50 |
| Firefunction v2 | Fireworks | LLM | 8K | $0.90 | $0.90 |
| Qwen 2.5 72B | Alibaba | LLM | 128K | $0.28 | $0.28 |
| Phi-4 14B | Microsoft | LLM | 16K | $0.10 | $0.10 |
* Цены указаны за 1 миллион токенов (если не указано иное). Актуальные цены на сайте провайдера.
Отзывы
Отзывы пока загружаются. Будьте первым, кто оставит отзыв!