Обзор
DeepInfra предоставляет доступный inference для open-source моделей. OpenAI-совместимый API, поддержка embeddings, chat и completion. Один из самых дешевых провайдеров на рынке.
Особенности
Low costStreamingEmbeddingsFine-tuningJSON modeFunction calling
Поддерживаемые модели
| Модель | Провайдер | Тип | Контекст | Input / 1M | Output / 1M |
|---|---|---|---|---|---|
| Llama 4 Maverick | Meta | LLM | 1M | $0.15 | $0.50 |
| Mixtral 8x22B | Mistral | LLM | 64K | $0.50 | $0.50 |
| Qwen 2.5 72B | Alibaba | LLM | 128K | $0.20 | $0.20 |
| Phi-4 14B | Microsoft | LLM | 16K | $0.07 | $0.07 |
* Цены указаны за 1 миллион токенов (если не указано иное). Актуальные цены на сайте провайдера.
Отзывы
Отзывы пока загружаются. Будьте первым, кто оставит отзыв!