DeepInfra

Доступный inference для open-source моделей

4.2(95 отзывов)
140 20

Обзор

DeepInfra предоставляет доступный inference для open-source моделей. OpenAI-совместимый API, поддержка embeddings, chat и completion. Один из самых дешевых провайдеров на рынке.

Особенности

Low costStreamingEmbeddingsFine-tuningJSON modeFunction calling

Поддерживаемые модели

МодельПровайдерТипКонтекстInput / 1MOutput / 1M
Llama 4 MaverickMetaLLM1M$0.15$0.50
Mixtral 8x22BMistralLLM64K$0.50$0.50
Qwen 2.5 72BAlibabaLLM128K$0.20$0.20
Phi-4 14BMicrosoftLLM16K$0.07$0.07

* Цены указаны за 1 миллион токенов (если не указано иное). Актуальные цены на сайте провайдера.

Отзывы

Отзывы пока загружаются. Будьте первым, кто оставит отзыв!

Статистика

Моделей80+
ОплатаPay-per-use
APIOpenAI-совместимый
Uptime99.5%
Latency~200ms
Основан2023

Возможности

Low costStreamingEmbeddingsFine-tuningJSON modeFunction calling

Попробовать DeepInfra

Зарегистрируйтесь и получите доступ к 80+ моделям через единое API