Корпоративный ИИ on-premise

Знания
становятся
действием

Физический сервер + 8 ИИ-агентов. Данные не покидают ваш контур. Внедрение 30 дней.

848 000 ₽ экономии в месяц на 8 агентах
584 ч освобождённого времени в мес
от 30 дн. до запуска первого агента
Получить демо-доступ
Внедрение 30 дней Окупаемость от 2 недель ROI 630–840%
PRAXIS · 3 из 8 агентов · доступны
🎯Квалификация лидовв разработке
✉️Персонализация писемдоступен
📝Резюмирование встречдоступен
📊Подготовка отчётовв разработке
📚RAG-ассистентдоступен
👤HR-скрининг резюмев разработке
💬Клиентский сервисв разработке
💰Мониторинг дебиторкив разработке
0 ₽
лицензий ПО в месяц
100%
данные внутри контура
🔒Данные внутри контура
⚖️152-ФЗ
🏛️Готовность к КИИ
🧩Open-source · MIT / Apache 2.0
🇷🇺Оборудование в РФ
Почему сейчас

Идеальный шторм для on-premise ИИ

Три фактора совпали одновременно. Компании, внедрившие сейчас, получат преимущество на 18–24 месяца.

01
Модели стали доступны
DeepSeek R1 и Qwen 3 достигли уровня GPT-4o по качеству рассуждений. Лицензии MIT и Apache 2.0. Стоимость инференса — 0 ₽/мес.
02
GPU стало доступным
RTX 4090 в 2026 году — реалистичный вход в серьёзный инференс. Praxis Start работает на одной карте: 3–5 пользователей одновременно.
03
Регуляторное давление
152-ФЗ, требования КИИ и NDA-ограничения делают облачные ИИ юридически рискованными для большинства B2B-компаний РФ.
Окно возможностей — 12–18 месяцев

ИИ-агенты на open-source моделях только что стали реально работоспособными. Первые 15–20% рынка, внедрившие сейчас, получат операционное преимущество, которое конкурентам будет дорого нагонять.

📅 Внедрение за 30 дней · Окупаемость от 2 недель
8 агентов из коробки

Агенты — не чат-боты.
Они выполняют работу.

Событие в системе → агент запускается → готовый артефакт без участия сотрудника. Human-in-the-loop: агент готовит, человек одобряет.

🎯
Квалификация входящих лидов
SDR · Менеджер по продажам · РОП
В разработке
«30 секунд вместо 30 минут на каждый лид»
185 000 ₽/мес
130 ч/мес
Окупаемость <3 нед.
✉️
Персонализация outreach-писем
SDR · AE · РОП
Доступен — нажмите чтобы открыть
«Письмо, которое читают, а не удаляют»
100 000 ₽/мес
66 ч/мес
Reply rate +30–50%
📝
Резюмирование встреч
Все сотрудники
Доступен — нажмите чтобы открыть
«Выжимка часового совещания за 8 минут»
125 000 ₽/мес
120 ч/мес
Окупаемость <1 мес.
📊
Подготовка клиентских отчётов
Консультанты · Аналитики
В разработке
«Черновик аналитического отчёта за 5 минут»
90 000 ₽/мес
35 ч/мес
Окупаемость <5 нед.
📚
Корпоративный RAG-ассистент
Все сотрудники
Доступен — нажмите чтобы открыть
«Ответ на вопрос по базе знаний за 3–5 сек»
90 000 ₽/мес
90 ч/мес
Окупаемость <2 нед.
👤
HR-скрининг резюме
HR-специалист · Рекрутер
В разработке
«50 резюме проверены за 5 минут»
110 000 ₽/мес
70 ч/мес
Окупаемость <2 нед.
💬
Клиентский сервис 24/7
Клиенты компании · Helpdesk
В разработке
«Поддержка без очереди и без менеджера»
93 000 ₽/мес
55 ч/мес
80% без эскалации
💰
Мониторинг дебиторской задолженности
Бухгалтер · CFO · Менеджер
В разработке
«Автонапоминания без участия бухгалтера»
55 000 ₽/мес
18 ч/мес
Просрочка −20–35%
848 000 ₽
совокупная экономия
в месяц
584 ч
освобождённого времени
= 3,5 FTE
630–840%
ROI за 24 месяца
при внедрении Praxis Start
Три тира · Прозрачные цены

Выберите конфигурацию

Praxis Start — для SMB 15–50 сотрудников. Praxis Pro — для 50–150. Praxis Max — для Enterprise 150–500.

Praxis Start
от 490 000 ₽
покупка под ключ
или от 55 000 ₽/мес подписка

SMB 15–50 сотрудников. Внедрение 30 дней. 8 агентов из коробки.


Оборудование
1× NVIDIA RTX 4090 24 GB
AMD Ryzen 9 7950X · 96 GB DDR5
2 TB NVMe + 4 TB NVMe (RAG)
LLM: DeepSeek R1 32B / Qwen 3 30B
3–5 пользователей одновременно
Поддержка (при покупке)
25 000 ₽/мес · SLA 97% · Пн–Пт 9–18
Популярный выбор
Praxis Pro
от 1 490 000 ₽
покупка под ключ
или от 145 000 ₽/мес подписка

SMB/нижний Enterprise 50–150 сотрудников. Qwen 3 235B.


Оборудование
2× NVIDIA RTX 4090 · 48 GB total
AMD EPYC 7443 · 256 GB ECC DDR4
4 TB NVMe RAID-1 + 8 TB NVMe
LLM: Qwen 3 235B / DeepSeek R1 70B
10–20 пользователей одновременно
Поддержка (при покупке)
55 000 ₽/мес · SLA 99% · Пн–Пт 9–20
Praxis Max
от 4 200 000 ₽
покупка под ключ
или от 420 000 ₽/мес подписка

Enterprise 150–500 сотрудников. HA Active-Passive. 24/7.


Оборудование
4× NVIDIA RTX A40 48 GB · 192 GB
2× AMD EPYC 7713 · 512 GB ECC
8 TB NVMe RAID-10 + SAN 20 TB
Kubernetes (k3s) · LDAP/AD
50+ пользователей · HA failover
Поддержка (при покупке)
120 000 ₽/мес · SLA 99.5% · 24/7

Лизинг 36 мес.: от 18 000 ₽/мес (Start) · от 52 000 ₽/мес (Pro) · от 145 000 ₽/мес (Max). Партнёры: Сбербанк Лизинг, ВТБ Лизинг, Балтийский лизинг.

Для руководителей

ROI. TCO. Аргументы для совета директоров.

Расчёт на компанию 50 сотрудников (Praxis Start + поддержка). Стоимость часа — 2 500 ₽.

848 000 ₽
экономии в месяц на 8 агентах
3,5 FTE
освобождённого персонала
= 525 000 ₽/мес ФОТ
630–840%
ROI за 24 месяца при
внедрении Praxis Start
<3 нед.
средняя окупаемость
одного агента
TCO трёх вариантов развёртывания (Praxis Start, 36 мес.)
Нарастающим итогом · млн ₽
Критерий A: Собственный сервер B: Подписка / Лизинг C: Аренда GPU
TCO 3 года~1,4 млн ₽~2,3 млн ₽~5,4 млн ₽
Тип затратCAPEX разовыйOPEX фиксированныйOPEX переменный
Данные внутри контура✓ Да✓ Да✗ Нет
Соответствие 152-ФЗ / КИИ✓ Полное✓ Полное⚠ Условно
Vendor Lock-in✓ Нет⚠ Контракт✗ Высокий
Работа без интернета✓ Да (Air Gap)✓ Да✗ Нет
Срок запуска4–6 недель4–6 недель1–3 дня (пилот)
Налоговый эффектАмортизация CAPEXOPEX + НДС к вычетуOPEX снижает налог
Конкурентный анализ

Почему PRAXIS, а не конкуренты

YADRO AI Platform
Серверы от ~8–15 млн ₽ (8× GPU)
Плюсы
Российское производство
Нет санкционных рисков на железо
Минусы
Только железо + базовое ПО
Нет готовых агентов, нет SMB
PRAXIS закрывает прикладной уровень: агенты, интеграции, UI — из коробки. Не нужна команда разработки.
Интегратор на заказ
200 000–400 000 ₽ + ~150 000 ₽/мес поддержка
Плюсы
Индивидуальная разработка
Гибкость под специфику
Минусы
Нет готовых агентов — всё с нуля
6–12 месяцев до результата
PRAXIS — это собранный, настроенный, интегрированный и поддерживаемый комплекс. 30 дней до первого агента, не 12 месяцев.
Для ИТ-директора и DevOps

Open-source стек. On-prem. Zero vendor lock-in.

СлойКомпонентЛицензияВерсия
LLM InferenceOllama / vLLMMIT Apache 2.0Ollama 0.4+
Базовая модельDeepSeek R1 / Qwen 3MIT Apache 2.0R1-0528 / Q3-2026
Оркестрацияn8n (self-hosted)Sustainable Usen8n 1.x
Агентный фреймворкLangGraph / CrewAIMITLG 0.2+
Векторная БДQdrantApache 2.01.9+
EmbeddingsBAAI/bge-m3MITbge-m3
ТранскрипцияWhisper large-v3MITlarge-v3
UI (чат)Open WebUIMIT0.5+
Реверс-проксиNGINX / CaddyBSD / ApacheStable
МониторингLangfuse + GrafanaMITLangfuse 2.x
VPNWireGuard / HeadscaleGPL / BSDStable

Суммарная стоимость лицензий ПО: 0 ₽/мес. Все компоненты — open-source, self-hosted.

ПараметрPraxis StartPraxis ProPraxis Max
GPU1× RTX 4090 24 GB2× RTX 4090 48 GB4× RTX A40 48 GB (192 GB)
CPUAMD Ryzen 9 7950X (16c)AMD EPYC 7443 (24c, 2P)2× AMD EPYC 7713 (128c)
RAM96 GB DDR5-5200256 GB ECC DDR4-3200512 GB ECC DDR4
Хранилище2 TB NVMe + 4 TB NVMe4 TB RAID-1 + 8 TB NVMe8 TB RAID-10 + SAN 20 TB
Сеть1 GbE2× 10 GbE4× 25 GbE + IPMI
Питание1 200 W 80+ Gold2× 1 600 W redundant4× 2 000 W redundant
Форм-факторTower / 4U rack2U rack4U rack
ОСUbuntu 22.04 LTSUbuntu 22.04 LTSUbuntu 22.04 + k3s
LLM модельDeepSeek R1 32B / Qwen 3 30BQwen 3 235B / DeepSeek R1 70BНесколько моделей одновременно
Concurrent users3–510–2050+
HAActive-Passive, RTO <15 мин
ubuntu-setup.sh
# Ubuntu + обновление + драйверы NVIDIA
sudo apt update && sudo apt upgrade -y
sudo ubuntu-drivers autoinstall && sudo reboot
nvidia-smi   # Проверка: RTX 4090, CUDA 12.4+

# Docker
curl -fsSL https://get.docker.com | sh
sudo usermod -aG docker $USER && newgrp docker
ollama-install.sh
# Установка Ollama
curl -fsSL https://ollama.com/install.sh | sh
sudo systemctl enable ollama && sudo systemctl start ollama

# Загрузка моделей
ollama pull deepseek-r1:32b    # ~19 GB
ollama pull qwen3:30b           # ~17 GB (MoE)
ollama pull deepseek-r1:14b    # ~9 GB
ollama pull bge-m3              # ~570 MB
deploy.sh
# Развёртывание сервисов
git clone https://[supplier-repo]/apk-start.git /opt/apk
cd /opt/apk && cp .env.example .env && nano .env
docker compose up -d
docker compose ps   # Все сервисы: Up (healthy)

# Загрузка базы знаний
python3 /opt/apk/scripts/ingest.py \
  --source /path/to/documents \
  --collection company_kb \
  --embedding bge-m3
443
HTTPS / TCP
NGINX (reverse proxy)
TLS 1.3, JWT/Basic Auth
11434
HTTP / TCP
Ollama API (Тир 1)
Только localhost — внешний доступ закрыт
8000/8001
HTTP / TCP
vLLM API (Тир 2/3)
Docker internal, API key обязателен
5678
HTTP / TCP
n8n UI & API
Только через NGINX + auth
6333
HTTP / gRPC
Qdrant
API key обязателен
3000
HTTP / TCP
Open WebUI
Через NGINX + TLS
5432
TCP
PostgreSQL
Internal network, пароль
51820
UDP
WireGuard VPN
WireGuard, preshared key
Praxis Start
97%
доступность в месяц
ПоддержкаПн–Пт 09–18 MSK
КаналEmail, Helpdesk
P1 отклик8 раб. часов
P1 решение48 ч (рабочих)
RTO≤ 4 часа
RPO≤ 24 часа
Praxis Pro
99%
доступность в месяц
ПоддержкаПн–Пт 09–20 MSK
КаналEmail, TG, Phone
P1 отклик4 часа (24/7)
P1 решение24 часа
RTO≤ 2 часа
RPO< 1 час (WAL)
Praxis Max
99.5%
доступность в месяц
Поддержка24/7/365
КаналВыделенный менеджер
P1 отклик1 час (24/7)
P1 решение8 часов
RTO< 15 мин (HA)
RPO~0 (Patroni)

Штраф Start: продление на срок простоя. Pro: 5% за каждые 0,5% ниже цели. Max: 10% за каждые 0,5% ниже цели.

30 дней внедрения

От договора до боевого режима

Пошаговый процесс без сюрпризов. Ваш ИТ-администратор тратит 4 часа в неделю на координацию.

1–3
Дни 1–3
Диагностика процессов

2 интервью с SDR, HR, бухгалтером. Определяем, какие агенты внедряем первыми и в каком порядке.

✓ Чёткий план внедрения
4–10
Дни 4–10
Поставка и установка

Ubuntu + n8n + Ollama + Qdrant, подключение к сети клиента. Проверка: Open WebUI доступен.

✓ Сервер работает
11–18
Дни 11–18
Настройка первого агента

Интеграция с amoCRM / Битрикс24. Тест на 20 реальных лидах. SDR видит первые автозаполненные карточки.

✓ Первый агент в работе
19–25
Дни 19–25
Загрузка базы знаний

PDF, регламенты, договоры → индексация в Qdrant. Сотрудники задают первые вопросы через RAG-чат.

✓ База знаний в работе
26–30
Дни 26–30
Приёмка и SLA

Все агенты протестированы, команда обучена. Подписание акта приёмки. Переход на контракт поддержки.

✓ Система в боевом режиме
Возражения и ответы

Часто задаваемые вопросы

PRAXIS — не ещё один чат-бот. Агенты встроены в ваши процессы: новый лид в CRM запускает агент автоматически. Никаких ручных запросов — система работает, пока вы занимаетесь бизнесом.
При нагрузке от 300 000 токенов в день — PRAXIS дешевле уже на 3-й месяц. YandexGPT API при нагрузке SMB = ~200 000 ₽/мес. За 24 мес. = ~4 800 000 ₽ только за токены. А данные ваших клиентов не уходят на серверы третьих сторон.
PRAXIS поставляется под ключ. 30 дней — и система работает. Ваш ИТ-администратор потратит 4 часа в неделю на мониторинг. Поддержка входит в контракт.
Praxis Start окупается за 2–3 недели при автоматизации только одного агента — например, квалификации лидов (экономия 185 000 ₽/мес). Для тех, кто предпочитает OPEX — лизинг от 18 000 ₽/мес или подписка от 55 000 ₽/мес.
Open-source — это стек, не продукт. PRAXIS — это собранный, настроенный, интегрированный и поддерживаемый комплекс. Вы покупаете работающую систему и SLA, а не набор компонентов, которые нужно самостоятельно связать.
Все компоненты — open-source: Ollama, n8n, Qdrant, DeepSeek, Qwen. Лицензии MIT и Apache 2.0. Если мы уйдём с рынка, вы продолжаете работать. Оборудование и ПО принадлежат вам.
Демо-доступ

Попробуйте агентов прямо сейчас

Введите email — и через минуту получите логин и пароль для работы с активными агентами PRAXIS. Бесплатно. Без звонков. Без демонстраций с менеджером.

Доступ за 60 секунд. Аккаунт создаётся автоматически сразу после отправки формы.
🤖2 активных агента: Персонализация outreach-писем и Резюмирование встреч. По 3 действия на каждого.
🔒Только ваши данные. Гостевой аккаунт изолирован — вы видите только свои результаты.
📅30 дней доступа. После использования 3 действий аккаунт переходит в режим чтения.

Нажимая кнопку, вы соглашаетесь на обработку персональных данных в соответствии с 152-ФЗ.