Корпоративный ИИ on-premise

Знания
становятся
действием

Физический сервер + 8 ИИ-агентов. Данные не покидают ваш контур. Внедрение 30 дней.

848 000 ₽ экономии в месяц на 8 агентах

584 ч освобождённого времени в мес

от 30 дн. до запуска первого агента

Получить демо-доступ

Внедрение 30 дней Окупаемость от 2 недель ROI 630–840%

PRAXIS · 3 из 8 агентов · доступны

🎯Квалификация лидовв разработке

✉️Персонализация писемдоступен

📝Резюмирование встречдоступен

📊Подготовка отчётовв разработке

📚RAG-ассистентдоступен

👤HR-скрининг резюмев разработке

💬Клиентский сервисв разработке

💰Мониторинг дебиторкив разработке

0 ₽

лицензий ПО в месяц

100%

данные внутри контура

🔒Данные внутри контура

⚖️152-ФЗ

🏛️Готовность к КИИ

🧩Open-source · MIT / Apache 2.0

🇷🇺Оборудование в РФ

Почему сейчас

Идеальный шторм для on-premise ИИ

Три фактора совпали одновременно. Компании, внедрившие сейчас, получат преимущество на 18–24 месяца.

Модели стали доступны

DeepSeek R1 и Qwen 3 достигли уровня GPT-4o по качеству рассуждений. Лицензии MIT и Apache 2.0. Стоимость инференса — 0 ₽/мес.

GPU стало доступным

RTX 4090 в 2026 году — реалистичный вход в серьёзный инференс. Praxis Start работает на одной карте: 3–5 пользователей одновременно.

Регуляторное давление

152-ФЗ, требования КИИ и NDA-ограничения делают облачные ИИ юридически рискованными для большинства B2B-компаний РФ.

Окно возможностей — 12–18 месяцев

ИИ-агенты на open-source моделях только что стали реально работоспособными. Первые 15–20% рынка, внедрившие сейчас, получат операционное преимущество, которое конкурентам будет дорого нагонять.

📅 Внедрение за 30 дней · Окупаемость от 2 недель

8 агентов из коробки

Агенты — не чат-боты.
Они выполняют работу.

Событие в системе → агент запускается → готовый артефакт без участия сотрудника. Human-in-the-loop: агент готовит, человек одобряет.

🎯

Квалификация входящих лидов

SDR · Менеджер по продажам · РОП

В разработке

«30 секунд вместо 30 минут на каждый лид»

185 000 ₽/мес

130 ч/мес
Окупаемость <3 нед.

✉️

Персонализация outreach-писем

SDR · AE · РОП

Доступен — нажмите чтобы открыть

«Письмо, которое читают, а не удаляют»

100 000 ₽/мес

66 ч/мес
Reply rate +30–50%

📝

Резюмирование встреч

Все сотрудники

Доступен — нажмите чтобы открыть

«Выжимка часового совещания за 8 минут»

125 000 ₽/мес

120 ч/мес
Окупаемость <1 мес.

📊

Подготовка клиентских отчётов

Консультанты · Аналитики

В разработке

«Черновик аналитического отчёта за 5 минут»

90 000 ₽/мес

35 ч/мес
Окупаемость <5 нед.

📚

Корпоративный RAG-ассистент

Все сотрудники

Доступен — нажмите чтобы открыть

«Ответ на вопрос по базе знаний за 3–5 сек»

90 000 ₽/мес

90 ч/мес
Окупаемость <2 нед.

👤

HR-скрининг резюме

HR-специалист · Рекрутер

В разработке

«50 резюме проверены за 5 минут»

110 000 ₽/мес

70 ч/мес
Окупаемость <2 нед.

💬

Клиентский сервис 24/7

Клиенты компании · Helpdesk

В разработке

«Поддержка без очереди и без менеджера»

93 000 ₽/мес

55 ч/мес
80% без эскалации

💰

Мониторинг дебиторской задолженности

Бухгалтер · CFO · Менеджер

В разработке

«Автонапоминания без участия бухгалтера»

55 000 ₽/мес

18 ч/мес
Просрочка −20–35%

848 000 ₽

совокупная экономия
в месяц

584 ч

освобождённого времени
= 3,5 FTE

630–840%

ROI за 24 месяца
при внедрении Praxis Start

Три тира · Прозрачные цены

Выберите конфигурацию

Praxis Start — для SMB 15–50 сотрудников. Praxis Pro — для 50–150. Praxis Max — для Enterprise 150–500.

Praxis Start

от 490 000 ₽

покупка под ключ

или от 55 000 ₽/мес подписка

SMB 15–50 сотрудников. Внедрение 30 дней. 8 агентов из коробки.

Оборудование

1× NVIDIA RTX 4090 24 GB

AMD Ryzen 9 7950X · 96 GB DDR5

2 TB NVMe + 4 TB NVMe (RAG)

LLM: DeepSeek R1 32B / Qwen 3 30B

3–5 пользователей одновременно

Поддержка (при покупке)

25 000 ₽/мес · SLA 97% · Пн–Пт 9–18

Популярный выбор

Praxis Pro

от 1 490 000 ₽

покупка под ключ

или от 145 000 ₽/мес подписка

SMB/нижний Enterprise 50–150 сотрудников. Qwen 3 235B.

Оборудование

2× NVIDIA RTX 4090 · 48 GB total

AMD EPYC 7443 · 256 GB ECC DDR4

4 TB NVMe RAID-1 + 8 TB NVMe

LLM: Qwen 3 235B / DeepSeek R1 70B

10–20 пользователей одновременно

Поддержка (при покупке)

55 000 ₽/мес · SLA 99% · Пн–Пт 9–20

Praxis Max

от 4 200 000 ₽

покупка под ключ

или от 420 000 ₽/мес подписка

Enterprise 150–500 сотрудников. HA Active-Passive. 24/7.

Оборудование

4× NVIDIA RTX A40 48 GB · 192 GB

2× AMD EPYC 7713 · 512 GB ECC

8 TB NVMe RAID-10 + SAN 20 TB

Kubernetes (k3s) · LDAP/AD

50+ пользователей · HA failover

Поддержка (при покупке)

120 000 ₽/мес · SLA 99.5% · 24/7

Лизинг 36 мес.: от 18 000 ₽/мес (Start) · от 52 000 ₽/мес (Pro) · от 145 000 ₽/мес (Max). Партнёры: Сбербанк Лизинг, ВТБ Лизинг, Балтийский лизинг.

Для руководителей

ROI. TCO. Аргументы для совета директоров.

Расчёт на компанию 50 сотрудников (Praxis Start + поддержка). Стоимость часа — 2 500 ₽.

848 000 ₽

экономии в месяц на 8 агентах

3,5 FTE

освобождённого персонала
= 525 000 ₽/мес ФОТ

630–840%

ROI за 24 месяца при
внедрении Praxis Start

<3 нед.

средняя окупаемость
одного агента

TCO трёх вариантов развёртывания (Praxis Start, 36 мес.)

Нарастающим итогом · млн ₽

Критерий	A: Собственный сервер	B: Подписка / Лизинг	C: Аренда GPU
TCO 3 года	~1,4 млн ₽	~2,3 млн ₽	~5,4 млн ₽
Тип затрат	CAPEX разовый	OPEX фиксированный	OPEX переменный
Данные внутри контура	✓ Да	✓ Да	✗ Нет
Соответствие 152-ФЗ / КИИ	✓ Полное	✓ Полное	⚠ Условно
Vendor Lock-in	✓ Нет	⚠ Контракт	✗ Высокий
Работа без интернета	✓ Да (Air Gap)	✓ Да	✗ Нет
Срок запуска	4–6 недель	4–6 недель	1–3 дня (пилот)
Налоговый эффект	Амортизация CAPEX	OPEX + НДС к вычету	OPEX снижает налог

Конкурентный анализ

Почему PRAXIS, а не конкуренты

YADRO AI Platform

Серверы от ~8–15 млн ₽ (8× GPU)

Плюсы

Российское производство

Нет санкционных рисков на железо

Минусы

Только железо + базовое ПО

Нет готовых агентов, нет SMB

PRAXIS закрывает прикладной уровень: агенты, интеграции, UI — из коробки. Не нужна команда разработки.

Интегратор на заказ

200 000–400 000 ₽ + ~150 000 ₽/мес поддержка

Плюсы

Индивидуальная разработка

Гибкость под специфику

Минусы

Нет готовых агентов — всё с нуля

6–12 месяцев до результата

PRAXIS — это собранный, настроенный, интегрированный и поддерживаемый комплекс. 30 дней до первого агента, не 12 месяцев.

Для ИТ-директора и DevOps

Open-source стек. On-prem. Zero vendor lock-in.

Слой	Компонент	Лицензия	Версия
LLM Inference	Ollama / vLLM	MIT Apache 2.0	Ollama 0.4+
Базовая модель	DeepSeek R1 / Qwen 3	MIT Apache 2.0	R1-0528 / Q3-2026
Оркестрация	n8n (self-hosted)	Sustainable Use	n8n 1.x
Агентный фреймворк	LangGraph / CrewAI	MIT	LG 0.2+
Векторная БД	Qdrant	Apache 2.0	1.9+
Embeddings	BAAI/bge-m3	MIT	bge-m3
Транскрипция	Whisper large-v3	MIT	large-v3
UI (чат)	Open WebUI	MIT	0.5+
Реверс-прокси	NGINX / Caddy	BSD / Apache	Stable
Мониторинг	Langfuse + Grafana	MIT	Langfuse 2.x
VPN	WireGuard / Headscale	GPL / BSD	Stable

Суммарная стоимость лицензий ПО: 0 ₽/мес. Все компоненты — open-source, self-hosted.

Параметр	Praxis Start	Praxis Pro	Praxis Max
GPU	1× RTX 4090 24 GB	2× RTX 4090 48 GB	4× RTX A40 48 GB (192 GB)
CPU	AMD Ryzen 9 7950X (16c)	AMD EPYC 7443 (24c, 2P)	2× AMD EPYC 7713 (128c)
RAM	96 GB DDR5-5200	256 GB ECC DDR4-3200	512 GB ECC DDR4
Хранилище	2 TB NVMe + 4 TB NVMe	4 TB RAID-1 + 8 TB NVMe	8 TB RAID-10 + SAN 20 TB
Сеть	1 GbE	2× 10 GbE	4× 25 GbE + IPMI
Питание	1 200 W 80+ Gold	2× 1 600 W redundant	4× 2 000 W redundant
Форм-фактор	Tower / 4U rack	2U rack	4U rack
ОС	Ubuntu 22.04 LTS	Ubuntu 22.04 LTS	Ubuntu 22.04 + k3s
LLM модель	DeepSeek R1 32B / Qwen 3 30B	Qwen 3 235B / DeepSeek R1 70B	Несколько моделей одновременно
Concurrent users	3–5	10–20	50+
HA	—	—	Active-Passive, RTO <15 мин

ubuntu-setup.sh

# Ubuntu + обновление + драйверы NVIDIA
sudo apt update && sudo apt upgrade -y
sudo ubuntu-drivers autoinstall && sudo reboot
nvidia-smi   # Проверка: RTX 4090, CUDA 12.4+

# Docker
curl -fsSL https://get.docker.com | sh
sudo usermod -aG docker $USER && newgrp docker

ollama-install.sh

# Установка Ollama
curl -fsSL https://ollama.com/install.sh | sh
sudo systemctl enable ollama && sudo systemctl start ollama

# Загрузка моделей
ollama pull deepseek-r1:32b    # ~19 GB
ollama pull qwen3:30b           # ~17 GB (MoE)
ollama pull deepseek-r1:14b    # ~9 GB
ollama pull bge-m3              # ~570 MB

deploy.sh

# Развёртывание сервисов
git clone https://[supplier-repo]/apk-start.git /opt/apk
cd /opt/apk && cp .env.example .env && nano .env
docker compose up -d
docker compose ps   # Все сервисы: Up (healthy)

# Загрузка базы знаний
python3 /opt/apk/scripts/ingest.py \
  --source /path/to/documents \
  --collection company_kb \
  --embedding bge-m3

443

HTTPS / TCP

NGINX (reverse proxy)

TLS 1.3, JWT/Basic Auth

11434

HTTP / TCP

Ollama API (Тир 1)

Только localhost — внешний доступ закрыт

8000/8001

HTTP / TCP

vLLM API (Тир 2/3)

Docker internal, API key обязателен

5678

HTTP / TCP

n8n UI & API

Только через NGINX + auth

6333

HTTP / gRPC

Qdrant

API key обязателен

3000

HTTP / TCP

Open WebUI

Через NGINX + TLS

5432

TCP

PostgreSQL

Internal network, пароль

51820

UDP

WireGuard VPN

WireGuard, preshared key

Praxis Start

97%

доступность в месяц

ПоддержкаПн–Пт 09–18 MSK

КаналEmail, Helpdesk

P1 отклик8 раб. часов

P1 решение48 ч (рабочих)

RTO≤ 4 часа

RPO≤ 24 часа

Praxis Pro

99%

доступность в месяц

ПоддержкаПн–Пт 09–20 MSK

КаналEmail, TG, Phone

P1 отклик4 часа (24/7)

P1 решение24 часа

RTO≤ 2 часа

RPO< 1 час (WAL)

Praxis Max

99.5%

доступность в месяц

Поддержка24/7/365

КаналВыделенный менеджер

P1 отклик1 час (24/7)

P1 решение8 часов

RTO< 15 мин (HA)

RPO~0 (Patroni)

Штраф Start: продление на срок простоя. Pro: 5% за каждые 0,5% ниже цели. Max: 10% за каждые 0,5% ниже цели.

30 дней внедрения

От договора до боевого режима

Пошаговый процесс без сюрпризов. Ваш ИТ-администратор тратит 4 часа в неделю на координацию.

1–3

Дни 1–3

Диагностика процессов

2 интервью с SDR, HR, бухгалтером. Определяем, какие агенты внедряем первыми и в каком порядке.

✓ Чёткий план внедрения

4–10

Дни 4–10

Поставка и установка

Ubuntu + n8n + Ollama + Qdrant, подключение к сети клиента. Проверка: Open WebUI доступен.

✓ Сервер работает

11–18

Дни 11–18

Настройка первого агента

Интеграция с amoCRM / Битрикс24. Тест на 20 реальных лидах. SDR видит первые автозаполненные карточки.

✓ Первый агент в работе

19–25

Дни 19–25

Загрузка базы знаний

PDF, регламенты, договоры → индексация в Qdrant. Сотрудники задают первые вопросы через RAG-чат.

✓ База знаний в работе

26–30

Дни 26–30

Приёмка и SLA

Все агенты протестированы, команда обучена. Подписание акта приёмки. Переход на контракт поддержки.

✓ Система в боевом режиме

Возражения и ответы

Часто задаваемые вопросы

PRAXIS — не ещё один чат-бот. Агенты встроены в ваши процессы: новый лид в CRM запускает агент автоматически. Никаких ручных запросов — система работает, пока вы занимаетесь бизнесом.

При нагрузке от 300 000 токенов в день — PRAXIS дешевле уже на 3-й месяц. YandexGPT API при нагрузке SMB = ~200 000 ₽/мес. За 24 мес. = ~4 800 000 ₽ только за токены. А данные ваших клиентов не уходят на серверы третьих сторон.

PRAXIS поставляется под ключ. 30 дней — и система работает. Ваш ИТ-администратор потратит 4 часа в неделю на мониторинг. Поддержка входит в контракт.

Praxis Start окупается за 2–3 недели при автоматизации только одного агента — например, квалификации лидов (экономия 185 000 ₽/мес). Для тех, кто предпочитает OPEX — лизинг от 18 000 ₽/мес или подписка от 55 000 ₽/мес.

Open-source — это стек, не продукт. PRAXIS — это собранный, настроенный, интегрированный и поддерживаемый комплекс. Вы покупаете работающую систему и SLA, а не набор компонентов, которые нужно самостоятельно связать.

Все компоненты — open-source: Ollama, n8n, Qdrant, DeepSeek, Qwen. Лицензии MIT и Apache 2.0. Если мы уйдём с рынка, вы продолжаете работать. Оборудование и ПО принадлежат вам.

Демо-доступ

Попробуйте агентов прямо сейчас

Введите email — и через минуту получите логин и пароль для работы с активными агентами PRAXIS. Бесплатно. Без звонков. Без демонстраций с менеджером.

⚡Доступ за 60 секунд. Аккаунт создаётся автоматически сразу после отправки формы.

🤖2 активных агента: Персонализация outreach-писем и Резюмирование встреч. По 3 действия на каждого.

🔒Только ваши данные. Гостевой аккаунт изолирован — вы видите только свои результаты.

📅30 дней доступа. После использования 3 действий аккаунт переходит в режим чтения.

Знаниястановятсядействием

Идеальный шторм для on-premise ИИ

Агенты — не чат-боты.Они выполняют работу.

Выберите конфигурацию

ROI. TCO. Аргументы для совета директоров.

Почему PRAXIS, а не конкуренты

Open-source стек. On-prem. Zero vendor lock-in.

От договора до боевого режима

Часто задаваемые вопросы

Попробуйте агентов прямо сейчас

Доступ отправлен!

Знания
становятся
действием

Агенты — не чат-боты.
Они выполняют работу.