Сохраняем большое видение продукта, но первый релиз строим вокруг проверяемого технического ядра.
Если пытаться сделать сразу всё, команда снова утонет в параллельных подсистемах.
Пользователь должен почувствовать AI-личность, а команда — показать устойчивый контур.
Профиль, характер, тон, язык, настройки поведения.
Быстрый streaming-ответ и история диалогов.
Сырые сообщения сразу, важные факты — асинхронно.
Единая диспетчерская для моделей, лимитов и стоимости.
RLS, tenant context, moderation v0, audit logs.
Метрики, стоимость AI, ошибки, очередь, приёмка.
Каждая следующая волна опирается на уже проверенный фундамент.
Staging, CI/CD, БД, RLS, auth, observability.
AI-личность, чат, память, AI Gateway, лимиты.
Генерации через очередь, изображения, gallery, moderation.
Профили, посты, follow, реакции, comments, reports.
Credits, подписки, затем wallet/donations/payouts.
Это не отказ. Это честное разделение “сейчас” и “позже”.
n8n полезен для прототипов и внутренних процессов, но не для чата, денег, памяти и генераций.
Админские процессы, тестовые сценарии, уведомления команде, временные интеграции.
Чат, списания, память, webhook платежей, генерации, действия от имени пользователя.
Быстрый ответ идёт сразу, а извлечение важных фактов выполняется в фоне.
Всегда сохраняются сразу.
Создаются только из важных фактов.
Обновляется осторожно, с confidence.
Так можно запустить платные сценарии без сложности настоящего кошелька с выводами и эскроу.
Пользователь покупает или получает кредиты. Кредиты списываются за AI-запросы и генерации. Нужен ledger и idempotency.
Настоящие переводы, донаты, выводы, партнёрка и эскроу. Это отдельная финансовая подсистема.
Перед обещанием анимаций, голоса, WebSocket и видео нужно проверить ограничения платформ.
Критерии должны быть техническими, измеримыми и демонстрируемыми.
Есть отдельная среда, миграции, деплой, rollback.
Работает streaming, сохраняются messages, есть trace id.
Есть тесты, что пользователь не видит чужие данные.
Видны модель, токены, стоимость, latency, ошибки.
Worker обрабатывает задачи памяти/генерации с retry.
Повтор webhook/запроса не создаёт двойное списание.
Иначе команда будет тянуть проект в разные стороны.