NGT Memory – открытый модуль персистентной памяти, который сохраняет контекст между сеансами без дообучения. Запускается одной командой Docker, а общение идёт через простой REST API.

Заменяя внешние векторные хранилища типа Pinecone или Weaviate, NGT Memory позволяет компаниям сократить инфраструктурные расходы на до 30 % без потери качества ответов. Экономия достигается за счёт локального хранения эмбеддингов и трёх быстрых методов извлечения: косинусного сходства, хеббовского ассоциативного графа и иерархической консолидации.

Пилотные проекты продемонстрировали рост удовлетворённости пользователей диалоговых систем от 12 % до 22 % благодаря сохранению персональных предпочтений (например, вегетарианства). Персонализированные рекомендации стали заметно релевантнее, а количество ошибочных запросов упало.

Для CEO это быстрый способ улучшить клиентский сервис без серьёзных инвестиций в сторонние решения. Тот, кто успеет внедрить NGT Memory, получит небольшое, но ощутимое конкурентное преимущество: удержание клиентов за счёт диалогов, которые помнят, что ты любишь салат, а не стейк. В реальном бизнес‑контексте это значит меньше оттока, более высокий LTV и возможность заявить клиенту «Мы знаем, чего ты хочешь», пока конкуренты всё ещё спрашивают: «Что вам подать?»

NGT Memoryвекторные сервисычат‑ботыэкономия расходовперсистентная память