Данная документация предназначена для специалистов, занимающихся развертыванием и промышленной эксплуатацией, а также пользователей Платформы для создания умных поисковых ИИ-ассистентов "ИнсайтСтрим" (https://compressa.ai) — системы поиска и формирования кратких сводок по корпоративным данным. Платформа для создания умных поисковых ИИ-ассистентов "ИнсайтСтрим" помогает упростить доступ к информации, автоматизировать поиск и формировать итоговые ответы, что повышает эффективность работы сотрудников.
Платформа для создания умных поисковых ИИ-ассистентов "ИнсайтСтрим" позволяет обрабатывать корпоративные данные, такие как регламенты, инструкции и другие неструктурированные документы, помогая сократить время поиска и повысить продуктивность сотрудников.
Платформа для создания умных поисковых ИИ-ассистентов "ИнсайтСтрим" представляет собой интеллектуальную поисковую систему для корпоративной сети, использующую технологию поиска с генерацией ответа (RAG) и большую языковую модель для формирования ответов. Система позволяет создавать ассистентов для поиска и формирования кратких сводок по информации из загруженных документов.
| Компонент | Требование |
|---|---|
| Операционная система | Linux (рекомендуется Ubuntu 20.04 и выше) |
| Процессор | 4 ядра |
| Оперативная память | 8 ГБ |
| Диск | 50 ГБ |
| Сеть | 100 Мбит/с |
| Компонент | Требование |
|---|---|
| Процессор | 8 ядер |
| Оперативная память | 16 ГБ и более |
| Диск | 100 ГБ на твердотельном накопителе (SSD) |
| Сеть | 1 Гбит/с |
Платформа для создания умных поисковых ИИ-ассистентов "ИнсайтСтрим" устанавливается с помощью средства оркестрации Docker Compose.
Для корректной работы системы необходимо указать значения следующих переменных:
CHAT_API_KEY: ключ доступа к программному интерфейсу языковой моделиCHAT_MODEL: используемая языковая модельCHAT_API_BASE: адрес доступа к программному интерфейсу языковой моделиEMBED_MODEL, EMBED_TIKTOKEN_MODEL, EMBED_API_KEY, EMBED_API_BASE: настройки модели и программного интерфейса векторизацииRERANK_MODEL, RERANK_API_KEY, RERANK_API_BASE: настройки модели и программного интерфейса переранжированияOPENAI_API_KEY: ключ (токен) для доступа к CompressaOPENAI_BASE: адрес для доступа к программному интерфейсу CompressaQDRANT_URL: базовый адрес базы данных QdrantRABBITMQ_URL: строка подключения к RabbitMQ (с логином и паролем)Дополнительные настраиваемые переменные:
RABBIT_USER, RABBIT_PASS: логин и пароль пользователя RabbitMQ (по умолчанию: guest/guest)AMQP_URL, AMQP_USER, AMQP_PASS: дублирующие переменные для RabbitMQ в случае проблем с доступом.env для настройки переменных на основе файла .env.exampledocker-compose up -d docker ps и docker logs <container_name> http://localhost:8501http://localhost:3000Платформа для создания умных поисковых ИИ-ассистентов "ИнсайтСтрим" не имеет встроенной аутентификации. Для её настройки рекомендуется использовать веб-сервер Nginx. Пример базовой конфигурации с фиксированным токеном:
server {
listen 443 ssl;
server_name yourdomain.com;
ssl_certificate /path/to/your/fullchain.pem;
ssl_certificate_key /path/to/your/privkey.pem;
location /api/ {
proxy_pass http://localhost:8000;
proxy_set_header Host $host;
proxy_set_header X-Real-IP $remote_addr;
proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
if ($http_authorization != "Bearer your_api_key_here") {
return 401;
}
}
} Журналы Платформы для создания умных поисковых ИИ-ассистентов "ИнсайтСтрим" выводятся в стандартный поток вывода (stdout). Для интеграции со стеком ELK используйте следующую конфигурацию:
input {
docker {
containers => ["insightstream"]
type => "docker-logs"
}
}
output {
elasticsearch {
hosts => ["http://localhost:9200"]
index => "insightstream-logs"
}
} После настройки Logstash настройте информационные панели в Kibana для анализа журналов.
Пример формата журнала:
[2024-10-29 14:32:45] INFO: Запрос пользователя: "Какие документы необходимы для регистрации?" [2024-10-29 14:32:50] ERROR: Ошибка индексации документа "doc123.pdf": Недопустимый формат.
curl -X POST "http://localhost:6333/collections/{collection_name}/snapshots" curl -X PUT "http://localhost:6333/collections/{collection_name}/snapshots/recover" -H 'Content-Type: application/json' -d'
{
"location": "http://qdrant-node-1:6333/collections/{collection_name}/snapshots/snapshot-2022-10-10.snapshot"
}' docker pulldocker-compose downdocker-compose up -d