Описание функциональных характеристик платформы быстрого и выгодного запуска моделей Искусственного Интеллекта "Compressa"
Общее описание системы
Compressa — это демонстрационная система, предназначенная для локальной работы моделей искусственного интеллекта без подключения к внешним сервисам. Решение разворачивается в виде контейнера Docker и содержит набор модулей для обработки текстов, документов и аудио, а также для тестирования совместимого программного интерфейса приложений.
Все вычисления выполняются на стороне пользователя, данные не выходят за пределы локальной среды, что обеспечивает безопасность и контроль над обработкой информации.
Функциональные характеристики
Модули платформы
- 1. Подготовка структуры документа и данных — модуль извлечения текста из документов PDF.
Поддерживает:
- загрузку файлов PDF;
- извлечение текста;
- разбиение текста на фрагменты;
- выбор режима обработки, языка и параметров разбиения.
- 2. Векторные представления текста — преобразование текста в векторные представления для смыслового поиска и классификации.
Включает:
- создание векторных представлений;
- демонстрацию примеров тематических категорий;
- классификацию пользовательских запросов.
- 3. Переранжирование — модуль улучшенного поиска. Упорядочивает список документов по смысловому соответствию заданному текстовому запросу.
- 4. Языковая модель с программным интерфейсом приложений — интерфейс работы с языковой моделью в формате совместимого программного интерфейса приложений.
Позволяет:
- анализировать текст;
- получать оценку тональности, ключевые темы, проблемы и выводы;
- использовать программный интерфейс приложений на собственных серверах без внешних сервисов.
- 5. Языковая модель в режиме работы с библиотекой LangChain — модуль обработки длинных транскриптов. Используется для:
- суммаризации длинных текстов;
- формирования краткого резюме;
- выделения перечня последующих действий.
- 6. Синтез речи — генерация аудио по тексту.
Возможности:
- выбор голоса;
- поддержка русского и других языков;
- скачивание аудиофайлов в формате WAV.
- 7. Распознавание речи — преобразование речи из аудиофайлов в текст.
Поддерживает:
- загрузку файлов WAV, MP3 и OGG;
- потоковый режим ответа;
- распознавание речи на русском языке.
Инфраструктура и архитектура
Платформа работает полностью локально в контейнере Docker. Все компоненты — языковые модели, модули обработки текста и аудио — запускаются внутри одной среды и не требуют доступа в интернет.
Архитектура ориентирована на демонстрацию возможностей модулей искусственного интеллекта и не предполагает распределённых вычислений или удалённых вызовов серверов.
Интерфейсы взаимодействия
- Веб-интерфейс — основной способ работы с демонстрационной сборкой. Содержит навигацию по модулям и наглядное отображение всех действий.
- Программный интерфейс приложений — позволяет использовать библиотеки OpenAI, LangChain и LlamaIndex через замену base_url.
Безопасность и масштабируемость
Безопасность
- Все данные обрабатываются локально в контейнере Docker.
- Передача данных ограничена средой пользователя.
- Не требует доступа в интернет.
Масштабируемость
Демонстрационная сборка не предназначена для промышленной нагрузки, однако поддерживает стабильную работу в локальной среде. Масштабирование не требуется и не предусмотрено в текущей версии.