Описание функциональных характеристик платформы быстрого и выгодного запуска моделей Искусственного Интеллекта "Compressa"

Описание функциональных характеристик платформы быстрого и выгодного запуска моделей Искусственного Интеллекта "Compressa"

Общее описание системы

Compressa — это демонстрационная система, предназначенная для локальной работы моделей искусственного интеллекта без подключения к внешним сервисам. Решение разворачивается в виде контейнера Docker и содержит набор модулей для обработки текстов, документов и аудио, а также для тестирования совместимого программного интерфейса приложений.

Все вычисления выполняются на стороне пользователя, данные не выходят за пределы локальной среды, что обеспечивает безопасность и контроль над обработкой информации.

Функциональные характеристики

Модули платформы

  • 1. Подготовка структуры документа и данных — модуль извлечения текста из документов PDF. Поддерживает:
    • загрузку файлов PDF;
    • извлечение текста;
    • разбиение текста на фрагменты;
    • выбор режима обработки, языка и параметров разбиения.
  • 2. Векторные представления текста — преобразование текста в векторные представления для смыслового поиска и классификации. Включает:
    • создание векторных представлений;
    • демонстрацию примеров тематических категорий;
    • классификацию пользовательских запросов.
  • 3. Переранжирование — модуль улучшенного поиска. Упорядочивает список документов по смысловому соответствию заданному текстовому запросу.
  • 4. Языковая модель с программным интерфейсом приложений — интерфейс работы с языковой моделью в формате совместимого программного интерфейса приложений. Позволяет:
    • анализировать текст;
    • получать оценку тональности, ключевые темы, проблемы и выводы;
    • использовать программный интерфейс приложений на собственных серверах без внешних сервисов.
  • 5. Языковая модель в режиме работы с библиотекой LangChain — модуль обработки длинных транскриптов. Используется для:
    • суммаризации длинных текстов;
    • формирования краткого резюме;
    • выделения перечня последующих действий.
  • 6. Синтез речи — генерация аудио по тексту. Возможности:
    • выбор голоса;
    • поддержка русского и других языков;
    • скачивание аудиофайлов в формате WAV.
  • 7. Распознавание речи — преобразование речи из аудиофайлов в текст. Поддерживает:
    • загрузку файлов WAV, MP3 и OGG;
    • потоковый режим ответа;
    • распознавание речи на русском языке.

Инфраструктура и архитектура

Платформа работает полностью локально в контейнере Docker. Все компоненты — языковые модели, модули обработки текста и аудио — запускаются внутри одной среды и не требуют доступа в интернет.

Архитектура ориентирована на демонстрацию возможностей модулей искусственного интеллекта и не предполагает распределённых вычислений или удалённых вызовов серверов.

Интерфейсы взаимодействия

  • Веб-интерфейс — основной способ работы с демонстрационной сборкой. Содержит навигацию по модулям и наглядное отображение всех действий.
  • Программный интерфейс приложений — позволяет использовать библиотеки OpenAI, LangChain и LlamaIndex через замену base_url.

Безопасность и масштабируемость

Безопасность

  • Все данные обрабатываются локально в контейнере Docker.
  • Передача данных ограничена средой пользователя.
  • Не требует доступа в интернет.

Масштабируемость

Демонстрационная сборка не предназначена для промышленной нагрузки, однако поддерживает стабильную работу в локальной среде. Масштабирование не требуется и не предусмотрено в текущей версии.