// Python Dev
Автоматический протокол звонка: от записи до структурированного документа
Опубликовано 29.04.2026
Автоматический протокол звонка: от записи до структурированного документа
Распределённые команды проводят много времени в звонках. Обсуждают задачи, принимают решения, раздают поручения — и всё это растворяется в воздухе, как только разговор заканчивается. Кто-то что-то записал в блокнот, кто-то понадеялся на память. Через два дня половина договорённостей потеряна.
Очевидное решение — записывать звонки. Но запись сама по себе не решает проблему: прослушивать часовой созвон ради одного поручения никто не будет.
Мы построили pipeline, который закрывает эту задачу полностью — от записи до готового протокола.
Как это работает
Запись разговора
Система поддерживает два источника: SIP-телефонию через Asterisk и кастомные видеоконференции на базе Jitsi Meet.
В обоих случаях разговор пишется в стерео — каждый участник в отдельном канале. Это даёт неожиданно дешёвый способ решить задачу атрибуции: не нужно синхронизировать отдельные файлы или настраивать диаризацию вручную.
ElevenLabs получает стерео-файл, параметр use_multi_channel — и на выходе сразу чистый диалог, где каждая реплика подписана по каналу. Никаких дополнительных шагов.
Распознавание речи
Как только звонок завершён, запись автоматически отправляется на транскрибацию.
Мы использовали ElevenLabs Scribe, но pipeline легко адаптируется под любой STT-сервис или локальную модель — в зависимости от требований к конфиденциальности и бюджету.
Анализ и структурирование
Готовый транскрипт уходит в Claude или локальную LLM с простым промптом: вот разговор двух людей, выяви темы обсуждения, зафиксируй поручения, структурируй по темам.
Модель справляется с этим хорошо — часовой разговор сжимается до компактного документа, где чётко видно кто что говорил, что обсуждалось и что нужно сделать.
Доставка результата
Готовый протокол отправляется туда, где команда уже работает — на email, в CRM, в базу знаний.
Оттуда он может автоматически попасть в to-do листы, задачи или внутреннюю документацию. Никакого ручного копирования.
Что это даёт
Часовой созвон превращается в одностраничный документ с темами, решениями и поручениями — и появляется в почте раньше, чем участники успевают закрыть ноутбуки.
Не нужно вести протокол во время разговора, переспрашивать коллег на следующий день или прослушивать записи в поисках одной фразы. Все договорённости зафиксированы, структурированы и доступны сразу.
Система работает в фоне и не требует никаких действий от участников звонка — просто разговариваете, как обычно.
Про внедрение
Pipeline настраивается быстро.
Если Asterisk или Jitsi уже используются в инфраструктуре — интеграция занимает минимум времени.
Выбор STT и LLM гибкий: можно использовать облачные сервисы или полностью локальный стек, если данные не должны покидать контур.
Мы сделали это для собственной распределённой команды — и это одна из тех вещей, про которые сложно вспомнить, как вообще работали без неё.