// Python Dev

Protocolo automático de llamada: de la grabación al documento estructurado

Publicado el 29.04.2026

Protocolo automático de la llamada: de la grabación al documento estructurado

Los equipos distribuidos pasan mucho tiempo en llamadas. Discuten tareas, toman decisiones, asignan encargos — y todo ello se desvanece en cuanto termina la conversación. Alguien apuntó algo en un cuaderno, alguien confió en la memoria. Al cabo de dos días, la mitad de los acuerdos se ha perdido.

La solución obvia es grabar las llamadas. Pero la grabación por sí sola no resuelve el problema: nadie va a escuchar una llamada de una hora por una sola tarea.

Construimos un pipeline que cubre esta necesidad por completo — desde la grabación hasta el acta lista para usar.


Cómo funciona

Grabación de la conversación

El sistema admite dos fuentes: telefonía SIP a través de Asterisk y videoconferencias personalizadas basadas en Jitsi Meet.

En ambos casos la conversación se graba en estéreo — cada participante en un canal separado. Esto ofrece una forma sorprendentemente barata de resolver la atribución: no hace falta sincronizar archivos por separado ni configurar la diarización manualmente.

ElevenLabs recibe el archivo estéreo, el parámetro use_multi_channel — y como resultado obtiene directamente un diálogo limpio, donde cada réplica está marcada según el canal. Sin pasos adicionales.


Reconocimiento de voz

Tan pronto como termina la llamada, la grabación se envía automáticamente para su transcripción.

Usamos ElevenLabs Scribe, pero el pipeline se adapta fácilmente a cualquier servicio STT o modelo local — según los requisitos de confidencialidad y presupuesto.


Análisis y estructuración

La transcripción resultante se envía a Claude o a una LLM local con un prompt simple: aquí hay la conversación de dos personas, identifica los temas tratados, registra las tareas, estructura por temas.

El modelo lo hace bien — una conversación de una hora se comprime en un documento compacto donde queda claro quién dijo qué, qué se discutió y qué hay que hacer.


Entrega del resultado

El acta resultante se envía a donde el equipo ya trabaja — al correo electrónico, al CRM, a la base de conocimientos.

Desde allí puede integrarse automáticamente en listas de tareas (to-do), en tickets o en la documentación interna. Nada de copiar manualmente.


Qué aporta

Una llamada de una hora se convierte en un documento de una página con temas, decisiones y tareas — y llega al correo antes de que los participantes cierren los portátiles.

No hace falta tomar notas durante la llamada, preguntar a los colegas al día siguiente o escuchar grabaciones buscando una frase. Todos los acuerdos quedan registrados, estructurados y disponibles de inmediato.

El sistema funciona en segundo plano y no requiere ninguna acción por parte de los participantes de la llamada — simplemente hablen como siempre.


Sobre la implementación

El pipeline se configura rápidamente.

Si Asterisk o Jitsi ya se usan en la infraestructura — la integración lleva el mínimo tiempo.

La elección de STT y LLM es flexible: se pueden usar servicios en la nube o una pila completamente local, si los datos no deben salir del perímetro.

Lo hicimos para nuestro propio equipo distribuido — y es una de esas cosas que resulta difícil recordar cómo se trabajaba sin ella.

Nueva solicitud

Enviar una solicitud

Confirme que no es un bot.

Enviar solicitud
Escribir y recibir una respuesta rápida