// Python Dev

Как анализировать тысячи отзывов на Wildberries с помощью LAG: пошаговый разбор

Опубликовано 01.04.2026

У популярных товаров на Wildberries количество отзывов легко переваливает за тысячи. Читать их вручную — долго, утомительно и неэффективно.

В отзывах скрыты реальные причины возвратов, системные проблемы товара, повторяющиеся жалобы и сильные стороны продукта. Задача — быстро извлечь суть, а не утонуть в тексте.

Почему анализ «в лоб» не работает

Типичный подход — загрузить все отзывы в LLM и попросить сделать вывод. На практике это даёт слабый результат: теряются повторяющиеся паттерны, важные детали размываются, итог получается слишком общий.

Причина проста: модель не справляется с большим количеством разнородного текста за один проход. Нужен другой подход.

Архитектура решения

Процесс строится поэтапно:

  1. Сбор отзывов
  2. Предварительная классификация
  3. Разбиение на группы
  4. Локальный анализ групп (Map-фаза)
  5. Финальная агрегация (Reduce-фаза)
  6. Генерация итогового отчёта

По сути это аналог MapReduce: сначала каждая группа анализируется независимо, затем результаты объединяются. Разберём каждый этап подробнее.

1. Сбор отзывов

Отзывы собираются через браузерную автоматизацию на базе Playwright с перехватом XHR-запросов. Это быстрее, чем HTML-парсинг, и устойчивее к изменениям вёрстки — структура API меняется реже, чем разметка страницы.

2. Предварительная классификация

Перед отправкой в LLM отзывы делятся на положительные и отрицательные — по оценке товара и простым фильтрам по ключевым словам. Это снижает нагрузку на модель и улучшает точность: модель работает с однородными данными, а не с перемешанным потоком.

3. Разбиение на группы

Отзывы разбиваются на группы по 20–30 штук. При большем объёме (от 100 и выше) модель хуже удерживает контекст, растёт количество ошибок и обобщений. Небольшие группы дают стабильный и предсказуемый результат.

4. Локальный анализ групп (Map-фаза)

Каждая группа обрабатывается через LLM с одним и тем же промптом:

Ты — аналитик товаров. Твоя задача — обработать отзывы о продукте и сделать агрегированный анализ.

Инструкции:
- Отделяй плюсы и минусы каждого отзыва.
- Сгруппируй повторяющиеся плюсы и минусы.
- В конце составь краткую сводку на 2–3 предложения: что чаще всего нравится покупателям, что чаще всего вызывает недовольство.

Входные данные:
[список отзывов]

На выходе каждой группы — список ключевых плюсов, список минусов и краткая сводка.

5. Финальная агрегация (Reduce-фаза)

Все результаты групп объединяются и повторно отправляются в LLM. Задача этого шага — удалить дубли, объединить схожие формулировки и выделить главные проблемы и преимущества. Без этого шага финальный отчёт будет перегружен повторами.

6. Итоговый отчёт

На выходе формируется структурированный документ:

  • Краткая сводка — 3–5 предложений о товаре в целом
  • Ключевые плюсы — сгруппированные и подкреплённые частотой упоминания
  • Ключевые минусы — аналогично

Дополнительно: генерируется несколько вариантов заголовков для карточки товара, из которых отдельным запросом выбирается лучший.

Пример фрагмента реального вывода:

Аэрогриль на 14 литров — готовит быстро, но ровно не всегда

Аэрогриль Libhof AFZ-14 имеет достаточно большой объём — 14 литров, что удобно для готовки больших порций, и разнообразные автоматические программы с сенсорным управлением. В процессе использования он готовит блюда быстро, обычно вкусно и сочно, а функция дегидратора позволяет делать полезные снеки. Устройство оснащено вертелом и съёмной крышкой, что расширяет возможности приготовления и удобство ухода.

Но в работе встречаются проблемы с равномерностью приготовления, что заметно на некоторых блюдах. Иногда появляется запах при первом использовании, а инструкция и рецепты оставляют вопросы. Качество сборки и комплектация у разных экземпляров разные — к сожалению, бывают неприятные дефекты и неполные наборы аксессуаров. В целом, это полезный прибор, но требует внимательности при выборе и эксплуатации.

#мультигриль #электрогриль #готовкадома

Аэрогриль электрический для дома 14 литров, мультипечь — 9 037 27 273 руб.

Производительность

На обработку одного товара уходит около 1 минуты:

  • ~25 секунд — сбор отзывов (браузер + XHR)
  • ~35 секунд — обработка через LLM

Объём данных: 1000–2000 отзывов, ~60–65 тысяч токенов на полный цикл.

Технический стек

  • Playwright — сбор данных
  • Простая логика фильтрации — предварительная классификация
  • OpenRouter — работа с LLM
  • Параллельная обработка групп — ускорение Map-фазы

Оркестрация может быть реализована как backend-сервис или через no-code инструменты — например, n8n.

Типичные ошибки при реализации

  • Слишком большие группы — при >100 отзывах модель начинает обобщать и терять детали
  • Разные промпты для разных групп — результаты становятся несовместимы на этапе агрегации
  • Отсутствие финальной агрегации — без Reduce-фазы отчёт превращается в нечитаемую свалку
  • Попытка сделать всё одним запросом — самая частая ошибка, с которой всё и начинается

Ограничения

Подход не идеален: качество зависит от выбранной модели, каждый цикл стоит токенов, и 100% точности формулировок никто не гарантирует. При этом ключевые проблемы и паттерны выявляются стабильно — шум эффективно отфильтровывается уже на этапе группировки.

Заключение

Анализ тысяч отзывов Wildberries через LLM «в лоб» — это лотерея. Поэтапная обработка с группировкой и агрегацией даёт принципиально другое качество: стабильный и повторяемый результат. Запустите его на одном товаре дважды — получите одинаковые выводы. Запустите на тысяче товаров — получите сопоставимые отчёты, которые можно сравнивать между собой.

Именно это отличает инструмент от эксперимента: не разовый удачный вывод, а предсказуемый процесс, который масштабируется под любой объём и превращает тысячи отзывов в структурированную аналитику за минуту.

Для бизнеса это способ быстро выявить проблемы товара, улучшить карточку и снизить возвраты. Для покупателя — возможность понять плюсы и минусы, не читая сотни комментариев вручную.

Разборы и примеры анализа: https://t.me/wildberris_pp

// Python Dev

Другие статьи Python Dev

Все статьи

// Python Projects

Проекты Python Dev

Все проекты

// Contact

Нужна помощь?

Свяжись со мной и я помогу решить проблему