ЭФИР В СРЕДУЗакрытое AI-комьюнити EdgeLab Space – библиотека, живой чат, эфиры по средам.
Claude Code · 6
Skills для Claude Code – 300+ бесплатных навыков для твоего агентаClaude Code Starter KitВоркшоп «AI-агент ClaudeCode за 3 дня»Claude Cowork – автопилот для вашей работыRuflo – как экономить до 75% токенов в Claude CodeСвой AI-агент на VPS за 3 шага
Гайды / Claude Code / Гайд

Ruflo – как экономить до 75% токенов в Claude Code

Ruflo маршрутизирует задачи между WASM, Haiku и Opus. Простые правки обрабатываются бесплатно, сложные – дорогой моделью. Результат: до 75% экономии токенов без потери качества.

Коротко

Устанавливаем Ruflo поверх Claude Code. Настраиваем 3-тировую маршрутизацию: WASM для механических правок, Haiku для простых задач, Opus для архитектуры. Телеметрия токенов показывает реальную экономию.

Протестировано · 7 апреля 2026
ОБНОВЛЕНО 7 АПРЕЛЯ 2026 · 20 МИН ЧТЕНИЯ

Что понадобится

01
Claude Code (подписка Pro или Max)

02
Node.js 20+

03
Терминал

Проблема: токены заканчиваются быстро

Подписка Claude Code – не бесконечная. Max даёт больше, Pro – ещё меньше. При активной работе лимит сгорает за несколько часов. Причина простая: Claude Code отправляет каждую задачу на Opus. Переименовать переменную – Opus. Добавить type hint – Opus. Поправить отступ – Opus.

80% задач в типичной coding-сессии – механические. Они не требуют reasoning уровня Opus. Но Claude Code не различает сложность – он просто шлёт всё на одну модель.

Ruflo решает эту проблему. Он встраивается между вами и Claude Code как MCP-сервер и маршрутизирует задачи по сложности на три уровня. Простое – бесплатно. Среднее – дёшево. Сложное – Opus, как раньше.

Как работает 3-тировая маршрутизация

Ruflo анализирует каждую задачу и направляет её на подходящий уровень:

Tier 1 – WASM (бесплатно, <1ms)

Механические трансформации, которые не требуют LLM вообще. Компилируемый в WebAssembly код обрабатывает их мгновенно:

  • varconst/let
  • Добавление type hints
  • Простые переименования
  • Форматирование кода
  • Исправление импортов

Стоимость: ноль токенов. Скорость: менее миллисекунды.

Tier 2 – Haiku (~30% задач)

Задачи, которые требуют понимания контекста, но не глубокого reasoning:

  • Написание docstrings
  • Простые рефакторинги
  • Генерация тестов для конкретных функций
  • Исправление линтер-ошибок
  • Обновление конфигов

Стоимость: ~$0.0002 за операцию. В 50 раз дешевле Opus.

Tier 3 – Opus (сложные задачи)

Архитектурные решения, security-аудит, сложный дебаг, проектирование API. То, для чего Opus действительно нужен.

Ruflo решает, какой tier использовать, через Q-Learning роутер – систему, которая обучается на ваших паттернах работы. Чем дольше используете, тем точнее маршрутизация.

ВНИМАНИЕ

Заявленные 75% экономии – цифра авторов Ruflo. Реальная экономия зависит от характера ваших задач. Если вы в основном делаете архитектуру – экономия будет меньше. Если много механических правок – может быть даже больше.

Установка

Одна команда:

curl -fsSL https://cdn.jsdelivr.net/gh/ruvnet/ruflo@main/scripts/install.sh | bash -s -- --full

Флаг --full устанавливает MCP-интеграцию с Claude Code и настраивает телеметрию.

Или через npx с интерактивным визардом:

npx ruflo@latest init --wizard

Визард проведёт через настройку: выбор модели по умолчанию, пороги маршрутизации, конфигурация памяти.

После установки Ruflo автоматически появляется как MCP-сервер в Claude Code. Перезапустите сессию – и он активен.

Настройка телеметрии токенов

Без метрик вы не увидите экономию. Включите телеметрию:

ruflo analysis setup-telemetry

Команда создаёт папку .claude-flow/metrics/ и устанавливает переменную CLAUDE_CODE_ENABLE_TELEMETRY=1.

После нескольких сессий проверьте статистику:

ruflo analysis token-report

Отчёт покажет: сколько задач ушло на каждый tier, сколько токенов потрачено, сколько сэкономлено.

ВНИМАНИЕ

Телеметрия работает только в non-interactive режиме Claude Code. В интерактивном (обычный чат) метрики не собираются.

Что Ruflo делает в фоне

После установки Ruflo работает прозрачно – вы продолжаете использовать Claude Code как обычно. Под капотом:

  • 17 хуков перехватывают события: edit файла, запуск команды, создание PR
  • 3 фоновых воркера обрабатывают очередь задач
  • HNSW-индекс хранит паттерны успешных решений для переиспользования
  • ReasoningBank кэширует reasoning-цепочки, чтобы не повторять одинаковые рассуждения

Вы не взаимодействуете с этим напрямую. Ruflo сам решает, когда использовать кэш, когда WASM, когда отправить на Haiku.

Swarm: параллельные агенты

Для крупных задач Ruflo запускает несколько агентов одновременно. Четыре топологии:

  • Hierarchy – один координатор, несколько исполнителей. Подходит для code review (6–8 агентов проверяют разные аспекты)
  • Mesh – агенты общаются напрямую. Для задач с тесной зависимостью
  • Ring – каждый агент передаёт результат следующему. Pipeline-обработка
  • Star – один агент собирает результаты от всех. Для параллельного сбора данных

Пример – запуск code review через swarm:

ПРОМПТ

title: Запуск Ruflo swarm для code review label: Prompt copy: true

ruflo swarm start --topology hierarchy --agents 6 --task "Review src/ for security vulnerabilities, performance issues, and code style violations"

6 агентов работают параллельно: один проверяет security, другой – performance, третий – стиль. Координатор собирает и объединяет результаты. При этом большинство проверок идёт через Tier 1–2, Opus задействуется только для сложных security-кейсов.

Шаблоны CLAUDE.md

Ruflo включает 30+ готовых шаблонов CLAUDE.md под разные типы проектов:

  • Web – React, Next.js, Vue
  • API – REST, GraphQL, gRPC
  • Mobile – React Native, Flutter
  • AI/ML – training pipelines, model serving
  • Методологии – TDD, DDD, Agile

Каждый шаблон содержит оптимизированные правила маршрутизации для конкретного типа проекта. Шаблон для React, например, знает, что создание компонентов-обёрток – это Tier 2, а проектирование state management – Tier 3.

ruflo template list
ruflo template apply nextjs-app

Честные ограничения

Cold start. Ruflo самообучающийся – Q-Learning роутер набирает точность со временем. Первые сессии экономия будет скромнее. Реальные преимущества появляются после накопления паттернов.

Alpha-статус. Пакет активно разрабатывается. В апреле 2026 вышло три релиза за один день (v3.5.49–3.5.51) с P0-фиксами. Ожидайте шероховатости.

Фоновые воркеры. До v3.5.48 воркеры запускались автоматически и сами потребляли токены. Сейчас autoStart по умолчанию выключен, количество воркеров сокращено с 10 до 3. Но следите за метриками.

Независимых бенчмарков нет. Цифры 75% экономии и 250% эффективности – заявления авторов. Реальные результаты зависят от проекта.

Место на диске. HNSW-индексы, knowledge graphs и vector embeddings занимают место. Для крупных проектов – несколько сотен мегабайт.

Итого: стоит ли ставить

Ruflo решает реальную проблему – бездумный расход токенов на механические задачи. Идея 3-тировой маршрутизации здравая: не все задачи заслуживают Opus.

Ставить имеет смысл если:

  • Вы упираетесь в лимит токенов на подписке
  • Большая часть работы – рефакторинг, правки, тесты (много Tier 1–2 задач)
  • Готовы к alpha-качеству и периодическим багам

Не ставить если:

  • Работаете в основном с архитектурой (всё равно пойдёт на Tier 3)
  • Проект маленький и лимита хватает
  • Нужна абсолютная стабильность

Попробуйте на тестовом проекте, посмотрите на token-report через пару дней. Цифры скажут больше, чем любые обещания.

EDGELAB SPACE

Вступить в Edge Lab https://edgelab.su

РЕЗУЛЬТАТ

Ruflo работает как MCP-сервер внутри Claude Code. Простые задачи не тратят токены, средние уходят на дешёвую модель. Opus задействуется только для сложного.

Дальше – вместе с сообществом
Гайд прочитан. Внедрять – проще не в одиночку, а в закрытом AI-комьюнити.
Библиотека готовых скиллов и юзкейсов для Claude и Codex
Живой чат, где общаются и люди, и их агенты
Эфиры по средам и готовые решения под реальные задачи
Вступить в EdgeLab Space →1490 ₽/месМгновенный доступ. Отмена в один клик.
В чате сейчас 320+ участников и их агенты