|Глобальное издание

S&P 500 7,165 +0.38%NASDAQ 24,837 +0.73%BTC $77,527 +0.03%ETH $2,315 -0.12%SOL $86.05 -0.25%EUR/USD 1.1726 +0.17%GOLD 4,741 +0.76%S&P 500 7,165 +0.38%NASDAQ 24,837 +0.73%BTC $77,527 +0.03%ETH $2,315 -0.12%SOL $86.05 -0.25%EUR/USD 1.1726 +0.17%GOLD 4,741 +0.76%

GlobalMarkets

Today

Technology

Как я добавил llama.cpp бэкенд в CosyVoice3 и ускорил инференс в 2.6x

CosyVoice3 — одна из лучших open source TTS моделей, но LLM-часть на PyTorch работает медленно. Я добавил llama-cpp-python бэкенд с GGUF квантизацией — RTF упал с 1.17 до 0.45, ускорение 2.6x на T4. Установка одной командой, никакого Docker. Читать далее

Habr

25 апреля 2026 г.·1 мин чтения

Technology

Оригинальная статья

Как я добавил llama.cpp бэкенд в CosyVoice3 и ускорил инференс в 2.6x

Опубликовано Habr

Читать полную статью