✔️ Tencent релизнула диффузионную языковую модель, которая в 6 раз быстрее классических LLM.
WeDLM 8B Instruct использует диффузионный подход к генерации текста вместо привычного для LLM авторегрессионного метода. Преимущество архитектуры в радикальном приросте производительности. В задачах математического рассуждения WeDLM работает в 3–6 раз быстрее, чем Qwen3-8B с оптимизацией vLLM.
Релиз опровергает стереотип о том, что диффузионные модели не подходят для точных текстовых задач и доказывает их способность превосходить трансформеры в скорости инференса.
Модель доступна на HuggigingFace под максимально свободной лицензией Apache 2.0.
https://wedlm.github.io/