MiniMax-2.
• Поддерживается динамическая 3/4-битная квантизация
• Можно запустить на Mac с 128 GB RAM
• Скорость - около 20 токенов/сек
Подходит для локальных AI-агентов, кодинга и приватной работы без облака
Это ещё один шаг к тому, что мощные модели постепенно переезжают с дата-центров на локальные машины.
Guide: https://unsloth.ai/docs/models/minimax-2.5
GGUF: https://huggingface.co/unsloth/MiniMax-M2.5-GGUF