Красивий десктопний додаток для запуску ШІ-моделей локально. Завантажуйте моделі з HuggingFace одним кліком, спілкуйтеся в зручному інтерфейсі та запускайте OpenAI-сумісний API-сервер — усе на вашому комп'ютері.
Сім причин, чому LM Studio — найкращий вибір для локального ШІ з графічним інтерфейсом
Не потрібен термінал! Зручний сучасний інтерфейс з чатом, налаштуваннями та керуванням моделями — усе мишкою.
Шукайте та завантажуйте моделі з HuggingFace прямо в додатку. Жодних команд, жодних конфігурацій — обрав і завантажив.
Спілкуйтеся з моделлю в зручному чаті з підсвіткою синтаксису, історією розмов та налаштуваннями генерації.
Запустіть локальний сервер на порту 1234 — і використовуйте LM Studio з будь-яким додатком, що підтримує OpenAI API, включно з Hermes Agent.
LM Studio автоматично визначає ваш GPU, RAM та CPU, і встановлює оптимальні параметри для найкращої швидкості.
Запустіть дві моделі поруч у спліт-режимі — порівнюйте відповіді, швидкість та якість в реальному часі.
LM Studio повністю безкоштовний для персонального використання. Жодних підписок, жодних обмежень на кількість запитів.
Актуальні моделі з розрахунком VRAM/RAM для запуску локально
Розміри: 8B / 70B / 405B
8B Q4_K_M: ~5 ГБ VRAM, 4.7 ГБ на диску
70B Q4_K_M: ~40 ГБ VRAM, 38 ГБ на диску
Призначення: Універсальна, чат, аналіз, tools
Пошук у LM Studio: llama 3.1
Розміри: 1.5B / 7B / 8B / 14B / 32B / 70B / 671B
8B Q4_K_M: ~5.5 ГБ VRAM, 5 ГБ на диску
14B Q4_K_M: ~9 ГБ VRAM, 8.5 ГБ на диску
Призначення: Reasoning, міркування, математика
Пошук у LM Studio: deepseek r1
Розміри: 27B / 35B
27B Q4_K_M: ~17 ГБ VRAM, 16 ГБ на диску
35B Q4_K_M: ~22 ГБ VRAM, 20 ГБ на диску
Призначення: Agentic coding, міркування, tools
Пошук у LM Studio: qwen 3.6
Розміри: E2B / E4B / 12B / 26B / 31B
E2B Q4: ~1.5 ГБ VRAM, 1.4 ГБ на диску
E4B Q4: ~3 ГБ VRAM, 2.8 ГБ на диску
12B Q4_K_M: ~8 ГБ VRAM, 7.5 ГБ на диску
26B (MoE 4B active) Q4: ~6 ГБ VRAM, 15 ГБ на диску
31B Q4_K_M: ~20 ГБ VRAM, 19 ГБ на диску
Призначення: Vision, reasoning, код, мультимодальність
Пошук у LM Studio: gemma 4
Розміри: 0.6B / 1.7B / 4B / 8B / 14B / 30B / 235B
4B Q4_K_M: ~3 ГБ VRAM, 2.7 ГБ на диску
8B Q4_K_M: ~5.5 ГБ VRAM, 5 ГБ на диску
14B Q4_K_M: ~9 ГБ VRAM, 8.5 ГБ на диску
Призначення: Мультилінгвальна, thinking, tools
Пошук у LM Studio: qwen3
Розмір: 128B
128B Q4 (cloud only): хмарний запуск
Призначення: Флагманська model, vision+tools+thinking
Пошук у LM Studio: mistral medium
Розміри: 3B / 8B / 30B
3B Q4_K_M: ~2 ГБ VRAM, 1.8 ГБ на диску
8B Q4_K_M: ~5.5 ГБ VRAM, 5 ГБ на диску
Призначення: Enterprise: RAG, tools, JSON, код
Пошук у LM Studio: granite 4.1
Розмір: cloud only
Призначення: Агентна модель: кодування, дизайн, мультіагентні системи
Пошук у LM Studio: kimi k2
Розмір: 284B MoE (13B activated), cloud only
Призначення: Швидкий reasoning, 1M контекст
Пошук у LM Studio: deepseek v4
Орієнтовні вимоги VRAM/RAM для запуску моделей (квантизація Q4_K_M)
| Модель | Розмір | VRAM (GPU) | RAM (CPU) | На диску |
|---|---|---|---|---|
| Gemma 4 E2B | 2B | 1.5 ГБ | 4 ГБ | 1.4 ГБ |
| Granite 4.1 | 3B | 2 ГБ | 4 ГБ | 1.8 ГБ |
| Gemma 4 E4B | 4B | 3 ГБ | 8 ГБ | 2.8 ГБ |
| Qwen3 | 4B | 3 ГБ | 8 ГБ | 2.7 ГБ |
| Llama 3.1 | 8B | 5 ГБ | 8 ГБ | 4.7 ГБ |
| DeepSeek R1 | 8B | 5.5 ГБ | 8 ГБ | 5 ГБ |
| Gemma 4 | 12B | 8 ГБ | 16 ГБ | 7.5 ГБ |
| DeepSeek R1 | 14B | 9 ГБ | 16 ГБ | 8.5 ГБ |
| Qwen 3.6 | 27B | 17 ГБ | 32 ГБ | 16 ГБ |
| Gemma 4 | 26B MoE | 6 ГБ* | 16 ГБ | 15 ГБ |
| Gemma 4 | 31B | 20 ГБ | 32 ГБ | 19 ГБ |
| Llama 3.1 | 70B | 40 ГБ | 64 ГБ | 38 ГБ |
Покрокові інструкції для Linux, macOS та Windows
Перейдіть на lmstudio.ai та завантажте версію для Linux (AppImage).
Відкрийте термінал у папці завантажень і виконайте:
chmod +x LM_Studio-*.AppImage
Двічі клікніть на AppImage файл або запустіть з терміналу:
./LM_Studio-*.AppImage
sudo apt install libfuse2. Також можна встановити LM Studio через Homebrew на Linux: brew install --cask lm-studio.
Перейдіть на lmstudio.ai та завантажте версію для macOS (DMG). Для Mac з Apple Silicon (M1/M2/M3/M4) оберіть ARM-версію, для Intel — x86.
Відкрийте завантажений DMG файл і перетягніть іконку LM Studio у папку Applications.
Відкрийте LM Studio з Applications або через Spotlight (Cmd + Space → LM Studio).
brew install --cask lm-studio.
Перейдіть на lmstudio.ai та завантажте EXE-інсталятор для Windows.
Відкрийте завантажений файл та слідуйте майстру встановлення. Натисніть «Next», прийміть ліцензію та оберіть папку встановлення.
Після встановлення відкрийте LM Studio з меню Пуск або з робочого столу.
Як розпочати роботу після встановлення
Після першого запуску LM Studio запропонує завантажити модель. Оберіть Llama 3.1 8B — це найкраща модель для початку: хороша якість, помірні вимоги до заліза (8 ГБ RAM). Або скористайтеся пошуком всередині додатку, щоб знайти інші моделі на HuggingFace.
Моделі для початку:
🦙 Llama 3.1 8B Instruct (GGUF) — універсальна, найкраща для чату
🔮 Qwen 3.6 27B (GGUF) — кодування, агентні задачі, міркування
✨ Gemma 4 E4B (GGUF) — від Google, компактна, vision
🧠 DeepSeek R1 8B (GGUF) — reasoning, аналіз, міркування
Коли модель завантажена, перейдіть на вкладку Chat у LM Studio. Виберіть модель у спадному списку та починайте спілкуватись! Ви можете налаштувати температуру, довжину відповіді та системний промпт у панелі налаштувань праворуч.
Перейдіть на вкладку Local Server (іконка ⟵→ у бічній панелі). Завантажте модель та натисніть «Start Server». LM Studio запустить OpenAI-сумісний сервер на порту 1234 — тепер ви можете використовувати його з будь-яким клієнтом або скриптом.
http://localhost:1234 — сумісний з OpenAI API.
Як використовувати LM Studio як OpenAI-сумісний сервер на порту 1234
У LM Studio перейдіть на вкладку Local Server. Виберіть модель, натисніть «Start Server». Сервер запуститься на http://localhost:1234 та підтримує endpoints:
POST /v1/chat/completions — чат-запити (як у ChatGPT)POST /v1/completions — текстові доповненняGET /v1/models — список доступних моделейНадішліть запит до LM Studio так само, як до OpenAI API:
curl http://localhost:1234/v1/chat/completions \
-H "Content-Type: application/json" \
-d '{
"model": "llama-3.1-8b-instruct",
"messages": [
{"role": "system", "content": "Ти — українськомовний асистент."},
{"role": "user", "content": "Розкажи жарт українською"}
],
"temperature": 0.7
}'
LM Studio повертає відповідь у стандартному форматі OpenAI:
{
"id": "chatcmpl-abc123",
"object": "chat.completion",
"model": "llama-3.1-8b-instruct",
"choices": [{
"index": 0,
"message": {
"role": "assistant",
"content": "Чому програміст не п'є чай? Бо він частіше п'є каву, поки код компілюється!"
},
"finish_reason": "stop"
}],
"usage": {
"prompt_tokens": 24,
"completion_tokens": 18,
"total_tokens": 42
}
}
LM Studio — ідеальне джерело моделі для Hermes Agent. Налаштуйте Hermes на використання LM Studio як провайдера:
# У конфігурації Hermes (~/.hermes/config.yaml)
provider: openai
base_url: http://localhost:1234/v1
model: llama-3.1-8b-instruct
api_key: lm-studio # будь-яке значення, LM Studio не перевіряє ключ
Використовуйте офіційний Python SDK OpenAI, просто змінивши base_url:
from openai import OpenAI
client = OpenAI(
base_url="http://localhost:1234/v1",
api_key="lm-studio" # будь-яке значення
)
response = client.chat.completions.create(
model="llama-3.1-8b-instruct",
messages=[
{"role": "system", "content": "Ти — українськомовний асистент."},
{"role": "user", "content": "Напиши вірш про Київ"}
]
)
print(response.choices[0].message.content)
Відповіді на найпоширеніші питання про LM Studio
CPU: Будь-який сучасний багатоядерний процесор (4+ ядер).
RAM: Мінімум 8 ГБ для моделей 7B-8B (16+ ГБ для моделей 13B+).
GPU (опціонально): NVIDIA з CUDA та 8+ ГБ VRAM значно прискорить генерацію. На macOS Apple Silicon (M1+) працює через Metal.
Диск: 10–50 ГБ вільного місця залежно від кількості моделей. Модель 8B займає ~5 ГБ.
LM Studio працює з моделями у форматі GGUF — це формат квантизованих моделей на основі llama.cpp. Ви знайдете тисячі GGUF-моделей на HuggingFace. LM Studio автоматично показує лише сумісні моделі при пошуку всередині додатку.
LM Studio безкоштовний для особистого використання. Для комерційного використання потрібна ліцензія — деталі на lmstudio.ai. Водночас самі моделі мають власні ліцензії (наприклад, Llama 3.1 дозволяє комерційне використання з певними обмеженнями).
Рекомендації залежать від вашого заліза:
Шукайте моделі з суфіксом Instruct — вони оптимізовані для чату та діалогів.
LM Studio — це десктопний додаток з графічним інтерфейсом. Він ідеальний для тих, хто хоче завантажувати моделі мишкою, спілкуватись у вбудованому чаті та порівнювати моделі поруч.
Ollama — це термінальний інструмент, який працює як фоновий сервіс. Він кращий для автоматизації, скриптів та інтеграції з іншими додатками.
Обирайте LM Studio, якщо вам потрібен GUI. Обирайте Ollama, якщо вам потрібен стабільний API-сервер або ви любите термінал. Можна використовувати обидва одночасно!