🎨 Встановлення LM Studio

Красивий десктопний додаток для запуску ШІ-моделей локально. Завантажуйте моделі з HuggingFace одним кліком, спілкуйтеся в зручному інтерфейсі та запускайте OpenAI-сумісний API-сервер — усе на вашому комп'ютері.

⟬ Встановити LM Studio Чому LM Studio? →

Чому варто обрати LM Studio?

Сім причин, чому LM Studio — найкращий вибір для локального ШІ з графічним інтерфейсом

🖌️

Красивий графічний інтерфейс

Не потрібен термінал! Зручний сучасний інтерфейс з чатом, налаштуваннями та керуванням моделями — усе мишкою.

⬇️

Завантаження моделей одним кліком

Шукайте та завантажуйте моделі з HuggingFace прямо в додатку. Жодних команд, жодних конфігурацій — обрав і завантажив.

💬

Вбудований чат-інтерфейс

Спілкуйтеся з моделлю в зручному чаті з підсвіткою синтаксису, історією розмов та налаштуваннями генерації.

🔌

OpenAI-сумісний API-сервер

Запустіть локальний сервер на порту 1234 — і використовуйте LM Studio з будь-яким додатком, що підтримує OpenAI API, включно з Hermes Agent.

🖥️

Автоматичне визначення заліза

LM Studio автоматично визначає ваш GPU, RAM та CPU, і встановлює оптимальні параметри для найкращої швидкості.

⚖️

Порівняння моделей поруч

Запустіть дві моделі поруч у спліт-режимі — порівнюйте відповіді, швидкість та якість в реальному часі.

🆓

Безкоштовно для особистого використання

LM Studio повністю безкоштовний для персонального використання. Жодних підписок, жодних обмежень на кількість запитів.

Скільки пам'яті потрібно?

Орієнтовні вимоги VRAM/RAM для запуску моделей (квантизація Q4_K_M)

Модель	Розмір	VRAM (GPU)	RAM (CPU)	На диску
Gemma 4 E2B	2B	1.5 ГБ	4 ГБ	1.4 ГБ
Granite 4.1	3B	2 ГБ	4 ГБ	1.8 ГБ
Gemma 4 E4B	4B	3 ГБ	8 ГБ	2.8 ГБ
Qwen3	4B	3 ГБ	8 ГБ	2.7 ГБ
Llama 3.1	8B	5 ГБ	8 ГБ	4.7 ГБ
DeepSeek R1	8B	5.5 ГБ	8 ГБ	5 ГБ
Gemma 4	12B	8 ГБ	16 ГБ	7.5 ГБ
DeepSeek R1	14B	9 ГБ	16 ГБ	8.5 ГБ
Qwen 3.6	27B	17 ГБ	32 ГБ	16 ГБ
Gemma 4	26B MoE	6 ГБ*	16 ГБ	15 ГБ
Gemma 4	31B	20 ГБ	32 ГБ	19 ГБ
Llama 3.1	70B	40 ГБ	64 ГБ	38 ГБ

⚠️ Важливо: VRAM вказано для квантизації Q4_K_M — оптимальний баланс якості та розміру. Для Q8_0 додайте ~50% до VRAM. Для FP16 — ~2x від Q4.
*Gemma 4 26B MoE — активує лише 4B параметрів на кожен токен, тому VRAM для inference значно менший, але модель завантажується повністю.

Встановлення LM Studio

Покрокові інструкції для Linux, macOS та Windows

🐧 Linux

1

Завантажте AppImage з офіційного сайту

Перейдіть на lmstudio.ai та завантажте версію для Linux (AppImage).
2
Зробіть файл виконуваним

Відкрийте термінал у папці завантажень і виконайте:
bash
```
chmod +x LM_Studio-*.AppImage
```
3
Запустіть LM Studio

Двічі клікніть на AppImage файл або запустіть з терміналу:
bash
```
./LM_Studio-*.AppImage
```

💡 Порада: Якщо AppImage не запускається, переконайтеся, що у вас встановлено FUSE: sudo apt install libfuse2. Також можна встановити LM Studio через Homebrew на Linux: brew install --cask lm-studio.

🍎 macOS

1

Завантажте DMG з офіційного сайту

Перейдіть на lmstudio.ai та завантажте версію для macOS (DMG). Для Mac з Apple Silicon (M1/M2/M3/M4) оберіть ARM-версію, для Intel — x86.
2

Перетягніть LM Studio до Applications

Відкрийте завантажений DMG файл і перетягніть іконку LM Studio у папку Applications.
3

Запустіть LM Studio

Відкрийте LM Studio з Applications або через Spotlight (Cmd + Space → LM Studio).

💡 Порада: На macOS з Apple Silicon (M1/M2/M3/M4) LM Studio працює нативно через Metal та досягає дуже високої швидкості генерації. Також можна встановити через Homebrew: brew install --cask lm-studio.

🪟 Windows

1

Завантажте інсталятор

Перейдіть на lmstudio.ai та завантажте EXE-інсталятор для Windows.
2

Запустіть інсталяцію

Відкрийте завантажений файл та слідуйте майстру встановлення. Натисніть «Next», прийміть ліцензію та оберіть папку встановлення.
3

Запустіть LM Studio

Після встановлення відкрийте LM Studio з меню Пуск або з робочого столу.

⚠️ Вимоги для GPU-прискорення на Windows: Для прискорення на NVIDIA GPU потрібен востанній драйвер CUDA та CUDA Toolkit. LM Studio автоматично використовує GPU, якщо він доступний. На AMD GPU підтримується Vulkan-бекенд.

Перші кроки в LM Studio

Як розпочати роботу після встановлення

1️⃣ Завантажте першу модель

Після першого запуску LM Studio запропонує завантажити модель. Оберіть Llama 3.1 8B — це найкраща модель для початку: хороша якість, помірні вимоги до заліза (8 ГБ RAM). Або скористайтеся пошуком всередині додатку, щоб знайти інші моделі на HuggingFace.

💡 Рекомендація

Моделі для початку:
  🦙 Llama 3.1 8B Instruct (GGUF)    — універсальна, найкраща для чату
  🔮 Qwen 3.6 27B (GGUF)             — кодування, агентні задачі, міркування
  ✨ Gemma 4 E4B (GGUF)              — від Google, компактна, vision
  🧠 DeepSeek R1 8B (GGUF)           — reasoning, аналіз, міркування

2️⃣ Почніть розмову в чаті

Коли модель завантажена, перейдіть на вкладку Chat у LM Studio. Виберіть модель у спадному списку та починайте спілкуватись! Ви можете налаштувати температуру, довжину відповіді та системний промпт у панелі налаштувань праворуч.

💡 Порада: Встановіть системний промпт українською, щоб модель відповідала вашою мовою: «Ти — українськомовний асистент. Відповідай українською.»

3️⃣ Спробуйте режим API-сервера

Перейдіть на вкладку Local Server (іконка ⟵→ у бічній панелі). Завантажте модель та натисніть «Start Server». LM Studio запустить OpenAI-сумісний сервер на порту 1234 — тепер ви можете використовувати його з будь-яким клієнтом або скриптом.

✅ Готово! Сервер працює на http://localhost:1234 — сумісний з OpenAI API.

API-сервер LM Studio

Як використовувати LM Studio як OpenAI-сумісний сервер на порту 1234

🚀 Запуск API-сервера

У LM Studio перейдіть на вкладку Local Server. Виберіть модель, натисніть «Start Server». Сервер запуститься на http://localhost:1234 та підтримує endpoints:

POST /v1/chat/completions — чат-запити (як у ChatGPT)
POST /v1/completions — текстові доповнення
GET /v1/models — список доступних моделей

📡 Приклад: запит через curl

Надішліть запит до LM Studio так само, як до OpenAI API:

bash

curl http://localhost:1234/v1/chat/completions \
  -H "Content-Type: application/json" \
  -d '{
    "model": "llama-3.1-8b-instruct",
    "messages": [
      {"role": "system", "content": "Ти — українськомовний асистент."},
      {"role": "user", "content": "Розкажи жарт українською"}
    ],
    "temperature": 0.7
  }'

📩 Відповідь сервера

LM Studio повертає відповідь у стандартному форматі OpenAI:

json

{
  "id": "chatcmpl-abc123",
  "object": "chat.completion",
  "model": "llama-3.1-8b-instruct",
  "choices": [{
    "index": 0,
    "message": {
      "role": "assistant",
      "content": "Чому програміст не п'є чай? Бо він частіше п'є каву, поки код компілюється!"
    },
    "finish_reason": "stop"
  }],
  "usage": {
    "prompt_tokens": 24,
    "completion_tokens": 18,
    "total_tokens": 42
  }
}

🤖 Використання з Hermes Agent

LM Studio — ідеальне джерело моделі для Hermes Agent. Налаштуйте Hermes на використання LM Studio як провайдера:

yaml

# У конфігурації Hermes (~/.hermes/config.yaml)
provider: openai
base_url: http://localhost:1234/v1
model: llama-3.1-8b-instruct
api_key: lm-studio   # будь-яке значення, LM Studio не перевіряє ключ

✅ Перевага: Hermes + LM Studio = повністю безкоштовний AI-асистент з графічним інтерфейсом для керування моделями та Telegram-ботом для спілкування.

🐍 Приклад: Python з OpenAI SDK

Використовуйте офіційний Python SDK OpenAI, просто змінивши base_url:

python

from openai import OpenAI

client = OpenAI(
    base_url="http://localhost:1234/v1",
    api_key="lm-studio"  # будь-яке значення
)

response = client.chat.completions.create(
    model="llama-3.1-8b-instruct",
    messages=[
        {"role": "system", "content": "Ти — українськомовний асистент."},
        {"role": "user", "content": "Напиши вірш про Київ"}
    ]
)

print(response.choices[0].message.content)

💡 Важливо: LM Studio API-сервер працює лише тоді, коли додаток запущений. Якщо вам потрібен фоновий сервер 24/7 — краще використовувати Ollama, який працює як системний демон.

Часті запитання

Відповіді на найпоширеніші питання про LM Studio

CPU: Будь-який сучасний багатоядерний процесор (4+ ядер).

RAM: Мінімум 8 ГБ для моделей 7B-8B (16+ ГБ для моделей 13B+).

GPU (опціонально): NVIDIA з CUDA та 8+ ГБ VRAM значно прискорить генерацію. На macOS Apple Silicon (M1+) працює через Metal.

Диск: 10–50 ГБ вільного місця залежно від кількості моделей. Модель 8B займає ~5 ГБ.

LM Studio працює з моделями у форматі GGUF — це формат квантизованих моделей на основі llama.cpp. Ви знайдете тисячі GGUF-моделей на HuggingFace. LM Studio автоматично показує лише сумісні моделі при пошуку всередині додатку.

Q4_K_M — оптимальний баланс якості та швидкості
Q5_K_M — краща якість, трохи повільніше
Q8_0 — майже без втрати якості, але значно більший розмір
FP16 — без квантизації, найкраща якість, потрібне багато VRAM

LM Studio безкоштовний для особистого використання. Для комерційного використання потрібна ліцензія — деталі на lmstudio.ai. Водночас самі моделі мають власні ліцензії (наприклад, Llama 3.1 дозволяє комерційне використання з певними обмеженнями).

Рекомендації залежать від вашого заліза:

4 ГБ RAM (слабкий ПК): Gemma 4 E2B, Granite 4.1 3B
8 ГБ RAM + GPU 8 ГБ VRAM: Llama 3.1 8B, DeepSeek R1 8B, Gemma 4 E4B, Qwen3 4B
16 ГБ RAM + GPU 12+ ГБ VRAM: Gemma 4 12B, Qwen 3.6 27B (MoE), DeepSeek R1 14B
24+ ГБ VRAM (RTX 4090 etc.): Gemma 4 26B MoE, Qwen 3.6 27B, Gemma 4 31B
Сервер з 2×GPU (80 ГБ VRAM): Llama 3.1 70B

Шукайте моделі з суфіксом Instruct — вони оптимізовані для чату та діалогів.

LM Studio — це десктопний додаток з графічним інтерфейсом. Він ідеальний для тих, хто хоче завантажувати моделі мишкою, спілкуватись у вбудованому чаті та порівнювати моделі поруч.

Ollama — це термінальний інструмент, який працює як фоновий сервіс. Він кращий для автоматизації, скриптів та інтеграції з іншими додатками.

Обирайте LM Studio, якщо вам потрібен GUI. Обирайте Ollama, якщо вам потрібен стабільний API-сервер або ви любите термінал. Можна використовувати обидва одночасно!

Поділіться з друзями

👁 Переглядів: —

🎨 Встановлення LM Studio

Чому варто обрати LM Studio?

Красивий графічний інтерфейс

Завантаження моделей одним кліком

Вбудований чат-інтерфейс

OpenAI-сумісний API-сервер

Автоматичне визначення заліза

Порівняння моделей поруч

Безкоштовно для особистого використання

Популярні моделі для LM Studio

Llama 3.1

DeepSeek R1

Qwen 3.6

Gemma 4

Qwen3

Mistral Medium 3.5

Granite 4.1

Kimi K2.6

DeepSeek V4 Flash

Скільки пам'яті потрібно?

Встановлення LM Studio

🐧 Linux

Завантажте AppImage з офіційного сайту

Зробіть файл виконуваним

Запустіть LM Studio

🍎 macOS

Завантажте DMG з офіційного сайту

Перетягніть LM Studio до Applications

Запустіть LM Studio

🪟 Windows

Завантажте інсталятор

Запустіть інсталяцію

Запустіть LM Studio

Перші кроки в LM Studio

1️⃣ Завантажте першу модель

2️⃣ Почніть розмову в чаті

3️⃣ Спробуйте режим API-сервера

API-сервер LM Studio

🚀 Запуск API-сервера

📡 Приклад: запит через curl

📩 Відповідь сервера

🤖 Використання з Hermes Agent

🐍 Приклад: Python з OpenAI SDK

Часті запитання

Поділіться з друзями