🎨 Встановлення LM Studio

Красивий десктопний додаток для запуску ШІ-моделей локально. Завантажуйте моделі з HuggingFace одним кліком, спілкуйтеся в зручному інтерфейсі та запускайте OpenAI-сумісний API-сервер — усе на вашому комп'ютері.

Чому варто обрати LM Studio?

Сім причин, чому LM Studio — найкращий вибір для локального ШІ з графічним інтерфейсом

🖌️

Красивий графічний інтерфейс

Не потрібен термінал! Зручний сучасний інтерфейс з чатом, налаштуваннями та керуванням моделями — усе мишкою.

⬇️

Завантаження моделей одним кліком

Шукайте та завантажуйте моделі з HuggingFace прямо в додатку. Жодних команд, жодних конфігурацій — обрав і завантажив.

💬

Вбудований чат-інтерфейс

Спілкуйтеся з моделлю в зручному чаті з підсвіткою синтаксису, історією розмов та налаштуваннями генерації.

🔌

OpenAI-сумісний API-сервер

Запустіть локальний сервер на порту 1234 — і використовуйте LM Studio з будь-яким додатком, що підтримує OpenAI API, включно з Hermes Agent.

🖥️

Автоматичне визначення заліза

LM Studio автоматично визначає ваш GPU, RAM та CPU, і встановлює оптимальні параметри для найкращої швидкості.

⚖️

Порівняння моделей поруч

Запустіть дві моделі поруч у спліт-режимі — порівнюйте відповіді, швидкість та якість в реальному часі.

🆓

Безкоштовно для особистого використання

LM Studio повністю безкоштовний для персонального використання. Жодних підписок, жодних обмежень на кількість запитів.

Популярні моделі для LM Studio

Актуальні моделі з розрахунком VRAM/RAM для запуску локально

🦙

Llama 3.1

Розміри: 8B / 70B / 405B
8B Q4_K_M: ~5 ГБ VRAM, 4.7 ГБ на диску
70B Q4_K_M: ~40 ГБ VRAM, 38 ГБ на диску
Призначення: Універсальна, чат, аналіз, tools
Пошук у LM Studio: llama 3.1

🧠

DeepSeek R1

Розміри: 1.5B / 7B / 8B / 14B / 32B / 70B / 671B
8B Q4_K_M: ~5.5 ГБ VRAM, 5 ГБ на диску
14B Q4_K_M: ~9 ГБ VRAM, 8.5 ГБ на диску
Призначення: Reasoning, міркування, математика
Пошук у LM Studio: deepseek r1

🔮

Qwen 3.6

Розміри: 27B / 35B
27B Q4_K_M: ~17 ГБ VRAM, 16 ГБ на диску
35B Q4_K_M: ~22 ГБ VRAM, 20 ГБ на диску
Призначення: Agentic coding, міркування, tools
Пошук у LM Studio: qwen 3.6

Gemma 4

Розміри: E2B / E4B / 12B / 26B / 31B
E2B Q4: ~1.5 ГБ VRAM, 1.4 ГБ на диску
E4B Q4: ~3 ГБ VRAM, 2.8 ГБ на диску
12B Q4_K_M: ~8 ГБ VRAM, 7.5 ГБ на диску
26B (MoE 4B active) Q4: ~6 ГБ VRAM, 15 ГБ на диску
31B Q4_K_M: ~20 ГБ VRAM, 19 ГБ на диску
Призначення: Vision, reasoning, код, мультимодальність
Пошук у LM Studio: gemma 4

🔮

Qwen3

Розміри: 0.6B / 1.7B / 4B / 8B / 14B / 30B / 235B
4B Q4_K_M: ~3 ГБ VRAM, 2.7 ГБ на диску
8B Q4_K_M: ~5.5 ГБ VRAM, 5 ГБ на диску
14B Q4_K_M: ~9 ГБ VRAM, 8.5 ГБ на диску
Призначення: Мультилінгвальна, thinking, tools
Пошук у LM Studio: qwen3

🌊

Mistral Medium 3.5

Розмір: 128B
128B Q4 (cloud only): хмарний запуск
Призначення: Флагманська model, vision+tools+thinking
Пошук у LM Studio: mistral medium

🧊

Granite 4.1

Розміри: 3B / 8B / 30B
3B Q4_K_M: ~2 ГБ VRAM, 1.8 ГБ на диску
8B Q4_K_M: ~5.5 ГБ VRAM, 5 ГБ на диску
Призначення: Enterprise: RAG, tools, JSON, код
Пошук у LM Studio: granite 4.1

Kimi K2.6

Розмір: cloud only
Призначення: Агентна модель: кодування, дизайн, мультіагентні системи
Пошук у LM Studio: kimi k2

🔬

DeepSeek V4 Flash

Розмір: 284B MoE (13B activated), cloud only
Призначення: Швидкий reasoning, 1M контекст
Пошук у LM Studio: deepseek v4

💡 Порада: Всі ці моделі можна знайти через пошук у LM Studio — відкрийте вкладку 🔍 Search і введіть назву моделі. LM Studio автоматично запропонує сумісні GGUF-файли для вашого заліза.

Скільки пам'яті потрібно?

Орієнтовні вимоги VRAM/RAM для запуску моделей (квантизація Q4_K_M)

Модель Розмір VRAM (GPU) RAM (CPU) На диску
Gemma 4 E2B 2B 1.5 ГБ 4 ГБ 1.4 ГБ
Granite 4.1 3B 2 ГБ 4 ГБ 1.8 ГБ
Gemma 4 E4B 4B 3 ГБ 8 ГБ 2.8 ГБ
Qwen3 4B 3 ГБ 8 ГБ 2.7 ГБ
Llama 3.1 8B 5 ГБ 8 ГБ 4.7 ГБ
DeepSeek R1 8B 5.5 ГБ 8 ГБ 5 ГБ
Gemma 4 12B 8 ГБ 16 ГБ 7.5 ГБ
DeepSeek R1 14B 9 ГБ 16 ГБ 8.5 ГБ
Qwen 3.6 27B 17 ГБ 32 ГБ 16 ГБ
Gemma 4 26B MoE 6 ГБ* 16 ГБ 15 ГБ
Gemma 4 31B 20 ГБ 32 ГБ 19 ГБ
Llama 3.1 70B 40 ГБ 64 ГБ 38 ГБ
⚠️ Важливо: VRAM вказано для квантизації Q4_K_M — оптимальний баланс якості та розміру. Для Q8_0 додайте ~50% до VRAM. Для FP16 — ~2x від Q4.
*Gemma 4 26B MoE — активує лише 4B параметрів на кожен токен, тому VRAM для inference значно менший, але модель завантажується повністю.

Встановлення LM Studio

Покрокові інструкції для Linux, macOS та Windows

🐧 Linux

  1. 1

    Завантажте AppImage з офіційного сайту

    Перейдіть на lmstudio.ai та завантажте версію для Linux (AppImage).

  2. 2

    Зробіть файл виконуваним

    Відкрийте термінал у папці завантажень і виконайте:

    bash
    chmod +x LM_Studio-*.AppImage
  3. 3

    Запустіть LM Studio

    Двічі клікніть на AppImage файл або запустіть з терміналу:

    bash
    ./LM_Studio-*.AppImage
💡 Порада: Якщо AppImage не запускається, переконайтеся, що у вас встановлено FUSE: sudo apt install libfuse2. Також можна встановити LM Studio через Homebrew на Linux: brew install --cask lm-studio.

🍎 macOS

  1. 1

    Завантажте DMG з офіційного сайту

    Перейдіть на lmstudio.ai та завантажте версію для macOS (DMG). Для Mac з Apple Silicon (M1/M2/M3/M4) оберіть ARM-версію, для Intel — x86.

  2. 2

    Перетягніть LM Studio до Applications

    Відкрийте завантажений DMG файл і перетягніть іконку LM Studio у папку Applications.

  3. 3

    Запустіть LM Studio

    Відкрийте LM Studio з Applications або через Spotlight (Cmd + Space → LM Studio).

💡 Порада: На macOS з Apple Silicon (M1/M2/M3/M4) LM Studio працює нативно через Metal та досягає дуже високої швидкості генерації. Також можна встановити через Homebrew: brew install --cask lm-studio.

🪟 Windows

  1. 1

    Завантажте інсталятор

    Перейдіть на lmstudio.ai та завантажте EXE-інсталятор для Windows.

  2. 2

    Запустіть інсталяцію

    Відкрийте завантажений файл та слідуйте майстру встановлення. Натисніть «Next», прийміть ліцензію та оберіть папку встановлення.

  3. 3

    Запустіть LM Studio

    Після встановлення відкрийте LM Studio з меню Пуск або з робочого столу.

⚠️ Вимоги для GPU-прискорення на Windows: Для прискорення на NVIDIA GPU потрібен востанній драйвер CUDA та CUDA Toolkit. LM Studio автоматично використовує GPU, якщо він доступний. На AMD GPU підтримується Vulkan-бекенд.

Перші кроки в LM Studio

Як розпочати роботу після встановлення

1️⃣ Завантажте першу модель

Після першого запуску LM Studio запропонує завантажити модель. Оберіть Llama 3.1 8B — це найкраща модель для початку: хороша якість, помірні вимоги до заліза (8 ГБ RAM). Або скористайтеся пошуком всередині додатку, щоб знайти інші моделі на HuggingFace.

💡 Рекомендація
Моделі для початку:
  🦙 Llama 3.1 8B Instruct (GGUF)    — універсальна, найкраща для чату
  🔮 Qwen 3.6 27B (GGUF)             — кодування, агентні задачі, міркування
  ✨ Gemma 4 E4B (GGUF)              — від Google, компактна, vision
  🧠 DeepSeek R1 8B (GGUF)           — reasoning, аналіз, міркування

2️⃣ Почніть розмову в чаті

Коли модель завантажена, перейдіть на вкладку Chat у LM Studio. Виберіть модель у спадному списку та починайте спілкуватись! Ви можете налаштувати температуру, довжину відповіді та системний промпт у панелі налаштувань праворуч.

💡 Порада: Встановіть системний промпт українською, щоб модель відповідала вашою мовою: «Ти — українськомовний асистент. Відповідай українською.»

3️⃣ Спробуйте режим API-сервера

Перейдіть на вкладку Local Server (іконка ⟵→ у бічній панелі). Завантажте модель та натисніть «Start Server». LM Studio запустить OpenAI-сумісний сервер на порту 1234 — тепер ви можете використовувати його з будь-яким клієнтом або скриптом.

✅ Готово! Сервер працює на http://localhost:1234 — сумісний з OpenAI API.

API-сервер LM Studio

Як використовувати LM Studio як OpenAI-сумісний сервер на порту 1234

🚀 Запуск API-сервера

У LM Studio перейдіть на вкладку Local Server. Виберіть модель, натисніть «Start Server». Сервер запуститься на http://localhost:1234 та підтримує endpoints:

  • POST /v1/chat/completions — чат-запити (як у ChatGPT)
  • POST /v1/completions — текстові доповнення
  • GET /v1/models — список доступних моделей

📡 Приклад: запит через curl

Надішліть запит до LM Studio так само, як до OpenAI API:

bash
curl http://localhost:1234/v1/chat/completions \
  -H "Content-Type: application/json" \
  -d '{
    "model": "llama-3.1-8b-instruct",
    "messages": [
      {"role": "system", "content": "Ти — українськомовний асистент."},
      {"role": "user", "content": "Розкажи жарт українською"}
    ],
    "temperature": 0.7
  }'

📩 Відповідь сервера

LM Studio повертає відповідь у стандартному форматі OpenAI:

json
{
  "id": "chatcmpl-abc123",
  "object": "chat.completion",
  "model": "llama-3.1-8b-instruct",
  "choices": [{
    "index": 0,
    "message": {
      "role": "assistant",
      "content": "Чому програміст не п'є чай? Бо він частіше п'є каву, поки код компілюється!"
    },
    "finish_reason": "stop"
  }],
  "usage": {
    "prompt_tokens": 24,
    "completion_tokens": 18,
    "total_tokens": 42
  }
}

🤖 Використання з Hermes Agent

LM Studio — ідеальне джерело моделі для Hermes Agent. Налаштуйте Hermes на використання LM Studio як провайдера:

yaml
# У конфігурації Hermes (~/.hermes/config.yaml)
provider: openai
base_url: http://localhost:1234/v1
model: llama-3.1-8b-instruct
api_key: lm-studio   # будь-яке значення, LM Studio не перевіряє ключ
✅ Перевага: Hermes + LM Studio = повністю безкоштовний AI-асистент з графічним інтерфейсом для керування моделями та Telegram-ботом для спілкування.

🐍 Приклад: Python з OpenAI SDK

Використовуйте офіційний Python SDK OpenAI, просто змінивши base_url:

python
from openai import OpenAI

client = OpenAI(
    base_url="http://localhost:1234/v1",
    api_key="lm-studio"  # будь-яке значення
)

response = client.chat.completions.create(
    model="llama-3.1-8b-instruct",
    messages=[
        {"role": "system", "content": "Ти — українськомовний асистент."},
        {"role": "user", "content": "Напиши вірш про Київ"}
    ]
)

print(response.choices[0].message.content)
💡 Важливо: LM Studio API-сервер працює лише тоді, коли додаток запущений. Якщо вам потрібен фоновий сервер 24/7 — краще використовувати Ollama, який працює як системний демон.

Часті запитання

Відповіді на найпоширеніші питання про LM Studio

CPU: Будь-який сучасний багатоядерний процесор (4+ ядер).

RAM: Мінімум 8 ГБ для моделей 7B-8B (16+ ГБ для моделей 13B+).

GPU (опціонально): NVIDIA з CUDA та 8+ ГБ VRAM значно прискорить генерацію. На macOS Apple Silicon (M1+) працює через Metal.

Диск: 10–50 ГБ вільного місця залежно від кількості моделей. Модель 8B займає ~5 ГБ.

LM Studio працює з моделями у форматі GGUF — це формат квантизованих моделей на основі llama.cpp. Ви знайдете тисячі GGUF-моделей на HuggingFace. LM Studio автоматично показує лише сумісні моделі при пошуку всередині додатку.

  • Q4_K_M — оптимальний баланс якості та швидкості
  • Q5_K_M — краща якість, трохи повільніше
  • Q8_0 — майже без втрати якості, але значно більший розмір
  • FP16 — без квантизації, найкраща якість, потрібне багато VRAM

LM Studio безкоштовний для особистого використання. Для комерційного використання потрібна ліцензія — деталі на lmstudio.ai. Водночас самі моделі мають власні ліцензії (наприклад, Llama 3.1 дозволяє комерційне використання з певними обмеженнями).

Рекомендації залежать від вашого заліза:

  • 4 ГБ RAM (слабкий ПК): Gemma 4 E2B, Granite 4.1 3B
  • 8 ГБ RAM + GPU 8 ГБ VRAM: Llama 3.1 8B, DeepSeek R1 8B, Gemma 4 E4B, Qwen3 4B
  • 16 ГБ RAM + GPU 12+ ГБ VRAM: Gemma 4 12B, Qwen 3.6 27B (MoE), DeepSeek R1 14B
  • 24+ ГБ VRAM (RTX 4090 etc.): Gemma 4 26B MoE, Qwen 3.6 27B, Gemma 4 31B
  • Сервер з 2×GPU (80 ГБ VRAM): Llama 3.1 70B

Шукайте моделі з суфіксом Instruct — вони оптимізовані для чату та діалогів.

LM Studio — це десктопний додаток з графічним інтерфейсом. Він ідеальний для тих, хто хоче завантажувати моделі мишкою, спілкуватись у вбудованому чаті та порівнювати моделі поруч.

Ollama — це термінальний інструмент, який працює як фоновий сервіс. Він кращий для автоматизації, скриптів та інтеграції з іншими додатками.

Обирайте LM Studio, якщо вам потрібен GUI. Обирайте Ollama, якщо вам потрібен стабільний API-сервер або ви любите термінал. Можна використовувати обидва одночасно!

Поділіться з друзями

👁 Переглядів: —