AI моделі в хмарі без обмежень. Використовуйте потужні ШІ-моделі через API — без встановлення, без потужного заліза, без очікування. З безкоштовним тарифом для початку.
Шість причин, чому хмарний API від Ollama — чудовий вибір для роботи з ШІ
Забудьте про GPU з 24 ГБ VRAM та 64 ГБ оперативки. Моделі працюють на серверах Ollama — вам достатньо будь-якого пристрою з інтернетом.
Не потрібно чекати на завантаження багатогігабайтних моделей. Оберіть модель — і вона готова до роботи за секунди.
Почніть безкоштовно з щедрим лімітом запитів. Ідеально для знайомства з моделями, прототипування та особистих проєктів.
Llama, Mistral, Phi, Gemma, Qwen, DeepSeek та десятки інших — весь каталог ollama.com/library доступний через API.
Ніяких інсталяторів, драйверів чи конфігурацій. Зареєструйтесь — отримайте API-ключ — надсилайте запити. Все.
Смартфон, планшет, старий ноутбук, сервер у хмарі — достатньо HTTP-клієнта та інтернету. AI доступний скрізь.
Найновіші моделі доступні в Ollama Cloud — без встановлення, миттєво
Розмір: 284B MoE (13B activated)
Контекст: 1M токенів
Призначення: Швидкий reasoning, код, аналіз великих документів
Команда: ollama run deepseek-v4-flash
Контекст: 1M токенів
Можливості: Vision, tools, thinking, мультимодальність
Призначення: Кодування, агентні задачі, автономне виконання
Команда: ollama run minimax-m3
Розмір: 128B параметрів
Можливості: Vision, tools, thinking
Призначення: Флагманська модель Mistral — код, розуміння зображень
Команда: ollama run mistral-medium-3.5
Можливості: Vision, tools, thinking
Призначення: Агентна модель: кодування, дизайн, мультіагентні системи
Команда: ollama run kimi-k2.6
Можливості: Vision, tools, thinking
Призначення: Агентні workflows від NVIDIA, довгі задачі, reasoning
Команда: ollama run nemotron-3-ultra
Контекст: 1M токенів
Можливості: tools, thinking, три режими reasoning
Призначення: Максимальна якість відповідей, глибокий аналіз
Команда: ollama run deepseek-v4-pro
Розмір: 3B / 8B / 30B параметрів
Можливості: tools, RAG, JSON, багатомовність
Призначення: Підприємницькі задачі від IBM: документи, код, аналітика
Команда: ollama run granite4.1
Розмір: 33B параметрів
Можливості: Vision, tools, thinking, audio
Призначення: Мультимодальна модель NVIDIA (текст + зображення + аудіо)
Команда: ollama run nemotron3
cloud — ці моделі доступні через Ollama Cloud API.
Порівняння трьох підходів — оберіть те, що підходить вам
| Критерій | Ollama Cloud ☁️ | Ollama локально 🦙 | ChatGPT 💬 |
|---|---|---|---|
| 💰 Вартість | Безкоштовний тариф + оплата за використання | Повністю безкоштовно | Від $20/міс (Plus) |
| 🔒 Приватність | Запити на серверах Ollama | 100% локально | Дані на серверах OpenAI |
| ⚡ Швидкість | Швидко (хмарні GPU) | Залежить від вашого заліза | Швидко (хмарні сервери) |
| 🌐 Офлайн | ❌ Ні | ✅ Так | ❌ Ні |
| 🖥️ Вимоги до заліза | Будь-який пристрій + інтернет | GPU/CPU + 8–64 ГБ RAM | Будь-який браузер |
| 🧠 Доступні моделі | Весь каталог Ollama | Весь каталог Ollama | Тільки моделі OpenAI |
| 🔧 Кастомізація | Параметри через API | ✅ Повна (Modelfile) | ❌ Обмежена |
| 🔌 Формат API | OpenAI-сумісний | Власний + OpenAI-сумісний | Власний OpenAI |
Три кроки — і ви вже спілкуєтесь з AI через хмарний API
Перейдіть на ollama.com та створіть безкоштовний акаунт. Ви можете увійти через Google або GitHub.
Після реєстрації перейдіть у налаштування акаунта та згенеруйте API-ключ. Він виглядає як довгий рядок символів — збережіть його в надійному місці.
Використовуйте API-ендпойнт Ollama Cloud для чату з моделлю:
curl https://api.ollama.com/v1/chat/completions -H "Authorization: Bearer ВАШ_API_КЛЮЧ" -H "Content-Type: application/json" -d '{
"model": "llama3.1",
"messages": [
{"role": "user", "content": "Привіт! Хто ти?"}
]
}'
Ollama Cloud використовує OpenAI-сумісний формат API. Ендпойнт: https://api.ollama.com/v1/chat/completions
# Простий запит до моделі Llama 3.1
curl https://api.ollama.com/v1/chat/completions \
-H "Authorization: Bearer ВАШ_API_КЛЮЧ" \
-H "Content-Type: application/json" \
-d '{
"model": "llama3.1",
"messages": [
{"role": "system", "content": "Ти — українськомовний асистент."},
{"role": "user", "content": "Розкажи жарт українською"}
],
"temperature": 0.7
}'
// Відповідь API
{
"id": "chatcmpl-abc123",
"model": "llama3.1",
"choices": [{
"message": {
"role": "assistant",
"content": "Чому програміст носить окуляри? Бо не бачить C#!"
},
"finish_reason": "stop"
}],
"usage": {
"prompt_tokens": 25,
"completion_tokens": 15,
"total_tokens": 40
}
}
Ендпойнт: POST /v1/chat/completions
Основний метод для розмови з моделлю. Підтримує multi-turn бесіди, системні промпти, параметри генерації.
Ендпойнт: POST /v1/completions
Продовження тексту одним запитом. Корисно для автодоповнення, генерації коду тощо.
Ендпойнт: GET /v1/models
Отримайте перелік усіх доступних моделей з їхніми ідентифікаторами.
Ollama Cloud сумісний із безліччю інструментів — оберіть свій
Перейдіть у конфігурацію профілю та знайдіть розділ провайдерів моделі.
Вкажіть наступні параметри:
# Налаштування Ollama Cloud у Hermes Agent
provider: ollama-cloud
base_url: https://api.ollama.com/v1
api_key: ВАШ_API_КЛЮЧ
model: llama3.1
Hermes Agent тепер використовує моделі Ollama Cloud для ваших запитів. Можете змінити модель у будь-який момент.
# Встановіть офіційний клієнт OpenAI (сумісний з Ollama Cloud)
pip install openai
from openai import OpenAI
# Підключення до Ollama Cloud
client = OpenAI(
base_url="https://api.ollama.com/v1",
api_key="ВАШ_API_КЛЮЧ"
)
# Запит до моделі
response = client.chat.completions.create(
model="llama3.1",
messages=[
{"role": "system", "content": "Ти — українськомовний асистент."},
{"role": "user", "content": "Розкажи про Київ"}
],
temperature=0.7
)
print(response.choices[0].message.content)
import OpenAI from 'openai';
// Підключення до Ollama Cloud
const client = new OpenAI({
baseURL: 'https://api.ollama.com/v1',
apiKey: 'ВАШ_API_КЛЮЧ'
});
// Запит до моделі
const response = await client.chat.completions.create({
model: 'llama3.1',
messages: [
{ role: 'system', content: 'Ти — українськомовний асистент.' },
{ role: 'user', content: 'Напиши вірш про Україну' }
]
});
console.log(response.choices[0].message.content);
Додайте Ollama Cloud як OpenAI-сумісний провайдер у налаштуваннях. Вкажіть base URL https://api.ollama.com/v1 та ваш API-ключ.
У налаштуваннях оберіть «OpenAI API» та вкажіть кастомну адресу https://api.ollama.com/v1 з вашим ключем.
Будь-який інструмент, що підтримує OpenAI API, працюватиме з Ollama Cloud — достатньо змінити base_url на https://api.ollama.com/v1.
Відповіді на найпоширеніші питання про Ollama Cloud
Ollama Cloud — це хмарний сервіс: моделі працюють на серверах Ollama, ви звертаєтесь до них через API з будь-якого пристрою. Не потрібне потужне залізо, але потрібен інтернет.
Локальний Ollama — ви встановлюєте програму на свій комп'ютер і моделі працюють на вашому CPU/GPU. Повна приватність, працює офлайн, але потрібне потужне залізо.
Ви можете використовувати обидва підходи одночасно — вони доповнюють один одного.
Ollama Cloud має безкоштовний тариф з обмеженою кількістю запитів — ідеально для тестування та особистого використання. Для інтенсивного використання доступні платні тарифи з оплатою за токени. Точні ціни уточнюйте на ollama.com.
Так! Моделі, доступні через Ollama Cloud (Llama 3.1, Mistral, Qwen та інші), добре розуміють і генерують український текст. Для найкращих результатів:
"role": "system", "content": "Відповідай українською"Ollama Cloud передає ваші запити на сервери для обробки — як і будь-який хмарний API. Дані шифруються при передаванні (HTTPS). Проте, якщо вам потрібна повна конфіденційність, використовуйте локальний Ollama — тоді дані взагалі не залишають ваш комп'ютер.
Повний каталог моделей доступний на ollama.com/library. Найпопулярніші: