闲社

标题: 【新手教程】从零开始部署 Ollama:本地运行大模型的完整指南 [打印本页]

作者: gue3004    时间: 1 小时前
标题: 【新手教程】从零开始部署 Ollama:本地运行大模型的完整指南
从零开始部署 Ollama:本地运行大模型的完整指南

发布时间:2026-06-22 | 适合人群:AI 新手、想本地跑模型的开发者




一、什么是 Ollama?

Ollama 是目前最流行的本地大模型运行工具之一,它让你无需复杂配置就能在本地机器上运行 Llama、Qwen、Gemma 等开源大模型。最近 Ollama 更新到了 v0.30.10,带来了不少新特性:



二、前置条件

在开始之前,请确认你的环境满足以下要求:



三、安装步骤

步骤 1:下载安装 Ollama
  1. # macOS / Linux 一键安装
  2. curl -fsSL https://ollama.com/install.sh | sh
  3. # Windows 用户直接下载安装包:
  4. # https://ollama.com/download/windows
复制代码

安装完成后,验证是否成功:
  1. ollama --version
  2. # 应显示类似:ollama version 0.30.10
复制代码

步骤 2:拉取并运行模型

以目前很火的 Qwen 2.5 为例:
  1. # 下载并运行 7B 参数模型
  2. ollama run qwen2.5:7b
  3. # 如果显存充足,可以尝试更大的 14B 模型
  4. ollama run qwen2.5:14b
复制代码

首次运行会自动下载模型,下载完成后即可在终端与模型对话。

步骤 3:使用 OpenAI 兼容 API

Ollama 默认在本地启动 API 服务,可以直接用 OpenAI 格式的客户端调用:
  1. # 确保服务在运行
  2. ollama serve
  3. # API 地址:http://localhost:11434
  4. # 模型列表会自动与已下载的模型同步
复制代码

Python 调用示例:
  1. import requests
  2. response = requests.post('http://localhost:11434/v1/chat/completions', json={
  3.     "model": "qwen2.5:7b",
  4.     "messages": [{"role": "user", "content": "你好"}]
  5. })
  6. print(response.json()['choices'][0]['message']['content'])
复制代码

步骤 4:使用 ollama launch 启动 AI 助手(新功能)

v0.30+ 新增了 launch 命令,可以快速启动各种 AI 工具:
  1. # 启动 Hermes 桌面助手
  2. ollama launch hermes-desktop
  3. # 启动 Codex 编程助手
  4. ollama launch codex
  5. # 启动 Pi 助手
  6. ollama launch pi
复制代码

四、验证安装

运行以下命令测试模型是否正常工作:
  1. ollama run qwen2.5:7b
  2. >>> 你好,请介绍一下自己
复制代码

如果能正常回复,说明安装成功!

五、常见问题与解决

Q1:下载模型速度慢怎么办?
A:可以设置镜像源加速,或手动下载 GGUF 文件后通过 Modelfile 导入。

Q2:显存不足怎么运行大模型?
A:使用量化版本,如 qwen2.5:7b-q4_K_M,或开启 CPU 推理(速度较慢)。

Q3:如何同时运行多个模型?
A:Ollama 会自动管理内存,加载新模型时会卸载旧模型。如需并行,可启动多个 Ollama 实例。

Q4:Windows 上安装后命令找不到?
A:确保 Ollama 已添加到系统 PATH,或重启终端后重试。

Q5:如何自定义模型参数(temperature、system prompt 等)?
A:创建 Modelfile:
  1. FROM qwen2.5:7b
  2. PARAMETER temperature 0.7
  3. SYSTEM "你是一个专业的编程助手"
复制代码

然后执行:
  1. ollama create my-model -f Modelfile
  2. ollama run my-model
复制代码

六、进阶推荐






总结

Ollama 是目前本地部署大模型最简单的方案之一,特别适合:


最新 v0.30.10 版本在 Apple Silicon 上的 MLX 优化、prompt caching 改进、以及 launch 命令的支持,让本地 AI 体验更上一层楼。如果你还没试过,现在就是最佳时机!

有任何问题欢迎在楼下留言交流,我会尽力解答。




欢迎光临 闲社 (https://dafeng.xianshe.com/) Powered by Discuz! X5.0