Ollama本地部署AI完全教程（2026）：让DeepSeek和Llama在你的电脑上运行

Ollama本地部署AI完全教程（2026）：让大模型在你自己的电脑上运行

你有没有想过，把DeepSeek、Llama、Mistral这些顶级AI大模型直接跑在自己的电脑上，完全不需要网络、不需要API密钥、数据绝对不会上传到任何服务器？Ollama让这件事变得出奇地简单。这份教程会带你从零开始，把Ollama装好、跑通，并告诉你怎么把本地AI融入日常工作流。

一、为什么要本地部署AI？

本地运行大模型有几个在线AI无法替代的优势：

绝对隐私：所有数据留在本地，适合处理合同、财务报告、源代码等敏感内容
零成本使用：一次下载，无限次使用，无API费用
离线可用：断网环境、出差、飞机上照常工作
无速率限制：不受API并发限制，批量处理任务效率极高
可定制化：自由调整模型参数、系统提示词，打造专属AI助手

二、运行Ollama的硬件要求

本地运行AI对硬件有一定要求，但不像很多人想象的那么高。以下是不同配置能运行的模型规模参考：

RAM配置	可运行模型	速度
8GB内存	7B参数模型（如Llama3.1-7B、DeepSeek-7B）	较慢，约10-20 token/s
16GB内存	13B参数模型，流畅运行7B模型	流畅，约30-50 token/s
32GB内存	34B参数模型，舒适运行13B	快速，接近在线体验
有独立GPU（8GB显存+）	任意7B-34B模型，GPU加速	极快，50-100+ token/s

对于大多数用户，推荐至少16GB内存，搭配一块独立显卡（NVIDIA或Apple Silicon的M系列芯片都有很好的支持）。特别是M2/M3/M4 MacBook Pro系列，凭借统一内存架构，是运行本地AI的绝佳平台。

三、安装Ollama：5分钟搞定

macOS / Linux安装

访问 ollama.com，点击下载对应系统版本。macOS直接下载.dmg安装包，双击安装即可。Linux用户可在终端执行：curl -fsSL https://ollama.com/install.sh | sh。安装完成后，Ollama会在后台静默运行。

Windows安装

下载Windows版.exe安装包，按提示完成安装。安装后在系统托盘可看到Ollama图标，右键可管理服务。

下载并运行第一个模型

打开终端（Windows用PowerShell），输入：ollama run deepseek-r1:7b，Ollama会自动下载模型（约4.7GB）并启动对话界面。首次下载需要时间，之后每次启动只需几秒。想试试Llama？运行 ollama run llama3.2。想用更强的推理模型？运行 ollama run qwq（通义千问的推理模型）。

四、推荐模型清单：按场景选择

Ollama支持数百个开源模型，以下是按场景筛选出的推荐选择：

日常问答/写作助手：llama3.2 或 gemma2:9b——速度快、中英文均衡
中文场景专用：qwen2.5:7b（通义千问2.5）——中文理解和生成最优
深度推理/数学：deepseek-r1:7b 或 qwq:32b——慢但准，适合需要思维链的复杂任务
代码生成：codellama:13b 或 deepseek-coder-v2——专为编程优化
轻量快速：phi3:mini——3.8B参数，低配机器也能跑，响应极快

五、进阶用法：API调用与工作流集成

Ollama安装后会在本地启动一个API服务（默认地址：http://localhost:11434），完全兼容OpenAI API格式。这意味着任何支持OpenAI API的工具都可以无缝切换到本地Ollama模型。

搭配Open WebUI使用（推荐）

Open WebUI是一个开源的ChatGPT风格界面，可以连接本地Ollama，提供多模型管理、对话历史、文件上传等功能。使用Docker安装只需一条命令：docker run -d -p 3000:80 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data ghcr.io/open-webui/open-webui:main。安装后访问 http://localhost:3000 即可使用完整的AI聊天界面。

搭配n8n自动化使用

n8n支持通过Ollama节点连接本地AI，可以构建完全本地化的自动化工作流：文件自动分类、邮件自动回复草稿、数据自动提取……整个流程数据不经过任何外部服务器，是企业内部敏感数据处理的理想方案。

搭配Continue.dev使用（AI编程）

Continue.dev是VS Code的AI编程插件，支持连接本地Ollama模型，实现免费的代码补全、解释和重构功能。配置方法：安装Continue插件后，在设置中将模型提供商选择为”Ollama”，选择已下载的代码模型即可。这套组合完全免费，代码数据留在本地，适合有代码保密需求的开发者。

六、常见问题与解决方案

Q：模型运行很慢怎么办？

首先确认是否有GPU加速：运行 ollama ps 查看模型是否使用GPU。如果显示”CPU only”，需要安装对应的GPU驱动（NVIDIA需要CUDA驱动，AMD需要ROCm）。在没有GPU的情况下，建议使用更小的模型（3B-7B参数），速度会明显提升。

Q：模型文件太大，磁盘空间不够怎么办？

Ollama模型默认存放在 ~/.ollama/models 目录。可以通过设置环境变量 OLLAMA_MODELS 更改存储位置到大容量硬盘。不再需要的模型可以用 ollama rm 模型名 删除。

Q：如何在同一网络的其他设备访问Ollama？

设置环境变量 OLLAMA_HOST=0.0.0.0 后重启Ollama，即可在同一局域网内的其他设备通过 http://你的IP:11434 访问。适合在家里NAS或台式机上运行Ollama，再用笔记本或手机远程调用。

七、总结：本地AI是数据隐私的终极方案

Ollama把”本地运行大模型”这件原本复杂的事情变得极其简单，安装到运行第一个模型，全程不超过15分钟。对于有隐私需求的个人用户、企业内网部署需求，或者只是想摆脱API费用束缚的AI爱好者，Ollama都是目前最优雅的解决方案。

配合Open WebUI的可视化界面、n8n的自动化工作流或Continue的AI编程辅助，本地AI的能力可以进一步放大，成为真正属于你自己的AI基础设施。想了解更多AI工具的深度使用技巧，欢迎访问AI工具导航与使用指南。

Ollama本地部署AI完全教程（2026）：让DeepSeek和Llama在你的电脑上运行

Ollama本地部署AI完全教程（2026）：让大模型在你自己的电脑上运行

一、为什么要本地部署AI？

二、运行Ollama的硬件要求