用Docker把DeepSeek跑起来：本地部署大模型入门

发表于2026年5月5日作者 zoran

最近DeepSeek火得不行，各种群都在聊。但很多人不知道，除了用官网的API，DeepSeek的模型是可以本地部署的。昨晚又封了好几个网上流传的免费中转站，与其操心哪个站点还能用，不如自己拉个容器跑。

今天分享一个最省事的方案——基于Ollama+Docker，几分钟就能把DeepSeek跑起来。

# 准备工作

你得有一台带显卡的机器。如果没有独显，纯CPU也能跑，就是慢点。VPS的话推荐至少4G内存，2核起步。

# 第一步：装Docker

这步不多说，一行命令搞定：

“`
curl -fsSL https://get.docker.com | sh
“`

装完别忘了把当前用户加到docker组：

“`
sudo usermod -aG docker $USER
“`

然后重新登录或newgrp docker生效。

# 第二步：部署Ollama

Ollama是目前最省心的本地LLM运行工具，没有之一。直接拉镜像跑：

“`
docker run -d –name ollama \
-v ollama:/root/.ollama \
-p 11434:11434 \
ollama/ollama
“`

等个几十秒，镜像拉完容器就起来了。

然后拉模型：

“`
docker exec ollama ollama pull deepseek-r1:7b
“`

7B的模型大概4G左右，网速快的话几分钟就拉完。如果VPS内存只有4G，可以试试deepseek-r1:1.5b，更轻量。

# 第三步：跑起来验证

拉完之后，直接调API验证：

“`
curl http://localhost:11434/api/generate \
-d ‘{“model”:”deepseek-r1:7b”,”prompt”:”Python的GIL是什么？”,”stream”:false}’
“`

能看到返回结果就说明部署成功了。默认的11434端口暴露的是Ollama的API接口，和OpenAI的API格式不太一样，但很多开源项目都原生支持Ollama。

# 第四步：装个Web界面（可选）

光命令行不够直观，可以用Open WebUI：

“`
docker run -d –name open-webui \
-p 3000:8080 \
-v open-webui:/app/backend/data \
–link ollama \
-e OLLAMA_BASE_URL=http://ollama:11434 \
ghcr.io/open-webui/open-webui:main
“`

访问 http://你的IP:3000 就能看到一个类似ChatGPT的界面了。

# 延伸：搭配OpenAI兼容API格式

如果你想让Ollama兼容OpenAI的client格式，Ollama 0.3.0+已经自带了兼容接口。直接这样调：

“`
curl http://localhost:11434/v1/chat/completions \
-H “Content-Type: application/json” \
-d ‘{
“model”:”deepseek-r1:7b”,
“messages”:[{“role”:”user”,”content”:”写一段冒泡排序”}]
}’
“`

这样就省去了写兼容层的麻烦，很多现成的Agent框架直接就能连。

# 一个忠告

本地部署虽然省钱，但7B的模型跑复杂任务效果一般。真要做代码分析、长文档处理，该用API还是用API。本地部署的好处是：私密性好、不限调用次数、适合做一些反复调用的自动化任务。

我个人是API+本地部署混着用的——敏感数据走本地，日常开发走API。

发表回复 取消回复

发表回复取消回复