最近DeepSeek火得不行,各种群都在聊。但很多人不知道,除了用官网的API,DeepSeek的模型是可以本地部署的。昨晚又封了好几个网上流传的免费中转站,与其操心哪个站点还能用,不如自己拉个容器跑。
今天分享一个最省事的方案——基于Ollama+Docker,几分钟就能把DeepSeek跑起来。
# 准备工作
你得有一台带显卡的机器。如果没有独显,纯CPU也能跑,就是慢点。VPS的话推荐至少4G内存,2核起步。
# 第一步:装Docker
这步不多说,一行命令搞定:
“`
curl -fsSL https://get.docker.com | sh
“`
装完别忘了把当前用户加到docker组:
“`
sudo usermod -aG docker $USER
“`
然后重新登录或newgrp docker生效。
# 第二步:部署Ollama
Ollama是目前最省心的本地LLM运行工具,没有之一。直接拉镜像跑:
“`
docker run -d –name ollama \
-v ollama:/root/.ollama \
-p 11434:11434 \
ollama/ollama
“`
等个几十秒,镜像拉完容器就起来了。
然后拉模型:
“`
docker exec ollama ollama pull deepseek-r1:7b
“`
7B的模型大概4G左右,网速快的话几分钟就拉完。如果VPS内存只有4G,可以试试deepseek-r1:1.5b,更轻量。
# 第三步:跑起来验证
拉完之后,直接调API验证:
“`
curl http://localhost:11434/api/generate \
-d ‘{“model”:”deepseek-r1:7b”,”prompt”:”Python的GIL是什么?”,”stream”:false}’
“`
能看到返回结果就说明部署成功了。默认的11434端口暴露的是Ollama的API接口,和OpenAI的API格式不太一样,但很多开源项目都原生支持Ollama。
# 第四步:装个Web界面(可选)
光命令行不够直观,可以用Open WebUI:
“`
docker run -d –name open-webui \
-p 3000:8080 \
-v open-webui:/app/backend/data \
–link ollama \
-e OLLAMA_BASE_URL=http://ollama:11434 \
ghcr.io/open-webui/open-webui:main
“`
访问 http://你的IP:3000 就能看到一个类似ChatGPT的界面了。
# 延伸:搭配OpenAI兼容API格式
如果你想让Ollama兼容OpenAI的client格式,Ollama 0.3.0+已经自带了兼容接口。直接这样调:
“`
curl http://localhost:11434/v1/chat/completions \
-H “Content-Type: application/json” \
-d ‘{
“model”:”deepseek-r1:7b”,
“messages”:[{“role”:”user”,”content”:”写一段冒泡排序”}]
}’
“`
这样就省去了写兼容层的麻烦,很多现成的Agent框架直接就能连。
# 一个忠告
本地部署虽然省钱,但7B的模型跑复杂任务效果一般。真要做代码分析、长文档处理,该用API还是用API。本地部署的好处是:私密性好、不限调用次数、适合做一些反复调用的自动化任务。
我个人是API+本地部署混着用的——敏感数据走本地,日常开发走API。