用Docker把DeepSeek跑起来:本地部署大模型入门

最近DeepSeek火得不行,各种群都在聊。但很多人不知道,除了用官网的API,DeepSeek的模型是可以本地部署的。昨晚又封了好几个网上流传的免费中转站,与其操心哪个站点还能用,不如自己拉个容器跑。

今天分享一个最省事的方案——基于Ollama+Docker,几分钟就能把DeepSeek跑起来。

# 准备工作

你得有一台带显卡的机器。如果没有独显,纯CPU也能跑,就是慢点。VPS的话推荐至少4G内存,2核起步。

# 第一步:装Docker

这步不多说,一行命令搞定:

“`
curl -fsSL https://get.docker.com | sh
“`

装完别忘了把当前用户加到docker组:

“`
sudo usermod -aG docker $USER
“`

然后重新登录或newgrp docker生效。

# 第二步:部署Ollama

Ollama是目前最省心的本地LLM运行工具,没有之一。直接拉镜像跑:

“`
docker run -d –name ollama \
-v ollama:/root/.ollama \
-p 11434:11434 \
ollama/ollama
“`

等个几十秒,镜像拉完容器就起来了。

然后拉模型:

“`
docker exec ollama ollama pull deepseek-r1:7b
“`

7B的模型大概4G左右,网速快的话几分钟就拉完。如果VPS内存只有4G,可以试试deepseek-r1:1.5b,更轻量。

# 第三步:跑起来验证

拉完之后,直接调API验证:

“`
curl http://localhost:11434/api/generate \
-d ‘{“model”:”deepseek-r1:7b”,”prompt”:”Python的GIL是什么?”,”stream”:false}’
“`

能看到返回结果就说明部署成功了。默认的11434端口暴露的是Ollama的API接口,和OpenAI的API格式不太一样,但很多开源项目都原生支持Ollama。

# 第四步:装个Web界面(可选)

光命令行不够直观,可以用Open WebUI:

“`
docker run -d –name open-webui \
-p 3000:8080 \
-v open-webui:/app/backend/data \
–link ollama \
-e OLLAMA_BASE_URL=http://ollama:11434 \
ghcr.io/open-webui/open-webui:main
“`

访问 http://你的IP:3000 就能看到一个类似ChatGPT的界面了。

# 延伸:搭配OpenAI兼容API格式

如果你想让Ollama兼容OpenAI的client格式,Ollama 0.3.0+已经自带了兼容接口。直接这样调:

“`
curl http://localhost:11434/v1/chat/completions \
-H “Content-Type: application/json” \
-d ‘{
“model”:”deepseek-r1:7b”,
“messages”:[{“role”:”user”,”content”:”写一段冒泡排序”}]
}’
“`

这样就省去了写兼容层的麻烦,很多现成的Agent框架直接就能连。

# 一个忠告

本地部署虽然省钱,但7B的模型跑复杂任务效果一般。真要做代码分析、长文档处理,该用API还是用API。本地部署的好处是:私密性好、不限调用次数、适合做一些反复调用的自动化任务。

我个人是API+本地部署混着用的——敏感数据走本地,日常开发走API。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注