Ollama 完整部署与使用指南
目录
一、Ollama 多平台安装
Linux 系统
# 一键安装
curl -fsSL https://ollama.com/install.sh | sh
# 权限配置
sudo usermod -aG ollama $USER
newgrp ollama
# 服务管理
sudo systemctl start ollama
sudo systemctl enable ollama
# 验证
ollama --version
macOS 系统
# 安装
curl -fsSL https://ollama.com/install.sh | sh
# 运行方式
ollama serve # 前台运行
brew services start ollama # 后台服务
Windows 系统
- 下载安装包:Ollama Windows Installer
- 双击安装
- 验证:
ollama list
二、远程访问配置
sudo systemctl edit ollama.service
添加内容:
[Service]
Environment="OLLAMA_HOST=0.0.0.0"
Environment="OLLAMA_ORIGINS=*"
重载服务:
sudo systemctl daemon-reload
sudo systemctl restart ollama
三、DeepSeek 模型部署
模型拉取
# 基础版
ollama pull deepseek-r1
# 可选规格
ollama pull deepseek-r1:7b # 7B参数
ollama pull deepseek-r1:33b # 33B参数
ollama pull deepseek-r1:7b-q4_0 # 量化版
模型运行
# 基础运行
ollama run deepseek-r1
# GPU加速
ollama run deepseek-r1 --gpu
# 限制线程
OLLAMA_NUM_THREADS=4 ollama run deepseek-r1
四、硬件适配方案
纯CPU运行
配置建议:
- 7B模型:≥8GB内存
- 33B模型:≥32GB内存
- 推荐使用量化模型
GPU加速
要求:
- 7B模型:≥6GB显存
- 33B模型:≥20GB显存
- 需安装NVIDIA驱动和CUDA Toolkit 12.x
五、应用接入方案
MaxKB 部署
docker run -d \
--name=maxkb \
-p 8080:8080 \
-v ~/maxkb_data:/var/lib/postgresql/data \
1panel/maxkb:latest
访问:http://localhost:8080 (默认账号: admin/MaxKB@123…)
ChatBox 部署
- 下载地址:ChatBox Releases
- 配置Ollama连接:
- API Endpoint:
http://localhost:11434 - Model Name:
deepseek-r1
- API Endpoint:
六、故障排查
- 服务无法启动:
journalctl -u ollama -f # 查看日志
- 模型加载失败:
ollama rm deepseek-r1 && ollama pull deepseek-r1
- 连接问题:
curl http://ollama-ip:11434 # 测试连通性
七、性能监控
建议部署监控工具:
- Zabbix + Grafana 监控系统资源
- nvidia-smi 监控GPU使用情况
提示:本文档持续更新,建议定期查看官方文档获取最新信息。
PREVIOUSlabuladong algorithm 笔记
NEXTtest笔记