TaskPyro:Python任务调度与爬虫管理轻量级平台介绍
前言
推荐一款本人在使用的Python爬虫管理平台,亲测不错!!!
TaskPyro 是什么?
TaskPyro官方文档
TaskPyro 是一个轻量级的 Python 任务调度平台,专注于提供简单易用的任务管理和爬虫调度解决方案。它能够帮助您轻松管理和调度 Python 任务,特别适合需要定时执行的爬虫任务和数据处理任务。
开发背景
在当今数字化时代,自动化数据采集和处理变得越来越重要。然而,现有的任务调度解决方案要么过于复杂,要么缺乏针对 Python 环境的特定优化。TaskPyro 正是为了解决这些痛点而诞生的,旨在为 Python 开发者提供一个简单、高效、可靠的任务调度平台。
为什么选择TaskPyro?
适用人群
TaskPyro 特别适合以下用户群体:
使用流程
核心功能
TaskPyro 提供了一系列强大的功能,帮助您高效管理 Python 任务:
📅 灵活的任务调度
🔧 Python 环境管理
🕷️ 爬虫框架支持
📊 任务监控与管理
💼 用户友好
项目截图
仪表盘
项目管理
Python虚拟环境
任务管理
Docker 安装
TaskPyro 提供了基于 Docker 的快速部署方案,让您能够轻松地在任何支持 Docker 的环境中运行。
前置条件
在开始安装之前,请确保您的系统已经安装了以下软件:
Docker 安装
Docker Compose 安装
安装步骤
0. 拉取代码
gitub
git clone https://github.com/taskPyroer/taskpyro.git
gitee
git clone https://gitee.com/hu_yupeng123/taskpyrodocker.git
可以直接拉取上面的代码,或者按下面的1、2、3步骤创建文件
1. 创建项目目录
mkdir taskpyro
cd taskpyro
2. 创建 docker-compose.yml 文件
在项目目录中创建 docker-compose.yml
文件,内容如下:
version: '3'
services:
frontend:
image: crpi-7ub5pdu5y0ps1uyh.cn-hangzhou.personal.cr.aliyuncs.com/taskpyro/taskpyro-frontend:1.0
ports:
- "${FRONTEND_PORT:-7789}:${FRONTEND_PORT:-7789}"
environment:
- PORT=${FRONTEND_PORT:-7789}
- SERVER_NAME=${SERVER_NAME:-localhost}
- BACKEND_PORT=${BACKEND_PORT:-8000}
- API_URL=http://${SERVER_NAME}:${BACKEND_PORT:-8000}
- TZ=Asia/Shanghai
env_file:
- .env
depends_on:
- api
api:
image: crpi-7ub5pdu5y0ps1uyh.cn-hangzhou.personal.cr.aliyuncs.com/taskpyro/taskpyro-api:1.0
ports:
- "${BACKEND_PORT:-8000}:${BACKEND_PORT:-8000}"
environment:
- PORT=${BACKEND_PORT:-8000}
- PYTHONPATH=/app
- CORS_ORIGINS=http://localhost:${FRONTEND_PORT:-7789},http://127.0.0.1:${FRONTEND_PORT:-7789}
- TZ=Asia/Shanghai
- WORKERS=${WORKERS:-1}
volumes:
- /opt/taskpyrodata/static:/app/../static
- /opt/taskpyrodata/logs:/app/../logs
- /opt/taskpyrodata/data:/app/data
env_file:
- .env
init: true
restart: unless-stopped
3. 创建 .env 文件
在项目目录中创建 .env
文件,用于配置环境变量:
FRONTEND_PORT=8080
BACKEND_PORT=9000
SERVER_NAME=localhost
WORKERS=1
4. 启动服务
docker-compose up -d
启动后直接在浏览器中访问至 http://<your_ip>:8080
安装注意事项
-
数据持久化
- 数据文件会保存在
/opt/taskpyrodata
目录下,包含以下子目录: static
:静态资源文件logs
:系统日志文件data
:应用数据文件- 建议定期备份这些目录,特别是
data
目录 -
环境变量配置
- 在
.env
文件中配置以下必要参数: FRONTEND_PORT
:前端服务端口(默认8080)BACKEND_PORT
:后端服务端口(默认9000)SERVER_NAME
:服务器域名或IP(默认localhost,不用修改)WORKERS
:后端工作进程数(默认1,不用修改)- 确保
SERVER_NAME
配置正确,否则可能导致API调用失败 -
端口配置
- 前端服务默认使用8080端口
- 后端服务默认使用9000端口
- 确保这些端口未被其他服务占用
- 如需修改端口,只需要更新
.env
文件中的配置 -
容器资源配置
- 建议为容器预留足够的CPU和内存资源
- 可通过Docker的资源限制参数进行调整
- 监控容器资源使用情况,适时调整配置
常见问题
-
前端服务无法访问
- 检查
FRONTEND_PORT
端口是否被占用 - 确认前端容器是否正常启动:
docker-compose ps frontend
- 查看前端容器日志:
docker-compose logs frontend
- 验证
SERVER_NAME
配置是否正确 -
后端API连接失败
- 检查
BACKEND_PORT
端口是否被占用 - 确认后端容器是否正常启动:
docker-compose ps api
- 查看后端容器日志:
docker-compose logs api
- 验证
CORS_ORIGINS
配置是否包含前端访问地址 -
容器启动失败
- 检查 Docker 服务状态:
systemctl status docker
- 确认 docker-compose.yml 文件格式正确
- 验证环境变量配置是否完整
- 检查数据目录权限:
ls -l /opt/taskpyrodata
-
数据持久化问题
- 确保
/opt/taskpyrodata
目录存在且有正确的权限 - 检查磁盘空间是否充足
- 定期清理日志文件避免空间占用过大
- 建议配置日志轮转策略
-
资源配置
- 根据实际需求调整 Docker 容器的资源限制
- 监控服务器资源使用情况,适时调整配置
升级说明
要升级到新版本,请执行以下步骤:
# 拉取最新镜像
docker-compose pull
# 重启服务
docker-compose up -d
更详细的文档
https://docs.taskpyro.cn/
作者:Data 实验室