We read every piece of feedback, and take your input very seriously.
To see all available qualifiers, see our documentation.
d237b25
一、命令行相关功能升级 1. cmd界面版增加对服务端与客户端模式的支持; 2. 新增丰富的命令行参数,且优先级高于配置文件。 二、配置文件更新 1. 增加更多可配置项; 2. 重新规范代码,配置参数为优先级最低的默认信息。 三、Spider结构体调整 1. Keyword改为Keyin,相应操作界面中“自定义输入”改为“自定义配置”(多任务时应分别多包裹一层“<>”); 2. MaxPage字段改为Limit,相应操作界面中“最大页数”改为“采集上限”(默认限制url请求数); 3. 添加subName,用于区分多任务并发的情况; 4. 允许在规则的Root()中进行阻塞; 5. 优化动态规则加载的错误处理。 四、调度器与历史记录模块升级 1. 增强历史记录功能,历史记录与Spider实例一一对应,且与输出操作保持同步更新; 2. 修复调度器在32位系统下panic的bug。 五、输出模块优化 1. 修改mysql输出模块,支持多行批量插入,修改默认连接池容量为2048,提升输出速率与稳定性; 2. mgo的insert方法更新,内部增加分批插入控制,默认为5000条,提升写入数据库的稳定性; 3. 修复连接池捕获panic的bug。 六、其他 1. 解决某些规则的代码片段在手动终止任务后依旧默默运行的问题,减少资源消耗; 2. 解决大量任务长时间运行后手动终止操作耗时太长的问题,加快终止操作响应速度; 3. 调整运行时目录文件; 4. 将大部分依赖包合并到项目中; 5. 修复一些bug。