#D-Octopus ##安装hiredis
git clone https://github.com/redis/hiredis
cd hiredis && make && sudo make install
sudo ldconfig
##安装pyreBloom
pip install -r requirements.txt
python setup.py install
##pyreBloom使用 https://github.com/seomoz/pyreBloom
##TODO
- 为pyreBloom增加scalable bloom filter功能
- 手动管理bloom filter dump file,避免bloom filter使用内存一直增加
- 添加js加载支持
- 解决任务状态追踪问题(storm,异或)不准确的问题
- 去重方式不支持计划任务,可以改用BerkelyDB或者其他数据库
- 提取正文,标题算法,可以使用链接密度算法或HTML Tag打分算法
- 提供用户自定义代码
- 任务优先级
- 单点问题