Skip to content

spydy组件

spydy的核心就是一个有序的工作流(PipeLine), 组成工作流各个步骤的就是各种组件。根据爬虫的各个步骤, spydy自带了多种类型的组件

注意: 每一个spydy组件都继承了一个抽象基类用来规范组件的行为(当然使用者在使用的时候是意识不到这些行为的存在的)。例如, 所有的Urls获取组件都继承自spydy.urls.Urls基类, 而该基类定义了一个pop抽象方法, 用来获取下一个url。