Scrapy 命令
Scrapy 命令(tool commands),该章节介绍了scrapy用到的全局命令和项目命令。每个命令都提供了描述以及一些使用例子,您可以通过运行命令来获取关于每个命令的详细内容。
scrapy <command> -h
您也可以查看所有可用的命令:
scrapy -h
Scrapy提供了两种类型的命令。一种必须在Scrapy项目中运行(针对项目(Project-specific)的命令),另外一种则不需要(全局命令)。全局命令在项目中运行时的表现可能会与在非项目中运行有些许差别(因为可能会使用项目的设定)。
全局命令:
-
startproject: 创建新项目 -
settings: 获取设置值 -
runspider: 运行一个独立的爬行器(不创建项目) -
shell: Interactive scraping console -
fetch: 使用Scrapy downloader获取一个URL -
view: 浏览器中打开URL, 与Scrapy中显示一致 -
version: 打印scrapy的版本
项目(Project-only)命令:
-
crawl: Run a spider -
check: Check spider contracts -
list: List available spiders -
edit: Edit spider -
parse: Parse URL (using its spider) and print the results -
genspider: Generate new spider using pre-defined templates -
bench: Run quick benchmark test