python3.8安装scrapy_python为什么叫爬虫

python3.8安装scrapy_python为什么叫爬虫安装Scrapy与安装其他Python包没有区别,同样使用如下命令来安装:pipinstallscrapy如果在命令行窗口中运行该命令,将会看到程序并不立即下载、安装Scrapy,而是不断地下载大量第三方包。如果在命令行窗口中提示找不到pip命令,则也可以通过python命令运行pip模块来安装Scrapy,例如python-mpipinstallscrapy…

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE使用 1年只要46元 售后保障 童叟无欺

安装 Scrapy 与安装其他 Python 包没有区别,同样使用如下命令来安装:

pip install scrapy

如果在命令行窗口中运行该命令,将会看到程序并不立即下载、安装 Scrapy,而是不断地下载大量第三方包。

如果在命令行窗口中提示找不到 pip 命令,则也可以通过 python 命令运行 pip 模块来安装 Scrapy,例如 python -m pip install scrapy。

这是因为 Scrapy 需要依赖、大量第三方包。典型的,Scrapy 需要依赖如下第三方包:

pyOpenSSL:Python 用于支持 SSL(Security Socket Layer)的包。

cryptography:Python 用于加密的库。

CFFI:Python 用于调用 C 的接口库。

zope.interface:为 Python 缺少接口而提供扩展的库。

lxml:一个处理 XML、HTML 文档的库,比 Python 内置的 xml 模块更好用。

cssselect:Python 用于处理 CSS 选择器的扩展包。

Twisted:为 Python 提供的基于事件驱动的网络引擎包。

……

如果在 Python 环境下没有这些第三方包,那么 Python 会根据依赖自动下载并安装它们。这个过程原本没啥好讲的,pip 通常会自动完成整个过程,我们只需要等待即可。但 pip 在自动下载、安装 Twisted 时会提示以下错误:

error:Microsoft Visual C++ 14.0 is required. Get it with “Microsoft Visual C++ Build Tools”:http://landinghub.visualstudio.com/visual-cpp-build-tools

按照上面的错误提示,我们需要先下载和安装 Microsoft Visual C++ Build Tools 工具,然后才能安装 Twisted。为了安装一个小小的 Twisted 包,难道就需要安装一个庞大的 Microsoft Visual C++ Build Tools?

答案是否定的,提示上面的错误只是因为 pip 自动下载的 Twisted 安装包有一些缺陷,因此可以先自行下载 Twisted 安装包。登录 www.lfd.uci.edu/~gohlke/pythonlibs/ 站点,在该页面中间查找“Twisted”项目,可以看到如图 1 所示的下载链接。

8-1561110674.gif

图 1 Twisted 包的下载链接

从图 1 所示的链接可以看到,当前 Twisted 的最新版是 18.9.0,Twisted 为 2.7、3.5、3.6、3.7 等不同版本的 Python 提供了对应的安装包。由于本教程内容主要以 Python 3.6 为主,因此应该下载 Twisted 的 Python 3.6 版本,其中文件名带 win32 的是 32 位版本,而带 win_amd64 的则是 64 位版本,此处还需要根据操作系统的位数选择对应的版本。

在下载了合适的 Twisted 安装包后,会得到一个 Twisted-18.9.0-cp36-cp36m-win_amd64.whl 文件(针对 64 位系统的),该文件就是 Twisted 安装包。

运行如下命令来安装 Twisted 包。

pip install Twisted-18.9.0-cp36-cp36m-win_amd64.whl

在安装过程中会自动检查,如有必要,会自动下载并安装 Twisted 所依赖的第三方包,如 zope.interface、Automat、incremental 等。

在安装完成后,会提示如下安装成功的信息:

Successfully installed Twisted-18.9.0

在成功安装 Twisted 包之后,再次执行 pip install scrapy 命令,即可成功安装 Scrapy。在安装成功后,会显示如下提示信息:

Successfully installed Scrapy-1.6.1

在成功安装 Scrapy 之后,可以通过 pydoc 来查看 Scrapy 的文档。在命令行窗口中输入如下命令:

python -m pydoc -p 8899

运行上面命令之后,打开浏览器查看 http://localhost:8899/ 页面,可以在 Python 安装目录的libsite-packages下看到 Scrapy 的文档,如图 2 所示。

8-1561110674.jpeg

图 2 Scrapy 的文档

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/192297.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)
blank

相关推荐

  • java json转map fastjson_java字符串转map

    java json转map fastjson_java字符串转mapjavajson传map,map数组

  • VirtualBox下安装ubuntu server 16.04

    VirtualBox下安装ubuntu server 16.04

    2021年10月28日
  • j2EE是什么_j2ee体系结构

    j2EE是什么_j2ee体系结构经过本次学习,我们知道了J2EE的整体架构以及一些核心的组件,更加理解了其伸缩性、灵活性和易维护性,这对我们以后的学习会有很大的帮助.当然,我们学过了这些基本的概念之后,最主要的还是要在实际运用中去体会,去总结,然后再返回来看这些东西,我们就会有很大的收获。这就是一个学习的过程,加油。

    2022年10月11日
  • vuerouter配置_route删除路由

    vuerouter配置_route删除路由介绍VueRouter是Vue.js官方的路由管理器。它和Vue.js的核心深度集成,让构建单页面应用变得易如反掌。包含的功能有:嵌套的路由/视图表模块化的、基于组件的路由配置路由参

  • pycharm专业版 没有试用30天按钮,需要登录的解决方案「建议收藏」

    pycharm专业版 没有试用30天按钮,需要登录的解决方案「建议收藏」pychram在2021年9月30日之后的版本,需要用户登录后才能开启试用;以此来抵制盗版(虽然没有什么用…)新版本是长这样:没有了之前的Evaluateforfree选项;进入的解决方案:注册一个JetBrains帐户;注册地址:https://account.jetbrains.com/login?_ga=2.268514929.1239888694.1637728385-1574465557.1637728385填写邮箱地址后,在邮箱中进行下一步操作;邮箱发送可能有

    2022年10月30日
  • dz搬家 win linux,Discuz论坛完美搬家 详细分享我的DZ搬家步骤[通俗易懂]

    dz搬家 win linux,Discuz论坛完美搬家 详细分享我的DZ搬家步骤[通俗易懂]Discuz论坛完美搬家详细分享我的DZ搬家步骤由于论坛的迅速发展,普通的虚拟主机已经承受不住了,想要换成云服务器,却又不懂得如果搬家。通过网络以及网站客服的查询帮助,亲手实现了Discuz完美搬家。我在搬家时截了每个步骤的图,今天写下这篇文章,为大家详细解说一下。其实网站要搬家有好几种方法,但是要求完美搬家的话,就不没那么多了。很多人都在用帝国备份王进行数据库的备份,自我感觉帝国备份王确实要比…

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号