pyquery安装

pyquery安装pyquery是一个类似jquery的工具,不过它是在服务端进行处理的,不像jquery是在浏览器中进行处理。如果我们要进行网络爬虫,爬取有用的信息,那么它是我至今见到的不二选择。我们当然可以自己爬取网页,然后可以通过正则表达式,选取有用的信息,但这其实要求挺高的。我以前也做过爬虫工具,专门抓取招聘网站的招聘信息,但我发先我以前做的实在是复杂。而我们程序员很重要的一点是,不要重复的发明轮子,我们只

大家好,又见面了,我是你们的朋友全栈君。

pyquery是一个类似jquery的工具,不过它是在服务端进行处理的,不像jquery是在浏览器中进行处理。如果我们要进行网络爬虫,爬取有用的信息,那么它是我至今见到的不二选择。我们当然可以自己爬取网页,然后可以通过正则表达式,选取有用的信息,但这其实要求挺高的。我以前也做过爬虫工具,专门抓取招聘网站的招聘信息,但我发先我以前做的实在是复杂。而我们程序员很重要的一点是,不要重复的发明轮子,我们只需要使用牛人们为我们准备好的工具就OK了。pyquery正是这样一款工具,希望大家可以有机会使用一下。

  pyquery的官方学习网站(全英文的,不过不难):http://packages.python.org/pyquery/

  如果快速功能预览,推荐一个大牛的博文,大家可以看看:http://www.cnblogs.com/QLeelulu/archive/2010/03/05/pyQuery.html

  如果以前学习过jquery,那么pyquery会很快入门(它是python的一个库,如果不懂python,可以简单看一下python的语法,绝对cool)。

  下面介绍一下安装过程。

  pyquery是python的一个库,并且它还有依赖库。

  第一,python的安装(如果对python不是一窍不通,请跳过,我相信你一定已经安装了python,并且了解python):

  一般Linux上都内置了python环境(类似java虚拟机,给python代码一个执行环境),不许要再安装,它的版本可能随操作系统不同。不过pyquery只要是在python2.3以上就肯定OK。查看python版本的命令,在linux终端下面,只需要输入python即可,然后就会进入python自带的命令行环境。并且第一行就会显示python的版本。在windows下面,我们首先安装python环境,我们可以去python官网(http://www.python.org/)下载windows的python版本进行安装。

  下一步当然是简单看看python的语法,推荐的电子教材:

  python简明教程(快速入门,绝对快):http://sebug.net/paper/python/

       Dive into python中文版:http://www.tsnc.edu.cn/default/tsnc_wgrj/doc/pythonhtml/html/

  第二,安装pyquery

  pyquery的依赖库有lxml,而lxml又依赖libxml2和libxsl,安装libxml2又需要安装setuptools。下面我们讲讲详细的安装过程。

       1.安装setuptools,下载地址:http://pypi.python.org/packages/source/s/setuptools/setuptools-0.6c11.tar.gz#md5=7df2a529a074f613b509fb44feefe74e,这是setuptools的python源码,在终端下解压后进入文件夹,输入命令“sudo python setup.py install“,这样我们就开始安装setuotools了,安装完成后会有信息提示。

  2.安装libxml2,下载地址:ftp://xmlsoft.org/libxslt/,我们最好下载源码,这样不需要考虑linux的版本。例如,我们可以下载http://lxml.de/files/lxml-2.2.7.tgz这个文件。解压后安装命令:

       ./configure

        make clean

        sudo make install

安装完成后会有提示信息

  3.安装libxslt,下载地址:ftp://xmlsoft.org/libxslt/libxslt-1.1.20.tar.gz ,解压后安装命令:

        ./configure

        make clean

            sudo make install

安装完成后会有提示信息

  4.安装lxml,命令为:

    sudo apt-get install python-lxml

  5.最后一步,激动人心呀,安装pyquery,pyquery的下载地址为:

    http://pypi.python.org/packages/source/p/pyquery/pyquery-1.0.tar.gz#md5=c96bc7a8e1fcdd3ede4769b2f44a6ec3

          解压后进入文件夹安装,命令为:sudo python setup.py install

说明:如果有的安装错误或者失败

           首先检查权限问题,如果为权限问题,那么我们需要在命令前加上sudo后再次尝试,

           如果提示版本问题,那么我们需要下载相应版本的库,假如你是python2.6那么你最好下载对应的2.6版本的库。

还有问题的话,我们可以交流,邮箱:programmer_sliver@163.com,希望大家可以享受python带来的乐趣,享受pyquery的便利!

原文地址:http://www.cnblogs.com/sliverdang/archive/2011/09/05/2167760.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/134543.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)


相关推荐

  • 用JAVA写一个冒泡排序「建议收藏」

    用JAVA写一个冒泡排序「建议收藏」一:实现思想:  基本思想:在要排序的一组数中,对当前还未排好序的范围内的全部数,自上而下对相邻的两个数依次进行比较和调整,让较大的数往下沉,较小的往上冒。即:每当两相邻的数比较后发现它们的排序与排序要求相反时,就将它们互换。二:实现代码:1packagebulubulu;23publicclassMaopao{4…

  • CSS3-transition「建议收藏」

    CSS3-transition「建议收藏」1、transition代表css3中的过渡,可以使元素从一种样式逐渐改变为另一种的效果。2、transition:height2s;表示需要渐变的是元素高度height,渐变时间是2s。tra

  • 《当时只道是寻常》——安意如——品纳兰容若《饮水词》「建议收藏」

    目录    如梦令2    如梦令4    浣溪沙5    浣溪沙6    浣溪纱7    虞美人9    虞美人(秋夕信步)10    虞美人11    虞美人12    虞美人14    虞美人15    蝶恋花16    蝶恋花18    蝶恋花19    蝶恋花散花楼送客21    采桑子塞上咏雪花22    采桑子23    采桑子25    采桑

  • 数据库索引是什么 有什么优缺点

    数据库索引是什么 有什么优缺点数据库索引是什么数据库索引是:数据库索引就像是一本书的目录一样,使用它可以让你在数据库里搜索查询的速度大大提升。而我们使用索引的目的就是,加快表中的查找和排序。索引的几种类型分别是普通索引、唯一索引、聚集索引、主键索引、全文索引几种。使用索引的优点就是:提高数据的搜索速度 加快表与表之间的连接速度 在信息检索过程中,若使用分组及排序子句进行时,通过建立索引能有效的减少检索过程中所…

  • 根据连续信道容量的香农公式,当信道带宽B_信道容量的公式

    根据连续信道容量的香农公式,当信道带宽B_信道容量的公式目录信道带宽信道容量香农公式说道通信,从广义上来讲就不得不提到信道容量和信道带宽、以及著名的香农公式。先说说是什么是信道吧,通俗的来讲,信道就是信息传输的通道。信道在通信系统中的位置如下图所示:但是,并不是所有频率的信号都可以通过信道传输,信道的频率响应决定了哪些频率的信号可以通过信道,哪些频率的信号不能通过信道。信道带宽前面说到不是所有的信号都可以通过信道传输。所以我们把可以通过信道传输的信号频率范围大小就是信道的带宽,就像是下面这张图所展示的:从图中可以看出.

    2022年10月11日
  • ACdream 1099 瑶瑶的第K大

    ACdream 1099 瑶瑶的第K大

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号