MAC 上抓取网页数据的工具有哪些？「建议收藏」

全栈程序员-用户IM • 2022年2月9日下午6:00 • 未分类

MAC 上抓取网页数据的工具有哪些？

大家好，又见面了，我是全栈君。

我希望能够从网页上, 比如气象局数据, 财经数据等等, 我看到官方提供的数据都比较混乱, 有的是一个php文件, 有的是一个文本, 有的干脆不提供数据, 我想问, Mac上, 用什么工具去抓数据, 以及处理这些数据大神们一般用很么方法?

链接：https://www.zhihu.com/question/27736988/answer/174849599

https://www.zhihu.com/question/27736988

1、http://Import.io

用法非常简单，注册后输入网址链接，就可以在可视化界面对数据进行筛选。操作也是超级简单，如下图，唯一缺点就是全英文，不过咱们自己也有，来看看第二个吧。

2、parsehub

与以上两种网页抓取不同的是，parsehub需要用户下载客户端之后再使用，打开就像一个浏览器，输入网址后在网页提取出需要的信息。

https://ma.taobao.com/ZTg4et (二维码自动识别)

3、80legs

80legs在由5万台计算机构成的Plura网格上每天抓取200万网页。但是在使用上可能并没有前几个那么好用。

4、Web Scraper

Web Scraper是需要在谷歌应用商店安装的一个插件，基本步骤就是点点点

详细的教程可以看这里http://www.w 2bc.com/article/241334

https://ma.taobao.com/ZTg4et (二维码自动识别)

5、FMiner

FMiner同样也需要下载客户端进行使用，但它是一款付费产品，有15天的免费使用期。

总结

以上介绍的都是国外的工具，如果更喜欢中文界面，可以来试试我们的产品造数造数 -深受广大爬虫爱好者喜欢的云爬虫

造数比http://import.io更适合国人使用。直接在原网页基础上操作，还可以分布式爬取、深度爬取等，对数据有需求的可以尝试下。

其实网页爬取工具很多，大可不必全部掌握，把它当作工具来方便自己的工作才是本文的目标。

作者：徐小磊

链接：https://www.zhihu.com/question/27736988/answer/497899625

来源：知乎

著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。

我在mac上用的是下图这个，日常基本数据的爬取足够了。

1）日常临时性的，或者快速的数据爬取，就用这个

2）其他的还是会写写python爬取，毕竟开发需要时间和成本，要考虑投入产出比

应用信息

主界面，和八抓鱼差不多

爬取规则页面，也和八抓鱼差不多，不过更好看和方便

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至举报，一经查实，本站将立刻删除。

发布者：全栈程序员-用户IM，转载请注明出处：https://javaforall.cn/112161.html原文链接：https://javaforall.cn

【正版授权，激活自己账号】： Jetbrains全家桶Ide使用，1年售后保障，每天仅需1毛

【官方授权正版激活】： 官方授权正版激活支持Jetbrains家族下所有IDE 使用个人JB账号...

赞 (0)

全栈程序员-用户IM

0 0

传播智客工作流视频，OA工作流视频

传播智客工作流视频，OA工作流视频OA工作流视频：链接：https://pan.baidu.com/s/1kVZjooR密码：rmg0传播智客工作流视频：链接：https://pan.baidu.com/s/1hsRNN8o密码：71yk相关对应代码到我的资源里面去下载吧。

全栈程序员-用户IM
2022年6月23日
html一个汉字空格占位_空格占位符复制

html一个汉字空格占位_空格占位符复制空格占位符Html

全栈程序员-用户IM
2022年9月1日
weex 在android模拟器,weex 启动 ios 模拟器

前提需要的安装nodenpmweex-toolkitcocoaPods1.创建weex工程weexcreatehelloWolrd2.进入helloWolrd文件夹安装依赖，我用cnpminstall的话就会报错，这里最好用npminstallnpminstall3.添加ios应用weexplatfromaddios4.到platforms/ios目录下为ios工程用coc…

全栈程序员-用户IM
2022年4月11日
windows默认颜色设置_微信怎么设置颜色皮肤

windows默认颜色设置_微信怎么设置颜色皮肤emwin使用了默认皮肤之后就不能够容易的重新设置颜色。这边我提供一种解决的方法，以button为例子。正常设置皮肤BUTTON_SetDefaultSkin(BUTTON_SKIN_FLEX);后效果如下：此时设置颜色并没有效果。换成如下代码，/*************************定制皮肤*****************************/ BUTTON_…

全栈程序员-用户IM
2022年8月31日
linux下socket编程实例_C语言窗口编程

linux下socket编程实例_C语言窗口编程1.什么是TCP/IP、UDP？TCP/IP（TransmissionControlProtocol/InternetProtocol）即传输控制协议/网间协议，是一个工业标准的协议集，它是为广域网（WANs）设计的。　　UDP（UserDataProtocol，用户数据报协议）是与TCP相对应的协议。它是属于TCP/IP协议族中的一种。下面的图表明了这些协议的关系。

全栈程序员-用户IM
2022年10月7日
android 浏览器开发,Android 浏览器的开发实例分享

android 浏览器开发,Android 浏览器的开发实例分享本文主要讲解Android浏览器的开发实例，有三部分内容：启动Android默认浏览器、指定浏览器进行访问以及打开本地的html文件。一、启动Android默认浏览器Java代码Intentintent=newIntent();intent.setAction(“android.intent.action.VIEW”);Uricontent_url=Uri.parse(“http:/…

全栈程序员-用户IM
2022年5月15日

发表回复

关注全栈程序员社区公众号