python激活成功教程qq密码_央·python编程之QQ数据清洗

python激活成功教程qq密码_央·python编程之QQ数据清洗一般我们从网上下下来的数据都很杂乱的,什么样的情况都有,不利于我们整理,所以在拿到数据的时候我们会先做一遍数据清理,把垃圾数据清理掉。今天我们拿QQ数据做示范。我们命令行是怎么看数据![Asm]纯文本查看复制代码morezy.txt#然后空格进行翻页效果如图:1.png(11.5KB,下载次数:0)2018-1-3017:54上传从数据中得知:—-中间4个-左边是账号,右边…

大家好,又见面了,我是你们的朋友全栈君。

一般我们从网上下下来的数据都很杂乱的,什么样的情况都有,不利于我们整理,所以在拿到数据的时候我们会先做一遍数据清理,把垃圾数据清理掉。

今天我们拿QQ数据做示范。

我们命令行是怎么看数据!

[Asm] 纯文本查看 复制代码more zy.txt

#然后空格进行翻页

效果如图:

55fd2b2273b5a8b4531f72773c469d6e.gif

1.png (11.5 KB, 下载次数: 0)

2018-1-30 17:54 上传

从数据中得知:

—- 中间4个-

左边是账号,右边是密码

目前QQ最多就11位,密码最长16位,所以数据中位数最多31位(4+11+16),大于的都是垃圾(第一轮筛选)

我先用python 读取QQ操作

[Asm] 纯文本查看 复制代码import codecs

filepath=r”C:\Users\Administrator\Desktop\zy.txt”

file=codecs.open(filepath,”rb”,”gbk”,”ignore”)#按照指定编码

mylist=file.readlines()#返回一个list,读取到内存

#savefilepath=”C:\Users\Administrator\Desktop\zy1.txt”

for line in mylist:

QQlist=line.split(‘—-‘)

print(QQlist[1])

55fd2b2273b5a8b4531f72773c469d6e.gif

2.png (19.57 KB, 下载次数: 1)

2018-1-30 17:55 上传

注:此方法是读取到内存,所以很占空间,会很卡。

数据中我们看到很多垃圾数据,我们看下垃圾数据

[Asm] 纯文本查看 复制代码import codecs

filepath=r”C:\Users\Administrator\Desktop\zy.txt”

file=codecs.open(filepath,”rb”,”gbk”,”ignore”)#按照指定编码

mylist=file.readlines()#返回一个list,读取到内存

#savefilepath=”C:\Users\Administrator\Desktop\zy1.txt”

for line in mylist:

QQlist=line.split(‘—-‘)

if len(line)>31:

print(line)#打印垃圾数据

55fd2b2273b5a8b4531f72773c469d6e.gif

22.png (26 KB, 下载次数: 0)

2018-1-30 17:56 上传

进行QQ清洗,在分别保存账号文本和密码文本。

[Asm] 纯文本查看 复制代码import codecs

filepath=r”C:\Users\Administrator\Desktop\zy.txt”

file=codecs.open(filepath,”rb”,”gbk”,”ignore”)#按照指定编码

mylist=file.readlines()#返回一个list,读取到内存

savegoodfilepath=r”C:\Users\Administrator\Desktop\zyQQGood.txt”

savebadfilepath=r”C:\Users\Administrator\Desktop\zyQQbad.txt”

filegood=open(savegoodfilepath,”wb”)

filebad=open(savebadfilepath,”wb”)

for line in mylist:

if len(line)>31 or len(line)<=15:#(4+5+6)

filebad.write(line.encode(“utf-8”))

else:

QQlist = line.split(‘—-‘)

if len(QQlist)==2:

filegood.write(line.encode(“utf-8”))

else:

filebad.write(line.encode(“utf-8”))

filebad.close()

filegood.close()

效果图:

55fd2b2273b5a8b4531f72773c469d6e.gif

44.png (38.09 KB, 下载次数: 0)

2018-1-30 17:57 上传

附件:

2b1bef8df4f01fee4fc8b39358cdcfb3.gif

中央纪委pyhon数据清理.zip

(3.81 KB, 下载次数: 25)

2018-1-30 17:58 上传

点击文件名下载附件

下载积分: 吾爱币 -1 CB

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/162202.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)
blank

相关推荐

  • go的channel_go channel原理

    go的channel_go channel原理Gochannel系列:"channel入门""为select设置超时时间""nilchannel用法示例""双层c

  • STM32F103C8T6芯片的引脚分布,及注意事项(用于芯片选型)「建议收藏」

    STM32F103C8T6芯片的引脚分布,及注意事项(用于芯片选型)「建议收藏」STM32F103C8T6这款芯片,是我们使用单片机做项目常用到的一款芯片。它具有价格便宜、性能强大、资源齐全等各种优点。我常常使用的是黑金的c8t6核心板,如下:以下将介绍他的资源配置该款芯片各个管脚的功能分配如下(注意:凡是引脚标注有ADC功能的,该引脚都是3.3V耐压,不可接5V信号,否则会使该引脚烧毁或者芯片烧毁)附件为:1.官方c8t6的数据手册(中英文)2….

    2022年10月15日
  • PhpStorm 2021.12.13 永久激活-激活码分享

    (PhpStorm 2021.12.13 永久激活)最近有小伙伴私信我,问我这边有没有免费的intellijIdea的激活码,然后我将全栈君台教程分享给他了。激活成功之后他一直表示感谢,哈哈~IntelliJ2021最新激活注册码,破解教程可免费永久激活,亲测有效,下面是详细链接哦~https://javaforall.cn/100143.html0B…

  • 联想笔记本键盘亮了屏幕不亮怎么办_电脑开机显示器和键盘都不亮

    联想笔记本键盘亮了屏幕不亮怎么办_电脑开机显示器和键盘都不亮联想电脑显示器不亮怎么办联想电脑显示器不亮解决方法一:1、开机后,我们先不管显示器是否能正常的亮或显示,我们先再次按主机上的重启键,然后我们按一下键中的“numlock”键,也就是台式键盘右边的数字开关切换键。2、如数字开关键上面的数字锁定灯可以正常的亮或正常的灭,这时就说明电脑主机一般没啥事儿了,基本上可以确定是由显示器本身的问题了。3、如无法显示正常的灯亮和灯灭的话,那么基本可以说明是电脑机…

  • 明日之后js免费脚本_超强免杀工具

    明日之后js免费脚本_超强免杀工具 js脚本免杀工具免杀经验以及简单的分析文章作者:虫虫信息来源:邪恶八进制信息安全团队(www.eviloctal.com)本文所做的实验是以ah.js(冰狐的一个变种,附件中名为”病毒样本.txt”)为病毒样本进行的,其他js恶意代码没有测试。由于卡巴斯基对js的查杀力度比较大,再者我本机就安装了卡巴斯基,所以对其有少量额外的分析。菜鸟作品,难登大雅之堂,高手多多指教!^-^常规的思路就是将

  • 常用正则表达式[通俗易懂]

    常用正则表达式[通俗易懂]常用正则表达式

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号