大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。
Jetbrains全家桶1年46,售后保障稳定
FreqDisk
nltk FreqDisk函数能够统计数组当中单词出现的次数。
text = ['hadoop','spark','hive','hadoop','hadoop'
,'spark','lucene','hadoop','spark','hive'
,'hadoop','hadoop','spark','pig','zookeeper'
,'flume','stream','hadoop','hadoop','spark'
,'pig','zookeeper','flume','stream','hadoop'
,'hadoop','spark','pig','zookeeper','flume'
,'stream','hadoop','hadoop','spark','pig'
,'zookeeper','flume','stream','hadoop','hadoop'
,'spark','pig','zookeeper','flume','stream']
fdist = nltk.FreqDist(text)
for k in fdist:
print(k+" "+str(fdist[k]))
hadoop 14
spark 8
hive 2
lucene 1
pig 5
zookeeper 5
flume 5
stream 5
FreqDisk::plot(n)
参数n,以折线图的方式展示频数最大的前n项数据。
fdist.plot(4)
FreqDisk::tabulate(n)
参数n,以表格的方式展示频数最大的前n项数据。
fdist.tabulate(5)
FreqDisk::most_common(n)
参数n,展示频数最大的前n项数据。
print(fdist.most_common(3))
[('hadoop', 14), ('spark', 8), ('pig', 5)]
FreqDisk::hapaxes()
展示频数最小的数据。
print(fdist.hapaxes())
['lucene']
FreqDisk::max()
展示频数最大的数据。
print(fdist.max())
hadoop
发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/226787.html原文链接:https://javaforall.cn
【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛
【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...