NLTK FreqDist

大家好，又见面了，我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全家桶1年46，售后保障稳定

FreqDisk

nltk FreqDisk函数能够统计数组当中单词出现的次数。

text = ['hadoop','spark','hive','hadoop','hadoop'
    ,'spark','lucene','hadoop','spark','hive'
    ,'hadoop','hadoop','spark','pig','zookeeper'
    ,'flume','stream','hadoop','hadoop','spark'
    ,'pig','zookeeper','flume','stream','hadoop'
    ,'hadoop','spark','pig','zookeeper','flume'
    ,'stream','hadoop','hadoop','spark','pig'
    ,'zookeeper','flume','stream','hadoop','hadoop'
    ,'spark','pig','zookeeper','flume','stream']
fdist = nltk.FreqDist(text)
for k in fdist:
    print(k+" "+str(fdist[k]))

Jetbrains全家桶1年46，售后保障稳定

hadoop 14
spark 8
hive 2
lucene 1
pig 5
zookeeper 5
flume 5
stream 5

FreqDisk::plot(n)

参数n，以折线图的方式展示频数最大的前n项数据。

fdist.plot(4)

在这里插入图片描述

FreqDisk::tabulate(n)

参数n，以表格的方式展示频数最大的前n项数据。

fdist.tabulate(5)

FreqDisk::most_common(n)

参数n，展示频数最大的前n项数据。

print(fdist.most_common(3))

[('hadoop', 14), ('spark', 8), ('pig', 5)]

FreqDisk::hapaxes()

展示频数最小的数据。

print(fdist.hapaxes())

['lucene']

FreqDisk::max()

展示频数最大的数据。

print(fdist.max())

hadoop

发布者：全栈程序员-用户IM，转载请注明出处：https://javaforall.cn/226787.html原文链接：https://javaforall.cn

【正版授权，激活自己账号】： Jetbrains全家桶Ide使用，1年售后保障，每天仅需1毛

【官方授权正版激活】： 官方授权正版激活支持Jetbrains家族下所有IDE 使用个人JB账号...

FreqDisk

FreqDisk::plot(n)

FreqDisk::tabulate(n)

FreqDisk::most_common(n)

FreqDisk::hapaxes()

FreqDisk::max()

相关推荐

RPC协议及其python实例[通俗易懂]

emwin用户设置界面_强制刷新快捷键

Repository XXX does not have a Realease file「建议收藏」

玩转SpringSession，重要知识点全面剖析！

Css中写RGB颜色

如何训练一个词向量

发表回复