NLTK FreqDist

NLTK FreqDistFreqDisknltkFreqDisk函数能够统计数组当中单词出现的次数。text=[‘hadoop’,’spark’,’hive’,’hadoop’,’hadoop’,’spark’,’lucene’,’hadoop’,’spark’,’hive’,’hadoop’,’hadoop’,’spark’,’pig’,’zookeeper’,’flume’,’…

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全家桶1年46,售后保障稳定

FreqDisk

nltk FreqDisk函数能够统计数组当中单词出现的次数。

text = ['hadoop','spark','hive','hadoop','hadoop'
    ,'spark','lucene','hadoop','spark','hive'
    ,'hadoop','hadoop','spark','pig','zookeeper'
    ,'flume','stream','hadoop','hadoop','spark'
    ,'pig','zookeeper','flume','stream','hadoop'
    ,'hadoop','spark','pig','zookeeper','flume'
    ,'stream','hadoop','hadoop','spark','pig'
    ,'zookeeper','flume','stream','hadoop','hadoop'
    ,'spark','pig','zookeeper','flume','stream']
fdist = nltk.FreqDist(text)
for k in fdist:
    print(k+" "+str(fdist[k]))

Jetbrains全家桶1年46,售后保障稳定

hadoop 14
spark 8
hive 2
lucene 1
pig 5
zookeeper 5
flume 5
stream 5

FreqDisk::plot(n)

参数n,以折线图的方式展示频数最大的前n项数据。

fdist.plot(4)

在这里插入图片描述

FreqDisk::tabulate(n)

参数n,以表格的方式展示频数最大的前n项数据。

fdist.tabulate(5)

在这里插入图片描述

FreqDisk::most_common(n)

参数n,展示频数最大的前n项数据。

print(fdist.most_common(3))
[('hadoop', 14), ('spark', 8), ('pig', 5)]

FreqDisk::hapaxes()

展示频数最小的数据。

print(fdist.hapaxes())
['lucene']

FreqDisk::max()

展示频数最大的数据。

print(fdist.max())
hadoop
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/226787.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)
blank

相关推荐

  • 401错误的解决方法_网络连接错误401

    401错误的解决方法_网络连接错误401在配置IIS的时候,如果安全稍微做的好一些。就会出现各式各样的问题。比如,常见的访问网页会弹出用户名密码的登陆界面,或者是访问某种页面比如html,asp没事情,但是访问jsp或者php就有问题,显示401.3 ACL禁止访问资源等  通常的解决办法是。          第一,看iis中(不管iis5还是iis6) ,网站或者目录,包括虚拟目录的属性,看目录安全性选项卡中的 编辑…

  • pidstat_使用pidstat查看进程资源使用情况

    pidstat_使用pidstat查看进程资源使用情况引言在查看系统资源使用情况时,很多工具为我们提供了从设备角度查看的方法。例如使用iostat查看磁盘io统计信息:linux:~#iostat-d3Device:tpsBlk_read/sBlk_wrtn/sBlk_readBlk_wrtnsda1.670.0040.000…

  • JQuery中的bind()和unbind()的理解「建议收藏」

    JQuery中的bind()和unbind()的理解「建议收藏」bind()和unbind()提供了事件的绑定和取消机制,既可以绑定html默认支持的事件,也能够绑定自定义的事件。1、JQuery中事件可以重复绑定,不会覆盖。当点击button1的时候,这2个

  • 如何用chkdsk修复磁盘_chkdsk发现磁盘大写表损坏

    如何用chkdsk修复磁盘_chkdsk发现磁盘大写表损坏chkdsk简单的说就是用来检查磁盘的,也是一种简单的修复命令,很多时候我们的电脑经常会提示用chkdsk修复磁盘,那么如何使用chkdsk命令呢,接下来告诉你!首先,win+r 快速启动

  • Luajit 概述「建议收藏」

    Luajit 概述「建议收藏」一、JIT即时编译器JIT:即时编译器。将频繁执行的代码,通过JIT编译器编译成机器码缓存起来,下次再调用时直接执行机器码。相比与原生Lua的逐条执行虚拟机指令效率更高。对于那些只执行一次的代码,则保持于原生Lua一样,逐条执行。JIT带来的效率提升,并不一定能抵消编译效率的下降。当虚拟机执行指令时并不会立刻用JIT进行编译。只有部分指令需要JIT进行编译,JIT将决定那些代码将被编译。延迟编译有…

  • error link2019无法解析的外部符号_inferior

    error link2019无法解析的外部符号_inferior最近在用VS2008开发,初学遇到不少问题,最头疼的问题之一就是:LNK2019。百度一下讲的并不够全面,反正都没解决我的问题。errorLNK2019问题在VC6.0中是errorLNK2001:unresolvedexternalsymbol问题,可能错误号改了。编译时出现类似这样的错误:Dlgcode.obj:errorLNK2019:无法解析的外部符号_readRe…

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号