SenticNet情感词典介绍[通俗易懂]

SenticNet情感词典介绍[通俗易懂]在进行情感分析时,一个好的情感词典能够让我们的工作事半功倍,较为出名的情感词典有SentiWordNet,GeneralInquirer等,这篇博客将介绍另外一个出色情感词典,SenticNet。简介当谈论SenticNet时,我们正在谈论概念层面的情感分析,即通过语义和语言学来完成极性探测、情感识别等任务,而不是单纯的依靠词共现频率。SenticNet可以看作是以下其中一种:1…

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE使用 1年只要46元 售后保障 童叟无欺

在进行情感分析时,一个好的情感词典能够让我们的工作事半功倍,较为出名的情感词典有SentiWordNetGeneral Inquirer等,这篇博客将介绍另外一个出色情感词典,SenticNet

简介

当谈论SenticNet时,我们正在谈论概念层面的情感分析,即通过语义和语言学来完成极性探测、情感识别等任务,而不是单纯的依靠词共现频率。SenticNet可以看作是以下其中一种:
1)一个概念层次的知识库
2)一个多学科的框架
3)一家私人公司
作为一个知识库,SenticNet提供了一组语义、情感、极性关联的100,000个自然语言概念。特别地,语义指与输入概念在语义上最相关的概念(比如,与输入概念共享最多语义特征的五个概念),情感指四个情感维度(Pleasantness, Attention, Sensitivity, and Aptitude)的情感值和-1到+1之间的情感极性值(其中,-1表示极度负向,+1表示极度正向)。该知识库可作为独立的XML文件免费下载,其最新版本(SenticNet5)也可作为API访问
作为一个框架,SenticNet包含了一系列将常识推理、心理学、语言学和机器学习相结合的情感分析工具和技术。在这种情况下,SenticNet通常指senti computing,一种多学科范式,它超越了单纯的统计情感分析方法,通过关注自然语言概念的语义表示(semantic-preserving representation)和句子结构。
作为一家公司,SenticNet覆盖了概念层次情感分析的最新发现,以此为大型社交数据分析提供易用的、最先进的工具,从而在不同的领域,语言和形式下实现自动化任务,比如产品定位、趋势发现和社交媒体营销。

下载使用

SenticNet提供了各种类型、任务、语言的词典,都可以从该页面下载
最新的SenticNet5包含100,000个自然语言概念,可以通过以下三种途径获取。

下载RDF/XML格式或者txt格式到本地

下载的senticnet-5.0包含以下三个重要文件:
senticnet5.py。文件形式如下:


这里写图片描述

首先定义了一个senticnet字典,关键字key是概念,值value是一个列表,元素依次是四个情感维度值、两个情绪标签、极性标签和极性值以及最相似的五个概念。
senticnet5.rdf.xml。以rdf的格式组织每一个概念,形式如下:


这里写图片描述

senticnet5.txt。仅仅展示了每个概念的极性和极性强度值,形式如下:


这里写图片描述

通过API访问

通过API获取指定概念的基本方法是:http://sentic.net/api/LANGUAGE/concept/CONCEPT_NAME,其中LANGUAGE指俩字母格式的目标语言,CONCEPT_NAME可以是单独的单词也可以是通过下划线连接的多个单词。更细粒度的方法可以分别获取语义、情感 、情绪标签和极性:

其中polarity由value(正或负)和强度(-1到1之间的浮点数)组成,分别查询如下:

作为Python第三方类库调用

可以直接使用pip安装

pip install senticnet

也可以通过源码安装,在github或者Pypi上下载源码,然后采用如下命令安装。

python setup.py install

在windows上安装可能出现LINCENSE文件解码错误,这个时候用一个空的LINCENSE文件替换原文件即可。安装好后使用方法如下:

from senticnet.senticnet import SenticNet

sn = SenticNet()   # 可以指定语言参数,不写默认英语
concept_info = sn.concept('love')
polarity_value = sn.polarity_value('love')
polarity_intense = sn.polarity_intense('love')
moodtags = sn.moodtags('love')
semantics = sn.semantics('love')
sentics = sn.sentics('love')

参考文献

SenticNet主页

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/172436.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)
blank

相关推荐

  • Python 创建加密压缩文件「建议收藏」

    Python 创建加密压缩文件「建议收藏」Python创建加密压缩文件1.配置ZLibhttp://www.winimage.com/zLibDll/minizip.html下载之后将zlibwapi.dll放在demo/目录下,与minizip.exe一起使用2.命令行使用minizip.exe>minizip.exeMiniZip1.01b,demoofzLib…

  • USB设备驱动程序开发框架[通俗易懂]

    USB设备驱动程序开发框架[通俗易懂]USB设备驱动程序开发框架USB设备驱动程序开发框架的源代码文件文件名说明Driver.h驱动程序头文件DrvInit.c入口例程和卸载例程DrvPnp.c即插即用例程DrvDispatch.c分发例程DrvPowe

  • office xls 文件已损坏 无法打开 word在试图打开文件时遇到错误

    office xls 文件已损坏 无法打开 word在试图打开文件时遇到错误转自:http://windyli.blog.51cto.com/1300305/326491故障现象:Office2010,当打开从其他来源的Office文档时,会出现“(受保护的视图)遇到问题需要关闭”的错误,并且提示“文档已损坏”。小提示:Office2010的新特性是打开非本机创建的文件时会使用受保护的视图打开,因此我的“其他来源”主要指几个方面。其他来源:1.

  • 超酷汇编教程-- 简明x86汇编语言教程(1)

    超酷汇编教程-- 简明x86汇编语言教程(1)第○章写在前面我不想夸大或者贬低汇编语言。但我想说,汇编语言改变了20世纪的历史。与前辈相比,我们这一代编程人员足够的幸福,因为我们有各式各样的编程语言,我们可以操作键盘、坐在显示器面前,甚至使用鼠标、语音识别。我们可以使用键盘、鼠标来驾驭“个人计算机”,而不是和一群人共享一台使用笨重的继电器、开关去操作的巨型机。相比之下,我们的前辈不得不使用机器语言编写程序,他们甚至没有最简单的汇编程序来

  • shell脚本编程基础

    shell脚本编程基础

  • [Vuex系列] – Actions的理解之我见

    [Vuex系列] – Actions的理解之我见

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号