基于python的情感分析案例_关于python爬虫的情感分析

基于python的情感分析案例_关于python爬虫的情感分析今天给大家分享的是通过情感词典来对文本进行情感分析最后计算出情感得分通过情感得分来判断正负调性主要步骤:数据准备本次情感词典采用的是BosonNLP的情感词典,来源于社交媒体文本,所以词典适用于处理社交媒体的情感分析本次分析准备的文本数据有:BosonNLP情感词典停用词表否定词表程度副词表生成停用…

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE使用 1年只要46元 售后保障 童叟无欺

今天给大家分享的是通过情感词典来对文本进行情感分析最后计算出情感得分 通过情感得分来判断正负调性

    主要步骤:

          

图片

数据准备

        

本次情感词典采用的是BosonNLP的情感词典,来源于社交媒体文本,所以词典适用于处理社交媒体的情感分析

     本次分析准备的文本数据有:

            BosonNLP情感词典

            停用词表

            否定词表

            程度副词表

基于python的情感分析案例_关于python爬虫的情感分析

生成停用词词典

         

在生成停用词词典的时候要注意过滤否定词和程度副词

    代码如下:

基于python的情感分析案例_关于python爬虫的情感分析

数据预处理

        

在数据预处理部分主要做的是对文本进行jieba分词和去停用词

     代码如下:

基于python的情感分析案例_关于python爬虫的情感分析

分数计算前期准备

对文本进行分词以后,得到文本中的情感词、否定词和程度副词

    读取情感词典文件、否定词文件、程度副词文件

    然后将分词后的情感词、否定词和程度副词通过情感词典文件、否定词文件、程度副词文件分别放入三个字典,为下面计算情感分数做铺垫:

基于python的情感分析案例_关于python爬虫的情感分析

基于python的情感分析案例_关于python爬虫的情感分析 

计算情感的分数

通过上一步得到了文本的分词结果,同时得到了文本的情感词、否定词和程度副词三个列表

    遍历所有的情感词,看查看当前情感词的前面是否有否定词和程度副词。

    如果没有否定词,就对当前情感词乘以1,如果有否定词或者有多个否定词,可以乘以(-1)^否定词的个数;如果有程度副词,就在当前情感词前面乘以程度副词的程度等级。

基于python的情感分析案例_关于python爬虫的情感分析

测试

   通过输入文本来测试一下由分词词典得到的情感分数:(最后得到的文本情感分数有正负之分  分数越高越趋近于正面 分数越低越趋近于负面)

基于python的情感分析案例_关于python爬虫的情感分析

测试用例1: 今天吃了顿砂锅米线 味道特别好 下次还去

图片

    测试用例2:今天外面下雨了 心情也顺带有点沮丧 提不起精神

图片

    测试用例3:年年岁岁花相似 岁岁年年人不同

图片

    测试用例4:在淘宝买了个商品 可是快递员把我的快递随意乱扔 里面的东西都被摔碎了 真的好生气

图片

    通过分数可以看到,还是分析的有点准的,但是相较于机器学习来做情感分析还是差距很大,后面有时间会陆续学习更新一些更深入的情感分析算法。希望大家多多支持~

如需源码请关注公众号【PyDream】后回复:【情感分析即可】

本文链接:https://mp.weixin.qq.com/s/ybboepfKDPxm65HXY8ZEaw

微信公众号二维码:

基于python的情感分析案例_关于python爬虫的情感分析

 

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/172445.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)
blank

相关推荐

  • Windows 10配置远程开机[通俗易懂]

    Windows 10配置远程开机[通俗易懂]简介最近有个需求,在外边或者是上班的时候想从家里的电脑拿点资料,虽然家里的路由器有公网IP地址,但是电脑总不能一直开着吧,然后就想到可以远程通过网卡唤醒电脑。前提条件拥有一个公网IP(一般可以找运营商申请),如果拥有的公网IP是动态的话,需要绑定DDNS域名,DDNS域名可以自行注册。 电脑主板支持网络唤醒功能。配置方法主板开启网络唤醒功能,如图:设置网络适配器支持唤醒…

  • traceroute工作原理[通俗易懂]

    traceroute工作原理[通俗易懂]traceroute,也就是traceroute,跟踪路由。这个程序最早是VanJacobson实现的。源代码在网上能够找到,只是我还没有去找。基本的原理是IP路由过程中对数据包TTL(Tim

  • 什么是bs模型_cs模型人物看不见

    什么是bs模型_cs模型人物看不见C/S结构,即Client/Server(客户机/服务器)结构,是大家熟知的软件系统体系结构,通过将任务合理分配到Client端和Server端,降低了系统的通讯开销,可以充分利用两端硬件环境的优势。早期的软件系统多以此作为首选设计标准。(用的是ip,tcp/udp通信协议)B/S结构,即Browser/Server(浏览器/服务器)结构,是随着Internet技术的兴起,对C/S结构的一种…

  • giland激活码_通用破解码

    giland激活码_通用破解码,https://javaforall.cn/100143.html。详细ieda激活码不妨到全栈程序员必看教程网一起来了解一下吧!

  • Unity Shader入门精要(3D画入门)

    Shader的种类UnityShader是将传统的硬件Shader(由Cg/HLSL编写)嵌入到独有的描述性结构中而形成的一种代码生成框架,最终会自动生成各硬件平台自己的Shader,从而实现跨平台。UnityShader分为表面着色器(SurfaceShader)和顶点片段着色器(VertexAndFragmentShader)。表面着色器(SurfaceShader

  • 差分数组模板

    差分数组模板参考于labuladong:论那些小而美的算法技巧:差分数组一、什么时候使用差分数组呢?相信很多人都遇到过这类题:给定一个原数组长度为n,查询次数m,每次查询给定一个区间[l,r]和一个整数k,使得原数组介于[l,r]之间的元素同时增(或减)k输出最终的数组num[8,2,6,3,1]m=2131023注:第一次查询num=83741第二次查询num=1161041最终num=1

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号