舆情监测分析系统_舆情监测系统

舆情监测分析系统_舆情监测系统一、引言1.1目的  编写此文档的目的是确认舆情分析系统的需求及系统边界,指导系统的设计。1.2项目信息项目名称:舆情分析系统项目提出者:指导教师开发者:东北大学软件学院大数据班T09实训项目组(lzf、lcx)用户:舆情分析员、系统管理员1.3缩写说明1.4术语定义1.5参考资料新浪舆情通:https://yqt.mdata.net/二、舆情分析系统概述2.1舆情分析系统介绍  我们的舆情分析系统主要包括舆情总缆分析、舆情搜索、文章分析、文章评论分析、事件

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE使用 1年只要46元 售后保障 童叟无欺

一、引言

1.1 目的

  编写此文档的目的是确认舆情分析系统的需求及系统边界,指导系统的设计。

1.2 项目信息

  • 项目名称:舆情分析系统
  • 项目提出者:指导教师
  • 开发者:东北大学软件学院大数据班T09实训项目组(lzf、lcx)
  • 用户:舆情分析员、系统管理员

1.3 缩写说明

1.4 术语定义

在这里插入图片描述

1.5 参考资料

  • 新浪舆情通:https://yqt.mdata.net/

二、舆情分析系统概述

2.1 舆情分析系统介绍

  我们的舆情分析系统主要包括舆情总缆分析、舆情搜索、文章分析、文章评论分析、事件舆情分析、事件舆情预警六大功能模块以及管理员系统配置模块。针对舆情总览分析、舆情搜索、文章分析、文章评论分析、事件舆情分析、事件舆情预警我们的分析数据来源于多个网站关于某一事件的报道文章的爬取,如微博、今日头条、知乎等,但主要集中于微博。管理员配置模块配置的是爬虫的爬虫间隔、舆情事件的展示参数以及系统日志查看。

2.2 舆情分析系统价值主张与愿景

  不论是热点新闻还是娱乐八卦,传播速度远超我们的想象。可以在短短数分钟内,有数万计转发,数百万的阅读。如此海量的信息可以得到爆炸式的传播,如何能够实时的把握民情并作出对应的处理对很多企业来说都是至关重要的。我们的舆情分析系统的目的是通过大数据技术实时获取民众舆论并分析舆论变化情况,同时能够提供舆情预警使得可以引导舆情向好的方向发展。

2.3 舆情分析系统功能架构

  下图为舆情分析系统整体功能架构图:
在这里插入图片描述

2.4 系统数据描述

  系统的数据来源于微博博文与今日头条新闻文章舆情数据的实时爬取,爬取的数据包括文章内容、文章作者、文章点赞量、文章评论量、文章转发量、文章时间、文章评论、文章评论对应的评论者性别、文章评论的点赞量、文章评论的回复量等。
爬虫爬取到的数据为JSON串(表示的是文章对象),文章对象的属性及其说明如下:

  • field
    • 文章所属领域
  • user_name
    • 用户名(即文章作者名)
  • user_id
    • 用户ID(即文章作者ID),文章作者为某一事件的传播人
  • user_type
    -用户类型(即作者类型)
  • gender
    • 作者性别
  • location
    • 作者地域,由于或取不到文章发表时的IP,采用文章作者的地域作为文章发表时的地址
  • fans_count
    • 作者粉丝数
  • blog_id
    • 文章(如博客等)ID
  • create_date
    • 创建时间,即文章时间
  • text
    • 文章内容(文章文本)
  • attitudes_count
    • 文章点赞量
  • comments_count
    • 文章评论量
  • reports_count
    • 文章转发量
  • get_time
    • 文章爬取时间
  • comments
    • 文章的各个评论组成的JSON数组,数组的元素为JSON字符串(表示的是评论对象)

  评论对象的属性及其说明如下表所示:

  • comment_id
    • 评论ID
  • commenter_id
    • 评论者ID
  • commenter_name
    • 评论者名称
  • commenter_gender
    • 评论者性别
  • comment_text
    • 评论文本
  • comment_reply
    • 评论回复量
  • comment_like
    • 评论点赞量

三、功能性需求

  系统用户中舆情观察分析员与系统管理员的用例图为:
在这里插入图片描述

3.1 舆情首页需求

在这里插入图片描述

3.1.1 领域舆情热度

  用表格展示不同领域下近七天事件的热度排名,表格展示的字段有事件名称,时间热度,事件类型,热度排名,点击事件名称可跳转到对于事件的详情页。

3.1.2 领域舆情热度时间变化

  用折线图展示不同领域最近七天的舆情热度变化。

3.1.3 地域舆情分布

  用热度地图展示中国范围内所有舆情文章的地域数量分布情况。

3.2 舆情搜索页需求

在这里插入图片描述

3.2.1 舆情事件搜索

  提供搜索框,输入事件关键词,将对应的事件名称,事件热度,事件类型用表格的显示展示在搜索框下,点击事件名称可跳转到对应事件详情页。

3.3 舆情预警页需求

在这里插入图片描述

3.3.1 事件负面评论预警列表

  用表格展示近七天内事件负面评论占比大于预警阈值的事件,表格包括事件名称,事件负面评论占比,负面舆论环比增长率(由最近一天的数据和前一天的数据计算而来),表格可根据事件负面评论占比和环比增长率进行排序,其中正增长用红色字体和增长箭头标识,负增长由绿色字体和下降箭头标识,点击事件名称可跳转至对应事件详情页。

3.3.2 事件情感占比排名

  用饼图展示事件负面评论占比排名 TopN 的事件,以及展示事件负面评论环比增长排名 TopN 的事件。

3.3.3 事件热度增长列表

  用表格展示近七天事件的热度增长率,表格字段有事件名称、时间热度、增长率,其中正增长用红色字体和增长箭头标识,负增长由绿色字体和下降箭头标识,点击事件名称可跳转至对应事件详情页。

3.3.4 事件热度增长排名

  用柱形图标识事件增长率排名靠前的事件,包括事件名称和事件热度增长率。

3.4 舆情事件总览页需求

在这里插入图片描述

3.4.1 事件关键词词云

  用词云图展示事件关键词。

3.4.2 事件传播趋势

  用折线图展示事件关注度走势和事件信息量走势,关注度是事件所有文章阅读量(由于无法爬取到阅读量,采用点赞量代替)之和,信息量事件所有文章的数量。

3.4.3 时间核心传播人

  用饼图展示事件核心传播人占比,可设置展示媒体或网民,展示的数据主要有传播人名称和传播量,传播量指文章的转发量。

3.4.4 时间关注度增长趋势

  用折线面积图展示事件关注度环比增长率随时间的变化曲线。

3.5 舆情事件文章页需求

在这里插入图片描述

3.5.1 事件文章排名

  用柱状图展示相关事件文章排名,横坐标是文章作者的名称,纵坐标数据可由按钮切换成点赞数,转发数,评论数。

3.5.2 事件文章地域分布

  用地图展示事件文章发表的地域分布(关于某事件的所有文章在全国的数量分布)。

3.5.3 事件热度TopN文章

  卡片展示热度排名TopN文章的具体内容,作者名称,文章热度,可用走马灯组件进行切换展示。

3.5.4 事件文章时间线列表

  用时间线按时间展示当前事件文章的发表,展示字段文章时间,文章作者,文章内容。

3.6 舆情事件评论页需求

在这里插入图片描述
在这里插入图片描述

3.6.1 事件评论关键词词云

  用词云图展示当前事件下所用评论的关键词。

3.6.2 事件评论情感走势

  折线图展示当前事件下所有评论的情感趋势变化,图像中标识出最大值和最小值,横坐标为事件,纵坐标分别为负面评论和正面评论的占比,点击折现右边显示当前横坐标时间之前的所有评论,按照正面,负面,中立进行分类。

3.6.3 事件评论者性别占比分析

  用饼状图展示当前事件下评论者的性别占比。

3.6.4 事件高赞评论

  饼图展示当前事件下的高赞评论。

3.6.5 事件高回复评论

  饼图展示当前事件下的高回复评论。

3.7 管理员页需求

3.7.1 爬虫参数配置

  设置爬虫爬取事件间隔。
在这里插入图片描述

3.7.2 TopN参数配置

  设置文章排名、文章热度排名、事件高赞与高回复评论排名。
在这里插入图片描述

3.7.3 事件负面评论占比预警阈值配置

  在事件负面评论占比输入框内输入事件负面评论占比阈值,点击设置事件负面评论占比预警阈值。
在这里插入图片描述

3.7.4 系统日志页

  按时间线显示系统操作的记录。
在这里插入图片描述

4. 非功能性需求

4.1 可交互性

  系统的人机交互符合人的认知心理学基本原理,并且需要降低系统工作人员的学习成本,必要的话还要提供系统使用的帮助文档。

4.2 可维护性与可扩展性

  系统基于大数据生态组件构建,鉴于大数据组件的横向扩展能力,系统的可扩展性有一定保证。系统代码的开发需要满足代码开发规范,需要做好充分的注释、注意代码的可复用性、注意功能模块之间解耦能力,使得系统能够以较低成本进行二次开发、进行功能扩展、进行系统维护。

4.3 可适应性

  网页需要支持可视化图表在主流浏览器的正常加载显示,以及在浏览器窗口大小变化时它们也能够适应窗口大小正常加载显示。

4.4 响应性

  在网络正常的情况下用户点击网页后页面的跳转时间<=3s;若页面的数据量较大而导致的页面加载时间长的话,页面必须提供网页加载提示。

4.5 可靠性

  在系统发生故障后,需要保证系统可以在较短时间内重建其性能水平并恢复直接受影响数据的能力,并且使系统故障率保持在一定的水平下。

4.6 安全性

  系统需要保证数据的安全,防止数据的泄漏等。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/193664.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)
blank

相关推荐

  • 共享格子售货机方案/案列/APP/小程序/项目

    共享格子售货机方案/案列/APP/小程序/项目现代化的共享格子售货机可以说都是自动售货机应用软件开发使用,不仅支持纸币硬币等现金支付,还可以支持微信、支付宝、百度钱包等手机支付,甚至可以支持银联卡、员工卡、学生卡等各种刷卡支付,除此之外可可以远程监控,不需要运营人员亲自到现场就能知道自动售货机的运营数据。以上各种功能不仅大大方便了大家在售货机上购买东西,也方便了商家的自动售货机运营。目录一、共享格子售货机方案介绍二、共享格子售货机方案优…

  • 晴天的魔法乐园——谢尔宾斯基地毯(递归打印图形)「建议收藏」

    晴天的魔法乐园——谢尔宾斯基地毯(递归打印图形)「建议收藏」题目链接:https://judger.net/problem/1061ProblemDescription谢尔宾斯基地毯是一种分形图案,它的定义如下:令F(n)表示嵌套n层的谢尔宾斯基地毯,那么(下面的“空”均表示空格,仅为示意,实际输出时应仍为空格)当n=1时,F(1)为:空当n=2时,F(2)为:空空空空X空空空空一般地,如果F(n-1)表示嵌…

  • JVM相关问题整理

    备注:针对基本问题做一些基本的总结,不是详细解答!1.运行时数据区域(内存模型)(必考)2.垃圾回收机制(必考)3.垃圾回收算法(必考)4.MinorGC和FullGC触发条件5.GC中Stoptheworld(STW)6.各垃圾回收器的特点及区别,怎么做选择?7.双亲委派模型8.JDBC和双亲委派模型关系9.JVM锁优化和锁膨胀过程10.JVM中G…

  • Linux 安装tomcat 部署war包项目

    Linux 安装tomcat 部署war包项目准备工作:jdk-8u161-linux-x64.tar.gz链接:https://pan.baidu.com/s/1zQGL_cfN5jFWshZkAJOkNw密码:0u7dapache-tomcat-9.0.20.zip链接:https://pan.baidu.com/s/1Nf_qdmUVlQ0Cz8BOoQg2rA密码:bh9f以及你的war包…

  • 关于G1收集器

    关于G1收集器G1(GarbageFirst)收集器是Oracle公司开发的一款主要面向服务端的拥有相对可靠的停顿预测模型的垃圾收集器。在垃圾收集器的历史上有着里程碑式的意义。与之前的收集器不同,G1不在基于固定的新生代与老年代的内存分配方式进行垃圾清理,而是使用了基于Region的内存分配的方式进行垃圾清理。这种方式使得G1在进行垃圾清理的时候不需要对整个新生代或老年代甚至整个Java堆进行垃圾清理,这样就极大的减少标记期间的停顿时间。设计思路:面向局部(单个或多个Region)收集内存布局:基于Regi

  • linux即时聊天源码,最简单的Linux命令行Socket聊天程序源代码

    linux即时聊天源码,最简单的Linux命令行Socket聊天程序源代码只有今天贴出代码,明天看才知道自己有多么傻。单线程,一对一聊天,混搭风格编程,函数乱入不解释……/**ChatonLinuxTerminal–alpha*WortebyJimmy’steam@uestc*2011-2-23**Thisisthesorcecodeofclient*SomeBUGSstillunsloved,butwearetryin…

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号