舆情监测分析系统_舆情监测系统

舆情监测分析系统_舆情监测系统一、引言1.1目的  编写此文档的目的是确认舆情分析系统的需求及系统边界,指导系统的设计。1.2项目信息项目名称:舆情分析系统项目提出者:指导教师开发者:东北大学软件学院大数据班T09实训项目组(lzf、lcx)用户:舆情分析员、系统管理员1.3缩写说明1.4术语定义1.5参考资料新浪舆情通:https://yqt.mdata.net/二、舆情分析系统概述2.1舆情分析系统介绍  我们的舆情分析系统主要包括舆情总缆分析、舆情搜索、文章分析、文章评论分析、事件

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE使用 1年只要46元 售后保障 童叟无欺

一、引言

1.1 目的

  编写此文档的目的是确认舆情分析系统的需求及系统边界,指导系统的设计。

1.2 项目信息

  • 项目名称:舆情分析系统
  • 项目提出者:指导教师
  • 开发者:东北大学软件学院大数据班T09实训项目组(lzf、lcx)
  • 用户:舆情分析员、系统管理员

1.3 缩写说明

1.4 术语定义

在这里插入图片描述

1.5 参考资料

  • 新浪舆情通:https://yqt.mdata.net/

二、舆情分析系统概述

2.1 舆情分析系统介绍

  我们的舆情分析系统主要包括舆情总缆分析、舆情搜索、文章分析、文章评论分析、事件舆情分析、事件舆情预警六大功能模块以及管理员系统配置模块。针对舆情总览分析、舆情搜索、文章分析、文章评论分析、事件舆情分析、事件舆情预警我们的分析数据来源于多个网站关于某一事件的报道文章的爬取,如微博、今日头条、知乎等,但主要集中于微博。管理员配置模块配置的是爬虫的爬虫间隔、舆情事件的展示参数以及系统日志查看。

2.2 舆情分析系统价值主张与愿景

  不论是热点新闻还是娱乐八卦,传播速度远超我们的想象。可以在短短数分钟内,有数万计转发,数百万的阅读。如此海量的信息可以得到爆炸式的传播,如何能够实时的把握民情并作出对应的处理对很多企业来说都是至关重要的。我们的舆情分析系统的目的是通过大数据技术实时获取民众舆论并分析舆论变化情况,同时能够提供舆情预警使得可以引导舆情向好的方向发展。

2.3 舆情分析系统功能架构

  下图为舆情分析系统整体功能架构图:
在这里插入图片描述

2.4 系统数据描述

  系统的数据来源于微博博文与今日头条新闻文章舆情数据的实时爬取,爬取的数据包括文章内容、文章作者、文章点赞量、文章评论量、文章转发量、文章时间、文章评论、文章评论对应的评论者性别、文章评论的点赞量、文章评论的回复量等。
爬虫爬取到的数据为JSON串(表示的是文章对象),文章对象的属性及其说明如下:

  • field
    • 文章所属领域
  • user_name
    • 用户名(即文章作者名)
  • user_id
    • 用户ID(即文章作者ID),文章作者为某一事件的传播人
  • user_type
    -用户类型(即作者类型)
  • gender
    • 作者性别
  • location
    • 作者地域,由于或取不到文章发表时的IP,采用文章作者的地域作为文章发表时的地址
  • fans_count
    • 作者粉丝数
  • blog_id
    • 文章(如博客等)ID
  • create_date
    • 创建时间,即文章时间
  • text
    • 文章内容(文章文本)
  • attitudes_count
    • 文章点赞量
  • comments_count
    • 文章评论量
  • reports_count
    • 文章转发量
  • get_time
    • 文章爬取时间
  • comments
    • 文章的各个评论组成的JSON数组,数组的元素为JSON字符串(表示的是评论对象)

  评论对象的属性及其说明如下表所示:

  • comment_id
    • 评论ID
  • commenter_id
    • 评论者ID
  • commenter_name
    • 评论者名称
  • commenter_gender
    • 评论者性别
  • comment_text
    • 评论文本
  • comment_reply
    • 评论回复量
  • comment_like
    • 评论点赞量

三、功能性需求

  系统用户中舆情观察分析员与系统管理员的用例图为:
在这里插入图片描述

3.1 舆情首页需求

在这里插入图片描述

3.1.1 领域舆情热度

  用表格展示不同领域下近七天事件的热度排名,表格展示的字段有事件名称,时间热度,事件类型,热度排名,点击事件名称可跳转到对于事件的详情页。

3.1.2 领域舆情热度时间变化

  用折线图展示不同领域最近七天的舆情热度变化。

3.1.3 地域舆情分布

  用热度地图展示中国范围内所有舆情文章的地域数量分布情况。

3.2 舆情搜索页需求

在这里插入图片描述

3.2.1 舆情事件搜索

  提供搜索框,输入事件关键词,将对应的事件名称,事件热度,事件类型用表格的显示展示在搜索框下,点击事件名称可跳转到对应事件详情页。

3.3 舆情预警页需求

在这里插入图片描述

3.3.1 事件负面评论预警列表

  用表格展示近七天内事件负面评论占比大于预警阈值的事件,表格包括事件名称,事件负面评论占比,负面舆论环比增长率(由最近一天的数据和前一天的数据计算而来),表格可根据事件负面评论占比和环比增长率进行排序,其中正增长用红色字体和增长箭头标识,负增长由绿色字体和下降箭头标识,点击事件名称可跳转至对应事件详情页。

3.3.2 事件情感占比排名

  用饼图展示事件负面评论占比排名 TopN 的事件,以及展示事件负面评论环比增长排名 TopN 的事件。

3.3.3 事件热度增长列表

  用表格展示近七天事件的热度增长率,表格字段有事件名称、时间热度、增长率,其中正增长用红色字体和增长箭头标识,负增长由绿色字体和下降箭头标识,点击事件名称可跳转至对应事件详情页。

3.3.4 事件热度增长排名

  用柱形图标识事件增长率排名靠前的事件,包括事件名称和事件热度增长率。

3.4 舆情事件总览页需求

在这里插入图片描述

3.4.1 事件关键词词云

  用词云图展示事件关键词。

3.4.2 事件传播趋势

  用折线图展示事件关注度走势和事件信息量走势,关注度是事件所有文章阅读量(由于无法爬取到阅读量,采用点赞量代替)之和,信息量事件所有文章的数量。

3.4.3 时间核心传播人

  用饼图展示事件核心传播人占比,可设置展示媒体或网民,展示的数据主要有传播人名称和传播量,传播量指文章的转发量。

3.4.4 时间关注度增长趋势

  用折线面积图展示事件关注度环比增长率随时间的变化曲线。

3.5 舆情事件文章页需求

在这里插入图片描述

3.5.1 事件文章排名

  用柱状图展示相关事件文章排名,横坐标是文章作者的名称,纵坐标数据可由按钮切换成点赞数,转发数,评论数。

3.5.2 事件文章地域分布

  用地图展示事件文章发表的地域分布(关于某事件的所有文章在全国的数量分布)。

3.5.3 事件热度TopN文章

  卡片展示热度排名TopN文章的具体内容,作者名称,文章热度,可用走马灯组件进行切换展示。

3.5.4 事件文章时间线列表

  用时间线按时间展示当前事件文章的发表,展示字段文章时间,文章作者,文章内容。

3.6 舆情事件评论页需求

在这里插入图片描述
在这里插入图片描述

3.6.1 事件评论关键词词云

  用词云图展示当前事件下所用评论的关键词。

3.6.2 事件评论情感走势

  折线图展示当前事件下所有评论的情感趋势变化,图像中标识出最大值和最小值,横坐标为事件,纵坐标分别为负面评论和正面评论的占比,点击折现右边显示当前横坐标时间之前的所有评论,按照正面,负面,中立进行分类。

3.6.3 事件评论者性别占比分析

  用饼状图展示当前事件下评论者的性别占比。

3.6.4 事件高赞评论

  饼图展示当前事件下的高赞评论。

3.6.5 事件高回复评论

  饼图展示当前事件下的高回复评论。

3.7 管理员页需求

3.7.1 爬虫参数配置

  设置爬虫爬取事件间隔。
在这里插入图片描述

3.7.2 TopN参数配置

  设置文章排名、文章热度排名、事件高赞与高回复评论排名。
在这里插入图片描述

3.7.3 事件负面评论占比预警阈值配置

  在事件负面评论占比输入框内输入事件负面评论占比阈值,点击设置事件负面评论占比预警阈值。
在这里插入图片描述

3.7.4 系统日志页

  按时间线显示系统操作的记录。
在这里插入图片描述

4. 非功能性需求

4.1 可交互性

  系统的人机交互符合人的认知心理学基本原理,并且需要降低系统工作人员的学习成本,必要的话还要提供系统使用的帮助文档。

4.2 可维护性与可扩展性

  系统基于大数据生态组件构建,鉴于大数据组件的横向扩展能力,系统的可扩展性有一定保证。系统代码的开发需要满足代码开发规范,需要做好充分的注释、注意代码的可复用性、注意功能模块之间解耦能力,使得系统能够以较低成本进行二次开发、进行功能扩展、进行系统维护。

4.3 可适应性

  网页需要支持可视化图表在主流浏览器的正常加载显示,以及在浏览器窗口大小变化时它们也能够适应窗口大小正常加载显示。

4.4 响应性

  在网络正常的情况下用户点击网页后页面的跳转时间<=3s;若页面的数据量较大而导致的页面加载时间长的话,页面必须提供网页加载提示。

4.5 可靠性

  在系统发生故障后,需要保证系统可以在较短时间内重建其性能水平并恢复直接受影响数据的能力,并且使系统故障率保持在一定的水平下。

4.6 安全性

  系统需要保证数据的安全,防止数据的泄漏等。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/193664.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)


相关推荐

  • python运维开发实战「建议收藏」

    python运维开发实战「建议收藏」python运维和开发实战-基础篇python运维和开发实战-基础篇课程链接如下:通过如下链接地址购买课程可享受优惠哈~限时优惠,原价499元,现价只需125元https://edu….

  • pycharm怎么用_pycharm学生版只能用一年

    pycharm怎么用_pycharm学生版只能用一年Pycharm专业版的学生license只有一年有效期,过期后如果你还是学生,想要继续免费使用Pycharm专业版,其实很简单。PyCharm官方会在license过期前两周给你发一份邮件,这份邮件在你学校的邮箱里。邮件内容如下图所示:点击usethislink,填入相关信息后,勾选阅读并接受协议,然后点击申请免费产品,然后使用你的jetbrains账号登录即可成功renewlicense然后进入pycharm,输入账号密码activate即可。…

  • i686和x86_64的区别

    i686和x86_64的区别i686的解释:i代表intel系列的cpu。386几乎适用于所有的x86平台,不论是旧的pentum或者是新的pentum-IV与K7系列的CPU等等,都可以正常的工作!那个i指的是Intel兼容的CPU的意思,至于386不用说,就是CPU的等级啦!i586就是586等级的计算机,那是哪些呢?包括pentum第一代MMXC…

  • 256. Spinnaker介绍(企业级K8S自动化运维平台)

    256. Spinnaker介绍(企业级K8S自动化运维平台)文章目录1.Spinnaker简介2.Spinnaker逻辑架构3.Spinnaker核心功能3.1集群管理3.2部署管理4.Spinnaker管理方法5.部署Spinnaker的Armory发行版1.Spinnaker简介Spinnaker是Netflix在2015年开源的一款持续交付平台,它继承了Netflix上一代集群和部署管理工具Asgard:Web-basedCloudManagementandDeployment的优点,同时根据公司业务以及技术的的发展抛

    2022年10月30日
  • join方法的使用

    join方法的使用一、join方法1.1jon方法的作用使所属的线程对象x正常执行run()方法中的任务,而使当前线程y无限期的阻塞,直到x线程销毁后再继续执行线程y后面的代码。join方法具有使线程排队运行的作用,有些类似同步的运行的效果。1.2join与synchronized的区别join在内部使用wait()方法进行等待,而synchronized关键字使用的是”对象监视器”原理作为同步。…

  • js原生判断是否是数字类型[通俗易懂]

    js原生判断是否是数字类型[通俗易懂]js判断数字类型汇总最近在写代码的时候,有些逻辑需要判断数字类型,等用到的时候才发现自己了解的方法不太严密,然后就决心查资料汇总了解下有哪些方法比较严密第一种:typeof+isNaN使用typeof可以判断是否是一个数字类型,但是NaN也是数字类型,为了筛除这个可能,进一步通过isNaN来筛除。这种方法会遗漏InfinityfunctionisNumber(num){ retu…

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号