山东大学舆情研究中心_舆情系统

山东大学舆情研究中心_舆情系统项目结题总结一、项目背景二、技术要点三、功能介绍1、服务器端(1)启动服务器一、项目背景对于一所高校来说一个好的风评有着十分重要的作用,拥有一个良好的口碑,能吸引更多的生源、引进更多的人才,学校的综合素质能力也会因此提升,因此我们小组选择了《山东大学舆情分析系统》这一题目,通过搜集百度新闻、央视新闻、今日头条、齐鲁网、新浪、网易新闻、微博、知乎等网站的有关信息,对搜集到的文本信息所进行的分词、统计处理,将结果绘制成可视化的热度词条、情感倾向变化图,并实时展示在网站上,以此来更直观的了解山大的实时风评。

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE使用 1年只要46元 售后保障 童叟无欺


一、项目背景

对于一所高校来说一个好的风评有着十分重要的作用,拥有一个良好的口碑,能吸引更多的生源、引进更多的人才,学校的综合素质能力也会因此提升,因此我们小组选择了《山东大学舆情分析系统》这一题目,通过搜集百度新闻、央视新闻、今日头条、齐鲁网、新浪、网易新闻、微博、知乎等网站的有关信息,对搜集到的文本信息所进行的分词、统计处理,将结果绘制成可视化的热度词条、情感倾向变化图,并实时展示在网站上,以此来更直观的了解山大的实时风评。

二、技术要点

在本项目中,我们主要选用python语言。

在爬虫方面,我们采用Scrapy爬虫框架,首先对上述若干带有搜索引擎的入口网站进行一级爬取,该层主要爬取网页中以“山东大学”为关键字的搜索结果
在这里插入图片描述
其次将对一级爬取中获得的网页链接进行二级爬取,该层主要爬取相关页面中的“相关推荐”、评论等内容。
在这里插入图片描述
对于大部分网站中常见的反爬虫技术,我们采用了请求头随机UA、资源延时下载、cookie保存状态等来掩盖我们的爬虫,防止其被反爬虫技术识别。

在分词方面,我们采用的是python的pkuseg库,并加入了我们自己生成的停用词词库、保留词词典等,以进一步优化分词结果。在情感分析方面,我们使用词的情感倾向表,通过各个词的权值对热词、评论进行情感分析。

在网页展示方面,我们采用了Vue的前端和Django的后端,以便能与爬虫和分词模块更好的兼容。

三、功能介绍

1、服务器端

(1)启动服务器

我们的项目是在python的虚拟环境中运行,目前运行过程已经可以脱离编译器。因此我们首先进入python虚拟环境,进入django项目目录下,输入:

python manage.py runserver 0.0.0.0:8080

在这里插入图片描述

(2)后台主系统(控制爬虫、分词、分析模块)

  • 后台主系统将在服务器启动时自动开启
  • 主系统将在每天凌晨4~5点开启核心系统(爬虫、分词、分析模块)
  • 主系统可以使用以下命令:
    • “start”:开启主系统
    • “stop” / “end”:关闭主系统
    • “exit”:退出主系统
    • ”help“:查看帮助信息
  • 在核心系统运行时,无法关闭、退出主系统

(3)关闭服务器

关闭服务器前,需优先关闭主系统,再手动关闭服务器cmd窗口

2、网页端——未登录

(1)首页

在这里插入图片描述

(2)总览

在这里插入图片描述

(3)登录 / 注册

在这里插入图片描述
在这里插入图片描述

3、网页端——用户端

(1)单个热词查询

在这里插入图片描述

(2)单个热词信息

在这里插入图片描述
在这里插入图片描述

(3)热词相关网页查询

在这里插入图片描述

(4)总览——登陆后

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

4、网页端——管理员端

(1)热词管理

在这里插入图片描述

(2)网页管理

在这里插入图片描述

(3)链接管理

在这里插入图片描述

(4)用户管理

在这里插入图片描述

(5)增加管理员

在这里插入图片描述

(6)管理后台主系

在这里插入图片描述

四、Github项目地址

https://github.com/STK425/django_vue

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/191387.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)
blank

相关推荐

  • [转载]Asp.net MVC 2 + Castle + NHibernate 项目实战(1)

    [转载]Asp.net MVC 2 + Castle + NHibernate 项目实战(1)

  • QT QList介绍及应用

    QT QList介绍及应用QList是目前最常用的容器类,它存储了给定类型的值的一个列表,而这些值可以通过索引访问。QList使用数组来实现,以确保进行快速的基于索引的访问。使用QList::append和QList::prepend在列表的两端进行添加项目。使用QList::insert()在列表的中间插入项目。实例:#include<QCoreApplication>#include<Q…

    2022年10月31日
  • HTML 有序列表 字母,HTML有序列表| HTML编号列表

    HTML 有序列表 字母,HTML有序列表| HTML编号列表本文概述HTML排序列表或编号列表以编号格式显示元素。HTMLol标签用于有序列表。我们可以使用有序列表以数字顺序格式或字母顺序格式或强调顺序的任何格式来表示项目。编号列表可以有不同类型:数值(1,2,3)大写罗马数字(IIIIII)小罗马数字(iiiiii)大写字母(ABC)小写字母(abc)为了表示不同的有序列表,标记中有5种类型的属性。类型描述输入“1”这是默认类…

  • mac pycharm 设置_pycharm配置conda环境

    mac pycharm 设置_pycharm配置conda环境MAC环境下pycharm调试Python代码@TOC安装从官网下载,社区版和专业版。和安装其他软件一样,不详细讲。需要配置解释器1.如图,打开配置页面2.如图,右边的框是解释器的位置,这个可以设置。因为项目的不同,经常会有使用不同的库的情况,不同版本放在一起很容易出问题,因此为避免此类问题,往往把不同的库装在不同的虚拟环境中。这样对于依赖于同样的库的项目就可以通过一个虚拟环境运行。安装包的时候最好在终端安装,pycharm直接安装容易出错。下图右面的框就是解释器的位置。3.点击右面的

  • L2-027 名人堂与代金(排序)

    L2-027 名人堂与代金(排序)原题链接对于在中国大学MOOC(http://www.icourse163.org/ )学习“数据结构”课程的学生,想要获得一张合格证书,总评成绩必须达到 60 分及以上,并且有另加福利:总评分在 [G, 100] 区间内者,可以得到 50 元 PAT 代金券;在 [60, G) 区间内者,可以得到 20 元PAT代金券。全国考点通用,一年有效。同时任课老师还会把总评成绩前 K 名的学生列入课程“名人堂”。本题就请你编写程序,帮助老师列出名人堂的学生,并统计一共发出了面值多少元的 PAT 代金券。输入格

  • 绕过问题也是一种能力–记一次接口的问题「建议收藏」

    绕过问题也是一种能力–记一次接口的问题

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号