山东大学舆情研究中心_舆情系统

全栈程序员-用户IM • 2022年9月20日下午3:46 • 未分类

山东大学舆情研究中心_舆情系统项目结题总结一、项目背景二、技术要点三、功能介绍1、服务器端（1）启动服务器一、项目背景对于一所高校来说一个好的风评有着十分重要的作用，拥有一个良好的口碑，能吸引更多的生源、引进更多的人才，学校的综合素质能力也会因此提升，因此我们小组选择了《山东大学舆情分析系统》这一题目，通过搜集百度新闻、央视新闻、今日头条、齐鲁网、新浪、网易新闻、微博、知乎等网站的有关信息，对搜集到的文本信息所进行的分词、统计处理，将结果绘制成可视化的热度词条、情感倾向变化图，并实时展示在网站上，以此来更直观的了解山大的实时风评。

大家好，又见面了，我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE使用 1年只要46元售后保障童叟无欺

一、项目背景

对于一所高校来说一个好的风评有着十分重要的作用，拥有一个良好的口碑，能吸引更多的生源、引进更多的人才，学校的综合素质能力也会因此提升，因此我们小组选择了《山东大学舆情分析系统》这一题目，通过搜集百度新闻、央视新闻、今日头条、齐鲁网、新浪、网易新闻、微博、知乎等网站的有关信息，对搜集到的文本信息所进行的分词、统计处理，将结果绘制成可视化的热度词条、情感倾向变化图，并实时展示在网站上，以此来更直观的了解山大的实时风评。

二、技术要点

在本项目中，我们主要选用python语言。

在爬虫方面，我们采用Scrapy爬虫框架，首先对上述若干带有搜索引擎的入口网站进行一级爬取，该层主要爬取网页中以“山东大学”为关键字的搜索结果

其次将对一级爬取中获得的网页链接进行二级爬取，该层主要爬取相关页面中的“相关推荐”、评论等内容。
在这里插入图片描述
对于大部分网站中常见的反爬虫技术，我们采用了请求头随机UA、资源延时下载、cookie保存状态等来掩盖我们的爬虫，防止其被反爬虫技术识别。

在分词方面，我们采用的是python的pkuseg库，并加入了我们自己生成的停用词词库、保留词词典等，以进一步优化分词结果。在情感分析方面，我们使用词的情感倾向表，通过各个词的权值对热词、评论进行情感分析。

在网页展示方面，我们采用了Vue的前端和Django的后端，以便能与爬虫和分词模块更好的兼容。

三、功能介绍

1、服务器端

（1）启动服务器

我们的项目是在python的虚拟环境中运行，目前运行过程已经可以脱离编译器。因此我们首先进入python虚拟环境，进入django项目目录下，输入：

python manage.py runserver 0.0.0.0:8080

在这里插入图片描述

（2）后台主系统（控制爬虫、分词、分析模块）

后台主系统将在服务器启动时自动开启
主系统将在每天凌晨4~5点开启核心系统（爬虫、分词、分析模块）
主系统可以使用以下命令：
- “start”：开启主系统
- “stop” / “end”：关闭主系统
- “exit”：退出主系统
- ”help“：查看帮助信息
在核心系统运行时，无法关闭、退出主系统

（3）关闭服务器

关闭服务器前，需优先关闭主系统，再手动关闭服务器cmd窗口

2、网页端——未登录

（1）首页

在这里插入图片描述

（2）总览

在这里插入图片描述

（3）登录 / 注册

在这里插入图片描述

3、网页端——用户端

（1）单个热词查询

在这里插入图片描述

（2）单个热词信息

在这里插入图片描述

（3）热词相关网页查询

在这里插入图片描述

（4）总览——登陆后

在这里插入图片描述

4、网页端——管理员端

（1）热词管理

在这里插入图片描述

（2）网页管理

在这里插入图片描述

（3）链接管理

在这里插入图片描述

（4）用户管理

在这里插入图片描述

（5）增加管理员

在这里插入图片描述

（6）管理后台主系

在这里插入图片描述

四、Github项目地址

https://github.com/STK425/django_vue

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至举报，一经查实，本站将立刻删除。

发布者：全栈程序员-用户IM，转载请注明出处：https://javaforall.cn/191387.html原文链接：https://javaforall.cn

【正版授权，激活自己账号】： Jetbrains全家桶Ide使用，1年售后保障，每天仅需1毛

【官方授权正版激活】： 官方授权正版激活支持Jetbrains家族下所有IDE 使用个人JB账号...

赞 (0)

全栈程序员-用户IM

0 0

session.setAttribute报错_java string contains方法

session.setAttribute报错_java string contains方法HTTPSession在setAttribute时，保存的对象是否需要序列化？查看StandardSession源码中，在setAttribute()中有如下代码if((manager!=null)&&manager.getDistributable()&&!isAttributeDistributable(name…

全栈程序员-用户IM
2022年10月9日
redis图形化管理工具_redis的安装

redis图形化管理工具_redis的安装一、redis的启动停止连接命令ifconfig查询ip———-redis-4.0.11（本机linux7系统）————cdwslxm/redis/redis-4.0.11切到redis目录./src/redis-serverredis.conf…

全栈程序员-用户IM
2022年10月12日
matlab画图透明度_css设置透明度

matlab画图透明度_css设置透明度直接上代码b=bar(1:10);alpha(0.1)alpha-向坐标区的对象添加透明度，值越小越透明下有两图做example：参考资料：bar画的图怎么设置颜色为透明？

全栈程序员-用户IM
2022年10月9日
SQL注入报错注入函数[通俗易懂]

SQL注入报错注入函数[通俗易懂]前言报错注入的前提是当语句发生错误时，错误信息被输出到前端。其漏洞原因是由于开发人员在开发程序时使用了print_r()，mysql_error()，mysqli_connect_error()函数将mysql错误信息输出到前端，因此可以通过闭合原先的语句，去执行后面的语句。常用报错函数updatexml()是mysql对xml文档数据进行查询和修改的xpath函数extractvalue()是mysql对xml文档数据进行查询的xpa…

全栈程序员-用户IM
2022年9月30日
IIC原理超详细讲解—值得一看[通俗易懂]

IIC原理超详细讲解—值得一看[通俗易懂]文章目录IIC简介ＩＩＣ的物理层IIC的高阻态IIC物理层总结：ＩＩＣ的协议层IIC总线时序图初始(空闲)状态开始信号：停止信号数据有效性应答信号IIC数据传送数据传送格式IIC发送数据IIC读数据：以AT24C02为例子软件IIC和硬件IICIIC简介 IIC(Inter－IntegratedCircuit)总线是一种由NXP…

全栈程序员-用户IM
2022年6月14日
java中String类型转Map类型[通俗易懂]

java中String类型转Map类型[通俗易懂]importcom.alibaba.fastjson;Stringstr=””;HashMaphashMap=JSON.parseObject(str,HashMap.class);

全栈程序员-用户IM
2022年9月11日

发表回复

关注全栈程序员社区公众号