AC自己主动机 总结

AC自己主动机 总结

大家好,又见面了,我是全栈君,今天给大家准备了Idea注册码。

模板–参考六如家培训指南

/*===============================*\
依照训练指南写的
\*===============================*/
#include<cstring>
#include<queue>
#include<cstdio>
#include<map>
#include<string>
using namespace std;

const int SIGMA_SIZE = 26;
const int MAXNODE = 11000;
const int MAXS = 150 + 10;

map<string,int> ms;

struct AhoCorasickAutomata {
  int ch[MAXNODE][SIGMA_SIZE];
  int f[MAXNODE];    // fail函数
  int val[MAXNODE];  // 每一个字符串的结尾结点都有一个非0的val
  int last[MAXNODE]; // 输出链表的下一个结点
  int cnt[MAXS];
  int sz;

  void init() {
    sz = 1;
    memset(ch[0], 0, sizeof(ch[0]));
    memset(cnt, 0, sizeof(cnt));
    ms.clear();
  }
  inline void clear(){memset(cnt,0,sizeof(cnt));}//假设text不仅仅是一个的话,常常须要每次find都清空一次cnt数组
  // 字符c的编号
  inline int idx(char c) {
    return c-'a';
    //这里一定小心,假设没有给定字符范围的话。直接return c;
    //由于可能出现负的...病毒侵袭那题就是
  }

  // 插入字符串。

v必须非0 void insert(char *s, int v) { int u = 0, n = strlen(s); for(int i = 0; i < n; i++) { int c = idx(s[i]); if(!ch[u][c]) { memset(ch[sz], 0, sizeof(ch[sz])); val[sz] = 0; ch[u][c] = sz++; } u = ch[u][c];//u是下一个节点所存储的ch第一维的位置,相当于我trie中的nxt } val[u] = v; //v是附加信息,最好区分开每一个单词这样 //cnt能够记录出现了哪些以及出现了几次 ms[string(s)] = v; } // 递归打印以结点j结尾的全部字符串 void print(int j) { if(j) { cnt[val[j]]++;//val[j]为单词的编号。ms存储了编号和单词的相应,能够用于打印单词 print(last[j]); } } // 在T中找模板 int find(char* T) { int n = strlen(T); int j = 0; // 当前结点编号,初始为根结点 for(int i = 0; i < n; i++) { // 文本串当前指针 int c = idx(T[i]); while(j && !ch[j][c]) j = f[j]; // 顺着细边走,直到能够匹配 j = ch[j][c]; if(val[j]) print(j);//到单词结尾 else if(last[j]) print(last[j]); // 找到了! } } // 计算fail函数 void getFail() { queue<int> q; f[0] = 0; // 初始化队列 for(int c = 0; c < SIGMA_SIZE; c++) { int u = ch[0][c]; if(u) { f[u] = 0; q.push(u); last[u] = 0; } }//由于第一个字符不匹配须要又一次匹配, //所以第一个字符都指向root(root是Trie入口,没有实际含义) //就是说全部单词第一个字符的f[]都等于0。把节点e的fail指针指向root表示没有匹配序列 // 按BFS顺序计算fail while(!q.empty()) { int r = q.front(); q.pop(); for(int c = 0; c < SIGMA_SIZE; c++) { int u = ch[r][c]; if(!u) continue; q.push(u); int v = f[r]; while(v && !ch[v][c]) v = f[v];//ch[v][c]==0的时候,就是说没有继续能够匹配的字母边了。也是没法继续匹配了,所以继续沿失配函数走 f[u] = ch[v][c]; last[u] = val[f[u]] ? f[u] : last[f[u]]; //last[j] 节点j沿着适配指针往回走时,遇到的下一个单词结点编号 //last是为了解决找到一个单词之后,看看有没有其它串包括 } } }};AhoCorasickAutomata ac;

1、看一个范围内的字符,变化SIGMA_SIZE以及idx功能

版权声明:本文博客原创文章,博客,未经同意,不得转载。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/117740.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)


相关推荐

  • plsql developer配置数据库连接_plsql使用教程

    plsql developer配置数据库连接_plsql使用教程一、概念PL/SQLDeveloper是一个集成开发环境,专门面向Oracle数据库存储程序单元的开发。如今,有越来越多的商业逻辑和应用逻辑转向了OracleServer,因此,PL/SQL编程也成了整个开发过程的一个重要组成部分。PL/SQLDeveloper侧重于易用性、代码品质和生产力,充分发挥Oracle应用程序开发过程中的主要优势。Oracle数据库并不提供图形界面的开发…

  • linux多进程与进程间通信_linux共享内存进程间通信

    linux多进程与进程间通信_linux共享内存进程间通信Linux下进程间通信–共享内存:最快的进程间通信方式

    2022年10月10日
  • JAVA求数组的平均数,众数,中位数[通俗易懂]

    JAVA求数组的平均数,众数,中位数[通俗易懂]目录1、名称解释2、实例代码(1)求平均数(2)求中位数(3)求众数1、名称解释平均数:是指一组数据之和,除以这组数的个数,所得的结果就是平均数。中位数:中位数是指把一组数据从小到大排列,如果这组数据的个数是奇数,那最中间那个就是中位数,如果这组数据的个数为偶数,那就把中间的两个数之和除以2,所得的结果就是中位数。众数:众数是指一组数据中出现次数最多的那个数,众数可以是0个或多个。2、实例代码(1)求平均数publicstaticdoublem..

  • win10更新失败0x80240fff_win10系统更新出现错误代码

    win10更新失败0x80240fff_win10系统更新出现错误代码Windows无法更新,无法启用功能,0x8000FFFF错误,系统存在损坏文件,用管理员打开命令行(或powershell)运行sfc/scannow检查并修复。

  • word在试图打开文件时遇到错误解决办法,亲测可用[通俗易懂]

    word在试图打开文件时遇到错误解决办法,亲测可用[通俗易懂]现象:解决办法:文件-右键属性-接除锁定如果没有接除锁定,则使用下面这个方法:“word在试图打开文件时遇到错误”解决办法,亲测可用_加鸡腿的博客-CSDN博客_windows在试图打开文件时遇到错误打开word文档时,出现以下报错:解决办法:步骤一:步骤二:步骤三:步骤四:步骤五:步骤六:步骤七:步骤八:点击【确定】即可。…https://blog.csdn.net/qq_43437571/article/details/102962500…

  • 手机:指纹识别基本原理图_手机指纹识别的工作原理

    手机:指纹识别基本原理图_手机指纹识别的工作原理指纹识别技术作为生物识别技术之一,指纹识别技术是通过取像设备读取指纹图像,然后在用识别软件提取指纹特征数据,最后在进行匹配识别算法得到结果,以确认指纹所有人身份的生物特征识别技术。指纹识别功能具体工

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号