我成了五个大佬的祖宗_我家可能有位大佬

我成了五个大佬的祖宗_我家可能有位大佬Lumpy_Trie 详解 —— 由Ciyang大佬发明(不一定是首次)

大家好,又见面了,我是你们的朋友全栈君。


原题解地址及本文目的

https://ciyang.blog.luogu.org/solution-p2580

本文目的:留作日后自用,翻译一下大佬清奇的码风。


正文

Lumpy_Trie是边压缩的Trie, 可以省空间, 各Node存的是字符串。

现在来翻译(解释及简化(我是懒癌))一下Ciyang的源码。(源码及原注释在Ciyang神犇的题解里, 这里的注释是我自己加的, 这里的码是我抄的, 不保证完全一致)

先翻译节点定义

//这是Ciyang的define #define clear(a) memset(a, 0, sizeof a) #define copy(a, b) memcpy(a, b, sizeof a) //这是Ciyang的节点定义 char allstr[10001][51];//这是Ciyang的腐竹内存 char tmp[51];//这是本文中不会用到的东西 struct Lumpy_Tnode { const char *pStr;//指针,指向辅助内存中的地址,即各Node保存的字符串都是存在腐竹内存中的 int length, isEnd;//length就是本节点中存的字符串的长度,即pStr后多少位, isEnd就和Trie的“终结标记”一样(isEnd的定义浅显易懂 Lumpy_Tnode *children[26];//这是子节点,像Trie一样, 存储后继节点的地址 inline Lumpy_Tnode() { pStr = 0, length = isEnd = 0, clear(children);//这段构造函数是用在根节点上的 } inline Lumpy_Tnode(const char *str, int len, int end) { pStr = str, length = len, isEnd = end, clear(children);//这段构造函数是用在除根节点之外的节点上的 } } mNode;//这个我想是 main Node, 即 root Node 

接下来翻译insert函数

//这个函数在主程序里这样调用 insert(要插入的串, 要插入的串的长度, mNode(root)); inline void insert(const char *str, int length, Lumpy_Tnode *bNode) { //bNode是当前节点, 和Trie完全一样, str就是指针啦 if(!length) { bNode->isEnd = 1; return; } //建议先看后面的翻译 int ch = str[0] - 'a';//这个就是懒癌的象征了, 当然确实快 if(bNode->children[ch]) { //已经存在以 str[0] 为首字母的后继子串,请看下面翻译 bNode = bNode->children[ch];//转移焦点,开始协调 register int sptr = 0;//指针 while(sptr < length && sptr < bNode->length//循环来找当前字符串和节点存储的字符串最长前缀(Ciyang的注释 && bNode->pStr[sptr] == str[sptr] ) ++sptr; if(sptr != bNode->length) { //当节点存储的字符串不是插入字符的子串时……(由上面那个while的结束条件表明 //于是就要将最大公共前缀变成此节点, 两个后缀都变成子节点 Lumpy_Tnode *nNode = new Lumpy_Tnode(bNode->pStr + sptr, bNode->length - sptr, bNode->isEnd); //上一行那句就是讲此节点的后缀拆一出来作为子节点,此时原节点的子节点信息应被继承 copy(nNode->children, bNode->children); // 这就是继承了, 为什么继承大家都清楚 bNode->isEnd = 0, bNode->children[bNode -> pStr[sptr] - 'a'] = nNode; //此时新节点要接到父节点上 } //以下应该是代码的简化, 如果想看的清楚明白一点就把以下代码加个完全复制到上面那个if里; bNode->length = sptr; insert(str+sptr, length - sptr, bNode); //将去掉与原bNode公共前缀的str插入 } else//并不存在以 str[0] 为首字母的后继子串(第一次的象征 bNode->children[ch] = new Lumpy_Tnode(str, length, 1); //于是就要新建节点, 并把整个串当数据 return; }

以下翻译find函数(简单多了

inline int find(const char *str, int length, Lumpy_Tnode *bNode) { if(!length) { if(bNode->isEnd == 1) return bNode->isEnd++;//这句带有题目的局限性,用时应怎么写大家都清楚 return bNode->isEnd; } int ch = str[0] - 'a'; if(bNode->children[ch]) { bNode= bNode->children[ch]; if(length < bNode->length) return 0; //自带剪枝,若当前查找字符串长度小于当前公共前缀,那么字典树中不存在当前查找的字符串(Ciyang的注释 //好吧, 我的解释:当前查找的字符串若存在(被插入过), 那么公共前缀一定比当前串长短或等长 register int sptr = 0; while(sptr < bNode->length && bNode->pStr[sptr] == str[sptr]) ++sptr; if(sptr != bNode->length) return 0; //最长公共前缀必须是当前查找的字符串的子串(Ciyang的注释) // 即……好吧看while条件吧,写不下去了 return find(str+sptr, length-sptr, bNode); //无需解释(写不下去了啊啊啊 } //这里可以加个else,更浅显 return 0; } 

以下是以我的码风(受Ciyang影响极深, 并认为Ciyang马蜂简洁的我的马蜂)抄写的Ciyang代码(luogu P2580

#include<bits/stdc++.h> using namespace std; #define clear(a) memset(a, 0, sizeof a) #define copy(a, b) memcpy(a, b, sizeof a) struct node{ const char *Sp; int len, isEnd; node *ch[26]; node() { Sp = 0, len = isEnd = 0, clear(ch); } node(const char *str, int length, int end) { Sp = str, len = length, isEnd = end, clear(ch); } } root; char AllStr[10001][60], s[60]; void insert(const char *str, int length, node* u) { if(!length) { u->isEnd = 1; return; } int v = str[0] - 'a'; if(u->ch[v]) { u = u->ch[v]; register int sptr = 0; while(sptr < u->len && sptr < length && str[sptr] == u->Sp[sptr]) ++sptr; if(sptr != u->len) { node *nNode = new node(u->Sp + sptr, u->len - sptr, u->isEnd); copy(nNode->ch, u->ch), clear(u->ch); u->isEnd = 0, u->ch[u->Sp[sptr] - 'a'] = nNode; } u->len = sptr; insert(str+sptr, length - sptr, u); } else u->ch[v] = new node(str, length, 1); return; } int find(const char *str, int length, node* u) { if(!length) { if(u->isEnd == 1) return u->isEnd++; return u->isEnd; } int v = str[0] - 'a'; if(u->ch[v]) { u = u->ch[v]; if(length < u->len) return 0; register int sptr = 0; while(sptr < u->len && str[sptr] == u->Sp[sptr]) ++sptr; if(sptr != u->len) return 0; return find(str + sptr, length - sptr, u); } return 0; } int main() { int n, m; scanf("%d", &n); for(int i = 1; i <= n; ++i) { scanf("%s", AllStr[i]); insert(AllStr[i], strlen(AllStr[i]), &root); } scanf("%d", &m); for(int i = 1; i <= m; ++i) { scanf("%s", s); switch(find(s, strlen(s), &root)) { case 0: cout << "WRONG\n";break; case 1: cout << "OK\n";break; case 2: cout << "REPEAT\n";break; } } return 0; }

转载于:https://www.cnblogs.com/tztqwq/p/11088418.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/106753.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)


相关推荐

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号