先考虑相同子串算不同的情况
性质一:后缀自动机中parent树中一个节点子树中np类节点的个数为该串在原串中出现的次数
根据这个性质可以通过一遍parent树上的dfs求出每个点的出现次数
后缀自动机里每个节点代表的串是多个的,但是这些串出现的次数都是一样的。
因此我们沿着字符边走到一个点的时候,这个点的权值就是这个字符串的出现次数
此时可以考虑到和权值线段树找第k大的思路:树上二分
记录一个点的新值sum来表示这个点能到的所有字符串的数量,然后可以通过一遍DAGdp来跑出sum
查找的话就是每次从小往大枚举该点的每一个字符边,如果到此为止的字符串数总和刚好大于k,那么答案就在这个点控制的子图里,如果刚好在这个点出现次数内,那么就到这个点为止
我用了比较烦的方法记录边,但其实没有必要,可以边查找边输出
再考虑重复只算一次的情况
性质二:后缀自动机表达的字符串为所有不重不漏的子串
根据这个性质,我们只要不要对parent树进行dfs,把每个点的出现次数直接设成1再跑上述的树上二分就行了
代码如下(太丑了)
#include<bits/stdc++.h>
#define N 1000050
using namespace std;
struct SAM
{
struct point
{
int son[26],fa,len,at,mx,vis[26];
}t[N];
int last=1,cnt=1;
long long sz[N],sum[N];
vector<int> g[1000050];
bool vis[1000050];
void add(int c)
{
int p=last;
int np=++cnt;
t[np].len=t[p].len+1;
sz[np]=1;
while(p&&(!t[p].son[c]))
{
t[p].son[c]=np;
p=t[p].fa;
}
if