Bootstrap

HDU 6088 Rikka with Rock-paper-scissors(莫比乌斯反演+组合数学+FFT)

Description

两个人玩儿n局石头剪刀布,每局每个人出石头剪刀布的概率相同,玩 n 局后假设第一个人赢a局,第二个人赢 b 局,那么得分就是gcd(a,b),设得分的期望为 s ,求s×22n,结果模 mod

Input

第一行一整数 T 表示用例组数,每组用例输入两个整数n mod 表示游戏局数和模数

(1T20,1n105,108mod109,mod)

Output

对于每组用例,输出 s×32n mod 的结果

Sample Input

5
1 998244353
2 998244353
3 998244353
4 998244353
5 998244353

Sample Output

6
90
972
9720
89910

Solution

ans=a=0nb=0na3ngcd(a,b)CanCbna=3nd=1nd×F(d) ,其中 F(d)=a=0nb=0naCanCbna[gcd(a,b)=d]

f(d)=a=0nb=0naCanCbna[d|gcd(a,b)][gcd(a,b)>0]=a=0ndb=0ndiCidnCjdnid1

F(d) f(d) 的定义知 f(d)=d|nF(n) ,莫比乌斯反演得 F(k)=k|dμ(dk)f(d) ,进而

ans=k=1nkF(k)=k=1nkk|dμ(dk)f(d)=d=1nk|dkμ(dk)f(d)=d=1nφ(d)f(d)

i=0ndj=0ndiCidnCjdnid=i=0ndj=0ndiCid+jdnCjdid+jd=i=0ndj=0iCidnCjdid(i=i+j)=n!i=0nd1(nid)!j=0i1(jd)!1((ij)d)!

FFT 处理 j=0i1(jd)!1((ij)d)! ,时间复杂度 O(d=1nndlognd)=O(nlog2n)

Code

#include<cstdio>
#include<cstring>
#include<algorithm>
#include<cmath>
using namespace std;
typedef long long ll;
#define maxn 100005
#define maxfft 262144+5
const double pi=acos(-1.0);
int T,n,mod,fact[maxn],inv[maxn],A[maxn],B[maxfft];
int inc(int a,int b)
{
    return a+b>=mod?a+b-mod:a+b;
}
int dec(int a,int b)
{
    return a-b<0?a-b+mod:a-b;
}
struct cp
{
    double a,b;
    cp operator +(const cp &o)const {return (cp){a+o.a,b+o.b};}
    cp operator -(const cp &o)const {return (cp){a-o.a,b-o.b};}
    cp operator *(const cp &o)const {return (cp){a*o.a-b*o.b,b*o.a+a*o.b};}
    cp operator *(const double &o)const {return (cp){a*o,b*o};}
    cp operator !() const{return (cp){a,-b};}
}w[maxfft];
int pos[maxfft];
void fft_init(int len)
{
    int j=0;
    while((1<<j)<len)j++;
    j--;
    for(int i=0;i<len;i++)
        pos[i]=pos[i>>1]>>1|((i&1)<<j);
}
void fft(cp *x,int len,int sta)
{
    for(int i=0;i<len;i++)
        if(i<pos[i])swap(x[i],x[pos[i]]);
    w[0]=(cp){1,0};
    for(unsigned i=2;i<=len;i<<=1)
    {
        cp g=(cp){cos(2*pi/i),sin(2*pi/i)*sta};
        for(int j=i>>1;j>=0;j-=2)w[j]=w[j>>1];
        for(int j=1;j<i>>1;j+=2)w[j]=w[j-1]*g;
        for(int j=0;j<len;j+=i)
        {
            cp *a=x+j,*b=a+(i>>1);
            for(int l=0;l<i>>1;l++)
            {
                cp o=b[l]*w[l];
                b[l]=a[l]-o;
                a[l]=a[l]+o;
            }
        }
    }
    if(sta==-1)for(int i=0;i<len;i++)x[i].a/=len,x[i].b/=len;
}
cp x[maxfft],y[maxfft],z[maxfft];
void FFT(int *a,int *b,int n,int m,int *c)
{
    for(int i=0;i<n+m-1;i++)c[i]=0;
    if(n<=100&&m<=100||min(n,m)<=5)
    {
        for(int i=0;i<n;i++)
            for(int j=0;j<m;j++)
                c[i+j]=inc(c[i+j],(ll)a[i]*b[j]%mod);
        return ;
    }
    int len=1;
    while(len<n+m)len<<=1;
    fft_init(len);
    for(int i=0;i<len;i++)
    {
        int aa=i<n?a[i]:0,bb=i<m?b[i]:0;
        x[i]=(cp){(aa>>15),(aa&32767)},y[i]=(cp){(bb>>15),(bb&32767)};
    }
    fft(x,len,1),fft(y,len,1);
    for(int i=0;i<len;i++)
    {
        int j=len-1&len-i;
        z[i]=((x[i]+!x[j])*(y[i]-!y[j])+(x[i]-!x[j])*(y[i]+!y[j]))*(cp){0,-0.25};
    }
    fft(z,len,-1);
    for(int i=0;i<n+m-1;i++)
    {
        ll ta=(ll)(z[i].a+0.5)%mod;
        ta=(ta<<15)%mod;
        c[i]=inc(c[i],ta);
    }
    for(int i=0;i<len;i++)
    {
        int j=len-1&len-i;
        z[i]=(x[i]-!x[j])*(y[i]-!y[j])*(cp){-0.25,0}+(x[i]+!x[j])*(y[i]+!y[j])*(cp){0,0.25};
    }
    fft(z,len,-1);
    for(int i=0;i<n+m-1;i++)
    {
        ll ta=(ll)(z[i].a+0.5)%mod,tb=(ll)(z[i].b+0.5)%mod;
        ta=(ta+(tb<<30))%mod;
        c[i]=inc(c[i],ta);
    }
}
int euler[maxn],prime[maxn],res;
void get_euler(int n=100000)
{
    memset(euler,0,sizeof(euler));
    euler[1]=1;
    res=0;
    for(int i=2;i<=n;i++)
    {
        if(!euler[i])euler[i]=i-1,prime[res++]=i;
        for(int j=0;j<res&&prime[j]*i<=n;j++)
        {
            if(i%prime[j]) euler[prime[j]*i]=euler[i]*(prime[j]-1);
            else
            {
                euler[prime[j]*i]=euler[i]*prime[j];
                break;
            }
        }
    }
}
int mod_pow(int a,int b)
{
    int ans=1;
    while(b)
    {
        if(b&1)ans=(ll)ans*a%mod;
        a=(ll)a*a%mod;
        b>>=1;
    }
    return ans;
}
int main()
{
    get_euler();
    scanf("%d",&T);
    while(T--)
    {
        scanf("%d%d",&n,&mod);
        fact[0]=1;
        for(int i=1;i<=n;i++)fact[i]=(ll)i*fact[i-1]%mod;
        inv[1]=1;
        for(int i=2;i<=n;i++)inv[i]=mod-(ll)(mod/i)*inv[mod%i]%mod;
        inv[0]=1;
        for(int i=1;i<=n;i++)inv[i]=(ll)inv[i]*inv[i-1]%mod;
        int ans=0;
        for(int d=1;d<=n;d++)
        {
            int temp=0;
            for(int i=0;i<=n/d;i++)A[i]=inv[i*d];
            FFT(A,A,n/d+1,n/d+1,B);
            for(int i=0;i<=n/d;i++)
                temp=inc(temp,(ll)inv[n-i*d]*B[i]%mod);
            temp=(ll)temp*fact[n]%mod*euler[d]%mod;
            ans=inc(ans,temp);
        }
        for(int i=1;i<=n;i++)ans=dec(ans,euler[i]);
        ans=(ll)ans*mod_pow(3,n)%mod;
        printf("%d\n",ans);
    }
    return 0;
}
;