一、数论基本概念
1、整除性
若a和b都为整数,a整除b是指b是a的倍数,a是b的约数(因数、因子),记为a|b。整除的大部分性质都是显而易见的,为了阐述方便,我给这些性质都随便起了个名字。
i) 任意性,若a|b,则对于任意非零整数m,有am|bm。
ii) 传递性,若a|b,且b|c,则a|c。
iii) 可消性,若a|bc,且a和c互素(互素的概念下文会讲到),则a|b。
iv) 组合性,若c|a,且c|b,则对于任意整数m、n,有c|(ma+nb)。
拿一个我还未出生时的初二数学竞赛题就能概括整除的性质了。
【例题1】(公元1987年初二数学竞赛题) x,y,z均为整数,若11|(7x+2y-5z),求证:11|(3x-7y+12z)。
非常典型的一个问题,为了描述方便,令a = (7x+2y-5z),b = (3x-7y+12z),通过构造可以得到一个等式:4a + 3b = 11(3x-2y+3z),则3b = 11(3x-2y+3z) – 4a。
任意性+组合性,得出 11 |(11(3x-2y+3z) – 4a) = 11|3b。
可消性,由于11和3互素,得出 11 | b,证明完毕。
2、素数
a.素数与合数
素数又称质数,素数首先满足条件是要大于等于2,并且除了1和它本身外,不能被其它任何自然数整除;其它的数称为合数;而1既非素数也非合数。
b.素数判定
如何判定一个数是否为素数?
i) 对n做[2, n)范围内的余数判定(C++中的’%’运算符),如果有至少一个数用n取余后为0,则表明n为合数;如果所有数都不能整除n,则n为素数,算法复杂度O(n)。
ii) 假设一个数能整除n,即a|n,那么n/a也必定能整除n,不妨设a <= n/a,则有a^2 <= n,即a <= sqrt(n)(sqrt表示对n开根号),所以在用i)的方法进行取余的时候,范围可以缩小到sqrt(n),所以算法复杂度降为O( sqrt(n) )。
iii) 如果n是合数,那么它必然有一个小于等于sqrt(n)的素因子,只需要对sqrt(n)内的素数进行测试即可,需要预处理求出sqrt(n)中的素数,假设该范围内素数的个数为s,那么复杂度降为O(s)。
c.素数定理
当x很大时,小于x的素数的个数近似等于x/ln(x),其中ln(x)表示x的自然对数,用极限表示如图一-2-1所示:
图一-2-1
从这个定理可以发现,程序中进行素数判定的时候,用ii)方法和iii)方法差了至少一个数量级。
d.素数筛选法
【例题2】给定n(n < 10000)个数,范围为[1, 2^32),判定它是素数还是合数。
首先1不是素数,如果n>1,则枚举[1,sqrt(n)]范围内的素数进行试除,如果至少有一个素数能够整除n,则表明n是合数,否则n是素数。
[1,sqrt(n)]范围内的素数可以通过筛选法预先筛出来,用一个数组notprime[i]标记i是素数与否,筛选法有很多,这里介绍一种最常用的筛选法——Eratosthenes筛选法。
直接给出伪代码:
#define MAXP 65536
#define LL __int64
void Eratosthenes() {
notprime[1] = true;
primes[0] = 0;
for(int i = 2; i < MAXP; i++) {
if( !notprime[i] ) {
primes[ ++primes[0] ] = i;
//需要注意i*i超出整型后变成负数的问题,所以转化成 __int64
for(LL j = (LL)i*i; j < MAXP; j += i) {
notprime[j] = true;
}
}
}
}
notprime[i]为真表明i为合数,否则i为素数(因为全局变量初始值为false,筛选法预处理只做一次,所以不需要初始化)。算法的核心就是不断将notprime[i]标记为true的过程,首先从小到大进行枚举,遇到notprime[i]为假的,表明i是素数,将i保存到数组primes中,然后将i的倍数都标记为合数,由于i*2、i*3、i*(i-1)在[1, i)的筛选过程中必定已经被标记为合数了,所以i的倍数只需要从i*i开始即可,避免不必要的时间开销。
虽然这个算法有两个嵌套的轮询,但是第二个轮询只有在i是素数的时候才会执行,而且随着i的增大,它的倍数会越来越少,所以整个算法的时间复杂度并不是O(n^2),而且远远小于O(n^2),在notprime进行赋值的时候加入一个计数器count,计数器的值就是该程序的总执行次数,对MAXP进行不同的值测试发现 int(count / MAXP) 的值随着MAXP的增长变化非常小,总是维持在2左右,所以这个算法的复杂度可以近似看成是O(n),更加确切的可以说是O(nC),其中C为常数,C一般取2。
事实上,实际应用中由于空间的限制(空间复杂度为O(n)),MAXP的值并不会取的很大,10^7基本已经算是极限了,再大的素数测试就需要用到Rabin-Miller
(第三章中会介绍该算法的具体实现)大数判素了。
3、因数分解
a、算术基本定理
算术基本定理可以描述为:对于每个整数n,都可以唯一分解成素数的乘积,如图一-3-1所示:
图一-3-1
这里的素数并不要求是不一样的,所以可以将相同的素数进行合并,采用素数幂的乘积进行表示,如图一-3-2所示:
图一-3-2
证明方法采用数学归纳法,此处略去。
b、素数拆分
给定一个数n,如何将它拆分成素数的乘积呢?
还是用到上面讲到的试除法,假设 n = pm 并且 m>1,其中p为素数,如果p > sqrt(n),那么根据算数基本定理,m中必定存在一个小于等于sqrt(n)的素数,所以我们不妨设p <= sqrt(n)。
然后通过枚举[2, sqrt(n)]的素数,如果能够找到一个素数p,使得n mod p == 0(mod 表示取余数、也称为模)。于是m = n/p,这时还需要注意一点,因为m中可能也有p这个素因子,所以如果p|m,需要继续试除,令m’ = m/p,直到将所有的素因子p除尽,统计除的次数e,于是我们得到了 n = (p^e) * n’,然后继续枚举素数对n’做同样的试除。
枚举完[2, sqrt(n)]的素数后,得到表达式如图一-3-3所示:
图一-3-3
这时有两种情况:
i) S == 1,则素数分解完毕;
ii) S > 1, 根据算术基本定理,S 必定为素数,而且是大于sqrt(n)的素数,并且最多只有1个,这种情况同样适用于n本身就是素数的情况,这时n = S。
这样的分解方式称为因数分解,各个素因子可以用一个二元的结构体来存储。算法时间复杂度为O( s ),s为sqrt(n)内素数的个数。
c、因子个数
朴素的求因子个数的方法为枚举[1, n]的数进行余数判定,复杂度为O(n),这里加入一个小优化,如果m为n的因子,那么必然n/m也为n的因子,不妨设m <= n/m,则有m <= sqrt(n),所以只要枚举从[1, sqrt(n)]的因子然后计数即可,复杂度变为O(sqrt(n))。
【例题3】给定X,Y(X, Y < 2^31),求X^Y的因子数 mod 10007。
由于这里的X^Y已经是天文数字,利用上述的枚举法已经无法满足要求,所以我们需要换个思路。考虑到任何整数都能表示成素数的乘积,那么X^Y也不例外,我们首先将X进行因数分解,那么X^Y可以表示成图一-3-4所示的形式:
图一-3-4
容易发现X^Y的因子一定是p1、p2、…、pk的组合,并且p1可以取的个数为[0, Ye1],p2可以取的个数为[0, Ye2],pk可以取的个数为[0, Yek],所以根据乘法原理,总的因子个数就是这些指数+1的连乘,即(1 + Ye1) * (1 + Ye2) * … * (1 + Yek)。
通过这个问题,可以得到更加一般的求因子个数的公式,如果用ei表示X分解素因子之后的指数,那么X的因子个数就是(1 + e1) * (1 + e2) * … * (1 + ek)。
d、因子和
【例题4】给定X,Y(X, Y < 2^31),求X^Y的所有因子之和 mod 10007。
同样还是将X^Y表示成图一-3-4的形式,然后就变成了标准素数分解后的数的因子和问题了。考虑数n,令n的因子和为s(n),对n进行素数分解后的,假设最小素数为p,素因子p的个数为e,那么n = (p^e)n’。
容易得知当n的因子中p的个数为0时,因子之和为s(n’)。更加一般地,当n的因子中p的个数为k的时候,因子之和为(p^k)*s(n’),所以n的所有因子之和就可以表示成:
s(n) = (1 + p^1 + p^2 + … p^e) * s(n’) = (p^(e+1) – 1) / (p-1) * s(n’)
s(n’)可以通过相同方法递归计算。最后可以表示成一系列等比数列和的乘积。
令g(p, e) = (p^(e+1) – 1) / (p-1),则s(n) = g(p1, e1) * g(p2, e2) * … * g(pk, ek)。
4、最大公约数(GCD)和最小公倍数(LCM)
两个数a和b的最大公约数(Greatest Common Divisor)是指同时整除a和b的最大因数,记为gcd(a, b)。特殊的,当gcd(a, b) = 1,我们称a和b互素(上文谈到整除的时候略有提及)。
两个数a和b的最小公倍数(Leatest Common Multiple)是指同时被a和b整除的最小倍数,记为lcm(a, b)。特殊的,当a和b互素时,lcm(a, b) = ab。
gcd是基础数论中非常重要的概念,求解gcd一般采用辗转相除法(这个方法会在第二章开头着重介绍,这里先引出概念),而求lcm需要先求gcd,然后通过lcm(a, b) = ab / gcd(a, b)求解。
这里无意中引出了一个恒等式:lcm(a, b) * gcd(a, b) = ab。这个等式可以通过算术基本定理进行证明,证明过程可以通过图一-4-1秒懂。
图一-4-1
需要说明的是这里的a和b的分解式中的指数是可以为0的,也就是说p1是a和b中某一个数的最小素因子,p2是次小的素因子。lcm(a, b)和gcd(a, b)相乘,相当于等式右边的每个素因子的指数相加,即min{xi, yi} + max{xi, yi} = xi + yi,正好对应了a和b的第i个素数分量的指数之和,得证。
给这样的gcd和lcm表示法冠个名以便后续使用——指数最值表示法。
【例题5】三个未知数x, y, z,它们的gcd为G,lcm为L,G和L已知,求(x, y, z)三元组的个数。
三个数的gcd可以参照两个数gcd的指数最值表示法,只不过每个素因子的指数上是三个数的最值(即min{x1, y1, z1}),那么这个问题首先要做的就是将G和L分别进行素因子分解,然后轮询L的每个素因子,对于每个素因子单独处理。
假设素因子为p,L分解式中p的指数为l,G分解式中p的指数为g,那么显然l < g时不可能存在满足条件的三元组,所以只需要讨论l >= g的情况,对于单个p因子,问题转化成了求三个数x1, y1, z1,满足min{x1, y1, z1} = g且max{x1, y1, z1} = l,更加通俗的意思就是三个数中最小的数是g,最大的数是l,另一个数在[g, l]范围内,这是一个排列组合问题,三元组{x1, y1, z1}的种类数当l == g时只有1中,否则答案就是 6(l – g)。
最后根据乘法原理将每个素因子对应的种类数相乘就是最后的答案了。
5、同余
a、模运算
给定一个正整数p,任意一个整数n,一定存在等式n = kp + r; 其中k、r是整数,且满足0 <= r < p,称k为n除以p的商, r为n除以p的余数,表示成n % p = r (这里采用C++语法,%表示取模运算)。
对于正整数和整数a, b, 定义如下运算:
取模运算:a % p(a mod p),表示a除以p的余数。
模p加法:(a + b) % p = (a%p + b%p) % p
模p减法:(a – b) % p = (a%p – b%p) % p
模p乘法:(a * b) % p = ((a % p)*(b % p)) % p
幂模p : (a^b) % p = ((a % p)^b) % p
模运算满足结合律、交换律和分配律。
a≡b (mod n) 表示a和b模n同余,即a和b除以n的余数相等。
【例题6】一个n位十进制数(n <= 1000000)必定包含1、2、3、4四个数字,现在将它顺序重排,求给出一种方案,使得重排后的数是7的倍数。
取出1、2、3、4后,将剩下的数字随便排列得到一个数a,令剩下的四个数字排列出来的数为b,那么就是要找到一种方案使得(a*10000 + b) % 7等于0。
但是a真的可以随便排吗?也就是说如果无论a等于多少,都能找到这样的b满足等式成立,那么a就可以随便排。
我们将等式简化:
(a*10000 + b) % 7 = (a*10000%7 + b%7) % 7
令 k = a*10000%7 = a*4%7,容易发现k的取值为[0, 7),如果b%7的取值也是[0, 7),那这个问题就可以完美解决了,很幸运的是,的确可以构造出7个这样的b。具体参见下图:
图一-5-1
b、快速幂取模
幂取模常常用在RSA加密算法的加密和解密过程中,是指给定整数a,正整数n,以及非零整数p,求a^n % p。利用模p乘法,这个问题可以递归求解,即令f(n) = a^n%p,那么f(n-1) = a^(n-1)%p,f(n) = a*f(n-1) % p,这样就转化成了递归式。但是递归求解的时间复杂度为O(n),往往当n很大的时候就很难在规定时间内出解了。
当n为偶数时,我们可以将a^n%p拆成两部分,令b = a^(n/2)%p,则a^n%p = b*b%p;
当n为奇数时,可以拆成三部分,令b = a^(n/2)%p,则a^n%p = a*b*b%p;
上述两个等式中的b可以通过递归计算,由于每次都是除2,所以时间复杂度是O(logn)。
c、循环节
【例题7】f[1] = a, f[2] = b, f[3] = c, 当n>3时 f[n] = (A*f[n-1] + B*f[n-2] + C*f[n-3]) % 53,给定a, b, c, A, B, C,求f[n] (n < 2^31)。
由于n非常大,循环模拟求解肯定是不现实的,仔细观察可以发现当n>3时,f[n]的值域为[0, 53),并且连续三个数f[n-1]、f[n-2]、f[n-3]一旦确定,那么f[n]也就确定了,而f[n-1]、f[n-2]、f[n-3]这三个数的组合数为53*53*53种情况,那么对于一个下标k<n,假设f[k]已经求出,并且满足f[k-1] == f[n-1]且f[k-2] == f[n-2]且f[k-3] == f[n-3], 则f[n]必定等于f[k],这里的f[k…n-1]就被称为这个数列的循环节。
并且在53*53*53次计算之内必定能够找到循环节,这个是显而易见的。