语音播报
集合筛法与素数三大猜想的证明
陕西神木史明智
集合筛法
一般认为 ,用来制造素数表的厄拉多塞筛法在理论上是没有用处的 。这种筛法虽然可以准确无误 、一个不漏地找出不大于N的每个素数 ,却无法运用它来推理和证明更为深刻的问题 。因为在不大于N的自然数集合中 ,任意一个不大于的素数P的倍数之个数为[] ,就是这个取整程序阻碍了推理和计算的顺利进行 。
但是 ,这不等于说厄氏筛法所涉及的自然数 、素数、合数相互关系的规律就无法进一步发掘和利用 。本文试图在推理过程中突破整数限制来探究它们之间的规律,即将[]视为去推理 ,推理和计算过程不考虑取整,只对最终结果四舍五入保留整数。对于由此产生的误差 ,在利用得出的规律解决实际问题时,根据问题本身对准确程度的要求再作具体分析处理。
把[]视为 ,就可以这样表述 :不大于N的自然数集合中,有的元素是P的倍数,也即自然数集合元素数分别与其中P的倍数集合元素数之比为1:。我们来证明如下定理。
定理:在不大于N的自然数集合中,每次筛去不大于的一个素数的倍数集合,每次筛剩的自然数个数与其中P倍数的个数之比与未筛前它们之间的比保持不变 ,仍为1:(P不等于已筛过的素数)。直至筛剩数中不再有P的倍数 。
证明定理之前 ,先证明两个引理。
引理1:在不大于N的自然数集合中,一个不大于的素数P的倍数集合 ,或几个不大于的素数P,P….的公倍数集合 ,其中有的元素是P的
倍数(前者中P≠P ,后者中P不等于P,P….中的任一素数)。
证明 :前者集合可表示为P(1,2 ,3……)
后者集合可表示为PP….(1,2,3……)
显然 ,自然数列中某个项是P的倍数时,该集合这个元素也是P的倍数 ,而自然数列中有的项是P的倍数,故得引理。但若前者集合中P=P ,后者集合中P等于P,P….其中之一时 ,该集合所有元素便都是P的倍数 ,故应除外 。
引理2 :正整数等差数列中有的项是P的倍数(P不等于公差中所含不大于的素因数) 。
证明:设等差数列中第一个能被P整除的项为mP,公差为d,则其后各项为mP+nd(n=1 ,2 ,3….) 。显然 ,n为P的倍数时,该项亦为P的倍数 ,而n(自然数列)中有的项是P的倍数 ,故得引理 。但若d为P的倍数时 ,则各项均为P的倍数,故公差中含该P者除外 。公差为负数时 ,该数列为从大到小的正整数等差数列 ,同样适用本引理。
定理的证明:
不大于N的自然数集合可以划分出不同层次的子集合 :不大于的各个素数的倍数集合,是第一层次的子集合 ;两子集交集,即两素数公倍数集合,是第二层次的子集合 ;三素数公倍数集合,又是其中两素数公倍数集合的交集 ,这是第三层次的子集合;以此类推.(显然 ,这些子集合没有把大于的素数包括进去) 。由引理1知 ,从不大于N的自然数集合到各层次各子集合 ,都各自有的元素是P的倍数(P不等于该集合公有的素因数)。所以,当我们在不大于N的自然数集合中筛掉2的倍数时,对于各层次各集合来说,除全部元素都是2的倍数的子集合是被整体筛去外,其他各集合都是被筛去自身元素数的 ,也就是这些集合的元素数都同时缩小。所以各层次各集合剩余元素数分别与其中所含其他子集元素数之比 ,仍保持未筛前它们之间的比值不变,即仍为1:(此时P≠2)。同理,再筛去自然数集合剩余元素中3的倍数,除全部元素都是3的倍数的子集合被整体筛去外 ,其他各层次各集合都被筛去自身所剩元素的,即这些集合的元素个数又同时缩小 。所以,再次剩余的各层次各集合元素数与其中所含其他子集合元素数之比仍保持1:不变(此时P不等于2和3) 。以此类推 ,定理得证 。
我们在证明定理的同时,也得到了求N以内素数个数即π(N)的筛法 ,就叫集合筛法。因为筛去P的倍数中包括1倍即P本身 ,所以π(N)的渐近表达式要加上P的个数 ;又因“1”不是素数,故应减去1,即 :
π(N)~N(1-)(1-)(1-)……(1-)+s-1
=N(1-)+s-1(P=2,P≤)
如前所述,把[]视为推导出的π(N)的渐近表达式,必然存在误差 。下面,我们对误差做一些初步的分析和讨论 :
1.集合筛法的本质,就是在不大于N的自然数集合中按比例逐步筛去不大于的各个素数的倍数,即全部合数。因为N不可能被大多数不大于的素数整除 ,所以每次得出的筛剩数大多不是整数 ,如果每次都取整 ,必然会造成累积性误差,而且对筛剩数取整与本该对被筛数取整适得其反 ,最终必然导致完全错误的结论 。而计算过程不取整,分数部分将在随后的计算中体现其存在的作用 。也可以这样理解 :表达式中∏(1-)这部分是计算素数在自然数集合中所占的比值,所以不须也不能取整,与N相乘后才是素数个数 ,则应四舍五入保留整数。因为避免了累积性误差 ,这样得出的结果,误差自然不会大 ,而且当N很大时 ,误差绝对值与实有素数之比 ,即相对误差会更小(见附表一)。
这里可能会提出这样一个问题:对比依据逐步淘汰原则得出的π(N)表达式 ,这个误差应该包括2个误差项(即有2个需要取整的项),这样多的误差项 ,致使人们得出厄氏筛法“几乎无用”的结论。而集合筛法认为这个误差并不大 ,该如何解释呢?其实 ,误差项多不等于误差大,因为在那个π(N)表达式中 ,误差项(取整项)有正有负 ,是可以相互抵消的 。
2.N只要在P和P之间 ,∏(1-)的值都是相同的(即尚无下一个小于的素数),而这个值与该区间每个自然数相乘都会得到一个不同的值 。如果该区间连续多个自然数都是合数 ,就会出现计算值增加了而实际素数个数并未增加的现象。相反,如果该区间频繁出现素数 ,甚至孪生素数,三生素数 ,就又显示为计算值未增加多少,实际素数个数却增加较多。进而言之 ,素数在自然数中分布是不均匀的,N处于素数稠密区结束处 ,计算值会小于实际值 ,呈负误差;N处于素数稀疏区结束处 ,计算值会大于实际值 ,呈正误差(本文一律将计算值大于实际值的误差称为正误差,反之称为负误差) 。误差的忽大忽小 ,忽正忽负 ,就是集合筛法误差的不规则性。上述N很大时相对误差会更小,是从误差绝对值的上限来比较的 。
3.集合筛法依据的是规律而非概率,在一定前提下 ,误差的存在并不影响我们对规律的利用。对于一些并不要求绝对准确值的命题或猜想(如孪生素数猜想和三生素数猜想只要求证明其无穷多 ;哥德巴赫猜想只要求证明大于4的偶数最少可分解为一个两奇素数相加的对子) ,我们完全可以利用它作为证明的工具。
附表一 :
用π(N)渐近表达式计算的素数个数与实际个数对比
N
计算值
实际值
误差
误差(绝对值)/实际值
100
26
25
1
0.040
500
93
95
-2
0.021
1,000
163
168
-5
0.029
2,000
296
303
-7
0.023
5,000
666
669
-3
0.004
10,000
1227
1229
-2
0.002
50,000
5194
5133
61
0.012
100,000
9716
9592
124
0.013
孪生素数猜想的证明
孪生素数是相差为2的素数对。证明孪生素数猜想就是要证明这样的素数对有无穷多 。我们的基本思路是 :在相差为2的奇数对集合中筛掉那些最少有一奇数是合数的对子 ,剩下的就是孪生素数对。我们来推导不超过N的自然数中孪生素数对子数即Z(N)的渐近表达式 。先把不大于N区间相差为2的奇数对集合按如下形式列出进行观察分析:
1 ,3
3 ,5
5,7
7,9
9 ,11
11,13
13 ,15
15 ,17
17,19
19,21
┊┊
(N为偶数时)N-3,N-1
(N为奇数时)N-2,N
不难看出,N为偶数时,不大于N区间相差为2的奇数对有-1对,N为奇数时则有对。表达式仅以N为偶数表示。
为了便于叙述 ,我们约定如下简称 :其中一奇数是3的倍数的对子称为含3对,其中一奇数是5的倍数的对子称为含5对 ,以此类推 。
对于相差为2的奇数对集合 ,一奇数含某个不大于的素因数的对子集合是它的子集合,我们称它为第一层子集合 ;既是含P对又是含P对(P,P均≤)的奇数对集合 ,是这两个子集合的交集 ,此为第二层子集合;三子集交集是其中两子集交集的子集 ,此为第三层子集合;以此类推(可以看出这些子集合没有把大于区间的孪生素数包括进去) 。不论几个子集的交集 ,其元素都可分为两种类型:一种是各子集自身公有的素因数(简称命名素数,如含3对的命名素数是3 ,含5对的命名素数是5)包含在其中一个奇数中,也即一奇数是各子集命名素数的公倍数,另一奇数则不含这些命名素数 ,我们把这类对子称为公倍数对;另一种是这些命名素数分含在两个奇数中,即一个命名素数的倍数或几个命名素数的公倍数与另一个命名素数的倍数或几个命名素数的公倍数相遇在一个奇数对中 ,我们把这类对子简称为相遇对。例如在含3对、含5对 、含7对三子集交集中,105和107这对奇数属于公倍数对,75和77这对奇数属于相遇对。
下面我们来分析各层次各集合元素数分别与其中所含其他子集元素数的比。
1.奇数对集合元素数分别与各子集元素数的比:从纵列看 ,每列都是一个连续的奇数数列 。由定理知,每列奇数都有的项是P的倍数,又因相差为2的两奇数不可能被同一素数整除 ,所以奇数对集合中有的元素是含P对 。即奇数对集合元素数分别与其中所含各子集元素数之比为1: 。
2.各子集元素数分别与其中所含其他各子集元素数(即相关两子集交集的元素数)的比:以含5对集合与其中的含3对元素为例,由定理和引理1知,5的奇数倍集合中有的元素是3的倍数,所以含5对集合中有的元素是二者交集中的公倍数对 ;另外,一列奇数中5的倍数与另一列奇数中3的倍数相遇的周期是15个奇数 ,即每3个5的倍数中有一个与3的倍数相遇 ,故含5对集合中有的元素是二者交集中的相遇对 。两者合计 ,含5对集合中有的元素是含3对。同理可推知 :第一层各子集元素数分别与其中所含其他子集元素数之比为1:。
3.各交集元素数分别与其中所含其他子集(即不包括形成该交集的子集)元素数的比:先说公倍数对。公倍数对可分为公倍数在前一奇数位和公倍数在后一奇数位两类。把每类公倍数对摘出来按原顺序排列 ,其公倍数和与之配对的奇数就是两列以最小公倍数2倍为公差的等差数列 。如含3对和含5对交集中的两类公倍数对 :
公倍数在前公倍数在后
15 ,1713 ,15
45 ,4743,45
75 ,7773 ,75
105,107103 ,105
┊┊┊┊
据引理2 ,每列奇数中都有的项是P的倍数 ,而同一奇数对的两奇数不可能同时被该P整除,所以每类公倍数对中都有的元素是含P对。则全体公倍数对中就有的元素是含P对 。
再说相遇对 。在两子集交集的相遇对中 ,按各子集命名素数的倍数在前后奇数位的不同,可分为两类相遇对 。因为每类相遇对的相遇周期都是两子集命名素数最小公倍数的2倍 ,所以每类相遇对按原顺序排列,也形成两列公差相等的等差数列。如含3对和含5对交集中的两类相遇对 :
3的倍数在前5的倍数在前
3,525 ,27
33 ,3555 ,57
63 ,6585,87
93 ,95115 ,117
┊┊┊┊
如果是多个子集的交集,各子集命名素数分含在两个奇数中 ,就有多种组合情况。如含3对、含5对、含7对交集中的相遇对:有3的倍数与5和7的公倍数相遇 ,有5的倍数与3和7的公倍数相遇,有7的倍数与3和5的公倍数相遇 ,每种相遇又按两数处在前后奇数位的不同分为两类 。不论哪种组合的哪类相遇,把属于它的元素按原顺序排列,都是以各命名素数最小公倍数的2倍为公差的两列等差数列 。如3和5的公倍数与7的倍数组成的相遇对(公差为3×5×7×2=210) :
3和5的公倍数在前3和5的公倍数在后
75 ,77133 ,135
285,287343 ,345
495,497553 ,555
┊┊┊┊
所以各类相遇对中都有的元素是含P对 ,则全体相遇对中有的元素是含P对。
公倍数对和相遇对各有的元素是含P对 ,所以整个交集就有的元素是含P对。即各交集元素数分别与其中所含其他子集元素数之比为1:。
根据以上分析得出 :从相差为2的奇数对集合到各层次各子集合 ,都各自有的元素是含P对。所以,当我们用集合筛法在相差为2的奇数对集合中首先筛去含3对时 ,除全部元素都是含3对的子集合是被整体筛去外 ,其他各层次各集合都是被筛去自身元素数的,也就是这些集合的元素个数都同时缩小了 ,所以奇数对集合的剩余元素数分别与各子集的剩余元素数之比 ,以及各子集剩余元素数分别与其中所含其他各子集元素数之比 ,保持未筛前它们之间的比值不变 ,即仍为1:(此时P≠3)。同理,再在剩余奇数对集合中筛去含5对,除全部元素都是含5对的子集合被整体筛去外,其余各层次各集合剩余元素数又同时缩小了,所以新剩余的各层次各集合中仍各有的元素是含P对(此时P不等于3和5) 。以此类推 ,直至筛掉不大于N区间奇数对集合中所有含P对,剩下的奇数对就都是孪生素数。但因P的倍数包括P本身,这样就将不大于区间的孪生素数也筛掉了 ,所以不大于N区间孪生素数对子数即Z(N)的渐近表达式为 :
Z(N)~(-1)(1-)(1-)……(1-)+Z()
=(-1)(1-)+Z()(P=3,P≤)
由上式可以看出 ,只要N为有限数 ,∏(1-)就是有限项相乘,其值总大于0。又因随着N的增大,新的(1-)的值越来越接近1,所以与(-1)的匀速增大相比 ,∏(1-)的缩小速度要慢得多 ,而且越来越慢 。所以 ,随着N的增大 ,总会有新的孪生素数出现 ,即Z(N)→∞(当N→∞)。当然,与π(N)的渐近表达式同理 ,用Z(N)的渐近表达式计算的孪生素数对子数也存在误差 ,但很明显,误差的存在并不影响结论的成立 。
附表二 :(见下页)
用Z(N)渐近表达式计算的值与实际值对比
N
计算值
实际值
误差
误差(绝对值)/实际值
100
9
8
1
0.1250
500
24
24
0
0
1,000
36
35
1
0.0286
2,000
59
61
-2
0.0323
3,000
80
81
-1
0.0123
4,000
99
103
-4
0.0388
5,000
118
125
-7
0.0560
100,000
1250
1224
26
0.0212
三生素数猜想的证明
P为素数,P+2和P+6也是素数 ,就是一个三生素数组。三生素数猜想要求证明这样的素数组有无穷多 。
显然 ,三生素数是在连续四奇数中除第三个奇数(简称三号位)外,其余都是素数 。事实上,P和P+2都是素数时 ,P+4必然是3的倍数(3,5,7例外 ,因为3既是素数又是3的倍数),所以我们以下分析中提到四奇数组时 ,均将三号位排除在外 ,只考虑另外三个奇数 。我们证明三生素数猜想的基本思路是:在不大于N区间的连续四奇数组集合中 ,筛掉那些除三号位外还有合数的奇数组 ,剩下的就是三生素数组 。先观察下列连续四奇数组 :
1 ,3,5 ,7
3,5 ,7 ,9
5 ,7 ,9 ,11
7 ,9,11,13
9 ,11 ,13 ,15
11 ,13 ,15 ,17
13 ,15,17,19
15 ,17 ,19 ,21
17 ,19 ,21,23
┊┊┊┊
(N为偶数时)N-7,N-5,N-3,N-1
(N为奇数时)N-6,N-4,N-2,N
不难看出,在不大于N区间,除最后三个奇数外 ,每个奇数都能居一号位组成一个四奇数组 ,所以四奇数组集合的元素数 :N为偶数时为-3 ,N为奇数时为-3 ,渐近表达式中仅以N为偶数表示。
为了叙述方便,先约定如下简称:除3号位外,有一个或两个奇数是3的倍数的奇数组称含3组;有一个奇数是5的倍数的奇数组称含5组,以此类推。
在连续四奇数组集合中 ,各含P组(P表示不大于的奇素数)是它的子集合;两子集合公共元素的集合是这两子集的交集 ,也是同属这两子集的子集;三子集交集是其中两子集交集的子集;四子集交集是其中三子集交集的子集……(可以看出 ,这些子集合没有把大于区间的三生素数包括进去)。不论几个子集的交集 ,其元素都可分为两种 :一种是其中一奇数是形成该交集各子集命名素数的公倍数 ,简称公倍数组 ;另一种是各子集命名素数分含在两个或三个奇数中,简称相遇组。
下面我们来分析各层次各集合元素数分别与其中所含其他子集元素数的比 。
1.四奇数组集合元素数分别与各子集元素数的比 :从纵列看,每一列都是连续的奇数数列 ,其中都有的项是3的倍数 ,但因一号位是3的倍数时,四号位也是3的倍数,所以含3组数等于3的倍数在前两列奇数中出现的次数,可知在四奇数组集合中有的元素是含3组 。凡大于3的素数的倍数在一组中最多只能出现一次 ,所以除含3组外,四奇数组中有的元素是含P组。
2.各子集元素数分别与其中所含的含3组元素数以及与其中所含其他子集元素数之比 。先以含5组集合与其中所含的含3组元素为例:首先,5的倍数中有的数是3的倍数,所以3与5的公倍数组在含5组中占;其次 ,3的倍数与5的倍数相遇分以下几种情况 :因一号位5的倍数与四号位3的倍数相遇时 ,它自身也是3的倍数 ,此类相遇已归入公倍数组中,所以只考虑一号位5的倍数与二号位3的倍数相遇;同理 ,四号位为5的倍数时 ,也只考虑其与二号位3的倍数相遇 ;二号位5的倍数则只需考虑其与一号位和四号位其中之一的3的倍数相遇。所以不论5的倍数在哪个位置 ,每三个5的倍数中有一个能与3的倍数相遇 ,所以相遇组在含5组中也占 。公倍数组与相遇组合计,含5组中有的元素是含3组 。
含5组集合元素数与其中所含其他子集元素数的比则不同 。因为大于3的素数的倍数在一个奇数组中最多只能出现一次 ,5的倍数要与另外两列奇数中P(P≠3)的倍数相遇 ,所以一奇数含P的相遇组在含5组中各占 ,与公倍数组合计 ,含5组集合中有的元素是含P组(P≠3)。
同理可推知 :第一层各子集(含3组除外)的元素数与其中所含含3组的元素数之比为1: ;各子集元素数(包括含3组)分别与其中所含其他子集的元素数之比为1:。
3.各交集元素数分别与其中所含其他子集(即不包括形成该交集的各子集)元素数的比 。首先 ,公倍数组可分为公倍数在一号位 、二号位 、四号位三类 。每一类公倍数组的元素按原顺序排列 ,就形成三列公差相等(形成该交集各子集命名素数最小公倍数的2倍)的等差数列。如含5组与含7组交集中之公倍数组 ,公倍数在一号位时,三列等差数列(纵列)是 :
35 ,37,() ,41
105 ,107 ,() ,111
175 ,177 ,(),181
┊┊┊┊
其中一号位是3的倍数时,四号位也是3的倍数,而大于3的素数的倍数在同一组中最多只能有一个 ,据引理2便可推知 ,各层次各交集的公倍数组集合中除有含3组外 ,有含P组(P不等于形成本交集各子集命名素数) 。
其次,相遇组集合中 ,虽然多子集交集的多个命名素数有多种组合的相遇 ,每种组合又因所在奇数位不同(一,二,四号位)而分三类,但因他们各自的相遇周期不变 ,所以只要把同种同类相遇组的元素按原顺序排列,就形成三列公差为这些命名素数最小公倍数2倍的等差数列 。所以与公倍数组集合一样 ,相遇组集合中除有含3组外 ,有含P组。则整个交集中有含3组 ,有含P组(P≠3) 。
综合以上分析可得 :从四奇数组集合到各层次各子集合,各自元素数与其中所含含3组元素数之比为1: ,与其中所含其他子集元素数之比为1: 。所以,我们可用集合筛法,首先在四奇数组集合中筛去含3组,即(-3)(1-),除全部元素都是含3组的子集合被整体筛去外 ,其他各层次各集合都被筛去自身元素的 ,即各集合元素数同时缩小了,所以剩余的四奇数组数分别与各子集的剩余元素数之比 ,以及各层次各子集剩余元素数分别与其中所含其他子集元素数之比 ,均保持他们之间原来的比值不变 ,即仍为1:(此时P≠3)。同理,再在剩余的四奇数组中筛去含5组,即(-3)(1-)(1-) ,除全部元素都是含5组的子集合被整体筛去外 ,其余各层次各集合的元素数又同时缩小了 ,所以各集合剩余元素数分别与其中所含其他子集元素数之比仍保持1:不变(此时P不等于3和5) 。以此类推,直至筛去所有含P组 ,剩下的就都是三生素数 。但因P的倍数包括P本身,致使不大于区间的三生素数也被筛掉了 ,所以不大于N区间三生素数组数即E(N)的渐近表达式为
E(N)~(-3)(1-)(1-)(1-)……(1-)+E()
=(-3)(1-)(1-)+E()(P≤)
由上式可以看出 ,只要N有限 ,(1-)∏(1-)就是有限项相乘 ,其值总大于0 ;又因随着N的增大 ,新的(1-)的值越来越接近1,与(-3)的匀速增大相比 ,(1-)∏(1-)的缩小速度要慢得多 ,而且越来越慢,所以随着N的增大,总会有新的三生素数出现 ,即E(N)→∞(当N→∞) 。当然,与π(N)的渐近表达式同理 ,由E(N)渐近表达式计算的三生素数组数与实有组数会有差,但三生素数猜想只要求证明其无穷多 ,所以误差的存在不影响结论的成立 。
附表三 :
用E(N)渐近表达式计算的值与实际值对比
N
计算值
实际值
误差
误差(绝对值)/实际值
100
4
4
0
0
300
7
8
-1
0.125
500
9
11
-2
0.182
1,000
13
15
-2
0.153
2,000
19
22
-3
0.136
3,000
26
28
-2
0.071
4,000
30
33
-3
0.091
5,000
35
40
-5
0.125
哥德巴赫猜想的证明
哥德巴赫猜想要求证明大于4的偶数都是两个奇素数的和(其推论为大于7的奇数都是3个奇素数的和) 。我们证明这个问题的基本思路是:大于4的偶数N都可以表示成个两奇数相加的对子 ,在这些奇数对集合中筛去那些最少有一奇数是合数的对子 ,剩下的对子除1+(N-1)外,都是素数对。只要证明大于4的偶数最少有这样一个素数对 ,就是证明了哥德巴赫猜想。
我们还是用分析的方法来推导和等于偶数N的素数对子数即D(N)的渐近表达式 。我们将和等于N的奇数对集合写成下面的形式进行观察分析:
1+(N-1)
3+(N-3)
5+(N-5)
7+(N-7)
9+(N-9)
11+(N-11)
┊┊┊
(-1)+(+1)(当N能被4整除)
或+(当N不能被4整除)
N不能被4整除时 ,不大于N区间有奇数个奇数 ,居中的奇数自成一个奇数对 。故实际计算时 ,应将进为整数 。
为了叙述方便先约定以下简称:奇数对中有一奇数是或两个奇数都是3的倍数的对子通称含3对 。两奇数都是3的倍数者称含3自配对 ;一奇数是3的倍数,另一奇数不是3的倍数者称含3他配对。其他以此类推 。
在和等于N的奇数对集合中,各含P对是它的子集合;一个子集合中所含的另外一个子集合的元素集合,是这两个子集合的交集,也是同属这两个子集的子集;同属三子集的元素集合是其中两子集交集的子集;同属四子集元素的集合是其中三子集交集的子集……(可以看出这些子集合没有把大于的两素数相加等于N的对子包括进去)。我们把各交集元素中最少有一个奇数是形成该交集各子集命名素数公倍数的对子简称为公倍数对;这些命名素数分含在两奇数中的对子简称为相遇对 ;既是公倍数对 ,又符合相遇对条件的对子计入公倍数对 ,不算相遇对(如N=54时,9+45这一对是含3对与含5对交集中的公倍数对,不算相遇对)。
下面我们来分析各层次各集合元素数分别与其中所含各子集元素数的比。
1.和等于N的奇数对集合元素数分别与各子集元素数的比:从纵列看 ,前一列是从小到大的奇数数列 ,后一列是从大到小的奇数数列 。由定理知 ,两列奇数中都有的项是P的倍数(3≤P<) 。故若P能整除N ,则含P对为自配对 ,在奇数对集合元素数中占 ;若P不能整除N,则含P对为他配对 ,在奇数对集合元素数中占 。
2.各子集元素数分别与其中所含其他各子集元素数(即相关两子集交集的元素数)的比:先以含5对集合与其中所含含3对元素为例:
(1)若含3对为自配对,不论含5对是自配对还是他配对 ,他们的交集中只有公倍数对,没有相遇对 ,因为5的倍数与3的倍数相遇时 ,它自身也是3的倍数,此类对子已归入公倍数对 。据引理1 ,含5对集合中有的元素是含3对 。
(2)若含3对是他配对 ,不论含5对是自配对还是他配对,它们的交集中既有公倍数对 ,也有相遇对。因为每3个5的倍数有一个与3的倍数相遇 ,所以含5对集合中有的元素是属于相遇对的含3对;另有的元素是属于公倍数对的含3对。二者合计,含5对集合中有的元素是含3对 。
同理可推知 :若N能被P整除时,各子集元素数与其中含P对元素数之比为1:;若N不能被P整除时 ,各子集元素数与其中含P对元素数之比为1: 。
3.各交集元素数与其中所含其他子集(即不包括形成该交集的子集)元素数之比 :先看公倍数对。公倍数对可分为公倍数在前一奇数位 、公倍数在后一奇数位 、两奇数都是公倍数三类。不论哪类公倍数对,把属于它的元素按原顺序排列,前后两奇数就形成两列公差绝对值相等(形成该交集各子集命名素数最小公倍数的2倍)正负相反的等差数列 。据引理2可推知 ,如果N能被P整除 ,这些公倍数对集合中就有的元素是含P对(P不等于形成该交集各子集命名素数) ;如果N不能被P整除,这些公倍数对集合中就有的元素是含P对。同样,在相遇对集合中,虽然多个命名素数相遇在一个奇数对中 ,有多种不同组合 ,每种组合又按其在前后奇数位的不同分为两类,但不论哪种组合的哪类相遇,每一类相遇对按原顺序排列,前后两奇数必然形成两列公差绝对值相等(形成该交集各子集命名素数乘积的2倍)正负相反的等差数列 。因此也得到同样结论 :如果N能被P整除 ,相遇对集合中就有的元素是含P对 ;如果N不能被P整除 ,相遇对集合中就有的元素是含P对 。所以不论某交集只有公倍数对没有相遇对,还是既有公倍数对又有相遇对 ,该交集元素数与其中所含其他子集元素数之比都同样:如果N能被P整除 ,其比为1: ;如果N不能被P整除,其比为1:。
根据以上分析结果,我们首先在和等于N的奇数对集合中筛去含3对 ,即(1-)或(1-) ,就等于各层次各子集合中除全部元素都是含3对的子集合被整体筛去外 ,其他各集合都被筛去各自所有元素数的或 ,也即奇数对集合和各层次各子集合各自所有的元素数都同时缩小了或同时缩小了 ,所以奇数对集合剩余元素数分别与各子集剩余元素数之比 ,以及各层次各子集合剩余元素数分别与其中所含其他子集合元素数之比 ,均保持未筛前它们之间的比不变 ,即仍为1:或1:(此时P≠3) 。同理 ,再在剩余的奇数对中筛去含5对,即给剩余奇数对子数再乘以(1-)或(1-) ,新剩余的奇数对集合元素数分别与其中所含其它子集元素数之比 ,以及各层次各子集合元素数分别与其中所含其它子集合元素数之比仍然不变。以此类推 ,直至筛去所有一奇数或两奇数为小于的素数的倍数的对子,最后剩余的奇数对除1+(N-1)这对外 ,都是素数对 。
至于1+(N-1)这对 ,如果N-1是合数 ,它必是某个P的倍数 ,故已被筛去 ;如果(N-1)是素数,则未被筛去 ,但因“1”不是素数 ,应另行筛去 ,式中用c表示。另外 ,因为小于的素数同时也是自身的倍数 ,使它与另一素数组成的对子也被筛去了,所以计算偶数N等于两素数相加的对子数即D(N)时,还要加上小于的素数实际组成的素数对子数,式中用b表示 。
根据以上分析,我们可以列出D(N)的渐近表达式 :
D(N)~(1-)(1-)……(1-)+b-c
=(1-)+b-c(P=3,P<)
1(当N能被P整除)
a=
2(当N不能被P整除)
可见在实际计算时,首先要对N进行因数分解,还要对N-1和每个N-P是否素数进行判断 ,否则无法计算 。下面举两个计算的例子 :
1.N=210=2×3×5×713<<17
b=2(即11+199;13+197)c=0(即209为合数)
D(210)~×(1-)(1-)(1-)(1-)(1-)+2-0≈19
(210实际可表为素数相加的对子为19对 ,误差为0)
2.N=256=213<<17
b=1(即5+251)c=0(即155为合数)
D(256)~×(1-)(1-)(1-)(1-)(1-)+1-0≈7
(256实际可表为两素数相加的对子为8对,误差为-1)
附表四:(见下页)
用D(N)渐近表达式计算的值与实际值对比
N
因数分解
P
b
c
计算值
实际值
误
差
误差
(绝对值)
实际值
12
2×3
3
0
1
1
1
0
0
64
2
7
2
0
4
5
-1
0.2000
256
2
13
1
0
7
8
-1
0.1250
512
2
19
2
0
12
11
1
0.0909
578
2×17
23
1
1
11
12
-1
0.0833
840
2×3×5×7
23
5
1
52
50
2
0.0400
1022
2×7×73
31
3
1
21
18
3
0.1667
1024
2
31
3
0
19
22
-3
0.1364
1386
2×3×7×11
37
3
0
57
57
0
0
2048
2
43
3
0
30
25
5
0.2000
2306
2×1153
47
3
0
32
34
-2
0.0588
2310
2×3×5×7×11
47
7
1
111
113
-2
0.0177
4096
2
61
5
0
52
53
-1
0.0189
4106
2×2053
61
2
0
49
52
-3
0.0577
4290
2×3×5×11×13
61
9
1
167
161
6
0.0373
4998
2×3×7×17
67
8
0
150
143
7
0.0489
5000
2×5
67
5
1
78
75
3
0.0400
5002
2×41×61
67
3
0
61
56
5
0.0893
由渐近表达式可以看出,N不含小于的素因子时 ,a的值皆为2,可见此类偶数与和它相近的其他偶数相比 ,能表为两素数相加的对子数最少 ,所以证明哥德巴赫猜想只要证明此类偶数的D(N)≥1即可 。但是 ,证明过程还必须设法消除误差的影响,否则即使证明了D(N)≥1 ,还须考虑会不会因为误差而使这个结论不成立。我们仍然用分析的方法来证明。
1.将(1-)展开来观察 :
(1-)=×××××……×
显然 ,后一乘数的分子总是大于或等于(遇到孪生素数时)前一乘数的分母。我们一律把两者视为相等进行约分,可将其值约为。这等于大大减小了D(N)的计算值 。减小的部分可以用来抵消计算值可能大于实际值的误差(正误差) 。这在N很小时作用还不够明显 ,特别是N<11时,后一乘数的分子和前一乘数的分母本来就是相等的 ,并未让出可抵消正误差的值 。但是当N不断增大时,让出的可抵消正误差的值就会越来越大 。虽然正误差的上限也会随N逐渐变大,但前者变大的速度比后者要快得多。
2.我们再将换成 。因为P<,所以< 。这就又一次减小了D(N)的计算值,也即又一次给正误差让出可抵消值。再舍去式中的非负值项b,而将c均视为1,则D(N)的计算值缩小成×-1=-1 。这时只要-1≥1成立 ,D(N)≥1就成立 。
3.-1≥1成立的条件是N≥64即可 ,但因N<11时尚未明显让出可抵消正误差的值 ,所以对于小于11的偶数 ,或者再放宽至小于17的偶数,我们可以一一检验 。经检验 ,证明它们都符合猜想要求。
至此 ,偶数哥德巴赫猜想已证完。至于其推论,即奇数哥德巴赫猜想 ,因为大于7的奇数减3即为大于4的偶数 ,所以不证自明。
附表五:
用替换(1-)(P不整除N)
所让出的可抵消正误差值与实际误差对比举例
N
(P不整除N)
因数分解
D(N)
计算值
D(N)
实际值
误差
通过替换能让出可抵消正误差的值
128
2
3
3
0
1
134
2×67
6
6
0
1
512
2
12
11
+1
4
524
2×131
10
11
-1
4
2042
2×1021
32
29
+3
13
2048
2
30
25
+5
13
4096
2
52
53
-1
31
4106
2×2053
49
52
-3
31
4954
2×2477
59
65
-6
37