Blame - third_party/gmp/tests/refmpn.c - RealtimeRoboticsGroup/test

blob: 42bb41122973fa68f3985be1a2907fe5feac04c7 [file] [log] [blame]

Austin Schuh	dace2a6	2020-08-18 10:56:48 -0700	[diff] [blame^]	1	/* Reference mpn functions, designed to be simple, portable and independent
				2	of the normal gmp code. Speed isn't a consideration.
				3
				4	Copyright 1996-2009, 2011-2014 Free Software Foundation, Inc.
				5
				6	This file is part of the GNU MP Library test suite.
				7
				8	The GNU MP Library test suite is free software; you can redistribute it
				9	and/or modify it under the terms of the GNU General Public License as
				10	published by the Free Software Foundation; either version 3 of the License,
				11	or (at your option) any later version.
				12
				13	The GNU MP Library test suite is distributed in the hope that it will be
				14	useful, but WITHOUT ANY WARRANTY; without even the implied warranty of
				15	MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the GNU General
				16	Public License for more details.
				17
				18	You should have received a copy of the GNU General Public License along with
				19	the GNU MP Library test suite. If not, see https://www.gnu.org/licenses/. */
				20
				21
				22	/* Most routines have assertions representing what the mpn routines are
				23	supposed to accept. Many of these reference routines do sensible things
				24	outside these ranges (eg. for size==0), but the assertions are present to
				25	pick up bad parameters passed here that are about to be passed the same
				26	to a real mpn routine being compared. */
				27
				28	/* always do assertion checking */
				29	#define WANT_ASSERT 1
				30
				31	#include <stdio.h> /* for NULL */
				32	#include <stdlib.h> /* for malloc */
				33
				34	#include "gmp-impl.h"
				35	#include "longlong.h"
				36
				37	#include "tests.h"
				38
				39
				40
				41	/* Return non-zero if regions {xp,xsize} and {yp,ysize} overlap, with sizes
				42	in bytes. */
				43	int
				44	byte_overlap_p (const void *v_xp, mp_size_t xsize,
				45	const void *v_yp, mp_size_t ysize)
				46	{
				47	const char xp = (const char ) v_xp;
				48	const char yp = (const char ) v_yp;
				49
				50	ASSERT (xsize >= 0);
				51	ASSERT (ysize >= 0);
				52
				53	/* no wraparounds */
				54	ASSERT (xp+xsize >= xp);
				55	ASSERT (yp+ysize >= yp);
				56
				57	if (xp + xsize <= yp)
				58	return 0;
				59
				60	if (yp + ysize <= xp)
				61	return 0;
				62
				63	return 1;
				64	}
				65
				66	/* Return non-zero if limb regions {xp,xsize} and {yp,ysize} overlap. */
				67	int
				68	refmpn_overlap_p (mp_srcptr xp, mp_size_t xsize, mp_srcptr yp, mp_size_t ysize)
				69	{
				70	return byte_overlap_p (xp, xsize * GMP_LIMB_BYTES,
				71	yp, ysize * GMP_LIMB_BYTES);
				72	}
				73
				74	/* Check overlap for a routine defined to work low to high. */
				75	int
				76	refmpn_overlap_low_to_high_p (mp_srcptr dst, mp_srcptr src, mp_size_t size)
				77	{
				78	return (dst <= src \|\| ! refmpn_overlap_p (dst, size, src, size));
				79	}
				80
				81	/* Check overlap for a routine defined to work high to low. */
				82	int
				83	refmpn_overlap_high_to_low_p (mp_srcptr dst, mp_srcptr src, mp_size_t size)
				84	{
				85	return (dst >= src \|\| ! refmpn_overlap_p (dst, size, src, size));
				86	}
				87
				88	/* Check overlap for a standard routine requiring equal or separate. */
				89	int
				90	refmpn_overlap_fullonly_p (mp_srcptr dst, mp_srcptr src, mp_size_t size)
				91	{
				92	return (dst == src \|\| ! refmpn_overlap_p (dst, size, src, size));
				93	}
				94	int
				95	refmpn_overlap_fullonly_two_p (mp_srcptr dst, mp_srcptr src1, mp_srcptr src2,
				96	mp_size_t size)
				97	{
				98	return (refmpn_overlap_fullonly_p (dst, src1, size)
				99	&& refmpn_overlap_fullonly_p (dst, src2, size));
				100	}
				101
				102
				103	mp_ptr
				104	refmpn_malloc_limbs (mp_size_t size)
				105	{
				106	mp_ptr p;
				107	ASSERT (size >= 0);
				108	if (size == 0)
				109	size = 1;
				110	p = (mp_ptr) malloc ((size_t) (size * GMP_LIMB_BYTES));
				111	ASSERT (p != NULL);
				112	return p;
				113	}
				114
				115	/* Free limbs allocated by refmpn_malloc_limbs. NOTE: Can't free
				116	* memory allocated by refmpn_malloc_limbs_aligned. */
				117	void
				118	refmpn_free_limbs (mp_ptr p)
				119	{
				120	free (p);
				121	}
				122
				123	mp_ptr
				124	refmpn_memdup_limbs (mp_srcptr ptr, mp_size_t size)
				125	{
				126	mp_ptr p;
				127	p = refmpn_malloc_limbs (size);
				128	refmpn_copyi (p, ptr, size);
				129	return p;
				130	}
				131
				132	/* malloc n limbs on a multiple of m bytes boundary */
				133	mp_ptr
				134	refmpn_malloc_limbs_aligned (mp_size_t n, size_t m)
				135	{
				136	return (mp_ptr) align_pointer (refmpn_malloc_limbs (n + m-1), m);
				137	}
				138
				139
				140	void
				141	refmpn_fill (mp_ptr ptr, mp_size_t size, mp_limb_t value)
				142	{
				143	mp_size_t i;
				144	ASSERT (size >= 0);
				145	for (i = 0; i < size; i++)
				146	ptr[i] = value;
				147	}
				148
				149	void
				150	refmpn_zero (mp_ptr ptr, mp_size_t size)
				151	{
				152	refmpn_fill (ptr, size, CNST_LIMB(0));
				153	}
				154
				155	void
				156	refmpn_zero_extend (mp_ptr ptr, mp_size_t oldsize, mp_size_t newsize)
				157	{
				158	ASSERT (newsize >= oldsize);
				159	refmpn_zero (ptr+oldsize, newsize-oldsize);
				160	}
				161
				162	int
				163	refmpn_zero_p (mp_srcptr ptr, mp_size_t size)
				164	{
				165	mp_size_t i;
				166	for (i = 0; i < size; i++)
				167	if (ptr[i] != 0)
				168	return 0;
				169	return 1;
				170	}
				171
				172	mp_size_t
				173	refmpn_normalize (mp_srcptr ptr, mp_size_t size)
				174	{
				175	ASSERT (size >= 0);
				176	while (size > 0 && ptr[size-1] == 0)
				177	size--;
				178	return size;
				179	}
				180
				181	/* the highest one bit in x */
				182	mp_limb_t
				183	refmpn_msbone (mp_limb_t x)
				184	{
				185	mp_limb_t n = (mp_limb_t) 1 << (GMP_LIMB_BITS-1);
				186
				187	while (n != 0)
				188	{
				189	if (x & n)
				190	break;
				191	n >>= 1;
				192	}
				193	return n;
				194	}
				195
				196	/* a mask of the highest one bit plus and all bits below */
				197	mp_limb_t
				198	refmpn_msbone_mask (mp_limb_t x)
				199	{
				200	if (x == 0)
				201	return 0;
				202
				203	return (refmpn_msbone (x) << 1) - 1;
				204	}
				205
				206	/* How many digits in the given base will fit in a limb.
				207	Notice that the product b is allowed to be equal to the limit
				208	2^GMP_NUMB_BITS, this ensures the result for base==2 will be
				209	GMP_NUMB_BITS (and similarly other powers of 2). */
				210	int
				211	refmpn_chars_per_limb (int base)
				212	{
				213	mp_limb_t limit[2], b[2];
				214	int chars_per_limb;
				215
				216	ASSERT (base >= 2);
				217
				218	limit[0] = 0; /* limit = 2^GMP_NUMB_BITS */
				219	limit[1] = 1;
				220	b[0] = 1; /* b = 1 */
				221	b[1] = 0;
				222
				223	chars_per_limb = 0;
				224	for (;;)
				225	{
				226	if (refmpn_mul_1 (b, b, (mp_size_t) 2, (mp_limb_t) base))
				227	break;
				228	if (refmpn_cmp (b, limit, (mp_size_t) 2) > 0)
				229	break;
				230	chars_per_limb++;
				231	}
				232	return chars_per_limb;
				233	}
				234
				235	/* The biggest value base*n which fits in GMP_NUMB_BITS. /
				236	mp_limb_t
				237	refmpn_big_base (int base)
				238	{
				239	int chars_per_limb = refmpn_chars_per_limb (base);
				240	int i;
				241	mp_limb_t bb;
				242
				243	ASSERT (base >= 2);
				244	bb = 1;
				245	for (i = 0; i < chars_per_limb; i++)
				246	bb *= base;
				247	return bb;
				248	}
				249
				250
				251	void
				252	refmpn_setbit (mp_ptr ptr, unsigned long bit)
				253	{
				254	ptr[bit/GMP_NUMB_BITS] \|= CNST_LIMB(1) << (bit%GMP_NUMB_BITS);
				255	}
				256
				257	void
				258	refmpn_clrbit (mp_ptr ptr, unsigned long bit)
				259	{
				260	ptr[bit/GMP_NUMB_BITS] &= ~ (CNST_LIMB(1) << (bit%GMP_NUMB_BITS));
				261	}
				262
				263	#define REFMPN_TSTBIT(ptr,bit) \
				264	(((ptr)[(bit)/GMP_NUMB_BITS] & (CNST_LIMB(1) << ((bit)%GMP_NUMB_BITS))) != 0)
				265
				266	int
				267	refmpn_tstbit (mp_srcptr ptr, unsigned long bit)
				268	{
				269	return REFMPN_TSTBIT (ptr, bit);
				270	}
				271
				272	unsigned long
				273	refmpn_scan0 (mp_srcptr ptr, unsigned long bit)
				274	{
				275	while (REFMPN_TSTBIT (ptr, bit) != 0)
				276	bit++;
				277	return bit;
				278	}
				279
				280	unsigned long
				281	refmpn_scan1 (mp_srcptr ptr, unsigned long bit)
				282	{
				283	while (REFMPN_TSTBIT (ptr, bit) == 0)
				284	bit++;
				285	return bit;
				286	}
				287
				288	void
				289	refmpn_copy (mp_ptr rp, mp_srcptr sp, mp_size_t size)
				290	{
				291	ASSERT (refmpn_overlap_fullonly_p (rp, sp, size));
				292	refmpn_copyi (rp, sp, size);
				293	}
				294
				295	void
				296	refmpn_copyi (mp_ptr rp, mp_srcptr sp, mp_size_t size)
				297	{
				298	mp_size_t i;
				299
				300	ASSERT (refmpn_overlap_low_to_high_p (rp, sp, size));
				301	ASSERT (size >= 0);
				302
				303	for (i = 0; i < size; i++)
				304	rp[i] = sp[i];
				305	}
				306
				307	void
				308	refmpn_copyd (mp_ptr rp, mp_srcptr sp, mp_size_t size)
				309	{
				310	mp_size_t i;
				311
				312	ASSERT (refmpn_overlap_high_to_low_p (rp, sp, size));
				313	ASSERT (size >= 0);
				314
				315	for (i = size-1; i >= 0; i--)
				316	rp[i] = sp[i];
				317	}
				318
				319	/* Copy {xp,xsize} to {wp,wsize}. If x is shorter, then pad w with low
				320	zeros to wsize. If x is longer, then copy just the high wsize limbs. */
				321	void
				322	refmpn_copy_extend (mp_ptr wp, mp_size_t wsize, mp_srcptr xp, mp_size_t xsize)
				323	{
				324	ASSERT (wsize >= 0);
				325	ASSERT (xsize >= 0);
				326
				327	/* high part of x if x bigger than w */
				328	if (xsize > wsize)
				329	{
				330	xp += xsize - wsize;
				331	xsize = wsize;
				332	}
				333
				334	refmpn_copy (wp + wsize-xsize, xp, xsize);
				335	refmpn_zero (wp, wsize-xsize);
				336	}
				337
				338	int
				339	refmpn_cmp (mp_srcptr xp, mp_srcptr yp, mp_size_t size)
				340	{
				341	mp_size_t i;
				342
				343	ASSERT (size >= 1);
				344	ASSERT_MPN (xp, size);
				345	ASSERT_MPN (yp, size);
				346
				347	for (i = size-1; i >= 0; i--)
				348	{
				349	if (xp[i] > yp[i]) return 1;
				350	if (xp[i] < yp[i]) return -1;
				351	}
				352	return 0;
				353	}
				354
				355	int
				356	refmpn_cmp_allowzero (mp_srcptr xp, mp_srcptr yp, mp_size_t size)
				357	{
				358	if (size == 0)
				359	return 0;
				360	else
				361	return refmpn_cmp (xp, yp, size);
				362	}
				363
				364	int
				365	refmpn_cmp_twosizes (mp_srcptr xp, mp_size_t xsize,
				366	mp_srcptr yp, mp_size_t ysize)
				367	{
				368	int opp, cmp;
				369
				370	ASSERT_MPN (xp, xsize);
				371	ASSERT_MPN (yp, ysize);
				372
				373	opp = (xsize < ysize);
				374	if (opp)
				375	MPN_SRCPTR_SWAP (xp,xsize, yp,ysize);
				376
				377	if (! refmpn_zero_p (xp+ysize, xsize-ysize))
				378	cmp = 1;
				379	else
				380	cmp = refmpn_cmp (xp, yp, ysize);
				381
				382	return (opp ? -cmp : cmp);
				383	}
				384
				385	int
				386	refmpn_equal_anynail (mp_srcptr xp, mp_srcptr yp, mp_size_t size)
				387	{
				388	mp_size_t i;
				389	ASSERT (size >= 0);
				390
				391	for (i = 0; i < size; i++)
				392	if (xp[i] != yp[i])
				393	return 0;
				394	return 1;
				395	}
				396
				397
				398	#define LOGOPS(operation) \
				399	{ \
				400	mp_size_t i; \
				401	\
				402	ASSERT (refmpn_overlap_fullonly_two_p (rp, s1p, s2p, size)); \
				403	ASSERT (size >= 1); \
				404	ASSERT_MPN (s1p, size); \
				405	ASSERT_MPN (s2p, size); \
				406	\
				407	for (i = 0; i < size; i++) \
				408	rp[i] = operation; \
				409	}
				410
				411	void
				412	refmpn_and_n (mp_ptr rp, mp_srcptr s1p, mp_srcptr s2p, mp_size_t size)
				413	{
				414	LOGOPS (s1p[i] & s2p[i]);
				415	}
				416	void
				417	refmpn_andn_n (mp_ptr rp, mp_srcptr s1p, mp_srcptr s2p, mp_size_t size)
				418	{
				419	LOGOPS (s1p[i] & ~s2p[i]);
				420	}
				421	void
				422	refmpn_nand_n (mp_ptr rp, mp_srcptr s1p, mp_srcptr s2p, mp_size_t size)
				423	{
				424	LOGOPS ((s1p[i] & s2p[i]) ^ GMP_NUMB_MASK);
				425	}
				426	void
				427	refmpn_ior_n (mp_ptr rp, mp_srcptr s1p, mp_srcptr s2p, mp_size_t size)
				428	{
				429	LOGOPS (s1p[i] \| s2p[i]);
				430	}
				431	void
				432	refmpn_iorn_n (mp_ptr rp, mp_srcptr s1p, mp_srcptr s2p, mp_size_t size)
				433	{
				434	LOGOPS (s1p[i] \| (s2p[i] ^ GMP_NUMB_MASK));
				435	}
				436	void
				437	refmpn_nior_n (mp_ptr rp, mp_srcptr s1p, mp_srcptr s2p, mp_size_t size)
				438	{
				439	LOGOPS ((s1p[i] \| s2p[i]) ^ GMP_NUMB_MASK);
				440	}
				441	void
				442	refmpn_xor_n (mp_ptr rp, mp_srcptr s1p, mp_srcptr s2p, mp_size_t size)
				443	{
				444	LOGOPS (s1p[i] ^ s2p[i]);
				445	}
				446	void
				447	refmpn_xnor_n (mp_ptr rp, mp_srcptr s1p, mp_srcptr s2p, mp_size_t size)
				448	{
				449	LOGOPS ((s1p[i] ^ s2p[i]) ^ GMP_NUMB_MASK);
				450	}
				451
				452
				453	/* set dh,dl to mh:ml - sh:sl, in full limbs */
				454	void
				455	refmpn_sub_ddmmss (mp_limb_t dh, mp_limb_t dl,
				456	mp_limb_t mh, mp_limb_t ml, mp_limb_t sh, mp_limb_t sl)
				457	{
				458	*dl = ml - sl;
				459	*dh = mh - sh - (ml < sl);
				460	}
				461
				462
				463	/* set w to x+y, return 0 or 1 carry /
				464	mp_limb_t
				465	ref_addc_limb (mp_limb_t *w, mp_limb_t x, mp_limb_t y)
				466	{
				467	mp_limb_t sum, cy;
				468
				469	ASSERT_LIMB (x);
				470	ASSERT_LIMB (y);
				471
				472	sum = x + y;
				473	#if GMP_NAIL_BITS == 0
				474	*w = sum;
				475	cy = (sum < x);
				476	#else
				477	*w = sum & GMP_NUMB_MASK;
				478	cy = (sum >> GMP_NUMB_BITS);
				479	#endif
				480	return cy;
				481	}
				482
				483	/* set w to x-y, return 0 or 1 borrow /
				484	mp_limb_t
				485	ref_subc_limb (mp_limb_t *w, mp_limb_t x, mp_limb_t y)
				486	{
				487	mp_limb_t diff, cy;
				488
				489	ASSERT_LIMB (x);
				490	ASSERT_LIMB (y);
				491
				492	diff = x - y;
				493	#if GMP_NAIL_BITS == 0
				494	*w = diff;
				495	cy = (diff > x);
				496	#else
				497	*w = diff & GMP_NUMB_MASK;
				498	cy = (diff >> GMP_NUMB_BITS) & 1;
				499	#endif
				500	return cy;
				501	}
				502
				503	/* set w to x+y+c (where c is 0 or 1), return 0 or 1 carry /
				504	mp_limb_t
				505	adc (mp_limb_t *w, mp_limb_t x, mp_limb_t y, mp_limb_t c)
				506	{
				507	mp_limb_t r;
				508
				509	ASSERT_LIMB (x);
				510	ASSERT_LIMB (y);
				511	ASSERT (c == 0 \|\| c == 1);
				512
				513	r = ref_addc_limb (w, x, y);
				514	return r + ref_addc_limb (w, *w, c);
				515	}
				516
				517	/* set w to x-y-c (where c is 0 or 1), return 0 or 1 borrow /
				518	mp_limb_t
				519	sbb (mp_limb_t *w, mp_limb_t x, mp_limb_t y, mp_limb_t c)
				520	{
				521	mp_limb_t r;
				522
				523	ASSERT_LIMB (x);
				524	ASSERT_LIMB (y);
				525	ASSERT (c == 0 \|\| c == 1);
				526
				527	r = ref_subc_limb (w, x, y);
				528	return r + ref_subc_limb (w, *w, c);
				529	}
				530
				531
				532	#define AORS_1(operation) \
				533	{ \
				534	mp_size_t i; \
				535	\
				536	ASSERT (refmpn_overlap_fullonly_p (rp, sp, size)); \
				537	ASSERT (size >= 1); \
				538	ASSERT_MPN (sp, size); \
				539	ASSERT_LIMB (n); \
				540	\
				541	for (i = 0; i < size; i++) \
				542	n = operation (&rp[i], sp[i], n); \
				543	return n; \
				544	}
				545
				546	mp_limb_t
				547	refmpn_add_1 (mp_ptr rp, mp_srcptr sp, mp_size_t size, mp_limb_t n)
				548	{
				549	AORS_1 (ref_addc_limb);
				550	}
				551	mp_limb_t
				552	refmpn_sub_1 (mp_ptr rp, mp_srcptr sp, mp_size_t size, mp_limb_t n)
				553	{
				554	AORS_1 (ref_subc_limb);
				555	}
				556
				557	#define AORS_NC(operation) \
				558	{ \
				559	mp_size_t i; \
				560	\
				561	ASSERT (refmpn_overlap_fullonly_two_p (rp, s1p, s2p, size)); \
				562	ASSERT (carry == 0 \|\| carry == 1); \
				563	ASSERT (size >= 1); \
				564	ASSERT_MPN (s1p, size); \
				565	ASSERT_MPN (s2p, size); \
				566	\
				567	for (i = 0; i < size; i++) \
				568	carry = operation (&rp[i], s1p[i], s2p[i], carry); \
				569	return carry; \
				570	}
				571
				572	mp_limb_t
				573	refmpn_add_nc (mp_ptr rp, mp_srcptr s1p, mp_srcptr s2p, mp_size_t size,
				574	mp_limb_t carry)
				575	{
				576	AORS_NC (adc);
				577	}
				578	mp_limb_t
				579	refmpn_sub_nc (mp_ptr rp, mp_srcptr s1p, mp_srcptr s2p, mp_size_t size,
				580	mp_limb_t carry)
				581	{
				582	AORS_NC (sbb);
				583	}
				584
				585
				586	mp_limb_t
				587	refmpn_add_n (mp_ptr rp, mp_srcptr s1p, mp_srcptr s2p, mp_size_t size)
				588	{
				589	return refmpn_add_nc (rp, s1p, s2p, size, CNST_LIMB(0));
				590	}
				591	mp_limb_t
				592	refmpn_sub_n (mp_ptr rp, mp_srcptr s1p, mp_srcptr s2p, mp_size_t size)
				593	{
				594	return refmpn_sub_nc (rp, s1p, s2p, size, CNST_LIMB(0));
				595	}
				596
				597	mp_limb_t
				598	refmpn_cnd_add_n (mp_limb_t cnd, mp_ptr rp, mp_srcptr s1p, mp_srcptr s2p, mp_size_t size)
				599	{
				600	if (cnd != 0)
				601	return refmpn_add_n (rp, s1p, s2p, size);
				602	else
				603	{
				604	refmpn_copyi (rp, s1p, size);
				605	return 0;
				606	}
				607	}
				608	mp_limb_t
				609	refmpn_cnd_sub_n (mp_limb_t cnd, mp_ptr rp, mp_srcptr s1p, mp_srcptr s2p, mp_size_t size)
				610	{
				611	if (cnd != 0)
				612	return refmpn_sub_n (rp, s1p, s2p, size);
				613	else
				614	{
				615	refmpn_copyi (rp, s1p, size);
				616	return 0;
				617	}
				618	}
				619
				620
				621	#define AORS_ERR1_N(operation) \
				622	{ \
				623	mp_size_t i; \
				624	mp_limb_t carry2; \
				625	\
				626	ASSERT (refmpn_overlap_fullonly_p (rp, s1p, size)); \
				627	ASSERT (refmpn_overlap_fullonly_p (rp, s2p, size)); \
				628	ASSERT (! refmpn_overlap_p (rp, size, yp, size)); \
				629	ASSERT (! refmpn_overlap_p (ep, 2, s1p, size)); \
				630	ASSERT (! refmpn_overlap_p (ep, 2, s2p, size)); \
				631	ASSERT (! refmpn_overlap_p (ep, 2, yp, size)); \
				632	ASSERT (! refmpn_overlap_p (ep, 2, rp, size)); \
				633	\
				634	ASSERT (carry == 0 \|\| carry == 1); \
				635	ASSERT (size >= 1); \
				636	ASSERT_MPN (s1p, size); \
				637	ASSERT_MPN (s2p, size); \
				638	ASSERT_MPN (yp, size); \
				639	\
				640	ep[0] = ep[1] = CNST_LIMB(0); \
				641	\
				642	for (i = 0; i < size; i++) \
				643	{ \
				644	carry = operation (&rp[i], s1p[i], s2p[i], carry); \
				645	if (carry == 1) \
				646	{ \
				647	carry2 = ref_addc_limb (&ep[0], ep[0], yp[size - 1 - i]); \
				648	carry2 = ref_addc_limb (&ep[1], ep[1], carry2); \
				649	ASSERT (carry2 == 0); \
				650	} \
				651	} \
				652	return carry; \
				653	}
				654
				655	mp_limb_t
				656	refmpn_add_err1_n (mp_ptr rp, mp_srcptr s1p, mp_srcptr s2p,
				657	mp_ptr ep, mp_srcptr yp,
				658	mp_size_t size, mp_limb_t carry)
				659	{
				660	AORS_ERR1_N (adc);
				661	}
				662	mp_limb_t
				663	refmpn_sub_err1_n (mp_ptr rp, mp_srcptr s1p, mp_srcptr s2p,
				664	mp_ptr ep, mp_srcptr yp,
				665	mp_size_t size, mp_limb_t carry)
				666	{
				667	AORS_ERR1_N (sbb);
				668	}
				669
				670
				671	#define AORS_ERR2_N(operation) \
				672	{ \
				673	mp_size_t i; \
				674	mp_limb_t carry2; \
				675	\
				676	ASSERT (refmpn_overlap_fullonly_p (rp, s1p, size)); \
				677	ASSERT (refmpn_overlap_fullonly_p (rp, s2p, size)); \
				678	ASSERT (! refmpn_overlap_p (rp, size, y1p, size)); \
				679	ASSERT (! refmpn_overlap_p (rp, size, y2p, size)); \
				680	ASSERT (! refmpn_overlap_p (ep, 4, s1p, size)); \
				681	ASSERT (! refmpn_overlap_p (ep, 4, s2p, size)); \
				682	ASSERT (! refmpn_overlap_p (ep, 4, y1p, size)); \
				683	ASSERT (! refmpn_overlap_p (ep, 4, y2p, size)); \
				684	ASSERT (! refmpn_overlap_p (ep, 4, rp, size)); \
				685	\
				686	ASSERT (carry == 0 \|\| carry == 1); \
				687	ASSERT (size >= 1); \
				688	ASSERT_MPN (s1p, size); \
				689	ASSERT_MPN (s2p, size); \
				690	ASSERT_MPN (y1p, size); \
				691	ASSERT_MPN (y2p, size); \
				692	\
				693	ep[0] = ep[1] = CNST_LIMB(0); \
				694	ep[2] = ep[3] = CNST_LIMB(0); \
				695	\
				696	for (i = 0; i < size; i++) \
				697	{ \
				698	carry = operation (&rp[i], s1p[i], s2p[i], carry); \
				699	if (carry == 1) \
				700	{ \
				701	carry2 = ref_addc_limb (&ep[0], ep[0], y1p[size - 1 - i]); \
				702	carry2 = ref_addc_limb (&ep[1], ep[1], carry2); \
				703	ASSERT (carry2 == 0); \
				704	carry2 = ref_addc_limb (&ep[2], ep[2], y2p[size - 1 - i]); \
				705	carry2 = ref_addc_limb (&ep[3], ep[3], carry2); \
				706	ASSERT (carry2 == 0); \
				707	} \
				708	} \
				709	return carry; \
				710	}
				711
				712	mp_limb_t
				713	refmpn_add_err2_n (mp_ptr rp, mp_srcptr s1p, mp_srcptr s2p,
				714	mp_ptr ep, mp_srcptr y1p, mp_srcptr y2p,
				715	mp_size_t size, mp_limb_t carry)
				716	{
				717	AORS_ERR2_N (adc);
				718	}
				719	mp_limb_t
				720	refmpn_sub_err2_n (mp_ptr rp, mp_srcptr s1p, mp_srcptr s2p,
				721	mp_ptr ep, mp_srcptr y1p, mp_srcptr y2p,
				722	mp_size_t size, mp_limb_t carry)
				723	{
				724	AORS_ERR2_N (sbb);
				725	}
				726
				727
				728	#define AORS_ERR3_N(operation) \
				729	{ \
				730	mp_size_t i; \
				731	mp_limb_t carry2; \
				732	\
				733	ASSERT (refmpn_overlap_fullonly_p (rp, s1p, size)); \
				734	ASSERT (refmpn_overlap_fullonly_p (rp, s2p, size)); \
				735	ASSERT (! refmpn_overlap_p (rp, size, y1p, size)); \
				736	ASSERT (! refmpn_overlap_p (rp, size, y2p, size)); \
				737	ASSERT (! refmpn_overlap_p (rp, size, y3p, size)); \
				738	ASSERT (! refmpn_overlap_p (ep, 6, s1p, size)); \
				739	ASSERT (! refmpn_overlap_p (ep, 6, s2p, size)); \
				740	ASSERT (! refmpn_overlap_p (ep, 6, y1p, size)); \
				741	ASSERT (! refmpn_overlap_p (ep, 6, y2p, size)); \
				742	ASSERT (! refmpn_overlap_p (ep, 6, y3p, size)); \
				743	ASSERT (! refmpn_overlap_p (ep, 6, rp, size)); \
				744	\
				745	ASSERT (carry == 0 \|\| carry == 1); \
				746	ASSERT (size >= 1); \
				747	ASSERT_MPN (s1p, size); \
				748	ASSERT_MPN (s2p, size); \
				749	ASSERT_MPN (y1p, size); \
				750	ASSERT_MPN (y2p, size); \
				751	ASSERT_MPN (y3p, size); \
				752	\
				753	ep[0] = ep[1] = CNST_LIMB(0); \
				754	ep[2] = ep[3] = CNST_LIMB(0); \
				755	ep[4] = ep[5] = CNST_LIMB(0); \
				756	\
				757	for (i = 0; i < size; i++) \
				758	{ \
				759	carry = operation (&rp[i], s1p[i], s2p[i], carry); \
				760	if (carry == 1) \
				761	{ \
				762	carry2 = ref_addc_limb (&ep[0], ep[0], y1p[size - 1 - i]); \
				763	carry2 = ref_addc_limb (&ep[1], ep[1], carry2); \
				764	ASSERT (carry2 == 0); \
				765	carry2 = ref_addc_limb (&ep[2], ep[2], y2p[size - 1 - i]); \
				766	carry2 = ref_addc_limb (&ep[3], ep[3], carry2); \
				767	ASSERT (carry2 == 0); \
				768	carry2 = ref_addc_limb (&ep[4], ep[4], y3p[size - 1 - i]); \
				769	carry2 = ref_addc_limb (&ep[5], ep[5], carry2); \
				770	ASSERT (carry2 == 0); \
				771	} \
				772	} \
				773	return carry; \
				774	}
				775
				776	mp_limb_t
				777	refmpn_add_err3_n (mp_ptr rp, mp_srcptr s1p, mp_srcptr s2p,
				778	mp_ptr ep, mp_srcptr y1p, mp_srcptr y2p, mp_srcptr y3p,
				779	mp_size_t size, mp_limb_t carry)
				780	{
				781	AORS_ERR3_N (adc);
				782	}
				783	mp_limb_t
				784	refmpn_sub_err3_n (mp_ptr rp, mp_srcptr s1p, mp_srcptr s2p,
				785	mp_ptr ep, mp_srcptr y1p, mp_srcptr y2p, mp_srcptr y3p,
				786	mp_size_t size, mp_limb_t carry)
				787	{
				788	AORS_ERR3_N (sbb);
				789	}
				790
				791
				792	mp_limb_t
				793	refmpn_addlsh_n (mp_ptr rp, mp_srcptr up, mp_srcptr vp,
				794	mp_size_t n, unsigned int s)
				795	{
				796	mp_limb_t cy;
				797	mp_ptr tp;
				798
				799	ASSERT (refmpn_overlap_fullonly_two_p (rp, up, vp, n));
				800	ASSERT (n >= 1);
				801	ASSERT (0 < s && s < GMP_NUMB_BITS);
				802	ASSERT_MPN (up, n);
				803	ASSERT_MPN (vp, n);
				804
				805	tp = refmpn_malloc_limbs (n);
				806	cy = refmpn_lshift (tp, vp, n, s);
				807	cy += refmpn_add_n (rp, up, tp, n);
				808	free (tp);
				809	return cy;
				810	}
				811	mp_limb_t
				812	refmpn_addlsh1_n (mp_ptr rp, mp_srcptr up, mp_srcptr vp, mp_size_t n)
				813	{
				814	return refmpn_addlsh_n (rp, up, vp, n, 1);
				815	}
				816	mp_limb_t
				817	refmpn_addlsh2_n (mp_ptr rp, mp_srcptr up, mp_srcptr vp, mp_size_t n)
				818	{
				819	return refmpn_addlsh_n (rp, up, vp, n, 2);
				820	}
				821	mp_limb_t
				822	refmpn_addlsh_n_ip1 (mp_ptr rp, mp_srcptr vp, mp_size_t n, unsigned int s)
				823	{
				824	return refmpn_addlsh_n (rp, rp, vp, n, s);
				825	}
				826	mp_limb_t
				827	refmpn_addlsh1_n_ip1 (mp_ptr rp, mp_srcptr vp, mp_size_t n)
				828	{
				829	return refmpn_addlsh_n (rp, rp, vp, n, 1);
				830	}
				831	mp_limb_t
				832	refmpn_addlsh2_n_ip1 (mp_ptr rp, mp_srcptr vp, mp_size_t n)
				833	{
				834	return refmpn_addlsh_n (rp, rp, vp, n, 2);
				835	}
				836	mp_limb_t
				837	refmpn_addlsh_n_ip2 (mp_ptr rp, mp_srcptr vp, mp_size_t n, unsigned int s)
				838	{
				839	return refmpn_addlsh_n (rp, vp, rp, n, s);
				840	}
				841	mp_limb_t
				842	refmpn_addlsh1_n_ip2 (mp_ptr rp, mp_srcptr vp, mp_size_t n)
				843	{
				844	return refmpn_addlsh_n (rp, vp, rp, n, 1);
				845	}
				846	mp_limb_t
				847	refmpn_addlsh2_n_ip2 (mp_ptr rp, mp_srcptr vp, mp_size_t n)
				848	{
				849	return refmpn_addlsh_n (rp, vp, rp, n, 2);
				850	}
				851	mp_limb_t
				852	refmpn_addlsh_nc (mp_ptr rp, mp_srcptr up, mp_srcptr vp,
				853	mp_size_t n, unsigned int s, mp_limb_t carry)
				854	{
				855	mp_limb_t cy;
				856
				857	ASSERT (carry <= (CNST_LIMB(1) << s));
				858
				859	cy = refmpn_addlsh_n (rp, up, vp, n, s);
				860	cy += refmpn_add_1 (rp, rp, n, carry);
				861	return cy;
				862	}
				863	mp_limb_t
				864	refmpn_addlsh1_nc (mp_ptr rp, mp_srcptr up, mp_srcptr vp, mp_size_t n, mp_limb_t carry)
				865	{
				866	return refmpn_addlsh_nc (rp, up, vp, n, 1, carry);
				867	}
				868	mp_limb_t
				869	refmpn_addlsh2_nc (mp_ptr rp, mp_srcptr up, mp_srcptr vp, mp_size_t n, mp_limb_t carry)
				870	{
				871	return refmpn_addlsh_nc (rp, up, vp, n, 2, carry);
				872	}
				873
				874	mp_limb_t
				875	refmpn_sublsh_n (mp_ptr rp, mp_srcptr up, mp_srcptr vp,
				876	mp_size_t n, unsigned int s)
				877	{
				878	mp_limb_t cy;
				879	mp_ptr tp;
				880
				881	ASSERT (refmpn_overlap_fullonly_two_p (rp, up, vp, n));
				882	ASSERT (n >= 1);
				883	ASSERT (0 < s && s < GMP_NUMB_BITS);
				884	ASSERT_MPN (up, n);
				885	ASSERT_MPN (vp, n);
				886
				887	tp = refmpn_malloc_limbs (n);
				888	cy = mpn_lshift (tp, vp, n, s);
				889	cy += mpn_sub_n (rp, up, tp, n);
				890	free (tp);
				891	return cy;
				892	}
				893	mp_limb_t
				894	refmpn_sublsh1_n (mp_ptr rp, mp_srcptr up, mp_srcptr vp, mp_size_t n)
				895	{
				896	return refmpn_sublsh_n (rp, up, vp, n, 1);
				897	}
				898	mp_limb_t
				899	refmpn_sublsh2_n (mp_ptr rp, mp_srcptr up, mp_srcptr vp, mp_size_t n)
				900	{
				901	return refmpn_sublsh_n (rp, up, vp, n, 2);
				902	}
				903	mp_limb_t
				904	refmpn_sublsh_n_ip1 (mp_ptr rp, mp_srcptr vp, mp_size_t n, unsigned int s)
				905	{
				906	return refmpn_sublsh_n (rp, rp, vp, n, s);
				907	}
				908	mp_limb_t
				909	refmpn_sublsh1_n_ip1 (mp_ptr rp, mp_srcptr vp, mp_size_t n)
				910	{
				911	return refmpn_sublsh_n (rp, rp, vp, n, 1);
				912	}
				913	mp_limb_t
				914	refmpn_sublsh2_n_ip1 (mp_ptr rp, mp_srcptr vp, mp_size_t n)
				915	{
				916	return refmpn_sublsh_n (rp, rp, vp, n, 2);
				917	}
				918	mp_limb_t
				919	refmpn_sublsh_n_ip2 (mp_ptr rp, mp_srcptr vp, mp_size_t n, unsigned int s)
				920	{
				921	return refmpn_sublsh_n (rp, vp, rp, n, s);
				922	}
				923	mp_limb_t
				924	refmpn_sublsh1_n_ip2 (mp_ptr rp, mp_srcptr vp, mp_size_t n)
				925	{
				926	return refmpn_sublsh_n (rp, vp, rp, n, 1);
				927	}
				928	mp_limb_t
				929	refmpn_sublsh2_n_ip2 (mp_ptr rp, mp_srcptr vp, mp_size_t n)
				930	{
				931	return refmpn_sublsh_n (rp, vp, rp, n, 2);
				932	}
				933	mp_limb_t
				934	refmpn_sublsh_nc (mp_ptr rp, mp_srcptr up, mp_srcptr vp,
				935	mp_size_t n, unsigned int s, mp_limb_t carry)
				936	{
				937	mp_limb_t cy;
				938
				939	ASSERT (carry <= (CNST_LIMB(1) << s));
				940
				941	cy = refmpn_sublsh_n (rp, up, vp, n, s);
				942	cy += refmpn_sub_1 (rp, rp, n, carry);
				943	return cy;
				944	}
				945	mp_limb_t
				946	refmpn_sublsh1_nc (mp_ptr rp, mp_srcptr up, mp_srcptr vp, mp_size_t n, mp_limb_t carry)
				947	{
				948	return refmpn_sublsh_nc (rp, up, vp, n, 1, carry);
				949	}
				950	mp_limb_t
				951	refmpn_sublsh2_nc (mp_ptr rp, mp_srcptr up, mp_srcptr vp, mp_size_t n, mp_limb_t carry)
				952	{
				953	return refmpn_sublsh_nc (rp, up, vp, n, 2, carry);
				954	}
				955
				956	mp_limb_signed_t
				957	refmpn_rsblsh_n (mp_ptr rp, mp_srcptr up, mp_srcptr vp,
				958	mp_size_t n, unsigned int s)
				959	{
				960	mp_limb_signed_t cy;
				961	mp_ptr tp;
				962
				963	ASSERT (refmpn_overlap_fullonly_two_p (rp, up, vp, n));
				964	ASSERT (n >= 1);
				965	ASSERT (0 < s && s < GMP_NUMB_BITS);
				966	ASSERT_MPN (up, n);
				967	ASSERT_MPN (vp, n);
				968
				969	tp = refmpn_malloc_limbs (n);
				970	cy = mpn_lshift (tp, vp, n, s);
				971	cy -= mpn_sub_n (rp, tp, up, n);
				972	free (tp);
				973	return cy;
				974	}
				975	mp_limb_signed_t
				976	refmpn_rsblsh1_n (mp_ptr rp, mp_srcptr up, mp_srcptr vp, mp_size_t n)
				977	{
				978	return refmpn_rsblsh_n (rp, up, vp, n, 1);
				979	}
				980	mp_limb_signed_t
				981	refmpn_rsblsh2_n (mp_ptr rp, mp_srcptr up, mp_srcptr vp, mp_size_t n)
				982	{
				983	return refmpn_rsblsh_n (rp, up, vp, n, 2);
				984	}
				985	mp_limb_signed_t
				986	refmpn_rsblsh_nc (mp_ptr rp, mp_srcptr up, mp_srcptr vp,
				987	mp_size_t n, unsigned int s, mp_limb_signed_t carry)
				988	{
				989	mp_limb_signed_t cy;
				990
				991	ASSERT (carry == -1 \|\| (carry >> s) == 0);
				992
				993	cy = refmpn_rsblsh_n (rp, up, vp, n, s);
				994	if (carry > 0)
				995	cy += refmpn_add_1 (rp, rp, n, carry);
				996	else
				997	cy -= refmpn_sub_1 (rp, rp, n, -carry);
				998	return cy;
				999	}
				1000	mp_limb_signed_t
				1001	refmpn_rsblsh1_nc (mp_ptr rp, mp_srcptr up, mp_srcptr vp, mp_size_t n, mp_limb_signed_t carry)
				1002	{
				1003	return refmpn_rsblsh_nc (rp, up, vp, n, 1, carry);
				1004	}
				1005	mp_limb_signed_t
				1006	refmpn_rsblsh2_nc (mp_ptr rp, mp_srcptr up, mp_srcptr vp, mp_size_t n, mp_limb_signed_t carry)
				1007	{
				1008	return refmpn_rsblsh_nc (rp, up, vp, n, 2, carry);
				1009	}
				1010
				1011	mp_limb_t
				1012	refmpn_rsh1add_n (mp_ptr rp, mp_srcptr up, mp_srcptr vp, mp_size_t n)
				1013	{
				1014	mp_limb_t cya, cys;
				1015
				1016	ASSERT (refmpn_overlap_fullonly_two_p (rp, up, vp, n));
				1017	ASSERT (n >= 1);
				1018	ASSERT_MPN (up, n);
				1019	ASSERT_MPN (vp, n);
				1020
				1021	cya = mpn_add_n (rp, up, vp, n);
				1022	cys = mpn_rshift (rp, rp, n, 1) >> (GMP_NUMB_BITS - 1);
				1023	rp[n - 1] \|= cya << (GMP_NUMB_BITS - 1);
				1024	return cys;
				1025	}
				1026	mp_limb_t
				1027	refmpn_rsh1sub_n (mp_ptr rp, mp_srcptr up, mp_srcptr vp, mp_size_t n)
				1028	{
				1029	mp_limb_t cya, cys;
				1030
				1031	ASSERT (refmpn_overlap_fullonly_two_p (rp, up, vp, n));
				1032	ASSERT (n >= 1);
				1033	ASSERT_MPN (up, n);
				1034	ASSERT_MPN (vp, n);
				1035
				1036	cya = mpn_sub_n (rp, up, vp, n);
				1037	cys = mpn_rshift (rp, rp, n, 1) >> (GMP_NUMB_BITS - 1);
				1038	rp[n - 1] \|= cya << (GMP_NUMB_BITS - 1);
				1039	return cys;
				1040	}
				1041
				1042	/* Twos complement, return borrow. */
				1043	mp_limb_t
				1044	refmpn_neg (mp_ptr dst, mp_srcptr src, mp_size_t size)
				1045	{
				1046	mp_ptr zeros;
				1047	mp_limb_t ret;
				1048
				1049	ASSERT (size >= 1);
				1050
				1051	zeros = refmpn_malloc_limbs (size);
				1052	refmpn_fill (zeros, size, CNST_LIMB(0));
				1053	ret = refmpn_sub_n (dst, zeros, src, size);
				1054	free (zeros);
				1055	return ret;
				1056	}
				1057
				1058
				1059	#define AORS(aors_n, aors_1) \
				1060	{ \
				1061	mp_limb_t c; \
				1062	ASSERT (s1size >= s2size); \
				1063	ASSERT (s2size >= 1); \
				1064	c = aors_n (rp, s1p, s2p, s2size); \
				1065	if (s1size-s2size != 0) \
				1066	c = aors_1 (rp+s2size, s1p+s2size, s1size-s2size, c); \
				1067	return c; \
				1068	}
				1069	mp_limb_t
				1070	refmpn_add (mp_ptr rp,
				1071	mp_srcptr s1p, mp_size_t s1size,
				1072	mp_srcptr s2p, mp_size_t s2size)
				1073	{
				1074	AORS (refmpn_add_n, refmpn_add_1);
				1075	}
				1076	mp_limb_t
				1077	refmpn_sub (mp_ptr rp,
				1078	mp_srcptr s1p, mp_size_t s1size,
				1079	mp_srcptr s2p, mp_size_t s2size)
				1080	{
				1081	AORS (refmpn_sub_n, refmpn_sub_1);
				1082	}
				1083
				1084
				1085	#define SHIFTHIGH(x) ((x) << GMP_LIMB_BITS/2)
				1086	#define SHIFTLOW(x) ((x) >> GMP_LIMB_BITS/2)
				1087
				1088	#define LOWMASK (((mp_limb_t) 1 << GMP_LIMB_BITS/2)-1)
				1089	#define HIGHMASK SHIFTHIGH(LOWMASK)
				1090
				1091	#define LOWPART(x) ((x) & LOWMASK)
				1092	#define HIGHPART(x) SHIFTLOW((x) & HIGHMASK)
				1093
				1094	/* Set return:lo to xy, using full limbs not nails. */
				1095	mp_limb_t
				1096	refmpn_umul_ppmm (mp_limb_t *lo, mp_limb_t x, mp_limb_t y)
				1097	{
				1098	mp_limb_t hi, s;
				1099
				1100	lo = LOWPART(x) LOWPART(y);
				1101	hi = HIGHPART(x) * HIGHPART(y);
				1102
				1103	s = LOWPART(x) * HIGHPART(y);
				1104	hi += HIGHPART(s);
				1105	s = SHIFTHIGH(LOWPART(s));
				1106	*lo += s;
				1107	hi += (*lo < s);
				1108
				1109	s = HIGHPART(x) * LOWPART(y);
				1110	hi += HIGHPART(s);
				1111	s = SHIFTHIGH(LOWPART(s));
				1112	*lo += s;
				1113	hi += (*lo < s);
				1114
				1115	return hi;
				1116	}
				1117
				1118	mp_limb_t
				1119	refmpn_umul_ppmm_r (mp_limb_t x, mp_limb_t y, mp_limb_t *lo)
				1120	{
				1121	return refmpn_umul_ppmm (lo, x, y);
				1122	}
				1123
				1124	mp_limb_t
				1125	refmpn_mul_1c (mp_ptr rp, mp_srcptr sp, mp_size_t size, mp_limb_t multiplier,
				1126	mp_limb_t carry)
				1127	{
				1128	mp_size_t i;
				1129	mp_limb_t hi, lo;
				1130
				1131	ASSERT (refmpn_overlap_low_to_high_p (rp, sp, size));
				1132	ASSERT (size >= 1);
				1133	ASSERT_MPN (sp, size);
				1134	ASSERT_LIMB (multiplier);
				1135	ASSERT_LIMB (carry);
				1136
				1137	multiplier <<= GMP_NAIL_BITS;
				1138	for (i = 0; i < size; i++)
				1139	{
				1140	hi = refmpn_umul_ppmm (&lo, sp[i], multiplier);
				1141	lo >>= GMP_NAIL_BITS;
				1142	ASSERT_NOCARRY (ref_addc_limb (&hi, hi, ref_addc_limb (&lo, lo, carry)));
				1143	rp[i] = lo;
				1144	carry = hi;
				1145	}
				1146	return carry;
				1147	}
				1148
				1149	mp_limb_t
				1150	refmpn_mul_1 (mp_ptr rp, mp_srcptr sp, mp_size_t size, mp_limb_t multiplier)
				1151	{
				1152	return refmpn_mul_1c (rp, sp, size, multiplier, CNST_LIMB(0));
				1153	}
				1154
				1155
				1156	mp_limb_t
				1157	refmpn_mul_N (mp_ptr dst, mp_srcptr src, mp_size_t size,
				1158	mp_srcptr mult, mp_size_t msize)
				1159	{
				1160	mp_ptr src_copy;
				1161	mp_limb_t ret;
				1162	mp_size_t i;
				1163
				1164	ASSERT (refmpn_overlap_fullonly_p (dst, src, size));
				1165	ASSERT (! refmpn_overlap_p (dst, size+msize-1, mult, msize));
				1166	ASSERT (size >= msize);
				1167	ASSERT_MPN (mult, msize);
				1168
				1169	/* in case dst==src */
				1170	src_copy = refmpn_malloc_limbs (size);
				1171	refmpn_copyi (src_copy, src, size);
				1172	src = src_copy;
				1173
				1174	dst[size] = refmpn_mul_1 (dst, src, size, mult[0]);
				1175	for (i = 1; i < msize-1; i++)
				1176	dst[size+i] = refmpn_addmul_1 (dst+i, src, size, mult[i]);
				1177	ret = refmpn_addmul_1 (dst+i, src, size, mult[i]);
				1178
				1179	free (src_copy);
				1180	return ret;
				1181	}
				1182
				1183	mp_limb_t
				1184	refmpn_mul_2 (mp_ptr rp, mp_srcptr sp, mp_size_t size, mp_srcptr mult)
				1185	{
				1186	return refmpn_mul_N (rp, sp, size, mult, (mp_size_t) 2);
				1187	}
				1188	mp_limb_t
				1189	refmpn_mul_3 (mp_ptr rp, mp_srcptr sp, mp_size_t size, mp_srcptr mult)
				1190	{
				1191	return refmpn_mul_N (rp, sp, size, mult, (mp_size_t) 3);
				1192	}
				1193	mp_limb_t
				1194	refmpn_mul_4 (mp_ptr rp, mp_srcptr sp, mp_size_t size, mp_srcptr mult)
				1195	{
				1196	return refmpn_mul_N (rp, sp, size, mult, (mp_size_t) 4);
				1197	}
				1198	mp_limb_t
				1199	refmpn_mul_5 (mp_ptr rp, mp_srcptr sp, mp_size_t size, mp_srcptr mult)
				1200	{
				1201	return refmpn_mul_N (rp, sp, size, mult, (mp_size_t) 5);
				1202	}
				1203	mp_limb_t
				1204	refmpn_mul_6 (mp_ptr rp, mp_srcptr sp, mp_size_t size, mp_srcptr mult)
				1205	{
				1206	return refmpn_mul_N (rp, sp, size, mult, (mp_size_t) 6);
				1207	}
				1208
				1209	#define AORSMUL_1C(operation_n) \
				1210	{ \
				1211	mp_ptr p; \
				1212	mp_limb_t ret; \
				1213	\
				1214	ASSERT (refmpn_overlap_fullonly_p (rp, sp, size)); \
				1215	\
				1216	p = refmpn_malloc_limbs (size); \
				1217	ret = refmpn_mul_1c (p, sp, size, multiplier, carry); \
				1218	ret += operation_n (rp, rp, p, size); \
				1219	\
				1220	free (p); \
				1221	return ret; \
				1222	}
				1223
				1224	mp_limb_t
				1225	refmpn_addmul_1c (mp_ptr rp, mp_srcptr sp, mp_size_t size,
				1226	mp_limb_t multiplier, mp_limb_t carry)
				1227	{
				1228	AORSMUL_1C (refmpn_add_n);
				1229	}
				1230	mp_limb_t
				1231	refmpn_submul_1c (mp_ptr rp, mp_srcptr sp, mp_size_t size,
				1232	mp_limb_t multiplier, mp_limb_t carry)
				1233	{
				1234	AORSMUL_1C (refmpn_sub_n);
				1235	}
				1236
				1237
				1238	mp_limb_t
				1239	refmpn_addmul_1 (mp_ptr rp, mp_srcptr sp, mp_size_t size, mp_limb_t multiplier)
				1240	{
				1241	return refmpn_addmul_1c (rp, sp, size, multiplier, CNST_LIMB(0));
				1242	}
				1243	mp_limb_t
				1244	refmpn_submul_1 (mp_ptr rp, mp_srcptr sp, mp_size_t size, mp_limb_t multiplier)
				1245	{
				1246	return refmpn_submul_1c (rp, sp, size, multiplier, CNST_LIMB(0));
				1247	}
				1248
				1249
				1250	mp_limb_t
				1251	refmpn_addmul_N (mp_ptr dst, mp_srcptr src, mp_size_t size,
				1252	mp_srcptr mult, mp_size_t msize)
				1253	{
				1254	mp_ptr src_copy;
				1255	mp_limb_t ret;
				1256	mp_size_t i;
				1257
				1258	ASSERT (dst == src \|\| ! refmpn_overlap_p (dst, size+msize-1, src, size));
				1259	ASSERT (! refmpn_overlap_p (dst, size+msize-1, mult, msize));
				1260	ASSERT (size >= msize);
				1261	ASSERT_MPN (mult, msize);
				1262
				1263	/* in case dst==src */
				1264	src_copy = refmpn_malloc_limbs (size);
				1265	refmpn_copyi (src_copy, src, size);
				1266	src = src_copy;
				1267
				1268	for (i = 0; i < msize-1; i++)
				1269	dst[size+i] = refmpn_addmul_1 (dst+i, src, size, mult[i]);
				1270	ret = refmpn_addmul_1 (dst+i, src, size, mult[i]);
				1271
				1272	free (src_copy);
				1273	return ret;
				1274	}
				1275
				1276	mp_limb_t
				1277	refmpn_addmul_2 (mp_ptr rp, mp_srcptr sp, mp_size_t size, mp_srcptr mult)
				1278	{
				1279	return refmpn_addmul_N (rp, sp, size, mult, (mp_size_t) 2);
				1280	}
				1281	mp_limb_t
				1282	refmpn_addmul_3 (mp_ptr rp, mp_srcptr sp, mp_size_t size, mp_srcptr mult)
				1283	{
				1284	return refmpn_addmul_N (rp, sp, size, mult, (mp_size_t) 3);
				1285	}
				1286	mp_limb_t
				1287	refmpn_addmul_4 (mp_ptr rp, mp_srcptr sp, mp_size_t size, mp_srcptr mult)
				1288	{
				1289	return refmpn_addmul_N (rp, sp, size, mult, (mp_size_t) 4);
				1290	}
				1291	mp_limb_t
				1292	refmpn_addmul_5 (mp_ptr rp, mp_srcptr sp, mp_size_t size, mp_srcptr mult)
				1293	{
				1294	return refmpn_addmul_N (rp, sp, size, mult, (mp_size_t) 5);
				1295	}
				1296	mp_limb_t
				1297	refmpn_addmul_6 (mp_ptr rp, mp_srcptr sp, mp_size_t size, mp_srcptr mult)
				1298	{
				1299	return refmpn_addmul_N (rp, sp, size, mult, (mp_size_t) 6);
				1300	}
				1301	mp_limb_t
				1302	refmpn_addmul_7 (mp_ptr rp, mp_srcptr sp, mp_size_t size, mp_srcptr mult)
				1303	{
				1304	return refmpn_addmul_N (rp, sp, size, mult, (mp_size_t) 7);
				1305	}
				1306	mp_limb_t
				1307	refmpn_addmul_8 (mp_ptr rp, mp_srcptr sp, mp_size_t size, mp_srcptr mult)
				1308	{
				1309	return refmpn_addmul_N (rp, sp, size, mult, (mp_size_t) 8);
				1310	}
				1311
				1312	mp_limb_t
				1313	refmpn_add_n_sub_nc (mp_ptr r1p, mp_ptr r2p,
				1314	mp_srcptr s1p, mp_srcptr s2p, mp_size_t size,
				1315	mp_limb_t carry)
				1316	{
				1317	mp_ptr p;
				1318	mp_limb_t acy, scy;
				1319
				1320	/* Destinations can't overlap. */
				1321	ASSERT (! refmpn_overlap_p (r1p, size, r2p, size));
				1322	ASSERT (refmpn_overlap_fullonly_two_p (r1p, s1p, s2p, size));
				1323	ASSERT (refmpn_overlap_fullonly_two_p (r2p, s1p, s2p, size));
				1324	ASSERT (size >= 1);
				1325
				1326	/* in case r1p==s1p or r1p==s2p */
				1327	p = refmpn_malloc_limbs (size);
				1328
				1329	acy = refmpn_add_nc (p, s1p, s2p, size, carry >> 1);
				1330	scy = refmpn_sub_nc (r2p, s1p, s2p, size, carry & 1);
				1331	refmpn_copyi (r1p, p, size);
				1332
				1333	free (p);
				1334	return 2 * acy + scy;
				1335	}
				1336
				1337	mp_limb_t
				1338	refmpn_add_n_sub_n (mp_ptr r1p, mp_ptr r2p,
				1339	mp_srcptr s1p, mp_srcptr s2p, mp_size_t size)
				1340	{
				1341	return refmpn_add_n_sub_nc (r1p, r2p, s1p, s2p, size, CNST_LIMB(0));
				1342	}
				1343
				1344
				1345	/* Right shift hi,lo and return the low limb of the result.
				1346	Note a shift by GMP_LIMB_BITS isn't assumed to work (doesn't on x86). */
				1347	mp_limb_t
				1348	rshift_make (mp_limb_t hi, mp_limb_t lo, unsigned shift)
				1349	{
				1350	ASSERT (shift < GMP_NUMB_BITS);
				1351	if (shift == 0)
				1352	return lo;
				1353	else
				1354	return ((hi << (GMP_NUMB_BITS-shift)) \| (lo >> shift)) & GMP_NUMB_MASK;
				1355	}
				1356
				1357	/* Left shift hi,lo and return the high limb of the result.
				1358	Note a shift by GMP_LIMB_BITS isn't assumed to work (doesn't on x86). */
				1359	mp_limb_t
				1360	lshift_make (mp_limb_t hi, mp_limb_t lo, unsigned shift)
				1361	{
				1362	ASSERT (shift < GMP_NUMB_BITS);
				1363	if (shift == 0)
				1364	return hi;
				1365	else
				1366	return ((hi << shift) \| (lo >> (GMP_NUMB_BITS-shift))) & GMP_NUMB_MASK;
				1367	}
				1368
				1369
				1370	mp_limb_t
				1371	refmpn_rshift (mp_ptr rp, mp_srcptr sp, mp_size_t size, unsigned shift)
				1372	{
				1373	mp_limb_t ret;
				1374	mp_size_t i;
				1375
				1376	ASSERT (refmpn_overlap_low_to_high_p (rp, sp, size));
				1377	ASSERT (size >= 1);
				1378	ASSERT (shift >= 1 && shift < GMP_NUMB_BITS);
				1379	ASSERT_MPN (sp, size);
				1380
				1381	ret = rshift_make (sp[0], CNST_LIMB(0), shift);
				1382
				1383	for (i = 0; i < size-1; i++)
				1384	rp[i] = rshift_make (sp[i+1], sp[i], shift);
				1385
				1386	rp[i] = rshift_make (CNST_LIMB(0), sp[i], shift);
				1387	return ret;
				1388	}
				1389
				1390	mp_limb_t
				1391	refmpn_lshift (mp_ptr rp, mp_srcptr sp, mp_size_t size, unsigned shift)
				1392	{
				1393	mp_limb_t ret;
				1394	mp_size_t i;
				1395
				1396	ASSERT (refmpn_overlap_high_to_low_p (rp, sp, size));
				1397	ASSERT (size >= 1);
				1398	ASSERT (shift >= 1 && shift < GMP_NUMB_BITS);
				1399	ASSERT_MPN (sp, size);
				1400
				1401	ret = lshift_make (CNST_LIMB(0), sp[size-1], shift);
				1402
				1403	for (i = size-2; i >= 0; i--)
				1404	rp[i+1] = lshift_make (sp[i+1], sp[i], shift);
				1405
				1406	rp[i+1] = lshift_make (sp[i+1], CNST_LIMB(0), shift);
				1407	return ret;
				1408	}
				1409
				1410	void
				1411	refmpn_com (mp_ptr rp, mp_srcptr sp, mp_size_t size)
				1412	{
				1413	mp_size_t i;
				1414
				1415	/* We work downwards since mpn_lshiftc needs that. */
				1416	ASSERT (refmpn_overlap_high_to_low_p (rp, sp, size));
				1417
				1418	for (i = size - 1; i >= 0; i--)
				1419	rp[i] = (~sp[i]) & GMP_NUMB_MASK;
				1420	}
				1421
				1422	mp_limb_t
				1423	refmpn_lshiftc (mp_ptr rp, mp_srcptr sp, mp_size_t size, unsigned shift)
				1424	{
				1425	mp_limb_t res;
				1426
				1427	/* No asserts here, refmpn_lshift will assert what we need. */
				1428
				1429	res = refmpn_lshift (rp, sp, size, shift);
				1430	refmpn_com (rp, rp, size);
				1431	return res;
				1432	}
				1433
				1434	/* accepting shift==0 and doing a plain copyi or copyd in that case */
				1435	mp_limb_t
				1436	refmpn_rshift_or_copy (mp_ptr rp, mp_srcptr sp, mp_size_t size, unsigned shift)
				1437	{
				1438	if (shift == 0)
				1439	{
				1440	refmpn_copyi (rp, sp, size);
				1441	return 0;
				1442	}
				1443	else
				1444	{
				1445	return refmpn_rshift (rp, sp, size, shift);
				1446	}
				1447	}
				1448	mp_limb_t
				1449	refmpn_lshift_or_copy (mp_ptr rp, mp_srcptr sp, mp_size_t size, unsigned shift)
				1450	{
				1451	if (shift == 0)
				1452	{
				1453	refmpn_copyd (rp, sp, size);
				1454	return 0;
				1455	}
				1456	else
				1457	{
				1458	return refmpn_lshift (rp, sp, size, shift);
				1459	}
				1460	}
				1461
				1462	/* accepting size==0 too */
				1463	mp_limb_t
				1464	refmpn_rshift_or_copy_any (mp_ptr rp, mp_srcptr sp, mp_size_t size,
				1465	unsigned shift)
				1466	{
				1467	return (size == 0 ? 0 : refmpn_rshift_or_copy (rp, sp, size, shift));
				1468	}
				1469	mp_limb_t
				1470	refmpn_lshift_or_copy_any (mp_ptr rp, mp_srcptr sp, mp_size_t size,
				1471	unsigned shift)
				1472	{
				1473	return (size == 0 ? 0 : refmpn_lshift_or_copy (rp, sp, size, shift));
				1474	}
				1475
				1476	/* Divide h,l by d, return quotient, store remainder to *rp.
				1477	Operates on full limbs, not nails.
				1478	Must have h < d.
				1479	__udiv_qrnnd_c isn't simple, and it's a bit slow, but it works. */
				1480	mp_limb_t
				1481	refmpn_udiv_qrnnd (mp_limb_t *rp, mp_limb_t h, mp_limb_t l, mp_limb_t d)
				1482	{
				1483	mp_limb_t q, r;
				1484	int n;
				1485
				1486	ASSERT (d != 0);
				1487	ASSERT (h < d);
				1488
				1489	#if 0
				1490	udiv_qrnnd (q, r, h, l, d);
				1491	*rp = r;
				1492	return q;
				1493	#endif
				1494
				1495	n = refmpn_count_leading_zeros (d);
				1496	d <<= n;
				1497
				1498	if (n != 0)
				1499	{
				1500	h = (h << n) \| (l >> (GMP_LIMB_BITS - n));
				1501	l <<= n;
				1502	}
				1503
				1504	__udiv_qrnnd_c (q, r, h, l, d);
				1505	r >>= n;
				1506	*rp = r;
				1507	return q;
				1508	}
				1509
				1510	mp_limb_t
				1511	refmpn_udiv_qrnnd_r (mp_limb_t h, mp_limb_t l, mp_limb_t d, mp_limb_t *rp)
				1512	{
				1513	return refmpn_udiv_qrnnd (rp, h, l, d);
				1514	}
				1515
				1516	/* This little subroutine avoids some bad code generation from i386 gcc 3.0
				1517	-fPIC -O2 -fomit-frame-pointer (%ebp being used uninitialized). */
				1518	static mp_limb_t
				1519	refmpn_divmod_1c_workaround (mp_ptr rp, mp_srcptr sp, mp_size_t size,
				1520	mp_limb_t divisor, mp_limb_t carry)
				1521	{
				1522	mp_size_t i;
				1523	mp_limb_t rem[1];
				1524	for (i = size-1; i >= 0; i--)
				1525	{
				1526	rp[i] = refmpn_udiv_qrnnd (rem, carry,
				1527	sp[i] << GMP_NAIL_BITS,
				1528	divisor << GMP_NAIL_BITS);
				1529	carry = *rem >> GMP_NAIL_BITS;
				1530	}
				1531	return carry;
				1532	}
				1533
				1534	mp_limb_t
				1535	refmpn_divmod_1c (mp_ptr rp, mp_srcptr sp, mp_size_t size,
				1536	mp_limb_t divisor, mp_limb_t carry)
				1537	{
				1538	mp_ptr sp_orig;
				1539	mp_ptr prod;
				1540	mp_limb_t carry_orig;
				1541
				1542	ASSERT (refmpn_overlap_fullonly_p (rp, sp, size));
				1543	ASSERT (size >= 0);
				1544	ASSERT (carry < divisor);
				1545	ASSERT_MPN (sp, size);
				1546	ASSERT_LIMB (divisor);
				1547	ASSERT_LIMB (carry);
				1548
				1549	if (size == 0)
				1550	return carry;
				1551
				1552	sp_orig = refmpn_memdup_limbs (sp, size);
				1553	prod = refmpn_malloc_limbs (size);
				1554	carry_orig = carry;
				1555
				1556	carry = refmpn_divmod_1c_workaround (rp, sp, size, divisor, carry);
				1557
				1558	/* check by multiplying back */
				1559	#if 0
				1560	printf ("size=%ld divisor=0x%lX carry=0x%lX remainder=0x%lX\n",
				1561	size, divisor, carry_orig, carry);
				1562	mpn_trace("s",sp_copy,size);
				1563	mpn_trace("r",rp,size);
				1564	printf ("mul_1c %lX\n", refmpn_mul_1c (prod, rp, size, divisor, carry));
				1565	mpn_trace("p",prod,size);
				1566	#endif
				1567	ASSERT (refmpn_mul_1c (prod, rp, size, divisor, carry) == carry_orig);
				1568	ASSERT (refmpn_cmp (prod, sp_orig, size) == 0);
				1569	free (sp_orig);
				1570	free (prod);
				1571
				1572	return carry;
				1573	}
				1574
				1575	mp_limb_t
				1576	refmpn_divmod_1 (mp_ptr rp, mp_srcptr sp, mp_size_t size, mp_limb_t divisor)
				1577	{
				1578	return refmpn_divmod_1c (rp, sp, size, divisor, CNST_LIMB(0));
				1579	}
				1580
				1581
				1582	mp_limb_t
				1583	refmpn_mod_1c (mp_srcptr sp, mp_size_t size, mp_limb_t divisor,
				1584	mp_limb_t carry)
				1585	{
				1586	mp_ptr p = refmpn_malloc_limbs (size);
				1587	carry = refmpn_divmod_1c (p, sp, size, divisor, carry);
				1588	free (p);
				1589	return carry;
				1590	}
				1591
				1592	mp_limb_t
				1593	refmpn_mod_1 (mp_srcptr sp, mp_size_t size, mp_limb_t divisor)
				1594	{
				1595	return refmpn_mod_1c (sp, size, divisor, CNST_LIMB(0));
				1596	}
				1597
				1598	mp_limb_t
				1599	refmpn_preinv_mod_1 (mp_srcptr sp, mp_size_t size, mp_limb_t divisor,
				1600	mp_limb_t inverse)
				1601	{
				1602	ASSERT (divisor & GMP_NUMB_HIGHBIT);
				1603	ASSERT (inverse == refmpn_invert_limb (divisor));
				1604	return refmpn_mod_1 (sp, size, divisor);
				1605	}
				1606
				1607	/* This implementation will be rather slow, but has the advantage of being
				1608	in a different style than the libgmp versions. */
				1609	mp_limb_t
				1610	refmpn_mod_34lsub1 (mp_srcptr p, mp_size_t n)
				1611	{
				1612	ASSERT ((GMP_NUMB_BITS % 4) == 0);
				1613	return mpn_mod_1 (p, n, (CNST_LIMB(1) << (3 * GMP_NUMB_BITS / 4)) - 1);
				1614	}
				1615
				1616
				1617	mp_limb_t
				1618	refmpn_divrem_1c (mp_ptr rp, mp_size_t xsize,
				1619	mp_srcptr sp, mp_size_t size, mp_limb_t divisor,
				1620	mp_limb_t carry)
				1621	{
				1622	mp_ptr z;
				1623
				1624	z = refmpn_malloc_limbs (xsize);
				1625	refmpn_fill (z, xsize, CNST_LIMB(0));
				1626
				1627	carry = refmpn_divmod_1c (rp+xsize, sp, size, divisor, carry);
				1628	carry = refmpn_divmod_1c (rp, z, xsize, divisor, carry);
				1629
				1630	free (z);
				1631	return carry;
				1632	}
				1633
				1634	mp_limb_t
				1635	refmpn_divrem_1 (mp_ptr rp, mp_size_t xsize,
				1636	mp_srcptr sp, mp_size_t size, mp_limb_t divisor)
				1637	{
				1638	return refmpn_divrem_1c (rp, xsize, sp, size, divisor, CNST_LIMB(0));
				1639	}
				1640
				1641	mp_limb_t
				1642	refmpn_preinv_divrem_1 (mp_ptr rp, mp_size_t xsize,
				1643	mp_srcptr sp, mp_size_t size,
				1644	mp_limb_t divisor, mp_limb_t inverse, unsigned shift)
				1645	{
				1646	ASSERT (size >= 0);
				1647	ASSERT (shift == refmpn_count_leading_zeros (divisor));
				1648	ASSERT (inverse == refmpn_invert_limb (divisor << shift));
				1649
				1650	return refmpn_divrem_1 (rp, xsize, sp, size, divisor);
				1651	}
				1652
				1653	mp_limb_t
				1654	refmpn_divrem_2 (mp_ptr qp, mp_size_t qxn,
				1655	mp_ptr np, mp_size_t nn,
				1656	mp_srcptr dp)
				1657	{
				1658	mp_ptr tp;
				1659	mp_limb_t qh;
				1660
				1661	tp = refmpn_malloc_limbs (nn + qxn);
				1662	refmpn_zero (tp, qxn);
				1663	refmpn_copyi (tp + qxn, np, nn);
				1664	qh = refmpn_sb_div_qr (qp, tp, nn + qxn, dp, 2);
				1665	refmpn_copyi (np, tp, 2);
				1666	free (tp);
				1667	return qh;
				1668	}
				1669
				1670	/* Inverse is floor((b*(b-d)-1) / d), per division by invariant integers
				1671	paper, figure 8.1 m', where b=2^GMP_LIMB_BITS. Note that -d-1 < d
				1672	since d has the high bit set. */
				1673
				1674	mp_limb_t
				1675	refmpn_invert_limb (mp_limb_t d)
				1676	{
				1677	mp_limb_t r;
				1678	ASSERT (d & GMP_LIMB_HIGHBIT);
				1679	return refmpn_udiv_qrnnd (&r, -d-1, MP_LIMB_T_MAX, d);
				1680	}
				1681
				1682	void
				1683	refmpn_invert (mp_ptr rp, mp_srcptr up, mp_size_t n, mp_ptr scratch)
				1684	{
				1685	mp_ptr qp, tp;
				1686	TMP_DECL;
				1687	TMP_MARK;
				1688
				1689	tp = TMP_ALLOC_LIMBS (2 * n);
				1690	qp = TMP_ALLOC_LIMBS (n + 1);
				1691
				1692	MPN_ZERO (tp, 2 * n); mpn_sub_1 (tp, tp, 2 * n, 1);
				1693
				1694	refmpn_tdiv_qr (qp, rp, 0, tp, 2 * n, up, n);
				1695	refmpn_copyi (rp, qp, n);
				1696
				1697	TMP_FREE;
				1698	}
				1699
				1700	void
				1701	refmpn_binvert (mp_ptr rp, mp_srcptr up, mp_size_t n, mp_ptr scratch)
				1702	{
				1703	mp_ptr tp;
				1704	mp_limb_t binv;
				1705	TMP_DECL;
				1706	TMP_MARK;
				1707
				1708	/* We use the library mpn_sbpi1_bdiv_q here, which isn't kosher in testing
				1709	code. To make up for it, we check that the inverse is correct using a
				1710	multiply. */
				1711
				1712	tp = TMP_ALLOC_LIMBS (2 * n);
				1713
				1714	MPN_ZERO (tp, n);
				1715	tp[0] = 1;
				1716	binvert_limb (binv, up[0]);
				1717	mpn_sbpi1_bdiv_q (rp, tp, n, up, n, -binv);
				1718
				1719	refmpn_mul_n (tp, rp, up, n);
				1720	ASSERT_ALWAYS (tp[0] == 1 && mpn_zero_p (tp + 1, n - 1));
				1721
				1722	TMP_FREE;
				1723	}
				1724
				1725	/* The aim is to produce a dst quotient and return a remainder c, satisfying
				1726	cb^n + src-i == 3dst, where i is the incoming carry.
				1727
				1728	Some value c==0, c==1 or c==2 will satisfy, so just try each.
				1729
				1730	If GMP_NUMB_BITS is even then 2^GMP_NUMB_BITS==1mod3 and a non-zero
				1731	remainder from the first division attempt determines the correct
				1732	remainder (3-c), but don't bother with that, since we can't guarantee
				1733	anything about GMP_NUMB_BITS when using nails.
				1734
				1735	If the initial src-i produces a borrow then refmpn_sub_1 leaves a twos
				1736	complement negative, ie. b^n+a-i, and the calculation produces c1
				1737	satisfying c1b^n + b^n+src-i == 3dst, from which clearly c=c1+1. This
				1738	means it's enough to just add any borrow back at the end.
				1739
				1740	A borrow only occurs when a==0 or a==1, and, by the same reasoning as in
				1741	mpn/generic/diveby3.c, the c1 that results in those cases will only be 0
				1742	or 1 respectively, so with 1 added the final return value is still in the
				1743	prescribed range 0 to 2. */
				1744
				1745	mp_limb_t
				1746	refmpn_divexact_by3c (mp_ptr rp, mp_srcptr sp, mp_size_t size, mp_limb_t carry)
				1747	{
				1748	mp_ptr spcopy;
				1749	mp_limb_t c, cs;
				1750
				1751	ASSERT (refmpn_overlap_fullonly_p (rp, sp, size));
				1752	ASSERT (size >= 1);
				1753	ASSERT (carry <= 2);
				1754	ASSERT_MPN (sp, size);
				1755
				1756	spcopy = refmpn_malloc_limbs (size);
				1757	cs = refmpn_sub_1 (spcopy, sp, size, carry);
				1758
				1759	for (c = 0; c <= 2; c++)
				1760	if (refmpn_divmod_1c (rp, spcopy, size, CNST_LIMB(3), c) == 0)
				1761	goto done;
				1762	ASSERT_FAIL (no value of c satisfies);
				1763
				1764	done:
				1765	c += cs;
				1766	ASSERT (c <= 2);
				1767
				1768	free (spcopy);
				1769	return c;
				1770	}
				1771
				1772	mp_limb_t
				1773	refmpn_divexact_by3 (mp_ptr rp, mp_srcptr sp, mp_size_t size)
				1774	{
				1775	return refmpn_divexact_by3c (rp, sp, size, CNST_LIMB(0));
				1776	}
				1777
				1778
				1779	/* The same as mpn/generic/mul_basecase.c, but using refmpn functions. */
				1780	void
				1781	refmpn_mul_basecase (mp_ptr prodp,
				1782	mp_srcptr up, mp_size_t usize,
				1783	mp_srcptr vp, mp_size_t vsize)
				1784	{
				1785	mp_size_t i;
				1786
				1787	ASSERT (! refmpn_overlap_p (prodp, usize+vsize, up, usize));
				1788	ASSERT (! refmpn_overlap_p (prodp, usize+vsize, vp, vsize));
				1789	ASSERT (usize >= vsize);
				1790	ASSERT (vsize >= 1);
				1791	ASSERT_MPN (up, usize);
				1792	ASSERT_MPN (vp, vsize);
				1793
				1794	prodp[usize] = refmpn_mul_1 (prodp, up, usize, vp[0]);
				1795	for (i = 1; i < vsize; i++)
				1796	prodp[usize+i] = refmpn_addmul_1 (prodp+i, up, usize, vp[i]);
				1797	}
				1798
				1799
				1800	/* The same as mpn/generic/mulmid_basecase.c, but using refmpn functions. */
				1801	void
				1802	refmpn_mulmid_basecase (mp_ptr rp,
				1803	mp_srcptr up, mp_size_t un,
				1804	mp_srcptr vp, mp_size_t vn)
				1805	{
				1806	mp_limb_t cy;
				1807	mp_size_t i;
				1808
				1809	ASSERT (un >= vn);
				1810	ASSERT (vn >= 1);
				1811	ASSERT (! refmpn_overlap_p (rp, un - vn + 3, up, un));
				1812	ASSERT (! refmpn_overlap_p (rp, un - vn + 3, vp, vn));
				1813	ASSERT_MPN (up, un);
				1814	ASSERT_MPN (vp, vn);
				1815
				1816	rp[un - vn + 1] = refmpn_mul_1 (rp, up + vn - 1, un - vn + 1, vp[0]);
				1817	rp[un - vn + 2] = CNST_LIMB (0);
				1818	for (i = 1; i < vn; i++)
				1819	{
				1820	cy = refmpn_addmul_1 (rp, up + vn - i - 1, un - vn + 1, vp[i]);
				1821	cy = ref_addc_limb (&rp[un - vn + 1], rp[un - vn + 1], cy);
				1822	cy = ref_addc_limb (&rp[un - vn + 2], rp[un - vn + 2], cy);
				1823	ASSERT (cy == 0);
				1824	}
				1825	}
				1826
				1827	void
				1828	refmpn_toom42_mulmid (mp_ptr rp, mp_srcptr up, mp_srcptr vp, mp_size_t n,
				1829	mp_ptr scratch)
				1830	{
				1831	refmpn_mulmid_basecase (rp, up, 2*n - 1, vp, n);
				1832	}
				1833
				1834	void
				1835	refmpn_mulmid_n (mp_ptr rp, mp_srcptr up, mp_srcptr vp, mp_size_t n)
				1836	{
				1837	/* FIXME: this could be made faster by using refmpn_mul and then subtracting
				1838	off products near the middle product region boundary */
				1839	refmpn_mulmid_basecase (rp, up, 2*n - 1, vp, n);
				1840	}
				1841
				1842	void
				1843	refmpn_mulmid (mp_ptr rp, mp_srcptr up, mp_size_t un,
				1844	mp_srcptr vp, mp_size_t vn)
				1845	{
				1846	/* FIXME: this could be made faster by using refmpn_mul and then subtracting
				1847	off products near the middle product region boundary */
				1848	refmpn_mulmid_basecase (rp, up, un, vp, vn);
				1849	}
				1850
				1851
				1852
				1853	#define TOOM3_THRESHOLD (MAX (MUL_TOOM33_THRESHOLD, SQR_TOOM3_THRESHOLD))
				1854	#define TOOM4_THRESHOLD (MAX (MUL_TOOM44_THRESHOLD, SQR_TOOM4_THRESHOLD))
				1855	#define TOOM6_THRESHOLD (MAX (MUL_TOOM6H_THRESHOLD, SQR_TOOM6_THRESHOLD))
				1856	#if WANT_FFT
				1857	#define FFT_THRESHOLD (MAX (MUL_FFT_THRESHOLD, SQR_FFT_THRESHOLD))
				1858	#else
				1859	#define FFT_THRESHOLD MP_SIZE_T_MAX /* don't use toom44 here */
				1860	#endif
				1861
				1862	void
				1863	refmpn_mul (mp_ptr wp, mp_srcptr up, mp_size_t un, mp_srcptr vp, mp_size_t vn)
				1864	{
				1865	mp_ptr tp, rp;
				1866	mp_size_t tn;
				1867
				1868	if (vn < TOOM3_THRESHOLD)
				1869	{
				1870	/* In the mpn_mul_basecase and toom2 ranges, use our own mul_basecase. */
				1871	if (vn != 0)
				1872	refmpn_mul_basecase (wp, up, un, vp, vn);
				1873	else
				1874	MPN_ZERO (wp, un);
				1875	return;
				1876	}
				1877
				1878	MPN_ZERO (wp, vn);
				1879	rp = refmpn_malloc_limbs (2 * vn);
				1880
				1881	if (vn < TOOM4_THRESHOLD)
				1882	tn = mpn_toom22_mul_itch (vn, vn);
				1883	else if (vn < TOOM6_THRESHOLD)
				1884	tn = mpn_toom33_mul_itch (vn, vn);
				1885	else if (vn < FFT_THRESHOLD)
				1886	tn = mpn_toom44_mul_itch (vn, vn);
				1887	else
				1888	tn = mpn_toom6h_mul_itch (vn, vn);
				1889	tp = refmpn_malloc_limbs (tn);
				1890
				1891	while (un >= vn)
				1892	{
				1893	if (vn < TOOM4_THRESHOLD)
				1894	/* In the toom3 range, use mpn_toom22_mul. */
				1895	mpn_toom22_mul (rp, up, vn, vp, vn, tp);
				1896	else if (vn < TOOM6_THRESHOLD)
				1897	/* In the toom4 range, use mpn_toom33_mul. */
				1898	mpn_toom33_mul (rp, up, vn, vp, vn, tp);
				1899	else if (vn < FFT_THRESHOLD)
				1900	/* In the toom6 range, use mpn_toom44_mul. */
				1901	mpn_toom44_mul (rp, up, vn, vp, vn, tp);
				1902	else
				1903	/* For the largest operands, use mpn_toom6h_mul. */
				1904	mpn_toom6h_mul (rp, up, vn, vp, vn, tp);
				1905
				1906	ASSERT_NOCARRY (refmpn_add (wp, rp, 2 * vn, wp, vn));
				1907	wp += vn;
				1908
				1909	up += vn;
				1910	un -= vn;
				1911	}
				1912
				1913	free (tp);
				1914
				1915	if (un != 0)
				1916	{
				1917	refmpn_mul (rp, vp, vn, up, un);
				1918	ASSERT_NOCARRY (refmpn_add (wp, rp, un + vn, wp, vn));
				1919	}
				1920	free (rp);
				1921	}
				1922
				1923	void
				1924	refmpn_mul_n (mp_ptr prodp, mp_srcptr up, mp_srcptr vp, mp_size_t size)
				1925	{
				1926	refmpn_mul (prodp, up, size, vp, size);
				1927	}
				1928
				1929	void
				1930	refmpn_mullo_n (mp_ptr prodp, mp_srcptr up, mp_srcptr vp, mp_size_t size)
				1931	{
				1932	mp_ptr tp = refmpn_malloc_limbs (2*size);
				1933	refmpn_mul (tp, up, size, vp, size);
				1934	refmpn_copyi (prodp, tp, size);
				1935	free (tp);
				1936	}
				1937
				1938	void
				1939	refmpn_sqr (mp_ptr dst, mp_srcptr src, mp_size_t size)
				1940	{
				1941	refmpn_mul (dst, src, size, src, size);
				1942	}
				1943
				1944	void
				1945	refmpn_sqrlo (mp_ptr dst, mp_srcptr src, mp_size_t size)
				1946	{
				1947	refmpn_mullo_n (dst, src, src, size);
				1948	}
				1949
				1950	/* Allowing usize<vsize, usize==0 or vsize==0. */
				1951	void
				1952	refmpn_mul_any (mp_ptr prodp,
				1953	mp_srcptr up, mp_size_t usize,
				1954	mp_srcptr vp, mp_size_t vsize)
				1955	{
				1956	ASSERT (! refmpn_overlap_p (prodp, usize+vsize, up, usize));
				1957	ASSERT (! refmpn_overlap_p (prodp, usize+vsize, vp, vsize));
				1958	ASSERT (usize >= 0);
				1959	ASSERT (vsize >= 0);
				1960	ASSERT_MPN (up, usize);
				1961	ASSERT_MPN (vp, vsize);
				1962
				1963	if (usize == 0)
				1964	{
				1965	refmpn_fill (prodp, vsize, CNST_LIMB(0));
				1966	return;
				1967	}
				1968
				1969	if (vsize == 0)
				1970	{
				1971	refmpn_fill (prodp, usize, CNST_LIMB(0));
				1972	return;
				1973	}
				1974
				1975	if (usize >= vsize)
				1976	refmpn_mul (prodp, up, usize, vp, vsize);
				1977	else
				1978	refmpn_mul (prodp, vp, vsize, up, usize);
				1979	}
				1980
				1981
				1982	mp_limb_t
				1983	refmpn_gcd_11 (mp_limb_t x, mp_limb_t y)
				1984	{
				1985	/* The non-ref function also requires input operands to be odd, but
				1986	below refmpn_gcd_1 doesn't guarantee that. */
				1987	ASSERT (x > 0);
				1988	ASSERT (y > 0);
				1989	do
				1990	{
				1991	while ((x & 1) == 0) x >>= 1;
				1992	while ((y & 1) == 0) y >>= 1;
				1993
				1994	if (x < y)
				1995	MP_LIMB_T_SWAP (x, y);
				1996
				1997	x -= y;
				1998	}
				1999	while (x != 0);
				2000
				2001	return y;
				2002	}
				2003
				2004	mp_double_limb_t
				2005	refmpn_gcd_22 (mp_limb_t x1, mp_limb_t x0, mp_limb_t y1, mp_limb_t y0)
				2006	{
				2007	ASSERT ((x0 & 1) != 0);
				2008	ASSERT ((y0 & 1) != 0);
				2009	mp_double_limb_t g;
				2010	mp_limb_t cy;
				2011
				2012	do
				2013	{
				2014	while ((x0 & 1) == 0)
				2015	{
				2016	x0 = (x1 << (GMP_NUMB_BITS - 1)) \| (x0 >> 1);
				2017	x1 >>= 1;
				2018	}
				2019	while ((y0 & 1) == 0)
				2020	{
				2021	y0 = (y1 << (GMP_NUMB_BITS - 1)) \| (y0 >> 1);
				2022	y1 >>= 1;
				2023	}
				2024
				2025
				2026	if (x1 < y1 \|\| (x1 == y1 && x0 < y0))
				2027	{
				2028	mp_limb_t t;
				2029	t = x1; x1 = y1; y1 = t;
				2030	t = x0; x0 = y0; y0 = t;
				2031	}
				2032
				2033	cy = (x0 < y0);
				2034	x0 -= y0;
				2035	x1 -= y1 + cy;
				2036	}
				2037	while ((x1 \| x0) != 0);
				2038
				2039	g.d1 = y1;
				2040	g.d0 = y0;
				2041	return g;
				2042	}
				2043
				2044	mp_limb_t
				2045	refmpn_gcd_1 (mp_srcptr xp, mp_size_t xsize, mp_limb_t y)
				2046	{
				2047	mp_limb_t x;
				2048	int twos;
				2049
				2050	ASSERT (y != 0);
				2051	ASSERT (! refmpn_zero_p (xp, xsize));
				2052	ASSERT_MPN (xp, xsize);
				2053	ASSERT_LIMB (y);
				2054
				2055	x = refmpn_mod_1 (xp, xsize, y);
				2056	if (x == 0)
				2057	return y;
				2058
				2059	twos = 0;
				2060	while ((x & 1) == 0 && (y & 1) == 0)
				2061	{
				2062	x >>= 1;
				2063	y >>= 1;
				2064	twos++;
				2065	}
				2066
				2067	return refmpn_gcd_11 (x, y) << twos;
				2068	}
				2069
				2070
				2071	/* Based on the full limb x, not nails. */
				2072	unsigned
				2073	refmpn_count_leading_zeros (mp_limb_t x)
				2074	{
				2075	unsigned n = 0;
				2076
				2077	ASSERT (x != 0);
				2078
				2079	while ((x & GMP_LIMB_HIGHBIT) == 0)
				2080	{
				2081	x <<= 1;
				2082	n++;
				2083	}
				2084	return n;
				2085	}
				2086
				2087	/* Full limbs allowed, not limited to nails. */
				2088	unsigned
				2089	refmpn_count_trailing_zeros (mp_limb_t x)
				2090	{
				2091	unsigned n = 0;
				2092
				2093	ASSERT (x != 0);
				2094	ASSERT_LIMB (x);
				2095
				2096	while ((x & 1) == 0)
				2097	{
				2098	x >>= 1;
				2099	n++;
				2100	}
				2101	return n;
				2102	}
				2103
				2104	/* Strip factors of two (low zero bits) from {p,size} by right shifting.
				2105	The return value is the number of twos stripped. */
				2106	mp_size_t
				2107	refmpn_strip_twos (mp_ptr p, mp_size_t size)
				2108	{
				2109	mp_size_t limbs;
				2110	unsigned shift;
				2111
				2112	ASSERT (size >= 1);
				2113	ASSERT (! refmpn_zero_p (p, size));
				2114	ASSERT_MPN (p, size);
				2115
				2116	for (limbs = 0; p[0] == 0; limbs++)
				2117	{
				2118	refmpn_copyi (p, p+1, size-1);
				2119	p[size-1] = 0;
				2120	}
				2121
				2122	shift = refmpn_count_trailing_zeros (p[0]);
				2123	if (shift)
				2124	refmpn_rshift (p, p, size, shift);
				2125
				2126	return limbs*GMP_NUMB_BITS + shift;
				2127	}
				2128
				2129	mp_limb_t
				2130	refmpn_gcd (mp_ptr gp, mp_ptr xp, mp_size_t xsize, mp_ptr yp, mp_size_t ysize)
				2131	{
				2132	int cmp;
				2133
				2134	ASSERT (ysize >= 1);
				2135	ASSERT (xsize >= ysize);
				2136	ASSERT ((xp[0] & 1) != 0);
				2137	ASSERT ((yp[0] & 1) != 0);
				2138	/* ASSERT (xp[xsize-1] != 0); / / don't think x needs to be odd */
				2139	ASSERT (yp[ysize-1] != 0);
				2140	ASSERT (refmpn_overlap_fullonly_p (gp, xp, xsize));
				2141	ASSERT (refmpn_overlap_fullonly_p (gp, yp, ysize));
				2142	ASSERT (! refmpn_overlap_p (xp, xsize, yp, ysize));
				2143	if (xsize == ysize)
				2144	ASSERT (refmpn_msbone (xp[xsize-1]) >= refmpn_msbone (yp[ysize-1]));
				2145	ASSERT_MPN (xp, xsize);
				2146	ASSERT_MPN (yp, ysize);
				2147
				2148	refmpn_strip_twos (xp, xsize);
				2149	MPN_NORMALIZE (xp, xsize);
				2150	MPN_NORMALIZE (yp, ysize);
				2151
				2152	for (;;)
				2153	{
				2154	cmp = refmpn_cmp_twosizes (xp, xsize, yp, ysize);
				2155	if (cmp == 0)
				2156	break;
				2157	if (cmp < 0)
				2158	MPN_PTR_SWAP (xp,xsize, yp,ysize);
				2159
				2160	ASSERT_NOCARRY (refmpn_sub (xp, xp, xsize, yp, ysize));
				2161
				2162	refmpn_strip_twos (xp, xsize);
				2163	MPN_NORMALIZE (xp, xsize);
				2164	}
				2165
				2166	refmpn_copyi (gp, xp, xsize);
				2167	return xsize;
				2168	}
				2169
				2170	unsigned long
				2171	ref_popc_limb (mp_limb_t src)
				2172	{
				2173	unsigned long count;
				2174	int i;
				2175
				2176	count = 0;
				2177	for (i = 0; i < GMP_LIMB_BITS; i++)
				2178	{
				2179	count += (src & 1);
				2180	src >>= 1;
				2181	}
				2182	return count;
				2183	}
				2184
				2185	unsigned long
				2186	refmpn_popcount (mp_srcptr sp, mp_size_t size)
				2187	{
				2188	unsigned long count = 0;
				2189	mp_size_t i;
				2190
				2191	ASSERT (size >= 0);
				2192	ASSERT_MPN (sp, size);
				2193
				2194	for (i = 0; i < size; i++)
				2195	count += ref_popc_limb (sp[i]);
				2196	return count;
				2197	}
				2198
				2199	unsigned long
				2200	refmpn_hamdist (mp_srcptr s1p, mp_srcptr s2p, mp_size_t size)
				2201	{
				2202	mp_ptr d;
				2203	unsigned long count;
				2204
				2205	ASSERT (size >= 0);
				2206	ASSERT_MPN (s1p, size);
				2207	ASSERT_MPN (s2p, size);
				2208
				2209	if (size == 0)
				2210	return 0;
				2211
				2212	d = refmpn_malloc_limbs (size);
				2213	refmpn_xor_n (d, s1p, s2p, size);
				2214	count = refmpn_popcount (d, size);
				2215	free (d);
				2216	return count;
				2217	}
				2218
				2219
				2220	/* set r to a%d */
				2221	void
				2222	refmpn_mod2 (mp_limb_t r[2], const mp_limb_t a[2], const mp_limb_t d[2])
				2223	{
				2224	mp_limb_t D[2];
				2225	int n;
				2226
				2227	ASSERT (! refmpn_overlap_p (r, (mp_size_t) 2, d, (mp_size_t) 2));
				2228	ASSERT_MPN (a, 2);
				2229	ASSERT_MPN (d, 2);
				2230
				2231	D[1] = d[1], D[0] = d[0];
				2232	r[1] = a[1], r[0] = a[0];
				2233	n = 0;
				2234
				2235	for (;;)
				2236	{
				2237	if (D[1] & GMP_NUMB_HIGHBIT)
				2238	break;
				2239	if (refmpn_cmp (r, D, (mp_size_t) 2) <= 0)
				2240	break;
				2241	refmpn_lshift (D, D, (mp_size_t) 2, 1);
				2242	n++;
				2243	ASSERT (n <= GMP_NUMB_BITS);
				2244	}
				2245
				2246	while (n >= 0)
				2247	{
				2248	if (refmpn_cmp (r, D, (mp_size_t) 2) >= 0)
				2249	ASSERT_NOCARRY (refmpn_sub_n (r, r, D, (mp_size_t) 2));
				2250	refmpn_rshift (D, D, (mp_size_t) 2, 1);
				2251	n--;
				2252	}
				2253
				2254	ASSERT (refmpn_cmp (r, d, (mp_size_t) 2) < 0);
				2255	}
				2256
				2257
				2258
				2259	/* Similar to the old mpn/generic/sb_divrem_mn.c, but somewhat simplified, in
				2260	particular the trial quotient is allowed to be 2 too big. */
				2261	mp_limb_t
				2262	refmpn_sb_div_qr (mp_ptr qp,
				2263	mp_ptr np, mp_size_t nsize,
				2264	mp_srcptr dp, mp_size_t dsize)
				2265	{
				2266	mp_limb_t retval = 0;
				2267	mp_size_t i;
				2268	mp_limb_t d1 = dp[dsize-1];
				2269	mp_ptr np_orig = refmpn_memdup_limbs (np, nsize);
				2270
				2271	ASSERT (nsize >= dsize);
				2272	/* ASSERT (dsize > 2); */
				2273	ASSERT (dsize >= 2);
				2274	ASSERT (dp[dsize-1] & GMP_NUMB_HIGHBIT);
				2275	ASSERT (! refmpn_overlap_p (qp, nsize-dsize, np, nsize) \|\| qp+dsize >= np);
				2276	ASSERT_MPN (np, nsize);
				2277	ASSERT_MPN (dp, dsize);
				2278
				2279	i = nsize-dsize;
				2280	if (refmpn_cmp (np+i, dp, dsize) >= 0)
				2281	{
				2282	ASSERT_NOCARRY (refmpn_sub_n (np+i, np+i, dp, dsize));
				2283	retval = 1;
				2284	}
				2285
				2286	for (i--; i >= 0; i--)
				2287	{
				2288	mp_limb_t n0 = np[i+dsize];
				2289	mp_limb_t n1 = np[i+dsize-1];
				2290	mp_limb_t q, dummy_r;
				2291
				2292	ASSERT (n0 <= d1);
				2293	if (n0 == d1)
				2294	q = GMP_NUMB_MAX;
				2295	else
				2296	q = refmpn_udiv_qrnnd (&dummy_r, n0, n1 << GMP_NAIL_BITS,
				2297	d1 << GMP_NAIL_BITS);
				2298
				2299	n0 -= refmpn_submul_1 (np+i, dp, dsize, q);
				2300	ASSERT (n0 == 0 \|\| n0 == MP_LIMB_T_MAX);
				2301	if (n0)
				2302	{
				2303	q--;
				2304	if (! refmpn_add_n (np+i, np+i, dp, dsize))
				2305	{
				2306	q--;
				2307	ASSERT_CARRY (refmpn_add_n (np+i, np+i, dp, dsize));
				2308	}
				2309	}
				2310	np[i+dsize] = 0;
				2311
				2312	qp[i] = q;
				2313	}
				2314
				2315	/* remainder < divisor */
				2316	#if 0 /* ASSERT triggers gcc 4.2.1 bug */
				2317	ASSERT (refmpn_cmp (np, dp, dsize) < 0);
				2318	#endif
				2319
				2320	/* multiply back to original */
				2321	{
				2322	mp_ptr mp = refmpn_malloc_limbs (nsize);
				2323
				2324	refmpn_mul_any (mp, qp, nsize-dsize, dp, dsize);
				2325	if (retval)
				2326	ASSERT_NOCARRY (refmpn_add_n (mp+nsize-dsize,mp+nsize-dsize, dp, dsize));
				2327	ASSERT_NOCARRY (refmpn_add (mp, mp, nsize, np, dsize));
				2328	ASSERT (refmpn_cmp (mp, np_orig, nsize) == 0);
				2329
				2330	free (mp);
				2331	}
				2332
				2333	free (np_orig);
				2334	return retval;
				2335	}
				2336
				2337	/* Similar to the old mpn/generic/sb_divrem_mn.c, but somewhat simplified, in
				2338	particular the trial quotient is allowed to be 2 too big. */
				2339	void
				2340	refmpn_tdiv_qr (mp_ptr qp, mp_ptr rp, mp_size_t qxn,
				2341	mp_ptr np, mp_size_t nsize,
				2342	mp_srcptr dp, mp_size_t dsize)
				2343	{
				2344	ASSERT (qxn == 0);
				2345	ASSERT_MPN (np, nsize);
				2346	ASSERT_MPN (dp, dsize);
				2347	ASSERT (dsize > 0);
				2348	ASSERT (dp[dsize-1] != 0);
				2349
				2350	if (dsize == 1)
				2351	{
				2352	rp[0] = refmpn_divmod_1 (qp, np, nsize, dp[0]);
				2353	return;
				2354	}
				2355	else
				2356	{
				2357	mp_ptr n2p = refmpn_malloc_limbs (nsize+1);
				2358	mp_ptr d2p = refmpn_malloc_limbs (dsize);
				2359	int norm = refmpn_count_leading_zeros (dp[dsize-1]) - GMP_NAIL_BITS;
				2360
				2361	n2p[nsize] = refmpn_lshift_or_copy (n2p, np, nsize, norm);
				2362	ASSERT_NOCARRY (refmpn_lshift_or_copy (d2p, dp, dsize, norm));
				2363
				2364	refmpn_sb_div_qr (qp, n2p, nsize+1, d2p, dsize);
				2365	refmpn_rshift_or_copy (rp, n2p, dsize, norm);
				2366
				2367	/* ASSERT (refmpn_zero_p (tp+dsize, nsize-dsize)); */
				2368	free (n2p);
				2369	free (d2p);
				2370	}
				2371	}
				2372
				2373	mp_limb_t
				2374	refmpn_redc_1 (mp_ptr rp, mp_ptr up, mp_srcptr mp, mp_size_t n, mp_limb_t invm)
				2375	{
				2376	mp_size_t j;
				2377	mp_limb_t cy;
				2378
				2379	ASSERT_MPN (up, 2*n);
				2380	/* ASSERT about directed overlap rp, up */
				2381	/* ASSERT about overlap rp, mp */
				2382	/* ASSERT about overlap up, mp */
				2383
				2384	for (j = n - 1; j >= 0; j--)
				2385	{
				2386	up[0] = refmpn_addmul_1 (up, mp, n, (up[0] * invm) & GMP_NUMB_MASK);
				2387	up++;
				2388	}
				2389	cy = mpn_add_n (rp, up, up - n, n);
				2390	return cy;
				2391	}
				2392
				2393	size_t
				2394	refmpn_get_str (unsigned char *dst, int base, mp_ptr src, mp_size_t size)
				2395	{
				2396	unsigned char *d;
				2397	size_t dsize;
				2398
				2399	ASSERT (size >= 0);
				2400	ASSERT (base >= 2);
				2401	ASSERT (base < numberof (mp_bases));
				2402	ASSERT (size == 0 \|\| src[size-1] != 0);
				2403	ASSERT_MPN (src, size);
				2404
				2405	MPN_SIZEINBASE (dsize, src, size, base);
				2406	ASSERT (dsize >= 1);
				2407	ASSERT (! byte_overlap_p (dst, (mp_size_t) dsize, src, size * GMP_LIMB_BYTES));
				2408
				2409	if (size == 0)
				2410	{
				2411	dst[0] = 0;
				2412	return 1;
				2413	}
				2414
				2415	/* don't clobber input for power of 2 bases */
				2416	if (POW2_P (base))
				2417	src = refmpn_memdup_limbs (src, size);
				2418
				2419	d = dst + dsize;
				2420	do
				2421	{
				2422	d--;
				2423	ASSERT (d >= dst);
				2424	*d = refmpn_divrem_1 (src, (mp_size_t) 0, src, size, (mp_limb_t) base);
				2425	size -= (src[size-1] == 0);
				2426	}
				2427	while (size != 0);
				2428
				2429	/* Move result back and decrement dsize if we didn't generate
				2430	the maximum possible digits. */
				2431	if (d != dst)
				2432	{
				2433	size_t i;
				2434	dsize -= d - dst;
				2435	for (i = 0; i < dsize; i++)
				2436	dst[i] = d[i];
				2437	}
				2438
				2439	if (POW2_P (base))
				2440	free (src);
				2441
				2442	return dsize;
				2443	}
				2444
				2445
				2446	mp_limb_t
				2447	ref_bswap_limb (mp_limb_t src)
				2448	{
				2449	mp_limb_t dst;
				2450	int i;
				2451
				2452	dst = 0;
				2453	for (i = 0; i < GMP_LIMB_BYTES; i++)
				2454	{
				2455	dst = (dst << 8) + (src & 0xFF);
				2456	src >>= 8;
				2457	}
				2458	return dst;
				2459	}
				2460
				2461
				2462	/* These random functions are mostly for transitional purposes while adding
				2463	nail support, since they're independent of the normal mpn routines. They
				2464	can probably be removed when those normal routines are reliable, though
				2465	perhaps something independent would still be useful at times. */
				2466
				2467	#if GMP_LIMB_BITS == 32
				2468	#define RAND_A CNST_LIMB(0x29CF535)
				2469	#endif
				2470	#if GMP_LIMB_BITS == 64
				2471	#define RAND_A CNST_LIMB(0xBAECD515DAF0B49D)
				2472	#endif
				2473
				2474	mp_limb_t refmpn_random_seed;
				2475
				2476	mp_limb_t
				2477	refmpn_random_half (void)
				2478	{
				2479	refmpn_random_seed = refmpn_random_seed * RAND_A + 1;
				2480	return (refmpn_random_seed >> GMP_LIMB_BITS/2);
				2481	}
				2482
				2483	mp_limb_t
				2484	refmpn_random_limb (void)
				2485	{
				2486	return ((refmpn_random_half () << (GMP_LIMB_BITS/2))
				2487	\| refmpn_random_half ()) & GMP_NUMB_MASK;
				2488	}
				2489
				2490	void
				2491	refmpn_random (mp_ptr ptr, mp_size_t size)
				2492	{
				2493	mp_size_t i;
				2494	if (GMP_NAIL_BITS == 0)
				2495	{
				2496	mpn_random (ptr, size);
				2497	return;
				2498	}
				2499
				2500	for (i = 0; i < size; i++)
				2501	ptr[i] = refmpn_random_limb ();
				2502	}
				2503
				2504	void
				2505	refmpn_random2 (mp_ptr ptr, mp_size_t size)
				2506	{
				2507	mp_size_t i;
				2508	mp_limb_t bit, mask, limb;
				2509	int run;
				2510
				2511	if (GMP_NAIL_BITS == 0)
				2512	{
				2513	mpn_random2 (ptr, size);
				2514	return;
				2515	}
				2516
				2517	#define RUN_MODULUS 32
				2518
				2519	/* start with ones at a random pos in the high limb */
				2520	bit = CNST_LIMB(1) << (refmpn_random_half () % GMP_NUMB_BITS);
				2521	mask = 0;
				2522	run = 0;
				2523
				2524	for (i = size-1; i >= 0; i--)
				2525	{
				2526	limb = 0;
				2527	do
				2528	{
				2529	if (run == 0)
				2530	{
				2531	run = (refmpn_random_half () % RUN_MODULUS) + 1;
				2532	mask = ~mask;
				2533	}
				2534
				2535	limb \|= (bit & mask);
				2536	bit >>= 1;
				2537	run--;
				2538	}
				2539	while (bit != 0);
				2540
				2541	ptr[i] = limb;
				2542	bit = GMP_NUMB_HIGHBIT;
				2543	}
				2544	}
				2545
				2546	/* This is a simple bitwise algorithm working high to low across "s" and
				2547	testing each time whether setting the bit would make s^2 exceed n. */
				2548	mp_size_t
				2549	refmpn_sqrtrem (mp_ptr sp, mp_ptr rp, mp_srcptr np, mp_size_t nsize)
				2550	{
				2551	mp_ptr tp, dp;
				2552	mp_size_t ssize, talloc, tsize, dsize, ret, ilimbs;
				2553	unsigned ibit;
				2554	long i;
				2555	mp_limb_t c;
				2556
				2557	ASSERT (nsize >= 0);
				2558
				2559	/* If n==0, then s=0 and r=0. */
				2560	if (nsize == 0)
				2561	return 0;
				2562
				2563	ASSERT (np[nsize - 1] != 0);
				2564	ASSERT (rp == NULL \|\| MPN_SAME_OR_SEPARATE_P (np, rp, nsize));
				2565	ASSERT (rp == NULL \|\| ! MPN_OVERLAP_P (sp, (nsize + 1) / 2, rp, nsize));
				2566	ASSERT (! MPN_OVERLAP_P (sp, (nsize + 1) / 2, np, nsize));
				2567
				2568	/* root */
				2569	ssize = (nsize+1)/2;
				2570	refmpn_zero (sp, ssize);
				2571
				2572	/* the remainder so far */
				2573	dp = refmpn_memdup_limbs (np, nsize);
				2574	dsize = nsize;
				2575
				2576	/* temporary */
				2577	talloc = 2*ssize + 1;
				2578	tp = refmpn_malloc_limbs (talloc);
				2579
				2580	for (i = GMP_NUMB_BITS * ssize - 1; i >= 0; i--)
				2581	{
				2582	/* t = 2s2^i + 2^(2*i), being the amount s^2 will increase by if 2^i
				2583	is added to it */
				2584
				2585	ilimbs = (i+1) / GMP_NUMB_BITS;
				2586	ibit = (i+1) % GMP_NUMB_BITS;
				2587	refmpn_zero (tp, ilimbs);
				2588	c = refmpn_lshift_or_copy (tp+ilimbs, sp, ssize, ibit);
				2589	tsize = ilimbs + ssize;
				2590	tp[tsize] = c;
				2591	tsize += (c != 0);
				2592
				2593	ilimbs = (2*i) / GMP_NUMB_BITS;
				2594	ibit = (2*i) % GMP_NUMB_BITS;
				2595	if (ilimbs + 1 > tsize)
				2596	{
				2597	refmpn_zero_extend (tp, tsize, ilimbs + 1);
				2598	tsize = ilimbs + 1;
				2599	}
				2600	c = refmpn_add_1 (tp+ilimbs, tp+ilimbs, tsize-ilimbs,
				2601	CNST_LIMB(1) << ibit);
				2602	ASSERT (tsize < talloc);
				2603	tp[tsize] = c;
				2604	tsize += (c != 0);
				2605
				2606	if (refmpn_cmp_twosizes (dp, dsize, tp, tsize) >= 0)
				2607	{
				2608	/* set this bit in s and subtract from the remainder */
				2609	refmpn_setbit (sp, i);
				2610
				2611	ASSERT_NOCARRY (refmpn_sub_n (dp, dp, tp, dsize));
				2612	dsize = refmpn_normalize (dp, dsize);
				2613	}
				2614	}
				2615
				2616	if (rp == NULL)
				2617	{
				2618	ret = ! refmpn_zero_p (dp, dsize);
				2619	}
				2620	else
				2621	{
				2622	ASSERT (dsize == 0 \|\| dp[dsize-1] != 0);
				2623	refmpn_copy (rp, dp, dsize);
				2624	ret = dsize;
				2625	}
				2626
				2627	free (dp);
				2628	free (tp);
				2629	return ret;
				2630	}