Context Navigation

source: Daodan/MinGW/lib/gcc/mingw32/5.3.0/include/mmintrin.h@ 1086

Last change on this file since 1086 was 1046, checked in by alloc, 9 years ago
Daodan: Added Windows MinGW and build batch file
File size: 30.4 KB

Rev	Line
[1046]	1	/* Copyright (C) 2002-2015 Free Software Foundation, Inc.
	2
	3	This file is part of GCC.
	4
	5	GCC is free software; you can redistribute it and/or modify
	6	it under the terms of the GNU General Public License as published by
	7	the Free Software Foundation; either version 3, or (at your option)
	8	any later version.
	9
	10	GCC is distributed in the hope that it will be useful,
	11	but WITHOUT ANY WARRANTY; without even the implied warranty of
	12	MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the
	13	GNU General Public License for more details.
	14
	15	Under Section 7 of GPL version 3, you are granted additional
	16	permissions described in the GCC Runtime Library Exception, version
	17	3.1, as published by the Free Software Foundation.
	18
	19	You should have received a copy of the GNU General Public License and
	20	a copy of the GCC Runtime Library Exception along with this program;
	21	see the files COPYING3 and COPYING.RUNTIME respectively. If not, see
	22	<http://www.gnu.org/licenses/>. */
	23
	24	/* Implemented from the specification included in the Intel C++ Compiler
	25	User Guide and Reference, version 9.0. */
	26
	27	#ifndef _MMINTRIN_H_INCLUDED
	28	#define _MMINTRIN_H_INCLUDED
	29
	30	#ifndef __MMX__
	31	#pragma GCC push_options
	32	#pragma GCC target("mmx")
	33	#define __DISABLE_MMX__
	34	#endif /* __MMX__ */
	35
	36	/* The Intel API is flexible enough that we must allow aliasing with other
	37	vector types, and their scalar components. */
	38	typedef int __m64 __attribute__ ((__vector_size__ (8), __may_alias__));
	39
	40	/* Internal data types for implementing the intrinsics. */
	41	typedef int __v2si __attribute__ ((__vector_size__ (8)));
	42	typedef short __v4hi __attribute__ ((__vector_size__ (8)));
	43	typedef char __v8qi __attribute__ ((__vector_size__ (8)));
	44	typedef long long __v1di __attribute__ ((__vector_size__ (8)));
	45	typedef float __v2sf __attribute__ ((__vector_size__ (8)));
	46
	47	/* Empty the multimedia state. */
	48	extern __inline void __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	49	_mm_empty (void)
	50	{
	51	__builtin_ia32_emms ();
	52	}
	53
	54	extern __inline void __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	55	_m_empty (void)
	56	{
	57	_mm_empty ();
	58	}
	59
	60	/* Convert I to a __m64 object. The integer is zero-extended to 64-bits. */
	61	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	62	_mm_cvtsi32_si64 (int __i)
	63	{
	64	return (__m64) __builtin_ia32_vec_init_v2si (__i, 0);
	65	}
	66
	67	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	68	_m_from_int (int __i)
	69	{
	70	return _mm_cvtsi32_si64 (__i);
	71	}
	72
	73	#ifdef __x86_64__
	74	/* Convert I to a __m64 object. */
	75
	76	/* Intel intrinsic. */
	77	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	78	_m_from_int64 (long long __i)
	79	{
	80	return (__m64) __i;
	81	}
	82
	83	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	84	_mm_cvtsi64_m64 (long long __i)
	85	{
	86	return (__m64) __i;
	87	}
	88
	89	/* Microsoft intrinsic. */
	90	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	91	_mm_cvtsi64x_si64 (long long __i)
	92	{
	93	return (__m64) __i;
	94	}
	95
	96	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	97	_mm_set_pi64x (long long __i)
	98	{
	99	return (__m64) __i;
	100	}
	101	#endif
	102
	103	/* Convert the lower 32 bits of the __m64 object into an integer. */
	104	extern __inline int __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	105	_mm_cvtsi64_si32 (__m64 __i)
	106	{
	107	return __builtin_ia32_vec_ext_v2si ((__v2si)__i, 0);
	108	}
	109
	110	extern __inline int __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	111	_m_to_int (__m64 __i)
	112	{
	113	return _mm_cvtsi64_si32 (__i);
	114	}
	115
	116	#ifdef __x86_64__
	117	/* Convert the __m64 object to a 64bit integer. */
	118
	119	/* Intel intrinsic. */
	120	extern __inline long long __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	121	_m_to_int64 (__m64 __i)
	122	{
	123	return (long long)__i;
	124	}
	125
	126	extern __inline long long __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	127	_mm_cvtm64_si64 (__m64 __i)
	128	{
	129	return (long long)__i;
	130	}
	131
	132	/* Microsoft intrinsic. */
	133	extern __inline long long __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	134	_mm_cvtsi64_si64x (__m64 __i)
	135	{
	136	return (long long)__i;
	137	}
	138	#endif
	139
	140	/* Pack the four 16-bit values from M1 into the lower four 8-bit values of
	141	the result, and the four 16-bit values from M2 into the upper four 8-bit
	142	values of the result, all with signed saturation. */
	143	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	144	_mm_packs_pi16 (__m64 __m1, __m64 __m2)
	145	{
	146	return (__m64) __builtin_ia32_packsswb ((__v4hi)__m1, (__v4hi)__m2);
	147	}
	148
	149	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	150	_m_packsswb (__m64 __m1, __m64 __m2)
	151	{
	152	return _mm_packs_pi16 (__m1, __m2);
	153	}
	154
	155	/* Pack the two 32-bit values from M1 in to the lower two 16-bit values of
	156	the result, and the two 32-bit values from M2 into the upper two 16-bit
	157	values of the result, all with signed saturation. */
	158	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	159	_mm_packs_pi32 (__m64 __m1, __m64 __m2)
	160	{
	161	return (__m64) __builtin_ia32_packssdw ((__v2si)__m1, (__v2si)__m2);
	162	}
	163
	164	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	165	_m_packssdw (__m64 __m1, __m64 __m2)
	166	{
	167	return _mm_packs_pi32 (__m1, __m2);
	168	}
	169
	170	/* Pack the four 16-bit values from M1 into the lower four 8-bit values of
	171	the result, and the four 16-bit values from M2 into the upper four 8-bit
	172	values of the result, all with unsigned saturation. */
	173	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	174	_mm_packs_pu16 (__m64 __m1, __m64 __m2)
	175	{
	176	return (__m64) __builtin_ia32_packuswb ((__v4hi)__m1, (__v4hi)__m2);
	177	}
	178
	179	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	180	_m_packuswb (__m64 __m1, __m64 __m2)
	181	{
	182	return _mm_packs_pu16 (__m1, __m2);
	183	}
	184
	185	/* Interleave the four 8-bit values from the high half of M1 with the four
	186	8-bit values from the high half of M2. */
	187	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	188	_mm_unpackhi_pi8 (__m64 __m1, __m64 __m2)
	189	{
	190	return (__m64) __builtin_ia32_punpckhbw ((__v8qi)__m1, (__v8qi)__m2);
	191	}
	192
	193	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	194	_m_punpckhbw (__m64 __m1, __m64 __m2)
	195	{
	196	return _mm_unpackhi_pi8 (__m1, __m2);
	197	}
	198
	199	/* Interleave the two 16-bit values from the high half of M1 with the two
	200	16-bit values from the high half of M2. */
	201	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	202	_mm_unpackhi_pi16 (__m64 __m1, __m64 __m2)
	203	{
	204	return (__m64) __builtin_ia32_punpckhwd ((__v4hi)__m1, (__v4hi)__m2);
	205	}
	206
	207	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	208	_m_punpckhwd (__m64 __m1, __m64 __m2)
	209	{
	210	return _mm_unpackhi_pi16 (__m1, __m2);
	211	}
	212
	213	/* Interleave the 32-bit value from the high half of M1 with the 32-bit
	214	value from the high half of M2. */
	215	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	216	_mm_unpackhi_pi32 (__m64 __m1, __m64 __m2)
	217	{
	218	return (__m64) __builtin_ia32_punpckhdq ((__v2si)__m1, (__v2si)__m2);
	219	}
	220
	221	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	222	_m_punpckhdq (__m64 __m1, __m64 __m2)
	223	{
	224	return _mm_unpackhi_pi32 (__m1, __m2);
	225	}
	226
	227	/* Interleave the four 8-bit values from the low half of M1 with the four
	228	8-bit values from the low half of M2. */
	229	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	230	_mm_unpacklo_pi8 (__m64 __m1, __m64 __m2)
	231	{
	232	return (__m64) __builtin_ia32_punpcklbw ((__v8qi)__m1, (__v8qi)__m2);
	233	}
	234
	235	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	236	_m_punpcklbw (__m64 __m1, __m64 __m2)
	237	{
	238	return _mm_unpacklo_pi8 (__m1, __m2);
	239	}
	240
	241	/* Interleave the two 16-bit values from the low half of M1 with the two
	242	16-bit values from the low half of M2. */
	243	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	244	_mm_unpacklo_pi16 (__m64 __m1, __m64 __m2)
	245	{
	246	return (__m64) __builtin_ia32_punpcklwd ((__v4hi)__m1, (__v4hi)__m2);
	247	}
	248
	249	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	250	_m_punpcklwd (__m64 __m1, __m64 __m2)
	251	{
	252	return _mm_unpacklo_pi16 (__m1, __m2);
	253	}
	254
	255	/* Interleave the 32-bit value from the low half of M1 with the 32-bit
	256	value from the low half of M2. */
	257	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	258	_mm_unpacklo_pi32 (__m64 __m1, __m64 __m2)
	259	{
	260	return (__m64) __builtin_ia32_punpckldq ((__v2si)__m1, (__v2si)__m2);
	261	}
	262
	263	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	264	_m_punpckldq (__m64 __m1, __m64 __m2)
	265	{
	266	return _mm_unpacklo_pi32 (__m1, __m2);
	267	}
	268
	269	/* Add the 8-bit values in M1 to the 8-bit values in M2. */
	270	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	271	_mm_add_pi8 (__m64 __m1, __m64 __m2)
	272	{
	273	return (__m64) __builtin_ia32_paddb ((__v8qi)__m1, (__v8qi)__m2);
	274	}
	275
	276	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	277	_m_paddb (__m64 __m1, __m64 __m2)
	278	{
	279	return _mm_add_pi8 (__m1, __m2);
	280	}
	281
	282	/* Add the 16-bit values in M1 to the 16-bit values in M2. */
	283	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	284	_mm_add_pi16 (__m64 __m1, __m64 __m2)
	285	{
	286	return (__m64) __builtin_ia32_paddw ((__v4hi)__m1, (__v4hi)__m2);
	287	}
	288
	289	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	290	_m_paddw (__m64 __m1, __m64 __m2)
	291	{
	292	return _mm_add_pi16 (__m1, __m2);
	293	}
	294
	295	/* Add the 32-bit values in M1 to the 32-bit values in M2. */
	296	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	297	_mm_add_pi32 (__m64 __m1, __m64 __m2)
	298	{
	299	return (__m64) __builtin_ia32_paddd ((__v2si)__m1, (__v2si)__m2);
	300	}
	301
	302	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	303	_m_paddd (__m64 __m1, __m64 __m2)
	304	{
	305	return _mm_add_pi32 (__m1, __m2);
	306	}
	307
	308	/* Add the 64-bit values in M1 to the 64-bit values in M2. */
	309	#ifndef __SSE2__
	310	#pragma GCC push_options
	311	#pragma GCC target("sse2")
	312	#define __DISABLE_SSE2__
	313	#endif /* __SSE2__ */
	314
	315	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	316	_mm_add_si64 (__m64 __m1, __m64 __m2)
	317	{
	318	return (__m64) __builtin_ia32_paddq ((__v1di)__m1, (__v1di)__m2);
	319	}
	320	#ifdef __DISABLE_SSE2__
	321	#undef __DISABLE_SSE2__
	322	#pragma GCC pop_options
	323	#endif /* __DISABLE_SSE2__ */
	324
	325	/* Add the 8-bit values in M1 to the 8-bit values in M2 using signed
	326	saturated arithmetic. */
	327	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	328	_mm_adds_pi8 (__m64 __m1, __m64 __m2)
	329	{
	330	return (__m64) __builtin_ia32_paddsb ((__v8qi)__m1, (__v8qi)__m2);
	331	}
	332
	333	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	334	_m_paddsb (__m64 __m1, __m64 __m2)
	335	{
	336	return _mm_adds_pi8 (__m1, __m2);
	337	}
	338
	339	/* Add the 16-bit values in M1 to the 16-bit values in M2 using signed
	340	saturated arithmetic. */
	341	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	342	_mm_adds_pi16 (__m64 __m1, __m64 __m2)
	343	{
	344	return (__m64) __builtin_ia32_paddsw ((__v4hi)__m1, (__v4hi)__m2);
	345	}
	346
	347	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	348	_m_paddsw (__m64 __m1, __m64 __m2)
	349	{
	350	return _mm_adds_pi16 (__m1, __m2);
	351	}
	352
	353	/* Add the 8-bit values in M1 to the 8-bit values in M2 using unsigned
	354	saturated arithmetic. */
	355	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	356	_mm_adds_pu8 (__m64 __m1, __m64 __m2)
	357	{
	358	return (__m64) __builtin_ia32_paddusb ((__v8qi)__m1, (__v8qi)__m2);
	359	}
	360
	361	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	362	_m_paddusb (__m64 __m1, __m64 __m2)
	363	{
	364	return _mm_adds_pu8 (__m1, __m2);
	365	}
	366
	367	/* Add the 16-bit values in M1 to the 16-bit values in M2 using unsigned
	368	saturated arithmetic. */
	369	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	370	_mm_adds_pu16 (__m64 __m1, __m64 __m2)
	371	{
	372	return (__m64) __builtin_ia32_paddusw ((__v4hi)__m1, (__v4hi)__m2);
	373	}
	374
	375	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	376	_m_paddusw (__m64 __m1, __m64 __m2)
	377	{
	378	return _mm_adds_pu16 (__m1, __m2);
	379	}
	380
	381	/* Subtract the 8-bit values in M2 from the 8-bit values in M1. */
	382	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	383	_mm_sub_pi8 (__m64 __m1, __m64 __m2)
	384	{
	385	return (__m64) __builtin_ia32_psubb ((__v8qi)__m1, (__v8qi)__m2);
	386	}
	387
	388	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	389	_m_psubb (__m64 __m1, __m64 __m2)
	390	{
	391	return _mm_sub_pi8 (__m1, __m2);
	392	}
	393
	394	/* Subtract the 16-bit values in M2 from the 16-bit values in M1. */
	395	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	396	_mm_sub_pi16 (__m64 __m1, __m64 __m2)
	397	{
	398	return (__m64) __builtin_ia32_psubw ((__v4hi)__m1, (__v4hi)__m2);
	399	}
	400
	401	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	402	_m_psubw (__m64 __m1, __m64 __m2)
	403	{
	404	return _mm_sub_pi16 (__m1, __m2);
	405	}
	406
	407	/* Subtract the 32-bit values in M2 from the 32-bit values in M1. */
	408	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	409	_mm_sub_pi32 (__m64 __m1, __m64 __m2)
	410	{
	411	return (__m64) __builtin_ia32_psubd ((__v2si)__m1, (__v2si)__m2);
	412	}
	413
	414	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	415	_m_psubd (__m64 __m1, __m64 __m2)
	416	{
	417	return _mm_sub_pi32 (__m1, __m2);
	418	}
	419
	420	/* Add the 64-bit values in M1 to the 64-bit values in M2. */
	421	#ifndef __SSE2__
	422	#pragma GCC push_options
	423	#pragma GCC target("sse2")
	424	#define __DISABLE_SSE2__
	425	#endif /* __SSE2__ */
	426
	427	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	428	_mm_sub_si64 (__m64 __m1, __m64 __m2)
	429	{
	430	return (__m64) __builtin_ia32_psubq ((__v1di)__m1, (__v1di)__m2);
	431	}
	432	#ifdef __DISABLE_SSE2__
	433	#undef __DISABLE_SSE2__
	434	#pragma GCC pop_options
	435	#endif /* __DISABLE_SSE2__ */
	436
	437	/* Subtract the 8-bit values in M2 from the 8-bit values in M1 using signed
	438	saturating arithmetic. */
	439	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	440	_mm_subs_pi8 (__m64 __m1, __m64 __m2)
	441	{
	442	return (__m64) __builtin_ia32_psubsb ((__v8qi)__m1, (__v8qi)__m2);
	443	}
	444
	445	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	446	_m_psubsb (__m64 __m1, __m64 __m2)
	447	{
	448	return _mm_subs_pi8 (__m1, __m2);
	449	}
	450
	451	/* Subtract the 16-bit values in M2 from the 16-bit values in M1 using
	452	signed saturating arithmetic. */
	453	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	454	_mm_subs_pi16 (__m64 __m1, __m64 __m2)
	455	{
	456	return (__m64) __builtin_ia32_psubsw ((__v4hi)__m1, (__v4hi)__m2);
	457	}
	458
	459	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	460	_m_psubsw (__m64 __m1, __m64 __m2)
	461	{
	462	return _mm_subs_pi16 (__m1, __m2);
	463	}
	464
	465	/* Subtract the 8-bit values in M2 from the 8-bit values in M1 using
	466	unsigned saturating arithmetic. */
	467	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	468	_mm_subs_pu8 (__m64 __m1, __m64 __m2)
	469	{
	470	return (__m64) __builtin_ia32_psubusb ((__v8qi)__m1, (__v8qi)__m2);
	471	}
	472
	473	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	474	_m_psubusb (__m64 __m1, __m64 __m2)
	475	{
	476	return _mm_subs_pu8 (__m1, __m2);
	477	}
	478
	479	/* Subtract the 16-bit values in M2 from the 16-bit values in M1 using
	480	unsigned saturating arithmetic. */
	481	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	482	_mm_subs_pu16 (__m64 __m1, __m64 __m2)
	483	{
	484	return (__m64) __builtin_ia32_psubusw ((__v4hi)__m1, (__v4hi)__m2);
	485	}
	486
	487	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	488	_m_psubusw (__m64 __m1, __m64 __m2)
	489	{
	490	return _mm_subs_pu16 (__m1, __m2);
	491	}
	492
	493	/* Multiply four 16-bit values in M1 by four 16-bit values in M2 producing
	494	four 32-bit intermediate results, which are then summed by pairs to
	495	produce two 32-bit results. */
	496	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	497	_mm_madd_pi16 (__m64 __m1, __m64 __m2)
	498	{
	499	return (__m64) __builtin_ia32_pmaddwd ((__v4hi)__m1, (__v4hi)__m2);
	500	}
	501
	502	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	503	_m_pmaddwd (__m64 __m1, __m64 __m2)
	504	{
	505	return _mm_madd_pi16 (__m1, __m2);
	506	}
	507
	508	/* Multiply four signed 16-bit values in M1 by four signed 16-bit values in
	509	M2 and produce the high 16 bits of the 32-bit results. */
	510	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	511	_mm_mulhi_pi16 (__m64 __m1, __m64 __m2)
	512	{
	513	return (__m64) __builtin_ia32_pmulhw ((__v4hi)__m1, (__v4hi)__m2);
	514	}
	515
	516	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	517	_m_pmulhw (__m64 __m1, __m64 __m2)
	518	{
	519	return _mm_mulhi_pi16 (__m1, __m2);
	520	}
	521
	522	/* Multiply four 16-bit values in M1 by four 16-bit values in M2 and produce
	523	the low 16 bits of the results. */
	524	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	525	_mm_mullo_pi16 (__m64 __m1, __m64 __m2)
	526	{
	527	return (__m64) __builtin_ia32_pmullw ((__v4hi)__m1, (__v4hi)__m2);
	528	}
	529
	530	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	531	_m_pmullw (__m64 __m1, __m64 __m2)
	532	{
	533	return _mm_mullo_pi16 (__m1, __m2);
	534	}
	535
	536	/* Shift four 16-bit values in M left by COUNT. */
	537	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	538	_mm_sll_pi16 (__m64 __m, __m64 __count)
	539	{
	540	return (__m64) __builtin_ia32_psllw ((__v4hi)__m, (__v4hi)__count);
	541	}
	542
	543	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	544	_m_psllw (__m64 __m, __m64 __count)
	545	{
	546	return _mm_sll_pi16 (__m, __count);
	547	}
	548
	549	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	550	_mm_slli_pi16 (__m64 __m, int __count)
	551	{
	552	return (__m64) __builtin_ia32_psllwi ((__v4hi)__m, __count);
	553	}
	554
	555	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	556	_m_psllwi (__m64 __m, int __count)
	557	{
	558	return _mm_slli_pi16 (__m, __count);
	559	}
	560
	561	/* Shift two 32-bit values in M left by COUNT. */
	562	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	563	_mm_sll_pi32 (__m64 __m, __m64 __count)
	564	{
	565	return (__m64) __builtin_ia32_pslld ((__v2si)__m, (__v2si)__count);
	566	}
	567
	568	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	569	_m_pslld (__m64 __m, __m64 __count)
	570	{
	571	return _mm_sll_pi32 (__m, __count);
	572	}
	573
	574	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	575	_mm_slli_pi32 (__m64 __m, int __count)
	576	{
	577	return (__m64) __builtin_ia32_pslldi ((__v2si)__m, __count);
	578	}
	579
	580	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	581	_m_pslldi (__m64 __m, int __count)
	582	{
	583	return _mm_slli_pi32 (__m, __count);
	584	}
	585
	586	/* Shift the 64-bit value in M left by COUNT. */
	587	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	588	_mm_sll_si64 (__m64 __m, __m64 __count)
	589	{
	590	return (__m64) __builtin_ia32_psllq ((__v1di)__m, (__v1di)__count);
	591	}
	592
	593	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	594	_m_psllq (__m64 __m, __m64 __count)
	595	{
	596	return _mm_sll_si64 (__m, __count);
	597	}
	598
	599	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	600	_mm_slli_si64 (__m64 __m, int __count)
	601	{
	602	return (__m64) __builtin_ia32_psllqi ((__v1di)__m, __count);
	603	}
	604
	605	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	606	_m_psllqi (__m64 __m, int __count)
	607	{
	608	return _mm_slli_si64 (__m, __count);
	609	}
	610
	611	/* Shift four 16-bit values in M right by COUNT; shift in the sign bit. */
	612	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	613	_mm_sra_pi16 (__m64 __m, __m64 __count)
	614	{
	615	return (__m64) __builtin_ia32_psraw ((__v4hi)__m, (__v4hi)__count);
	616	}
	617
	618	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	619	_m_psraw (__m64 __m, __m64 __count)
	620	{
	621	return _mm_sra_pi16 (__m, __count);
	622	}
	623
	624	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	625	_mm_srai_pi16 (__m64 __m, int __count)
	626	{
	627	return (__m64) __builtin_ia32_psrawi ((__v4hi)__m, __count);
	628	}
	629
	630	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	631	_m_psrawi (__m64 __m, int __count)
	632	{
	633	return _mm_srai_pi16 (__m, __count);
	634	}
	635
	636	/* Shift two 32-bit values in M right by COUNT; shift in the sign bit. */
	637	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	638	_mm_sra_pi32 (__m64 __m, __m64 __count)
	639	{
	640	return (__m64) __builtin_ia32_psrad ((__v2si)__m, (__v2si)__count);
	641	}
	642
	643	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	644	_m_psrad (__m64 __m, __m64 __count)
	645	{
	646	return _mm_sra_pi32 (__m, __count);
	647	}
	648
	649	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	650	_mm_srai_pi32 (__m64 __m, int __count)
	651	{
	652	return (__m64) __builtin_ia32_psradi ((__v2si)__m, __count);
	653	}
	654
	655	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	656	_m_psradi (__m64 __m, int __count)
	657	{
	658	return _mm_srai_pi32 (__m, __count);
	659	}
	660
	661	/* Shift four 16-bit values in M right by COUNT; shift in zeros. */
	662	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	663	_mm_srl_pi16 (__m64 __m, __m64 __count)
	664	{
	665	return (__m64) __builtin_ia32_psrlw ((__v4hi)__m, (__v4hi)__count);
	666	}
	667
	668	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	669	_m_psrlw (__m64 __m, __m64 __count)
	670	{
	671	return _mm_srl_pi16 (__m, __count);
	672	}
	673
	674	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	675	_mm_srli_pi16 (__m64 __m, int __count)
	676	{
	677	return (__m64) __builtin_ia32_psrlwi ((__v4hi)__m, __count);
	678	}
	679
	680	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	681	_m_psrlwi (__m64 __m, int __count)
	682	{
	683	return _mm_srli_pi16 (__m, __count);
	684	}
	685
	686	/* Shift two 32-bit values in M right by COUNT; shift in zeros. */
	687	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	688	_mm_srl_pi32 (__m64 __m, __m64 __count)
	689	{
	690	return (__m64) __builtin_ia32_psrld ((__v2si)__m, (__v2si)__count);
	691	}
	692
	693	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	694	_m_psrld (__m64 __m, __m64 __count)
	695	{
	696	return _mm_srl_pi32 (__m, __count);
	697	}
	698
	699	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	700	_mm_srli_pi32 (__m64 __m, int __count)
	701	{
	702	return (__m64) __builtin_ia32_psrldi ((__v2si)__m, __count);
	703	}
	704
	705	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	706	_m_psrldi (__m64 __m, int __count)
	707	{
	708	return _mm_srli_pi32 (__m, __count);
	709	}
	710
	711	/* Shift the 64-bit value in M left by COUNT; shift in zeros. */
	712	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	713	_mm_srl_si64 (__m64 __m, __m64 __count)
	714	{
	715	return (__m64) __builtin_ia32_psrlq ((__v1di)__m, (__v1di)__count);
	716	}
	717
	718	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	719	_m_psrlq (__m64 __m, __m64 __count)
	720	{
	721	return _mm_srl_si64 (__m, __count);
	722	}
	723
	724	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	725	_mm_srli_si64 (__m64 __m, int __count)
	726	{
	727	return (__m64) __builtin_ia32_psrlqi ((__v1di)__m, __count);
	728	}
	729
	730	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	731	_m_psrlqi (__m64 __m, int __count)
	732	{
	733	return _mm_srli_si64 (__m, __count);
	734	}
	735
	736	/* Bit-wise AND the 64-bit values in M1 and M2. */
	737	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	738	_mm_and_si64 (__m64 __m1, __m64 __m2)
	739	{
	740	return __builtin_ia32_pand (__m1, __m2);
	741	}
	742
	743	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	744	_m_pand (__m64 __m1, __m64 __m2)
	745	{
	746	return _mm_and_si64 (__m1, __m2);
	747	}
	748
	749	/* Bit-wise complement the 64-bit value in M1 and bit-wise AND it with the
	750	64-bit value in M2. */
	751	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	752	_mm_andnot_si64 (__m64 __m1, __m64 __m2)
	753	{
	754	return __builtin_ia32_pandn (__m1, __m2);
	755	}
	756
	757	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	758	_m_pandn (__m64 __m1, __m64 __m2)
	759	{
	760	return _mm_andnot_si64 (__m1, __m2);
	761	}
	762
	763	/* Bit-wise inclusive OR the 64-bit values in M1 and M2. */
	764	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	765	_mm_or_si64 (__m64 __m1, __m64 __m2)
	766	{
	767	return __builtin_ia32_por (__m1, __m2);
	768	}
	769
	770	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	771	_m_por (__m64 __m1, __m64 __m2)
	772	{
	773	return _mm_or_si64 (__m1, __m2);
	774	}
	775
	776	/* Bit-wise exclusive OR the 64-bit values in M1 and M2. */
	777	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	778	_mm_xor_si64 (__m64 __m1, __m64 __m2)
	779	{
	780	return __builtin_ia32_pxor (__m1, __m2);
	781	}
	782
	783	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	784	_m_pxor (__m64 __m1, __m64 __m2)
	785	{
	786	return _mm_xor_si64 (__m1, __m2);
	787	}
	788
	789	/* Compare eight 8-bit values. The result of the comparison is 0xFF if the
	790	test is true and zero if false. */
	791	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	792	_mm_cmpeq_pi8 (__m64 __m1, __m64 __m2)
	793	{
	794	return (__m64) __builtin_ia32_pcmpeqb ((__v8qi)__m1, (__v8qi)__m2);
	795	}
	796
	797	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	798	_m_pcmpeqb (__m64 __m1, __m64 __m2)
	799	{
	800	return _mm_cmpeq_pi8 (__m1, __m2);
	801	}
	802
	803	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	804	_mm_cmpgt_pi8 (__m64 __m1, __m64 __m2)
	805	{
	806	return (__m64) __builtin_ia32_pcmpgtb ((__v8qi)__m1, (__v8qi)__m2);
	807	}
	808
	809	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	810	_m_pcmpgtb (__m64 __m1, __m64 __m2)
	811	{
	812	return _mm_cmpgt_pi8 (__m1, __m2);
	813	}
	814
	815	/* Compare four 16-bit values. The result of the comparison is 0xFFFF if
	816	the test is true and zero if false. */
	817	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	818	_mm_cmpeq_pi16 (__m64 __m1, __m64 __m2)
	819	{
	820	return (__m64) __builtin_ia32_pcmpeqw ((__v4hi)__m1, (__v4hi)__m2);
	821	}
	822
	823	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	824	_m_pcmpeqw (__m64 __m1, __m64 __m2)
	825	{
	826	return _mm_cmpeq_pi16 (__m1, __m2);
	827	}
	828
	829	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	830	_mm_cmpgt_pi16 (__m64 __m1, __m64 __m2)
	831	{
	832	return (__m64) __builtin_ia32_pcmpgtw ((__v4hi)__m1, (__v4hi)__m2);
	833	}
	834
	835	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	836	_m_pcmpgtw (__m64 __m1, __m64 __m2)
	837	{
	838	return _mm_cmpgt_pi16 (__m1, __m2);
	839	}
	840
	841	/* Compare two 32-bit values. The result of the comparison is 0xFFFFFFFF if
	842	the test is true and zero if false. */
	843	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	844	_mm_cmpeq_pi32 (__m64 __m1, __m64 __m2)
	845	{
	846	return (__m64) __builtin_ia32_pcmpeqd ((__v2si)__m1, (__v2si)__m2);
	847	}
	848
	849	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	850	_m_pcmpeqd (__m64 __m1, __m64 __m2)
	851	{
	852	return _mm_cmpeq_pi32 (__m1, __m2);
	853	}
	854
	855	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	856	_mm_cmpgt_pi32 (__m64 __m1, __m64 __m2)
	857	{
	858	return (__m64) __builtin_ia32_pcmpgtd ((__v2si)__m1, (__v2si)__m2);
	859	}
	860
	861	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	862	_m_pcmpgtd (__m64 __m1, __m64 __m2)
	863	{
	864	return _mm_cmpgt_pi32 (__m1, __m2);
	865	}
	866
	867	/* Creates a 64-bit zero. */
	868	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	869	_mm_setzero_si64 (void)
	870	{
	871	return (__m64)0LL;
	872	}
	873
	874	/* Creates a vector of two 32-bit values; I0 is least significant. */
	875	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	876	_mm_set_pi32 (int __i1, int __i0)
	877	{
	878	return (__m64) __builtin_ia32_vec_init_v2si (__i0, __i1);
	879	}
	880
	881	/* Creates a vector of four 16-bit values; W0 is least significant. */
	882	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	883	_mm_set_pi16 (short __w3, short __w2, short __w1, short __w0)
	884	{
	885	return (__m64) __builtin_ia32_vec_init_v4hi (__w0, __w1, __w2, __w3);
	886	}
	887
	888	/* Creates a vector of eight 8-bit values; B0 is least significant. */
	889	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	890	_mm_set_pi8 (char __b7, char __b6, char __b5, char __b4,
	891	char __b3, char __b2, char __b1, char __b0)
	892	{
	893	return (__m64) __builtin_ia32_vec_init_v8qi (__b0, __b1, __b2, __b3,
	894	__b4, __b5, __b6, __b7);
	895	}
	896
	897	/* Similar, but with the arguments in reverse order. */
	898	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	899	_mm_setr_pi32 (int __i0, int __i1)
	900	{
	901	return _mm_set_pi32 (__i1, __i0);
	902	}
	903
	904	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	905	_mm_setr_pi16 (short __w0, short __w1, short __w2, short __w3)
	906	{
	907	return _mm_set_pi16 (__w3, __w2, __w1, __w0);
	908	}
	909
	910	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	911	_mm_setr_pi8 (char __b0, char __b1, char __b2, char __b3,
	912	char __b4, char __b5, char __b6, char __b7)
	913	{
	914	return _mm_set_pi8 (__b7, __b6, __b5, __b4, __b3, __b2, __b1, __b0);
	915	}
	916
	917	/* Creates a vector of two 32-bit values, both elements containing I. */
	918	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	919	_mm_set1_pi32 (int __i)
	920	{
	921	return _mm_set_pi32 (__i, __i);
	922	}
	923
	924	/* Creates a vector of four 16-bit values, all elements containing W. */
	925	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	926	_mm_set1_pi16 (short __w)
	927	{
	928	return _mm_set_pi16 (__w, __w, __w, __w);
	929	}
	930
	931	/* Creates a vector of eight 8-bit values, all elements containing B. */
	932	extern __inline __m64 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
	933	_mm_set1_pi8 (char __b)
	934	{
	935	return _mm_set_pi8 (__b, __b, __b, __b, __b, __b, __b, __b);
	936	}
	937	#ifdef __DISABLE_MMX__
	938	#undef __DISABLE_MMX__
	939	#pragma GCC pop_options
	940	#endif /* __DISABLE_MMX__ */
	941
	942	#endif /* _MMINTRIN_H_INCLUDED */

Note: See TracBrowser for help on using the repository browser.

Download in other formats: