Commits · 6bc4b9c7f80bdad5f16ea4e8550555352563cb4e · Roger Ferrer / llvm-epi-0.8

Apr 03, 2006
- Remove unused method · 6bc4b9c7
  Chris Lattner authored Apr 03, 2006
```
llvm-svn: 27379
```
  6bc4b9c7
- Add a missing check, this fixes UnitTests/Vector/sumarray.c · e1e3adf8
  Chris Lattner authored Apr 03, 2006
```
llvm-svn: 27375
```
  e1e3adf8
- Add a missing check, which broke a bunch of vector tests. · 04c00fc8
  Chris Lattner authored Apr 03, 2006
```
llvm-svn: 27374
```
  04c00fc8
- back this out · 94f012f6
  Andrew Lenharth authored Apr 03, 2006
```
llvm-svn: 27367
```
  94f012f6
Apr 02, 2006

This should be a win of every arch · 015eaf5f
Andrew Lenharth authored Apr 02, 2006
```
llvm-svn: 27364
```
015eaf5f

Add a little dag combine to compile this: · 4993249a

Chris Lattner authored Apr 02, 2006

int %AreSecondAndThirdElementsBothNegative(<4 x float>* %in) {
entry:
        %tmp1 = load <4 x float>* %in           ; <<4 x float>> [#uses=1]
        %tmp = tail call int %llvm.ppc.altivec.vcmpgefp.p( int 1, <4 x float> < float 0x7FF8000000000000, float 0.000000e+00, float 0.000000e+00, float 0x7FF8000000000000 >, <4 x float> %tmp1 )           ; <int> [#uses=1]
        %tmp = seteq int %tmp, 0                ; <bool> [#uses=1]
        %tmp3 = cast bool %tmp to int           ; <int> [#uses=1]
        ret int %tmp3
}

into this:

_AreSecondAndThirdElementsBothNegative:
        mfspr r2, 256
        oris r4, r2, 49152
        mtspr 256, r4
        li r4, lo16(LCPI1_0)
        lis r5, ha16(LCPI1_0)
        lvx v0, 0, r3
        lvx v1, r5, r4
        vcmpgefp. v0, v1, v0
        mfcr r3, 2
        rlwinm r3, r3, 27, 31, 31
        mtspr 256, r2
        blr

instead of this:

_AreSecondAndThirdElementsBothNegative:
        mfspr r2, 256
        oris r4, r2, 49152
        mtspr 256, r4
        li r4, lo16(LCPI1_0)
        lis r5, ha16(LCPI1_0)
        lvx v0, 0, r3
        lvx v1, r5, r4
        vcmpgefp. v0, v1, v0
        mfcr r3, 2
        rlwinm r3, r3, 27, 31, 31
        xori r3, r3, 1
        cntlzw r3, r3
        srwi r3, r3, 5
        mtspr 256, r2
        blr

llvm-svn: 27356

4993249a

Implement promotion for EXTRACT_VECTOR_ELT, allowing v16i8 multiplies to work with PowerPC. · 42a5fca4
Chris Lattner authored Apr 02, 2006
```
llvm-svn: 27349
```
42a5fca4

Implement the Expand action for binary vector operations to break the binop · 87f08094

Chris Lattner authored Apr 02, 2006

into elements and operate on each piece.  This allows generic vector integer
multiplies to work on PPC, though the generated code is horrible.

llvm-svn: 27347

87f08094

Intrinsics that just load from memory can be treated like loads: they don't · a9c59156
Chris Lattner authored Apr 02, 2006
```
have to serialize against each other.  This allows us to schedule lvx's
across each other, for example.

llvm-svn: 27346
```
a9c59156

Constant fold all of the vector binops. This allows us to compile this: · 0442a187

Chris Lattner authored Apr 02, 2006

"vector unsigned char mergeLowHigh = (vector unsigned char)
( 8, 9, 10, 11, 16, 17, 18, 19, 12, 13, 14, 15, 20, 21, 22, 23 );
vector unsigned char mergeHighLow = vec_xor( mergeLowHigh, vec_splat_u8(8));"

aka:

void %test2(<16 x sbyte>* %P) {
  store <16 x sbyte> cast (<4 x int> xor (<4 x int> cast (<16 x ubyte> < ubyte 8, ubyte 9, ubyte 10, ubyte 11, ubyte 16, ubyte 17, ubyte 18, ubyte 19, ubyte 12, ubyte 13, ubyte 14, ubyte 15, ubyte 20, ubyte 21, ubyte 22, ubyte 23 > to <4 x int>), <4 x int> cast (<16 x sbyte> < sbyte 8, sbyte 8, sbyte 8, sbyte 8, sbyte 8, sbyte 8, sbyte 8, sbyte 8, sbyte 8, sbyte 8, sbyte 8, sbyte 8, sbyte 8, sbyte 8, sbyte 8, sbyte 8 > to <4 x int>)) to <16 x sbyte>), <16 x sbyte> * %P
  ret void
}

into this:

_test2:
        mfspr r2, 256
        oris r4, r2, 32768
        mtspr 256, r4
        li r4, lo16(LCPI2_0)
        lis r5, ha16(LCPI2_0)
        lvx v0, r5, r4
        stvx v0, 0, r3
        mtspr 256, r2
        blr

instead of this:

_test2:
        mfspr r2, 256
        oris r4, r2, 49152
        mtspr 256, r4
        li r4, lo16(LCPI2_0)
        lis r5, ha16(LCPI2_0)
        vspltisb v0, 8
        lvx v1, r5, r4
        vxor v0, v1, v0
        stvx v0, 0, r3
        mtspr 256, r2
        blr

... which occurs here:
http://developer.apple.com/hardware/ve/calcspeed.html

llvm-svn: 27343

0442a187

Add a new -view-legalize-dags command line option · ef598059
Chris Lattner authored Apr 02, 2006
```
llvm-svn: 27342
```
ef598059
Implement constant folding of bit_convert of arbitrary constant vbuild_vector nodes. · e4e64b6b
Chris Lattner authored Apr 02, 2006
```
llvm-svn: 27341
```
e4e64b6b
These entries already exist · 1c227287
Chris Lattner authored Apr 02, 2006
```
llvm-svn: 27340
```
1c227287
Add some missing node names · 1985e1cb
Chris Lattner authored Apr 02, 2006
```
llvm-svn: 27339
```
1985e1cb
Prefer larger register classes over smaller ones when a register occurs in · bec582f4
Chris Lattner authored Apr 02, 2006
```
multiple register classes.  This fixes PowerPC/2006-04-01-FloatDoubleExtend.ll

llvm-svn: 27334
```
bec582f4

Apr 01, 2006
- Delete identity shuffles, implementing CodeGen/Generic/vector-identity-shuffle.ll · 39dcf1a9
  Chris Lattner authored Mar 31, 2006
```
llvm-svn: 27317
```
  39dcf1a9
Mar 31, 2006

Do not endian swap split vector loads. This fixes UnitTests/Vector/sumarray-dbl on PPC. · d9e4daab
Chris Lattner authored Mar 31, 2006
```
Now all UnitTests/Vector/* tests pass on PPC.

llvm-svn: 27299
```
d9e4daab
Do not endian swap the operands to a store if the operands came from a vector. · 8d90f526
Chris Lattner authored Mar 31, 2006
```
This fixes UnitTests/Vector/simple.c with altivec.

llvm-svn: 27298
```
8d90f526

Remove dead *extloads. This allows us to codegen vector.ll:test_extract_elt · 7e30af38

Chris Lattner authored Mar 31, 2006

to:

test_extract_elt:
        alloc r3 = ar.pfs,0,1,0,0
        adds r8 = 12, r32
        ;;
        ldfs f8 = [r8]
        mov ar.pfs = r3
        br.ret.sptk.many rp

instead of:

test_extract_elt:
        alloc r3 = ar.pfs,0,1,0,0
        adds r8 = 28, r32
        adds r9 = 24, r32
        adds r10 = 20, r32
        adds r11 = 16, r32
        ;;
        ldfs f6 = [r8]
        ;;
        ldfs f6 = [r9]
        adds r8 = 12, r32
        adds r9 = 8, r32
        adds r14 = 4, r32
        ;;
        ldfs f6 = [r10]
        ;;
        ldfs f6 = [r11]
        ldfs f8 = [r8]
        ;;
        ldfs f6 = [r9]
        ;;
        ldfs f6 = [r14]
        ;;
        ldfs f6 = [r32]
        mov ar.pfs = r3
        br.ret.sptk.many rp

llvm-svn: 27297

7e30af38

Delete dead loads in the dag. This allows us to compile · 2d8551c8

Chris Lattner authored Mar 31, 2006

vector.ll:test_extract_elt2 into:

_test_extract_elt2:
        lfd f1, 32(r3)
        blr

instead of:

_test_extract_elt2:
        lfd f0, 56(r3)
        lfd f0, 48(r3)
        lfd f0, 40(r3)
        lfd f1, 32(r3)
        lfd f0, 24(r3)
        lfd f0, 16(r3)
        lfd f0, 8(r3)
        lfd f0, 0(r3)
        blr

llvm-svn: 27296

2d8551c8

Implement PromoteOp for VEXTRACT_VECTOR_ELT. Thsi fixes · 6f42325d
Chris Lattner authored Mar 31, 2006
```
Generic/vector.ll:test_extract_elt on non-sse X86 systems.

llvm-svn: 27294
```
6f42325d

Scalarized vector stores need not be legal, e.g. if the vector element type · 8e1fcab2

Chris Lattner authored Mar 31, 2006

needs to be promoted or expanded.  Relegalize the scalar store once created.
This fixes CodeGen/Generic/vector.ll:test1 on non-SSE x86 targets.

llvm-svn: 27293

8e1fcab2

Make sure to pass enough values to phi nodes when we are dealing with · ba38035e
Chris Lattner authored Mar 31, 2006
```
decimated vectors.  This fixes UnitTests/Vector/sumarray-dbl.c

llvm-svn: 27280
```
ba38035e

Significantly improve handling of vectors that are live across basic blocks, · 5fe1f54c

Chris Lattner authored Mar 31, 2006

handling cases where the vector elements need promotion, expansion, and when
the vector type itself needs to be decimated.

llvm-svn: 27278

5fe1f54c

Expand INSERT_VECTOR_ELT to store vec, sp; store elt, sp+k; vec = load sp; · 168e45b0
Evan Cheng authored Mar 31, 2006
```
llvm-svn: 27274
```
168e45b0

Mar 29, 2006

Bug fixes: handle constantexpr insert/extract element operations · 67271869

Chris Lattner authored Mar 29, 2006

Handle constantpacked vectors with constantexpr elements.

This fixes CodeGen/Generic/vector-constantexpr.ll

llvm-svn: 27241

67271869

When building a VVECTOR_SHUFFLE node from extract_element operations, make · 20e619fb

Chris Lattner authored Mar 28, 2006

sure to build it as SHUFFLE(X, undef, mask), not SHUFFLE(X, X, mask).

The later is not canonical form, and prevents the PPC splat pattern from
matching.  For a particular splat, we go from generating this:

	li r10, lo16(LCPI1_0)
	lis r11, ha16(LCPI1_0)
	lvx v3, r11, r10
	vperm v3, v2, v2, v3

to generating:

	vspltw v3, v2, 3

llvm-svn: 27236

20e619fb

Canonicalize VECTOR_SHUFFLE(X, X, Y) -> VECTOR_SHUFFLE(X,undef,Y') · a46dfe80
Chris Lattner authored Mar 28, 2006
```
llvm-svn: 27235
```
a46dfe80

Mar 28, 2006

Turn a series of extract_element's feeding a build_vector into a · c9992548

Chris Lattner authored Mar 28, 2006

vector_shuffle node.  For this:

void test(__m128 *res, __m128 *A, __m128 *B) {
  *res = _mm_unpacklo_ps(*A, *B);
}

we now produce this code:

_test:
        movl 8(%esp), %eax
        movaps (%eax), %xmm0
        movl 12(%esp), %eax
        unpcklps (%eax), %xmm0
        movl 4(%esp), %eax
        movaps %xmm0, (%eax)
        ret

instead of this:

_test:
        subl $76, %esp
        movl 88(%esp), %eax
        movaps (%eax), %xmm0
        movaps %xmm0, (%esp)
        movaps %xmm0, 32(%esp)
        movss 4(%esp), %xmm0
        movss 32(%esp), %xmm1
        unpcklps %xmm0, %xmm1
        movl 84(%esp), %eax
        movaps (%eax), %xmm0
        movaps %xmm0, 16(%esp)
        movaps %xmm0, 48(%esp)
        movss 20(%esp), %xmm0
        movss 48(%esp), %xmm2
        unpcklps %xmm0, %xmm2
        unpcklps %xmm1, %xmm2
        movl 80(%esp), %eax
        movaps %xmm2, (%eax)
        addl $76, %esp
        ret

GCC produces this (with -fomit-frame-pointer):

_test:
        subl    $12, %esp
        movl    20(%esp), %eax
        movaps  (%eax), %xmm0
        movl    24(%esp), %eax
        unpcklps        (%eax), %xmm0
        movl    16(%esp), %eax
        movaps  %xmm0, (%eax)
        addl    $12, %esp
        ret

llvm-svn: 27233

c9992548

Teach Legalize how to pack VVECTOR_SHUFFLE nodes into VECTOR_SHUFFLE nodes. · f6f94d3b
Chris Lattner authored Mar 28, 2006
```
llvm-svn: 27232
```
f6f94d3b
new node · 8d57da2f
Chris Lattner authored Mar 28, 2006
```
llvm-svn: 27231
```
8d57da2f
Don't crash on X^X if X is a vector. Instead, produce a vector of zeros. · b7163598
Chris Lattner authored Mar 28, 2006
```
llvm-svn: 27229
```
b7163598
Add an assertion · ffec47eb
Chris Lattner authored Mar 28, 2006
```
llvm-svn: 27228
```
ffec47eb
Refactor address attributes. Add base register to frame info. · dea03488
Jim Laskey authored Mar 28, 2006
```
llvm-svn: 27226
```
dea03488
More bulletproofing of llvm.dbg.declare. · 67a636c5
Jim Laskey authored Mar 28, 2006
```
llvm-svn: 27224
```
67a636c5
More bulletproofing of DebugInfoDesc verify. · 8374e9c4
Jim Laskey authored Mar 28, 2006
```
llvm-svn: 27203
```
8374e9c4

Tblgen doesn't like multiple SDNode<> definitions that map to the sameenum... · e55d171c

Chris Lattner authored Mar 28, 2006

Tblgen doesn't like multiple SDNode<> definitions that map to the sameenum value.  Split them into separate enums.

llvm-svn: 27201

e55d171c

Reactivate llvm.dbg.declare. · d387cc5c
Jim Laskey authored Mar 27, 2006
```
llvm-svn: 27192
```
d387cc5c

Mar 27, 2006
- Disable dbg_declare, it currently breaks the CFE build · 5bb1d90a
  Chris Lattner authored Mar 27, 2006
```
llvm-svn: 27182
```
  5bb1d90a
- Fix legalization of intrinsics with chain and result values · d5f94c95
  Chris Lattner authored Mar 27, 2006
```
llvm-svn: 27181
```
  d5f94c95