Commits · ebf1006d16d3293009b2c49d201eec7138d1e0db · Roger Ferrer / llvm-epi-0.8

Apr 03, 2006
- - More efficient extract_vector_elt with shuffle and movss, movsd, movd, etc. · ebf1006d
  Evan Cheng authored Apr 03, 2006
```
- Some bug fixes and naming inconsistency fixes.

llvm-svn: 27377
```
  ebf1006d
- Align vectors to the size in bytes, not bits. · 78c788b4
  Chris Lattner authored Apr 03, 2006
```
llvm-svn: 27376
```
  78c788b4
- Add a missing check, this fixes UnitTests/Vector/sumarray.c · e1e3adf8
  Chris Lattner authored Apr 03, 2006
```
llvm-svn: 27375
```
  e1e3adf8
- Add a missing check, which broke a bunch of vector tests. · 04c00fc8
  Chris Lattner authored Apr 03, 2006
```
llvm-svn: 27374
```
  04c00fc8
- Add the full set of min/max instructions · 9ccd61c8
  Chris Lattner authored Apr 03, 2006
```
llvm-svn: 27372
```
  9ccd61c8
- support x * (c1 + c2) where c1 and c2 are pow2s. special case for c2 == 4 · df7abf8b
  Andrew Lenharth authored Apr 03, 2006
```
llvm-svn: 27370
```
  df7abf8b
- mul by const conversion sequences. more coming soon · 4e2c073a
  Andrew Lenharth authored Apr 03, 2006
```
llvm-svn: 27368
```
  4e2c073a
- back this out · 94f012f6
  Andrew Lenharth authored Apr 03, 2006
```
llvm-svn: 27367
```
  94f012f6
Apr 02, 2006

This should be a win of every arch · 015eaf5f
Andrew Lenharth authored Apr 02, 2006
```
llvm-svn: 27364
```
015eaf5f
This makes McCat/12-IOtest go 8x faster or so · 444bdb06
Andrew Lenharth authored Apr 02, 2006
```
llvm-svn: 27363
```
444bdb06
This will be needed soon · 01bd5523
Andrew Lenharth authored Apr 02, 2006
```
llvm-svn: 27362
```
01bd5523
add a note · acf1fc8a
Chris Lattner authored Apr 02, 2006
```
llvm-svn: 27360
```
acf1fc8a
Inform the dag combiner that the predicate compares only return a low bit. · c5287c0e
Chris Lattner authored Apr 02, 2006
```
llvm-svn: 27359
```
c5287c0e
relax assertion · 6c1321ca
Chris Lattner authored Apr 02, 2006
```
llvm-svn: 27358
```
6c1321ca
Allow targets to compute masked bits for intrinsics. · e6025525
Chris Lattner authored Apr 02, 2006
```
llvm-svn: 27357
```
e6025525

Add a little dag combine to compile this: · 4993249a

Chris Lattner authored Apr 02, 2006

int %AreSecondAndThirdElementsBothNegative(<4 x float>* %in) {
entry:
        %tmp1 = load <4 x float>* %in           ; <<4 x float>> [#uses=1]
        %tmp = tail call int %llvm.ppc.altivec.vcmpgefp.p( int 1, <4 x float> < float 0x7FF8000000000000, float 0.000000e+00, float 0.000000e+00, float 0x7FF8000000000000 >, <4 x float> %tmp1 )           ; <int> [#uses=1]
        %tmp = seteq int %tmp, 0                ; <bool> [#uses=1]
        %tmp3 = cast bool %tmp to int           ; <int> [#uses=1]
        ret int %tmp3
}

into this:

_AreSecondAndThirdElementsBothNegative:
        mfspr r2, 256
        oris r4, r2, 49152
        mtspr 256, r4
        li r4, lo16(LCPI1_0)
        lis r5, ha16(LCPI1_0)
        lvx v0, 0, r3
        lvx v1, r5, r4
        vcmpgefp. v0, v1, v0
        mfcr r3, 2
        rlwinm r3, r3, 27, 31, 31
        mtspr 256, r2
        blr

instead of this:

_AreSecondAndThirdElementsBothNegative:
        mfspr r2, 256
        oris r4, r2, 49152
        mtspr 256, r4
        li r4, lo16(LCPI1_0)
        lis r5, ha16(LCPI1_0)
        lvx v0, 0, r3
        lvx v1, r5, r4
        vcmpgefp. v0, v1, v0
        mfcr r3, 2
        rlwinm r3, r3, 27, 31, 31
        xori r3, r3, 1
        cntlzw r3, r3
        srwi r3, r3, 5
        mtspr 256, r2
        blr

llvm-svn: 27356

4993249a

vector casts of casts are eliminable. Transform this: · caba72b6

Chris Lattner authored Apr 02, 2006

        %tmp = cast <4 x uint> %tmp to <4 x int>                ; <<4 x int>> [#uses=1]
        %tmp = cast <4 x int> %tmp to <4 x float>               ; <<4 x float>> [#uses=1]

into:

        %tmp = cast <4 x uint> %tmp to <4 x float>              ; <<4 x float>> [#uses=1]

llvm-svn: 27355

caba72b6

vector casts never reinterpret bits · 7ee10dec
Chris Lattner authored Apr 02, 2006
```
llvm-svn: 27354
```
7ee10dec

Allow transforming this: · ebca476b

Chris Lattner authored Apr 02, 2006

        %tmp = cast <4 x uint>* %testData to <4 x int>*         ; <<4 x int>*> [#uses=1]
        %tmp = load <4 x int>* %tmp             ; <<4 x int>> [#uses=1]

to this:

        %tmp = load <4 x uint>* %testData               ; <<4 x uint>> [#uses=1]
        %tmp = cast <4 x uint> %tmp to <4 x int>                ; <<4 x int>> [#uses=1]

llvm-svn: 27353

ebca476b

Turn altivec lvx/stvx intrinsics into loads and stores. This allows the · f42d0aed

Chris Lattner authored Apr 02, 2006

elimination of one load from this:

int AreSecondAndThirdElementsBothNegative( vector float *in ) {
#define QNaN 0x7FC00000
const vector unsigned int testData = (vector unsigned int)( QNaN, 0, 0, QNaN );
vector float test = vec_ld( 0, (float*) &testData );
return ! vec_any_ge( test, *in );
}

Now generating:

_AreSecondAndThirdElementsBothNegative:
        mfspr r2, 256
        oris r4, r2, 49152
        mtspr 256, r4
        li r4, lo16(LCPI1_0)
        lis r5, ha16(LCPI1_0)
        addi r6, r1, -16
        lvx v0, r5, r4
        stvx v0, 0, r6
        lvx v1, 0, r3
        vcmpgefp. v0, v0, v1
        mfcr r3, 2
        rlwinm r3, r3, 27, 31, 31
        xori r3, r3, 1
        cntlzw r3, r3
        srwi r3, r3, 5
        mtspr 256, r2
        blr

llvm-svn: 27352

f42d0aed

Remove done item · 80fdc1eb
Chris Lattner authored Apr 02, 2006
```
llvm-svn: 27351
```
80fdc1eb
Implement promotion for EXTRACT_VECTOR_ELT, allowing v16i8 multiplies to work with PowerPC. · 42a5fca4
Chris Lattner authored Apr 02, 2006
```
llvm-svn: 27349
```
42a5fca4
add a note · b80f1147
Chris Lattner authored Apr 02, 2006
```
llvm-svn: 27348
```
b80f1147

Implement the Expand action for binary vector operations to break the binop · 87f08094

Chris Lattner authored Apr 02, 2006

into elements and operate on each piece.  This allows generic vector integer
multiplies to work on PPC, though the generated code is horrible.

llvm-svn: 27347

87f08094

Intrinsics that just load from memory can be treated like loads: they don't · a9c59156
Chris Lattner authored Apr 02, 2006
```
have to serialize against each other.  This allows us to schedule lvx's
across each other, for example.

llvm-svn: 27346
```
a9c59156
Adjust to change in Intrinsics.gen interface. · 70ec96fa
Chris Lattner authored Apr 02, 2006
```
llvm-svn: 27344
```
70ec96fa

Constant fold all of the vector binops. This allows us to compile this: · 0442a187

Chris Lattner authored Apr 02, 2006

"vector unsigned char mergeLowHigh = (vector unsigned char)
( 8, 9, 10, 11, 16, 17, 18, 19, 12, 13, 14, 15, 20, 21, 22, 23 );
vector unsigned char mergeHighLow = vec_xor( mergeLowHigh, vec_splat_u8(8));"

aka:

void %test2(<16 x sbyte>* %P) {
  store <16 x sbyte> cast (<4 x int> xor (<4 x int> cast (<16 x ubyte> < ubyte 8, ubyte 9, ubyte 10, ubyte 11, ubyte 16, ubyte 17, ubyte 18, ubyte 19, ubyte 12, ubyte 13, ubyte 14, ubyte 15, ubyte 20, ubyte 21, ubyte 22, ubyte 23 > to <4 x int>), <4 x int> cast (<16 x sbyte> < sbyte 8, sbyte 8, sbyte 8, sbyte 8, sbyte 8, sbyte 8, sbyte 8, sbyte 8, sbyte 8, sbyte 8, sbyte 8, sbyte 8, sbyte 8, sbyte 8, sbyte 8, sbyte 8 > to <4 x int>)) to <16 x sbyte>), <16 x sbyte> * %P
  ret void
}

into this:

_test2:
        mfspr r2, 256
        oris r4, r2, 32768
        mtspr 256, r4
        li r4, lo16(LCPI2_0)
        lis r5, ha16(LCPI2_0)
        lvx v0, r5, r4
        stvx v0, 0, r3
        mtspr 256, r2
        blr

instead of this:

_test2:
        mfspr r2, 256
        oris r4, r2, 49152
        mtspr 256, r4
        li r4, lo16(LCPI2_0)
        lis r5, ha16(LCPI2_0)
        vspltisb v0, 8
        lvx v1, r5, r4
        vxor v0, v1, v0
        stvx v0, 0, r3
        mtspr 256, r2
        blr

... which occurs here:
http://developer.apple.com/hardware/ve/calcspeed.html

llvm-svn: 27343

0442a187

Add a new -view-legalize-dags command line option · ef598059
Chris Lattner authored Apr 02, 2006
```
llvm-svn: 27342
```
ef598059
Implement constant folding of bit_convert of arbitrary constant vbuild_vector nodes. · e4e64b6b
Chris Lattner authored Apr 02, 2006
```
llvm-svn: 27341
```
e4e64b6b
These entries already exist · 1c227287
Chris Lattner authored Apr 02, 2006
```
llvm-svn: 27340
```
1c227287
Add some missing node names · 1985e1cb
Chris Lattner authored Apr 02, 2006
```
llvm-svn: 27339
```
1985e1cb
New note · 7a29cf3c
Chris Lattner authored Apr 02, 2006
```
llvm-svn: 27337
```
7a29cf3c
Constant fold casts from things like <4 x int> -> <4 x uint>, likewise int<->fp. · 6b3f475d
Chris Lattner authored Apr 02, 2006
```
llvm-svn: 27336
```
6b3f475d
Custom lower all BUILD_VECTOR's so that we can compile vec_splat_u8(8) into · 9b2d6e78
Chris Lattner authored Apr 02, 2006
```
"vspltisb v0, 8" instead of a constant pool load.

llvm-svn: 27335
```
9b2d6e78
Prefer larger register classes over smaller ones when a register occurs in · bec582f4
Chris Lattner authored Apr 02, 2006
```
multiple register classes.  This fixes PowerPC/2006-04-01-FloatDoubleExtend.ll

llvm-svn: 27334
```
bec582f4
add valuemapper support for inline asm · 1b2436a6
Chris Lattner authored Apr 01, 2006
```
llvm-svn: 27332
```
1b2436a6
Implement vnot using VNOR instead of using 'vspltisb v0, -1' and vxor · dc72c177
Chris Lattner authored Apr 01, 2006
```
llvm-svn: 27331
```
dc72c177
Fix InstCombine/2006-04-01-InfLoop.ll · 6cf4914f
Chris Lattner authored Apr 01, 2006
```
llvm-svn: 27330
```
6cf4914f

Apr 01, 2006

Fold A^(B&A) -> (B&A)^A · dcd07926

Chris Lattner authored Apr 01, 2006

Fold (B&A)^A == ~B & A

This implements InstCombine/xor.ll:test2[56]

llvm-svn: 27328

dcd07926

Fix Transforms/IndVarsSimplify/2006-03-31-NegativeStride.ll and · 98e9604d

Chris Lattner authored Apr 01, 2006

PR726 by performing consistent signed division, not consistent unsigned
division when evaluating scev's.  Do not touch udivs.

llvm-svn: 27326

98e9604d