Commits · 063f1773001bbe8a86303ff31e1d41a0b8dee0ef · Roger Ferrer / llvm-epi-0.8

Apr 28, 2006
- Add a note · a4c2c4a2
  Chris Lattner authored Apr 28, 2006
```
llvm-svn: 27999
```
  a4c2c4a2
Apr 19, 2006
- add a note · 05bbec50
  Chris Lattner authored Apr 19, 2006
```
llvm-svn: 27832
```
  05bbec50
- add a note · a922a516
  Chris Lattner authored Apr 19, 2006
```
llvm-svn: 27828
```
  a922a516
Apr 18, 2006

add a note · 197d7622
Chris Lattner authored Apr 18, 2006
```
llvm-svn: 27809
```
197d7622

Implement an important entry from README_ALTIVEC: · 9754d142

Chris Lattner authored Apr 18, 2006

If an altivec predicate compare is used immediately by a branch, don't
use a (serializing) MFCR instruction to read the CR6 register, which requires
a compare to get it back to CR's.  Instead, just branch on CR6 directly. :)

For example, for:
void foo2(vector float *A, vector float *B) {
  if (!vec_any_eq(*A, *B))
    *B = (vector float){0,0,0,0};
}

We now generate:

_foo2:
        mfspr r2, 256
        oris r5, r2, 12288
        mtspr 256, r5
        lvx v2, 0, r4
        lvx v3, 0, r3
        vcmpeqfp. v2, v3, v2
        bne cr6, LBB1_2 ; UnifiedReturnBlock
LBB1_1: ; cond_true
        vxor v2, v2, v2
        stvx v2, 0, r4
        mtspr 256, r2
        blr
LBB1_2: ; UnifiedReturnBlock
        mtspr 256, r2
        blr

instead of:

_foo2:
        mfspr r2, 256
        oris r5, r2, 12288
        mtspr 256, r5
        lvx v2, 0, r4
        lvx v3, 0, r3
        vcmpeqfp. v2, v3, v2
        mfcr r3, 2
        rlwinm r3, r3, 27, 31, 31
        cmpwi cr0, r3, 0
        beq cr0, LBB1_2 ; UnifiedReturnBlock
LBB1_1: ; cond_true
        vxor v2, v2, v2
        stvx v2, 0, r4
        mtspr 256, r2
        blr
LBB1_2: ; UnifiedReturnBlock
        mtspr 256, r2
        blr

This implements CodeGen/PowerPC/vec_br_cmp.ll.

llvm-svn: 27804

9754d142

move some stuff around, clean things up · 68c16a20
Chris Lattner authored Apr 18, 2006
```
llvm-svn: 27802
```
68c16a20

Implement v16i8 multiply with this code: · d6d82aa8

Chris Lattner authored Apr 18, 2006

        vmuloub v5, v3, v2
        vmuleub v2, v3, v2
        vperm v2, v2, v5, v4

This implements CodeGen/PowerPC/vec_mul.ll.  With this, v16i8 multiplies are
6.79x faster than before.

Overall, UnitTests/Vector/multiplies.c is now 2.45x faster with LLVM than with
GCC.

Remove the 'integer multiplies' todo from the README file.

llvm-svn: 27792

d6d82aa8

Apr 17, 2006
- remove done item · 63a5cdc4
  Chris Lattner authored Apr 17, 2006
```
llvm-svn: 27778
```
  63a5cdc4
- add a note · 26fb8d93
  Chris Lattner authored Apr 17, 2006
```
llvm-svn: 27758
```
  26fb8d93
- Implement a TODO: for any shuffle that can be viewed as a v4[if]32 shuffle, · 071ad01c
  Chris Lattner authored Apr 17, 2006
```
if it can be implemented in 3 or fewer discrete altivec instructions, codegen
it as such.  This implements Regression/CodeGen/PowerPC/vec_perf_shuffle.ll

llvm-svn: 27748
```
  071ad01c
Apr 16, 2006
- Implement a TODO: have the legalizer canonicalize a bunch of operations to · 06a21ba9
  Chris Lattner authored Apr 16, 2006
```
one type (v4i32) so that we don't have to write patterns for each type, and
so that more CSE opportunities are exposed.

llvm-svn: 27731
```
  06a21ba9
- Make the BUILD_VECTOR lowering code much more aggressive w.r.t constant vectors. · fa5aa396
  Chris Lattner authored Apr 16, 2006
```
Remove some done items from the todo list.

llvm-svn: 27729
```
  fa5aa396
Apr 13, 2006
- add a note, move an altivec todo to the altivec list. · 5879efe0
  Chris Lattner authored Apr 13, 2006
```
llvm-svn: 27654
```
  5879efe0
Apr 12, 2006

Add a new way to match vector constants, which make it easier to bang bits of · 147e50e1

Chris Lattner authored Apr 12, 2006

different types.

Codegen spltw(0x7FFFFFFF) and spltw(0x80000000) without a constant pool load,
implementing PowerPC/vec_constants.ll:test1.  This compiles:

typedef float vf __attribute__ ((vector_size (16)));
typedef int vi __attribute__ ((vector_size (16)));
void test(vi *P1, vi *P2, vf *P3) {
  *P1 &= (vi){0x80000000,0x80000000,0x80000000,0x80000000};
  *P2 &= (vi){0x7FFFFFFF,0x7FFFFFFF,0x7FFFFFFF,0x7FFFFFFF};
  *P3 = vec_abs((vector float)*P3);
}

to:

_test:
        mfspr r2, 256
        oris r6, r2, 49152
        mtspr 256, r6
        vspltisw v0, -1
        vslw v0, v0, v0
        lvx v1, 0, r3
        vand v1, v1, v0
        stvx v1, 0, r3
        lvx v1, 0, r4
        vandc v1, v1, v0
        stvx v1, 0, r4
        lvx v1, 0, r5
        vandc v0, v1, v0
        stvx v0, 0, r5
        mtspr 256, r2
        blr

instead of (with two constant pool entries):

_test:
        mfspr r2, 256
        oris r6, r2, 49152
        mtspr 256, r6
        li r6, lo16(LCPI1_0)
        lis r7, ha16(LCPI1_0)
        li r8, lo16(LCPI1_1)
        lis r9, ha16(LCPI1_1)
        lvx v0, r7, r6
        lvx v1, 0, r3
        vand v0, v1, v0
        stvx v0, 0, r3
        lvx v0, r9, r8
        lvx v1, 0, r4
        vand v1, v1, v0
        stvx v1, 0, r4
        lvx v1, 0, r5
        vand v0, v1, v0
        stvx v0, 0, r5
        mtspr 256, r2
        blr

GCC produces (with 2 cp entries):

_test:
        mfspr r0,256
        stw r0,-4(r1)
        oris r0,r0,0xc00c
        mtspr 256,r0
        lis r2,ha16(LC0)
        lis r9,ha16(LC1)
        la r2,lo16(LC0)(r2)
        lvx v0,0,r3
        lvx v1,0,r5
        la r9,lo16(LC1)(r9)
        lwz r12,-4(r1)
        lvx v12,0,r2
        lvx v13,0,r9
        vand v0,v0,v12
        stvx v0,0,r3
        vspltisw v0,-1
        vslw v12,v0,v0
        vandc v1,v1,v12
        stvx v1,0,r5
        lvx v0,0,r4
        vand v0,v0,v13
        stvx v0,0,r4
        mtspr 256,r12
        blr

llvm-svn: 27624

147e50e1

Apr 11, 2006
- we have a shuffle instr, add an example. · aaa04230
  Chris Lattner authored Apr 11, 2006
```
llvm-svn: 27592
```
  aaa04230
Apr 07, 2006
- Add an item · e61cfad8
  Chris Lattner authored Apr 06, 2006
```
llvm-svn: 27470
```
  e61cfad8
Apr 06, 2006
- Pattern match vmrg* instructions, which are now lowered by the CFE into shuffles. · d1dcb520
  Chris Lattner authored Apr 06, 2006
```
llvm-svn: 27457
```
  d1dcb520
- remove two done items · a4c727f1
  Chris Lattner authored Apr 06, 2006
```
llvm-svn: 27453
```
  a4c727f1
- Support pattern matching vsldoi(x,y) and vsldoi(x,x), which allows the f.e. to · 1d338191
  Chris Lattner authored Apr 06, 2006
```
lower it and LLVM to have one fewer intrinsic.  This implements
CodeGen/PowerPC/vec_shuffle.ll

llvm-svn: 27450
```
  1d338191
- Add all of the data stream intrinsics and instructions. woo · c94d9324
  Chris Lattner authored Apr 05, 2006
```
llvm-svn: 27442
```
  c94d9324
Apr 05, 2006
- add vmladduhm · 575352ac
  Chris Lattner authored Apr 05, 2006
```
llvm-svn: 27423
```
  575352ac
- add a note · 0c82447c
  Chris Lattner authored Apr 04, 2006
```
llvm-svn: 27419
```
  0c82447c
- add a note · 4464383a
  Chris Lattner authored Apr 04, 2006
```
llvm-svn: 27414
```
  4464383a
Apr 02, 2006
- Remove done item · 80fdc1eb
  Chris Lattner authored Apr 02, 2006
```
llvm-svn: 27351
```
  80fdc1eb
- add a note · b80f1147
  Chris Lattner authored Apr 02, 2006
```
llvm-svn: 27348
```
  b80f1147
Mar 31, 2006

add a note · 40ff17dc
Chris Lattner authored Mar 31, 2006
```
llvm-svn: 27302
```
40ff17dc

Implement an item from the readme, folding vcmp/vcmp. instructions with · d4058a59

Chris Lattner authored Mar 31, 2006

identical instructions into a single instruction.  For example, for:

void test(vector float *x, vector float *y, int *P) {
  int v = vec_any_out(*x, *y);
  *x = (vector float)vec_cmpb(*x, *y);
  *P = v;
}

we now generate:

_test:
        mfspr r2, 256
        oris r6, r2, 49152
        mtspr 256, r6
        lvx v0, 0, r4
        lvx v1, 0, r3
        vcmpbfp. v0, v1, v0
        mfcr r4, 2
        stvx v0, 0, r3
        rlwinm r3, r4, 27, 31, 31
        xori r3, r3, 1
        stw r3, 0(r5)
        mtspr 256, r2
        blr

instead of:

_test:
        mfspr r2, 256
        oris r6, r2, 57344
        mtspr 256, r6
        lvx v0, 0, r4
        lvx v1, 0, r3
        vcmpbfp. v2, v1, v0
        mfcr r4, 2
***     vcmpbfp v0, v1, v0
        rlwinm r4, r4, 27, 31, 31
        stvx v0, 0, r3
        xori r3, r4, 1
        stw r3, 0(r5)
        mtspr 256, r2
        blr

Testcase here: CodeGen/PowerPC/vcmp-fold.ll

llvm-svn: 27290

d4058a59

These are done · e5a6c4f8
Chris Lattner authored Mar 31, 2006
```
llvm-svn: 27284
```
e5a6c4f8

Mar 29, 2006
- add a note · 7d6f4f14
  Chris Lattner authored Mar 29, 2006
```
llvm-svn: 27243
```
  7d6f4f14
Mar 28, 2006
- add a note · 66e14108
  Chris Lattner authored Mar 28, 2006
```
llvm-svn: 27227
```
  66e14108
- Add a few more altivec intrinsics · 1b392876
  Nate Begeman authored Mar 28, 2006
```
llvm-svn: 27215
```
  1b392876
- implement a bunch more intrinsics. · 3710fca2
  Chris Lattner authored Mar 28, 2006
```
llvm-svn: 27209
```
  3710fca2
Mar 27, 2006
- Add a bunch of notes from my journey thus far. · 939c9ab8
  Chris Lattner authored Mar 27, 2006
```
llvm-svn: 27170
```
  939c9ab8
- Split out altivec notes into their own README · 22ec3e7b
  Chris Lattner authored Mar 27, 2006
```
llvm-svn: 27168
```
  22ec3e7b