Commits · 44a73e9fa581dcfbaa8e9f39f2709ac8521d4ea7 · Roger Ferrer / llvm-epi-0.8

May 05, 2006

Teach the code generator to use cvtss2sd as extload f32 -> f64 · 44a73e9f
Chris Lattner authored May 05, 2006
```
llvm-svn: 28131
```
44a73e9f
Fold (fpext (load x)) -> (extload x) · 3d265773
Chris Lattner authored May 05, 2006
```
llvm-svn: 28130
```
3d265773

More aggressively sink GEP offsets into loops. For example, before we · 3e3f2c63

Chris Lattner authored May 05, 2006

generated:

        movl 8(%esp), %eax
        movl %eax, %edx
        addl $4316, %edx
        cmpb $1, %cl
        ja LBB1_2       #cond_false
LBB1_1: #cond_true
        movl L_QuantizationTables720$non_lazy_ptr, %ecx
        movl %ecx, (%edx)
        movl L_QNOtoQuantTableShift720$non_lazy_ptr, %edx
        movl %edx, 4460(%eax)
        ret
...

Now we generate:

        movl 8(%esp), %eax
        cmpb $1, %cl
        ja LBB1_2       #cond_false
LBB1_1: #cond_true
        movl L_QuantizationTables720$non_lazy_ptr, %ecx
        movl %ecx, 4316(%eax)
        movl L_QNOtoQuantTableShift720$non_lazy_ptr, %ecx
        movl %ecx, 4460(%eax)
        ret

... which uses one fewer register.

llvm-svn: 28129

3e3f2c63

Fix an infinite loop compiling oggenc last night. · e745c7de
Chris Lattner authored May 05, 2006
```
llvm-svn: 28128
```
e745c7de
Need extload patterns after Chris' DAG combiner changes · 52c22512
Evan Cheng authored May 05, 2006
```
llvm-svn: 28127
```
52c22512
Implement InstCombine/cast.ll:test29 · 3af10534
Chris Lattner authored May 05, 2006
```
llvm-svn: 28126
```
3af10534
New testcase · c9043ef7
Chris Lattner authored May 05, 2006
```
llvm-svn: 28125
```
c9043ef7
Fold some common code. · 25a5283a
Chris Lattner authored May 05, 2006
```
llvm-svn: 28124
```
25a5283a

Implement: · 002ee914

Chris Lattner authored May 05, 2006

  // fold (and (sext x), (sext y)) -> (sext (and x, y))
  // fold (or  (sext x), (sext y)) -> (sext (or  x, y))
  // fold (xor (sext x), (sext y)) -> (sext (xor x, y))
  // fold (and (aext x), (aext y)) -> (aext (and x, y))
  // fold (or  (aext x), (aext y)) -> (aext (or  x, y))
  // fold (xor (aext x), (aext y)) -> (aext (xor x, y))

llvm-svn: 28123

002ee914

Pull and through and/or/xor. This compiles some bitfield code to: · 5ac42936

Chris Lattner authored May 05, 2006

        mov EAX, DWORD PTR [ESP + 4]
        mov ECX, DWORD PTR [EAX]
        mov EDX, ECX
        add EDX, EDX
        or EDX, ECX
        and EDX, -2147483648
        and ECX, 2147483647
        or EDX, ECX
        mov DWORD PTR [EAX], EDX
        ret

instead of:

        sub ESP, 4
        mov DWORD PTR [ESP], ESI
        mov EAX, DWORD PTR [ESP + 8]
        mov ECX, DWORD PTR [EAX]
        mov EDX, ECX
        add EDX, EDX
        mov ESI, ECX
        and ESI, -2147483648
        and EDX, -2147483648
        or EDX, ESI
        and ECX, 2147483647
        or EDX, ECX
        mov DWORD PTR [EAX], EDX
        mov ESI, DWORD PTR [ESP]
        add ESP, 4
        ret

llvm-svn: 28122

5ac42936

Implement a variety of simplifications for ANY_EXTEND. · 812646aa
Chris Lattner authored May 05, 2006
```
llvm-svn: 28121
```
812646aa

Factor some code, add these transformations: · 8d6fc201

Chris Lattner authored May 05, 2006

  // fold (and (trunc x), (trunc y)) -> (trunc (and x, y))
  // fold (or  (trunc x), (trunc y)) -> (trunc (or  x, y))
  // fold (xor (trunc x), (trunc y)) -> (trunc (xor x, y))

llvm-svn: 28120

8d6fc201

Better implementation of truncate. ISel matches it to a pseudo instruction · ddb6cc1d

Evan Cheng authored May 05, 2006

that gets emitted as movl (for r32 to i16, i8) or a movw (for r16 to i8). And
if the destination gets allocated a subregister of the source operand, then
the instruction will not be emitted at all.

llvm-svn: 28119

ddb6cc1d

New note, Nate, please check to see if I'm full of it :) · 304bbf3b
Chris Lattner authored May 05, 2006
```
llvm-svn: 28118
```
304bbf3b
Fix VC++ compilation error. · 78a7f0e0
Jeff Cohen authored May 05, 2006
```
llvm-svn: 28117
```
78a7f0e0
Somehow, I missed this part of the checkin a couple days ago · dec86e74
Nate Begeman authored May 05, 2006
```
llvm-svn: 28116
```
dec86e74

Sink noop copies into the basic block that uses them. This reduces the number · 7a3ecf79

Chris Lattner authored May 05, 2006

of cross-block live ranges, and allows the bb-at-a-time selector to always
coallesce these away, at isel time.

This reduces the load on the coallescer and register allocator. For example
on a codec on X86, we went from:

1643 asm-printer - Number of machine instrs printed
419 liveintervals - Number of loads/stores folded into instructions
1144 liveintervals - Number of identity moves eliminated after coalescing
1022 liveintervals - Number of interval joins performed
282 liveintervals - Number of intervals after coalescing
1304 liveintervals - Number of original intervals
86 regalloc - Number of times we had to backtrack
1.90232 regalloc - Ratio of intervals processed over total intervals
40 spiller - Number of values reused
182 spiller - Number of loads added
121 spiller - Number of stores added
132 spiller - Number of register spills
6 twoaddressinstruction - Number of instructions commuted to coalesce
360 twoaddressinstruction - Number of two-address instructions

to:

1636 asm-printer - Number of machine instrs printed
403 liveintervals - Number of loads/stores folded into instructions
1155 liveintervals - Number of identity moves eliminated after coalescing
1033 liveintervals - Number of interval joins performed
279 liveintervals - Number of intervals after coalescing
1312 liveintervals - Number of original intervals
76 regalloc - Number of times we had to backtrack
1.88998 regalloc - Ratio of intervals processed over total intervals
1 spiller - Number of copies elided
41 spiller - Number of values reused
191 spiller - Number of loads added
114 spiller - Number of stores added
128 spiller - Number of register spills
4 twoaddressinstruction - Number of instructions commuted to coalesce
356 twoaddressinstruction - Number of two-address instructions

On this testcase, this change provides a modest reduction in spill code,
regalloc iterations, and total instructions emitted. It increases the number
of register coallesces.

llvm-svn: 28115

7a3ecf79

Add a helper method. · a0c3ec51
Chris Lattner authored May 05, 2006
```
llvm-svn: 28114
```
a0c3ec51
wrap long line · 34d26c38
Chris Lattner authored May 04, 2006
```
llvm-svn: 28113
```
34d26c38

May 04, 2006
- Adjust to use proper TargetData copy ctor · b6277c51
  Chris Lattner authored May 04, 2006
```
llvm-svn: 28112
```
  b6277c51
- Fix this to be a proper copy ctor · 660d80ef
  Chris Lattner authored May 04, 2006
```
llvm-svn: 28111
```
  660d80ef
- Final pass of minor cleanups for MachineInstr · abdf4d56
  Chris Lattner authored May 04, 2006
```
llvm-svn: 28110
```
  abdf4d56
- Initial support for register pressure aware scheduling. The register reduction · 9add8805
  Evan Cheng authored May 04, 2006
```
scheduler can go into a "vertical mode" (i.e. traversing up the two-address
chain, etc.) when the register pressure is low.
This does seem to reduce the number of spills in the cases I've looked at. But
with x86, it's no guarantee the performance of the code improves.
It can be turned on with -sched-vertically option.

llvm-svn: 28108
```
  9add8805
- Remove redundancy and a level of indirection when creating machine operands · 53af9da3
  Chris Lattner authored May 04, 2006
```
llvm-svn: 28107
```
  53af9da3
- Move register numbers out of "extra" into "contents". Other minor cleanup. · 6b18d20c
  Chris Lattner authored May 04, 2006
```
llvm-svn: 28106
```
  6b18d20c
- Remove and simplify some more machineinstr/machineoperand stuff. · 469647bf
  Chris Lattner authored May 04, 2006
```
llvm-svn: 28105
```
  469647bf
- Rename MO_VirtualRegister -> MO_Register. Clean up immediate handling. · 10b71c0d
  Chris Lattner authored May 04, 2006
```
llvm-svn: 28104
```
  10b71c0d
- remove hasAllocatedReg · 700cd27e
  Chris Lattner authored May 04, 2006
```
llvm-svn: 28103
```
  700cd27e
- Move some methods out of MachineInstr into MachineOperand · 10d63416
  Chris Lattner authored May 04, 2006
```
llvm-svn: 28102
```
  10d63416
- Fix Transforms/InstCombine/2006-05-04-DemandedBitCrash.ll · fb296920
  Chris Lattner authored May 04, 2006
```
llvm-svn: 28101
```
  fb296920
- new testcase that crashes the instcombine pass · 618ff2dc
  Chris Lattner authored May 04, 2006
```
llvm-svn: 28100
```
  618ff2dc
- There shalt be only one "immediate" operand type! · fef7a2d0
  Chris Lattner authored May 04, 2006
```
llvm-svn: 28099
```
  fef7a2d0
- Change "value" in MachineOperand to be a GlobalValue, as that is the only · 15c52bda
  Chris Lattner authored May 04, 2006
```
thing that can be in it.  Remove a dead method.

llvm-svn: 28098
```
  15c52bda
- Revert Nate's CR patch from last night, which caused many regressions (e.g. fhourstones). · 13d5f3eb
  Chris Lattner authored May 04, 2006
```
Loading and storing off R0 isn't what we wanted.  Also, taking some CR's out of
CRRC seems to cause failures as well.  Further investigation is required.

llvm-svn: 28097
```
  13d5f3eb
- Make external globals public; other minor cleanup. · 06041abe
  Jeff Cohen authored May 04, 2006
```
llvm-svn: 28096
```
  06041abe
- Make Intel syntax the default when LLVM is built with VC++. · f812a4fa
  Jeff Cohen authored May 04, 2006
```
llvm-svn: 28095
```
  f812a4fa
- Remove a bunch more dead V9 specific stuff · ee64b6b4
  Chris Lattner authored May 04, 2006
```
llvm-svn: 28094
```
  ee64b6b4
- Remove a bunch more SparcV9 specific stuff · 940cc978
  Chris Lattner authored May 04, 2006
```
llvm-svn: 28093
```
  940cc978
- Remove some more V9-specific stuff. · 6e663f1c
  Chris Lattner authored May 04, 2006
```
llvm-svn: 28092
```
  6e663f1c
- Remove some more unused stuff from MachineInstr that was leftover from V9. · 9f6639b6
  Chris Lattner authored May 04, 2006
```
llvm-svn: 28091
```
  9f6639b6