graal-jvmci-8: src/cpu/x86/vm/stubGenerator_x86

comparison src/cpu/x86/vm/stubGenerator_x86_32.cpp @ 1365:6476042f815c

6940701: Don't align loops in stubs for Niagara sparc Summary: Don't align loops in stubs for Niagara sparc since NOPs are expensive. Reviewed-by: twisti, never

author	kvn
date	Wed, 07 Apr 2010 09:37:47 -0700
parents	9eba43136cb5
children	93767e6a2dfd

comparison

equal deleted inserted replaced

-:0dc88ad3244e
+:6476042f815c
 void xmm_copy_forward(Register from, Register to_from, Register qword_count) {
 assert( UseSSE >= 2, "supported cpu only" );
 Label L_copy_64_bytes_loop, L_copy_64_bytes, L_copy_8_bytes, L_exit;
 // Copy 64-byte chunks
 __ jmpb(L_copy_64_bytes);
-__ align(16);
+__ align(OptoLoopAlignment);
 __ BIND(L_copy_64_bytes_loop);
 if(UseUnalignedLoadStores) {
 __ movdqu(xmm0, Address(from, 0));
 __ movdqu(Address(from, to_from, Address::times_1, 0), xmm0);
 void mmx_copy_forward(Register from, Register to_from, Register qword_count) {
 assert( VM_Version::supports_mmx(), "supported cpu only" );
 Label L_copy_64_bytes_loop, L_copy_64_bytes, L_copy_8_bytes, L_exit;
 // Copy 64-byte chunks
 __ jmpb(L_copy_64_bytes);
-__ align(16);
+__ align(OptoLoopAlignment);
 __ BIND(L_copy_64_bytes_loop);
 __ movq(mmx0, Address(from, 0));
 __ movq(mmx1, Address(from, 8));
 __ movq(mmx2, Address(from, 16));
 __ movq(Address(from, to_from, Address::times_1, 0), mmx0);
 __ subl(count, 1<<shift);
 __ movl(rdx, Address(from, count, sf, 0));
 __ movl(Address(to, count, sf, 0), rdx);
 __ jmpb(L_copy_8_bytes);
-__ align(16);
+__ align(OptoLoopAlignment);
 // Move 8 bytes
 __ BIND(L_copy_8_bytes_loop);
 if (UseXMMForArrayCopy) {
 __ movq(xmm0, Address(from, count, sf, 0));
 __ movq(Address(to, count, sf, 0), xmm0);
 } else {
 mmx_copy_forward(from, to_from, count);
 }
 } else {
 __ jmpb(L_copy_8_bytes);
-__ align(16);
+__ align(OptoLoopAlignment);
 __ BIND(L_copy_8_bytes_loop);
 __ fild_d(Address(from, 0));
 __ fistp_d(Address(from, to_from, Address::times_1));
 __ addptr(from, 8);
 __ BIND(L_copy_8_bytes);
 __ movptr(from, Address(rsp, 8));  // from
 __ jump_cc(Assembler::aboveEqual, nooverlap);
 __ jmpb(L_copy_8_bytes);
-__ align(16);
+__ align(OptoLoopAlignment);
 __ BIND(L_copy_8_bytes_loop);
 if (VM_Version::supports_mmx()) {
 if (UseXMMForArrayCopy) {
 __ movq(xmm0, Address(from, count, Address::times_8));
 __ movq(Address(to, count, Address::times_8), xmm0);
 // ======== begin loop ========
 // (Loop is rotated; its entry is L_load_element.)
 // Loop control:
 //   for (count = -count; count != 0; count++)
 // Base pointers src, dst are biased by 8*count,to last element.
-__ align(16);
+__ align(OptoLoopAlignment);
 __ BIND(L_store_element);
 __ movptr(to_element_addr, elem);     // store the oop
 __ increment(count);                // increment the count toward zero
 __ jccb(Assembler::zero, L_do_card_marks);

Mercurial > hg > graal-jvmci-8

comparison src/cpu/x86/vm/stubGenerator_x86_32.cpp @ 1365:6476042f815c