graal-jvmci-8: src/share/vm/opto/loopTransform.cpp comparison

comparison src/share/vm/opto/loopTransform.cpp @ 3383:38569792a45a

7044725: -XX:-UnrollLimitCheck -Xcomp : Exception: String index out of range: 29488 Summary: Fix problems in new RCE code. Reviewed-by: never

author	kvn
date	Mon, 16 May 2011 14:21:16 -0700
parents	3b1d58916d5f
children	789d04408ca3

comparison

equal deleted inserted replaced

-:c149193c768b
+:38569792a45a
 assert(ctrl->is_CFG(), "must be control");
 Node* backedge = _head->as_Loop()->in(LoopNode::LoopBackControl);
 return _phase->dom_lca_internal(ctrl, backedge) == ctrl;
 }
+//------------------------------adjust_limit-----------------------------------
+// Helper function for add_constraint().
+Node* PhaseIdealLoop::adjust_limit(int stride_con, Node * scale, Node *offset, Node *rc_limit, Node *loop_limit, Node *pre_ctrl) {
+// Compute "I :: (limit-offset)/scale"
+Node *con = new (C, 3) SubINode(rc_limit, offset);
+register_new_node(con, pre_ctrl);
+Node *X = new (C, 3) DivINode(0, con, scale);
+register_new_node(X, pre_ctrl);
+// Adjust loop limit
+loop_limit = (stride_con > 0)
+? (Node*)(new (C, 3) MinINode(loop_limit, X))
+: (Node*)(new (C, 3) MaxINode(loop_limit, X));
+register_new_node(loop_limit, pre_ctrl);
+return loop_limit;
+}
 //------------------------------add_constraint---------------------------------
 // Constrain the main loop iterations so the conditions:
 //    low_limit <= scale_con * I + offset  <  upper_limit
 // always holds true.  That is, either increase the number of iterations in
 // the pre-loop or the post-loop until the condition holds true in the main
 // Also for positive stride*scale the affine function is increasing, so the
 // pre-loop must check for underflow and the post-loop for overflow.
 // Negative stride*scale reverses this; pre-loop checks for overflow and
 // post-loop for underflow.
-if (stride_con*scale_con > 0) {
+Node *scale = _igvn.intcon(scale_con);
+set_ctrl(scale, C->root());
+if ((stride_con^scale_con) >= 0) { // Use XOR to avoid overflow
 // The overflow limit: scale*I+offset < upper_limit
 // For main-loop compute
 //   ( if (scale > 0) /* and stride > 0 */
 //       I < (upper_limit-offset)/scale
 //     else /* scale < 0 and stride < 0 */
 //       I > (upper_limit-offset)/scale
 //   )
 //
-// (upper_limit-offset) may overflow when offset < 0.
+// (upper_limit-offset) may overflow or underflow.
 // But it is fine since main loop will either have
 // less iterations or will be skipped in such case.
-Node *con = new (C, 3) SubINode(upper_limit, offset);
+*main_limit = adjust_limit(stride_con, scale, offset, upper_limit, *main_limit, pre_ctrl);
-register_new_node(con, pre_ctrl);
-Node *scale = _igvn.intcon(scale_con);
-set_ctrl(scale, C->root());
-Node *X = new (C, 3) DivINode(0, con, scale);
-register_new_node(X, pre_ctrl);
-// Adjust main-loop last iteration
-Node *loop_limit = *main_limit;
-loop_limit = (stride_con > 0) // scale > 0
-? (Node*)(new (C, 3) MinINode(loop_limit, X))
-: (Node*)(new (C, 3) MaxINode(loop_limit, X));
-register_new_node(loop_limit, pre_ctrl);
-*main_limit = loop_limit;
 // The underflow limit: low_limit <= scale*I+offset.
 // For pre-loop compute
 //   NOT(scale*I+offset >= low_limit)
 //   scale*I+offset < low_limit
 //   )
 if (low_limit->get_int() == -max_jint) {
 if (!RangeLimitCheck) return;
 // We need this guard when scale*pre_limit+offset >= limit
-// due to underflow so we need execute pre-loop until
+// due to underflow. So we need execute pre-loop until
-// scale*I+offset >= min_int. But (low_limit-offset) will
+// scale*I+offset >= min_int. But (min_int-offset) will
-// underflow when offset > 0 and X will be > original_limit.
+// underflow when offset > 0 and X will be > original_limit
-// To avoid it we replace offset = offset > 0 ? 0 : offset
+// when stride > 0. To avoid it we replace positive offset with 0.
-// and add min(pre_limit, original_limit).
+//
+// Also (min_int+1 == -max_int) is used instead of min_int here
+// to avoid problem with scale == -1 (min_int/(-1) == min_int).
 Node* shift = _igvn.intcon(31);
 set_ctrl(shift, C->root());
-Node *neg_off = new (C, 3) RShiftINode(offset, shift);
+Node* sign = new (C, 3) RShiftINode(offset, shift);
-register_new_node(neg_off, pre_ctrl);
+register_new_node(sign, pre_ctrl);
-offset = new (C, 3) AndINode(offset, neg_off);
+offset = new (C, 3) AndINode(offset, sign);
 register_new_node(offset, pre_ctrl);
 } else {
 assert(low_limit->get_int() == 0, "wrong low limit for range check");
 // The only problem we have here when offset == min_int
-// since (0-min_int) == min_int. It may be fine for scale > 0
+// since (0-min_int) == min_int. It may be fine for stride > 0
-// but for scale < 0 X will be < original_limit.
+// but for stride < 0 X will be < original_limit. To avoid it
-}
+// max(pre_limit, original_limit) is used in do_range_check().
-con = new (C, 3) SubINode(low_limit, offset);
+}
-register_new_node(con, pre_ctrl);
+// Pass (-stride) to indicate pre_loop_cond = NOT(main_loop_cond);
-scale = _igvn.intcon(scale_con);
+*pre_limit = adjust_limit((-stride_con), scale, offset, low_limit, *pre_limit, pre_ctrl);
-set_ctrl(scale, C->root());
-X = new (C, 3) DivINode(0, con, scale);
-register_new_node(X, pre_ctrl);
-// Adjust pre-loop last iteration
-loop_limit = *pre_limit;
-loop_limit = (stride_con > 0) // scale > 0
-? (Node*)(new (C, 3) MaxINode(loop_limit, X))
-: (Node*)(new (C, 3) MinINode(loop_limit, X));
-register_new_node( loop_limit, pre_ctrl );
-*pre_limit = loop_limit;
 } else { // stride_con*scale_con < 0
 // For negative stride*scale pre-loop checks for overflow and
 // post-loop for underflow.
 //
-// The underflow limit: low_limit <= scale*I+offset.
-// For main-loop compute
-//   scale*I+offset+1 > low_limit
-//   ( if (scale < 0) /* and stride > 0 */
-//       I < (low_limit-(offset+1))/scale
-//     else /* scale < 0 and stride < 0 */
-//       I > (low_limit-(offset+1))/scale
-//   )
-if (low_limit->get_int() == -max_jint) {
-if (!RangeLimitCheck) return;
-} else {
-assert(low_limit->get_int() == 0, "wrong low limit for range check");
-}
-Node *one  = _igvn.intcon(1);
-set_ctrl(one, C->root());
-Node *plus_one = new (C, 3) AddINode(offset, one);
-register_new_node( plus_one, pre_ctrl );
-Node *con = new (C, 3) SubINode(low_limit, plus_one);
-register_new_node(con, pre_ctrl);
-Node *scale = _igvn.intcon(scale_con);
-set_ctrl(scale, C->root());
-Node *X = new (C, 3) DivINode(0, con, scale);
-register_new_node(X, pre_ctrl);
-// Adjust main-loop last iteration
-Node *loop_limit = *main_limit;
-loop_limit = (stride_con > 0) // scale < 0
-? (Node*)(new (C, 3) MinINode(loop_limit, X))
-: (Node*)(new (C, 3) MaxINode(loop_limit, X));
-register_new_node(loop_limit, pre_ctrl);
-*main_limit = loop_limit;
 // The overflow limit: scale*I+offset < upper_limit
 // For pre-loop compute
 //   NOT(scale*I+offset < upper_limit)
 //   scale*I+offset >= upper_limit
 //   scale*I+offset+1 > upper_limit
 //   ( if (scale < 0) /* and stride > 0 */
 //       I < (upper_limit-(offset+1))/scale
-//     else /* scale < 0 and stride < 0 */
+//     else /* scale > 0 and stride < 0 */
 //       I > (upper_limit-(offset+1))/scale
 //   )
-plus_one = new (C, 3) AddINode(offset, one);
+//
+// (upper_limit-offset-1) may underflow or overflow.
+// To avoid it min(pre_limit, original_limit) is used
+// in do_range_check() for stride > 0 and max() for < 0.
+Node *one  = _igvn.intcon(1);
+set_ctrl(one, C->root());
+Node *plus_one = new (C, 3) AddINode(offset, one);
 register_new_node( plus_one, pre_ctrl );
-con = new (C, 3) SubINode(upper_limit, plus_one);
+// Pass (-stride) to indicate pre_loop_cond = NOT(main_loop_cond);
-register_new_node(con, pre_ctrl);
+*pre_limit = adjust_limit((-stride_con), scale, plus_one, upper_limit, *pre_limit, pre_ctrl);
-scale = _igvn.intcon(scale_con);
-set_ctrl(scale, C->root());
+if (low_limit->get_int() == -max_jint) {
-X = new (C, 3) DivINode(0, con, scale);
+if (!RangeLimitCheck) return;
-register_new_node(X, pre_ctrl);
+// We need this guard when scale*main_limit+offset >= limit
+// due to underflow. So we need execute main-loop while
-// Adjust pre-loop last iteration
+// scale*I+offset+1 > min_int. But (min_int-offset-1) will
-loop_limit = *pre_limit;
+// underflow when (offset+1) > 0 and X will be < main_limit
-loop_limit = (stride_con > 0) // scale < 0
+// when scale < 0 (and stride > 0). To avoid it we replace
-? (Node*)(new (C, 3) MaxINode(loop_limit, X))
+// positive (offset+1) with 0.
-: (Node*)(new (C, 3) MinINode(loop_limit, X));
+//
-register_new_node( loop_limit, pre_ctrl );
+// Also (min_int+1 == -max_int) is used instead of min_int here
-*pre_limit = loop_limit;
+// to avoid problem with scale == -1 (min_int/(-1) == min_int).
+Node* shift = _igvn.intcon(31);
+set_ctrl(shift, C->root());
+Node* sign = new (C, 3) RShiftINode(plus_one, shift);
+register_new_node(sign, pre_ctrl);
+plus_one = new (C, 3) AndINode(plus_one, sign);
+register_new_node(plus_one, pre_ctrl);
+} else {
+assert(low_limit->get_int() == 0, "wrong low limit for range check");
+// The only problem we have here when offset == max_int
+// since (max_int+1) == min_int and (0-min_int) == min_int.
+// But it is fine since main loop will either have
+// less iterations or will be skipped in such case.
+}
+// The underflow limit: low_limit <= scale*I+offset.
+// For main-loop compute
+//   scale*I+offset+1 > low_limit
+//   ( if (scale < 0) /* and stride > 0 */
+//       I < (low_limit-(offset+1))/scale
+//     else /* scale > 0 and stride < 0 */
+//       I > (low_limit-(offset+1))/scale
+//   )
+*main_limit = adjust_limit(stride_con, scale, plus_one, low_limit, *main_limit, pre_ctrl);
 }
 }
 //------------------------------is_scaled_iv---------------------------------
 if( cmp->Opcode() == Op_CmpU ) {// Unsigned compare is really 2 tests
 if( b_test._test == BoolTest::lt ) { // Range checks always use lt
 // The underflow and overflow limits: 0 <= scale*I+offset < limit
 add_constraint( stride_con, scale_con, offset, zero, limit, pre_ctrl, &pre_limit, &main_limit );
 if (!conditional_rc) {
-conditional_rc = !loop->dominates_backedge(iff);
+// (0-offset)/scale could be outside of loop iterations range.
-// It is also needed if offset->_lo == min_int since
+conditional_rc = !loop->dominates_backedge(iff) || RangeLimitCheck;
-// (0-min_int) == min_int. It may be fine for stride > 0
-// but for stride < 0 pre_limit will be < original_limit.
-const TypeInt* offset_t = _igvn.type(offset)->is_int();
-conditional_rc |= RangeLimitCheck && (offset_t->_lo == min_jint) &&
-(scale_con<0) && (stride_con<0);
 }
 } else {
 #ifndef PRODUCT
 if( PrintOpto )
 tty->print_cr("missed RCE opportunity");
 register_new_node( limit, pre_ctrl );
 }
 // Fall into LT case
 case BoolTest::lt:
 // The underflow and overflow limits: MIN_INT <= scale*I+offset < limit
+// Note: (MIN_INT+1 == -MAX_INT) is used instead of MIN_INT here
+// to avoid problem with scale == -1: MIN_INT/(-1) == MIN_INT.
 add_constraint( stride_con, scale_con, offset, mini, limit, pre_ctrl, &pre_limit, &main_limit );
 if (!conditional_rc) {
-conditional_rc = !loop->dominates_backedge(iff);
+// ((MIN_INT+1)-offset)/scale could be outside of loop iterations range.
-// It is also needed if scale*pre_limit+offset >= limit
+// Note: negative offset is replaced with 0 but (MIN_INT+1)/scale could
-// due to underflow so we need execute pre-loop until
+// still be outside of loop range.
-// scale*I+offset >= min_int. But (low_limit-offset) will
+conditional_rc = !loop->dominates_backedge(iff) || RangeLimitCheck;
-// underflow when offset > 0 and X will be > original_limit.
-const TypeInt* offset_t = _igvn.type(offset)->is_int();
-conditional_rc |= RangeLimitCheck && (offset_t->_hi > 0) &&
-(scale_con>0) && (stride_con>0);
 }
 break;
 default:
 #ifndef PRODUCT
 if( PrintOpto )

Mercurial > hg > graal-jvmci-8

comparison src/share/vm/opto/loopTransform.cpp @ 3383:38569792a45a