AI智能
改变未来

Java 表达式之谜:为什么 index 增加了两次?

Code Golf中的一位挑战者在比赛中写了下面这段代码:(译注:Code Golf是一个编程挑战比赛,提交的代码越短越好)

import java.util.*;public class Main {  public static void main(String[] args) {    int size = 3;    String[] array = new String[size];    Arrays.fill(array, \"\");    for(int i = 0; i <= 100; ) {      array[i++%size] += i + \" \";    }    for(String element: array) {      System.out.println(element);    }  }}

在Java 8中运行代码,得到结果如下:

1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58 61 64 67 70 73 76 79 82 85 88 91 94 97 100 2 5 8 11 14 17 20 23 26 29 32 35 38 41 44 47 50 53 56 59 62 65 68 71 74 77 80 83 86 89 92 95 98 101 3 6 9 12 15 18 21 24 27 30 33 36 39 42 45 48 51 54 57 60 63 66 69 72 75 78 81 84 87 90 93 96 99

在Java 10中运行代码,得到结果如下:

2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50 52 54 56 58 60 62 64 66 68 70 72 74 76 78 80 82 84 86 88 90 92 94 96 98 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50 52 54 56 58 60 62 64 66 68 70 72 74 76 78 80 82 84 86 88 90 92 94 96 98 100 102 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50 52 54 56 58 60 62 64 66 68 70 72 74 76 78 80 82 84 86 88 90 92 94 96 98 100

在Java 10中编号似乎完全失效了。这中间发生了什么?这是Java 10的bug吗?

来自评论区的讨论:

用Java 9或更高版本编译会出现问题(我们在Java 10中找到了问题)。在Java 8上编译这段代码,然后在Java 9或更高版本(包括Java 11 EA)中运行,可以得到预期结果。

虽然这种代码不标准,但符合Java规范。Kevin Cruijssen在一个Code Golf挑战中发现了这个问题,看起来结果很奇怪。

Didier L发现可以用更短、更容易理解的代码重现该问题:

class Main {  public static void main(String[] args) {    String[] array = { \"\" };    array[test()] += \"a\";  }  static int test() {    System.out.println(\"evaluated\");    return 0;  }}

用Java 8编译,运行结果:

evaluated

用Java 9和10编译,运行结果

evaluatedevaluated

问题似乎与字符串连接操作和赋值运算符(+=)有关,当作为左操作符时会出现副作用,例如array[test()]+=\”a\”、array[ix++]+=\”a\”、test()[index]+=\”a\”或test().field+=\”a\”。字符串连接要求至少有一边的对象类型为String。其他类型或结构无法复现该错误。

答案

这是JDK 9开始引入的一个javac bug(疑似在字符串拼接过程中进行了修改),已由javac团队确认,bug id  JDK-8204322。查看该行对应的字节码:

array[i++%size] += i + \" \";

字节码:

  21: aload_2  22: iload_3  23: iinc          3, 1  26: iload_1  27: irem  28: aload_2  29: iload_3  30: iinc          3, 1  33: iload_1  34: irem  35: aaload  36: iload_3  37: invokedynamic #5,  0 // makeConcatWithConstants:(Ljava/lang/String;I)Ljava/lang/String;  42: aastore

最后的aaload从数组中实际加载数据。但是,下面这段

  21: aload_2             // load 数组引用  22: iload_3             // load \'i\'  23: iinc          3, 1  // \'i\' 加1  (不影响已加载的数组值)  26: iload_1             // load \'size\'  27: irem                // 计算余数

基本上能与array[i++%size]表达式对应(去掉实际的load和store),问题是这里出现了两次。按照jls-15.26.2规范中的描述,这是不正确的:

复合表达式E1 op= E2与E1 = (T) ((E1) op (E2))等价,其中T的类型是E1,除了E1应该只执行一次。

因此,表达式array[i++%size] += i + \” \”;中array[i++%size]应该只计算一次。但是这里会计算两次(load一次,store一次)。

可以确认,这是一个bug。

更新:

该bug已在JDK 11中修复,并且对应更新到JDK 10(但JDK 9不会修复,因为它不再进行public updates)。

Aleksey ShipilevJBS 页面上提到(@DidierL在此进行了评论):

解决方法:使用-XDstringConcat=inline编译。

这样会使用StringBuilder进行字符串连接,不会出现该bug。

原作者:ImportNew/唐尤华
原文链接:Java 表达式之谜:为什么 index 增加了两次?
原出处:公众号

赞(0) 打赏
未经允许不得转载:爱站程序员基地 » Java 表达式之谜:为什么 index 增加了两次?