아이템 6. 불필요한 객체 생성을 피하라
교재 : Effective java, 강의 : inflearn 백기선
똑같은 기능의 객체를 매번 생성하기보다는 객체 하나를 재사용하는 편이 나을 때가 많다.
public static void main(String[] args) {
String hello = "hello";
String hello2 = new String("hello");
// 이 문장은 실행될 때마다 String 인스턴스를 새로 만든다. (권장하지 않음)
String hello3 = "hello";
System.out.println(hello == hello2); // false
System.out.println(hello.equals(hello2)); // true
System.out.println(hello == hello3); // true
System.out.println(hello.equals(hello3)); // true
}
JVM이 문자열을 풀에서 캐싱 하고 있다.
일종의 해시맵에 한 번 만들어진 문자열을 담아놓고 참조하는데, new로 생성하면 새로 만들게 된다.
정적 팩터리 메서드를 제공하는 불변 클래스
생성자 대신 정적 팩터리 메서드를 제공하는 불변 클래스에서는 정적 팩터리 메서드를 사용해 불필요한 객체 생성을 피할 수 있다. Boolean(String)
생성자 대신 Boolean.valueOf(String)
팩터리 메서드를 사용하는 것이 좋다. (이 생성자는 자바 9에서 deprecated API로 지정되었다.)
@Deprecated(since="9")
public Boolean(String s) {
this(parseBoolean(s));
}
public static Boolean valueOf(String s) {
return parseBoolean(s) ? TRUE : FALSE;
}
불변 객체가 아니라 가변 객체라 해도 사용 중에 변경되지 않을 것임을 안다면 재사용할 수 있다.
생성 비용이 비싼 객체도 더러 있다.
static boolean isRomanNumeralSlow(String s) {
return s.matches("^(?=.)M*(C[MD]|D?C{0,3})"
+ "(X[CL]|L?X{0,3})(I[XV]|V?I{0,3})$");
}
String.matches
는 정규표현식으로 문자열 형태를 확인하는 가장 쉬운 방법이지만, 성능이 중요한 상황에서 반복해 사용하기엔 적합하지 않다.
이 메서드가 내부에서 만드는 정규표현식용 Pattern
인스턴스는, 한 번 쓰고 버려져서 곧바로 가비지 컬렉션 대상이 된다. Pattern은 입력받은 정규표현식에 해당하는 유한 상태 머신(finite state machine)을 만들기 때문에 인스턴스 생성 비용이 높다.
public class RomanNumerals {
private static final Pattern ROMAN = Pattern.compile(
"^(?=.)M*(C[MD]|D?C{0,3})"
+ "(X[CL]|L?X{0,3})(I[XV]|V?I{0,3})$");
static boolean isRomanNumeralFast(String s) {
return ROMAN.matcher(s).matches();
}
}
필요한 정규표현식을 표현하는 불변인 Pattern
인스턴스를 클래스 초기화(정적 초기화) 과정에서 직접 생성해 캐싱해두고, 나중에 isRomanNumeralFast
메서드가 호출될 때마다 이 인스턴스를 재사용한다. 이렇게 개선하면 isRomanNumeralFast
이 빈번하게 호출되는 상황에서 성능을 상당히 끌어올릴 수 있다. 또 이름을 지어주어 코드의 의미가 훨씬 잘 드러난다.
public static void main(String[] args) {
boolean result = false;
long start = System.nanoTime();
for (int j = 0; j < 100; j++) {
// TODO 성능 차이를 확인하려면 xxxSlow 메서드를 xxxFast 메서드로 바꿔 실행해보자.
result = isRomanNumeralSlow("MCMLXXVI"); // 11258750 출력
// result = isRomanNumeralFast("MCMLXXVI"); // 1985917 출력
}
long end = System.nanoTime();
System.out.println(end - start);
System.out.println(result);
}
isRomanNumeralSlow, isRomanNumeralFast 성능 차이가 꽤 많이 발생함을 볼 수 있다.
개선된 isRomanNumeralFast 방식의 클랙스가 초기화된 후 이 메서드를 한 번도 호출하지 않는다면 ROMAN
필드는 쓸데없이 초기화된 꼴이지만, isRomanNumeralFast 메서드가 처음 호출될 때 필드를 초기화하는 지연 초기화(lazy initialization)는 권하지 않는다. 지연 초기화는 코드를 복잡하게 만드는데, 성능은 크게 개선되지 않을 때가 많기 때문이다.
오토박싱(auto boxing)
프로그래머가 기본 타입과 박싱된 기본 타입을 섞어 쓸 때 자동으로 상호 변환해주는 기술로, 불필요한 객체를 만들어낼 수도 있다.
private static long sum() {
Long sum = 0L;
// long sum = 0L;
for (long i = 0; i <= Integer.MAX_VALUE; i++) {
sum += i;
}
return sum;
}
sum 변수를 long이 아닌 Long으로 선언해서 불필요한 Long 인스턴스가 Integer.MAX_VALUE (2^31 - 1)개나 만들어졌다.
박싱된 기본 타입보다는 기본 타입을 사용하고, 의도치 않은 오토박싱이 숨어들지 않도록 주의하자.
"객체 생성은 비싸니 피해야 한다"로 오해하면 안 된다. 특히나 요즘의 JVM에서는 별다른 일을 하지 않는 작은 객체를 생성하고 회수하는 일이 크게 부담되지 않고, 프로그램의 명확성, 간결성, 기능을 위해서 객체를 추가로 생성하는 것이라면 일반적으로 좋은 일이다.
아주 무거운 객체가 아닌 다음에야 단순히 객체 생성을 피하고자 여러분만의 객체 풀(pool)을 만들지는 말자.
- 데이터 베이스 연결 같은 경우 생성 비용이 워낙 비싸니 재사용 하는 편이 낫다. (객체 풀을 만드는 게 나은 예)
- 하지만 일반적으로는 자체 객체 풀은 코드를 헷갈리게 만들고 메모리 사용량을 늘리고 성능을 떨어뜨린다. 요즘 JVM의 가비지 컬렉터는 상당히 잘 최적화되어서 가벼운 객체용을 다룰 때는 직접 만든 객체 풀보다 훨씬 빠르다.