BOOK 3 - 자바 ORM 표준 JPA 프로그래밍(3)

영속성 관리

  • JPA가 제공하는 기능
    • entity와 table을 매핑하는 설계 부분
    • 매핑한 entity를 실제 사용하는 부분
  • EntityManager는 엔티티를 저장, 수정, 삭제, 조회하는 등 엔티티와 관련된 모든 일을 처리한다.
    • 즉, 엔티티를 저장하는 가상의 데이터베이스로 생각할 수 있다.

EntityManagerFactory 와 EntityManager

  • 데이터베이스를 하나만 사용하는 어플리케이션은 일반적으로 EntityManagerFactory를 하나만 생성한다.

  • 필요할 때마다 EntityManagerFactory에서 EntityManager를 생성한다.

  • 엔티티 매니저 팩토리는 여러 스레드가 동시 접근해도 안전하므로 서로 다른 스레드 간에 공유해도 되지만, 엔티티 매니저는 여러 스레드가 동시 접근하면 문제가 발생하므로 스레드 간에 절대 공유하면 안된다.

    image

  • JPA 구현체들은 EntityManagerFactory를 생성할 때 Connection pool도 만든다.

    • 엔티티 매니저는 데이터베이스 연결이 꼭 필요한 시점까지 connection을 얻지 않는다. 보통 트랜잭션을 시작할 때 커넥션을 획득한다.

영속성 컨텍스트

  • persistence context란 엔티티를 영구 저장하는 환경이라는 의미이다.
  • 엔티티 매니저로 엔티티를 저장하거나 조회하면 엔티티 매니저는 영속성 컨텍스트에 엔티티를 보관하고 관리한다.
    • 예를 들어 persist() 메서드는 엔티티 매니저를 사용해서 엔티티를 영속성 컨텍스트에 저장한다.

What exactly is a Persistence in JPA? How is it connected to  EntityManagerFactory? - Stack Overflow

  • 엔티티 매니저를 통해서 영속성 컨텍스트에 접근할 수 있고, 영속성 컨텍스트를 관리할 수 있다.

여러 엔티티 매니저가 같은 영속성 컨텍스트에 접근할 수 있다.

엔티티 생명주기

  • 엔티티에는 다음과 같은 4가지 상태가 존재한다.
    • 비영속(new / transient) : 영속성 컨텍스트와 전혀 관계가 없는 상태
    • 영속(managed) : 영속성 컨텍스트에 저장된 상태
    • 준영속(detached) : 영속성 컨텍스트에 저장되었다가 분리된 상태
    • 삭제(removed) : 삭제된 상태

image

  • 비영속
    • 엔티티 객체를 new 연산자로 생성하여 순수한 객체 상태이며 아직 저장하지 않은 상태
    • 영속성 컨텍스트나 데이터베이스와는 전혀 관련이 없다.
  • 영속
    • 엔티티 매니저를 통해서 엔티티를 영속성 컨텍스트에 저장한 상태
    • 즉, 엔티티가 영속성 컨텍스트에 의해 관리된다는 뜻이다.
    • find 나 JPQL을 사용해서 조회한 엔티티도 영속성 컨텍스트가 관리하는 영속 상태이다.
  • 준영속
    • 영속성 컨텍스트가 관리하던 영속 상태의 엔티티를 영속성 컨텍스트가 더이상 관리하지 않는 상태
    • detach() 를 호출하여 엔티티를 분리하거나 close() 를 호출해서 영속성 컨텍스트를 닫거나 clear() 를 호출해서 영속성 컨텍스트를 초기화하면 엔티티는 준영속 상태가 된다.
  • 삭제
    • 엔티티를 영속성 컨텍스트와 데이터베이스에서 삭제한다.
    • remove() 메서드로 엔티티를 삭제할 수 있다.

영속성 컨텍스트 특징

  • 식별자 값
    • 영속성 컨텍스트는 엔티티를 식별자 값(@Id 로 매핑된 값)으로 구분한다.
    • 영속 상태는 식별자 값이 반드시 있어야 하고, 없으면 예외가 발생한다.
  • 데이터베이스 저장
    • JPA는 보통 transaction을 commit하는 순간 영속성 컨텍스트에 새로 저장된 엔티티를 데이터베이스에 반영하는데, 이것을 flush 라고 한다.
  • 영속성 컨텍스트의 장점
    • 1차 캐시
    • 동일성 보장
    • 트랜잭션을 지원하는 쓰기 지연
    • 변경 감지
    • 지연 로딩

엔티티 조회

  • 영속성 컨텍스트는 내부에 캐시를 가지고 있는데 이것을 1차 캐시라 한다.
    • 영속 상태의 엔티티는 모두 이 1차 캐시에 저장된다.
    • 저장할 때 key는 식별자 값으로, value는 엔티티 인스턴스로 저장한다.
    • 즉, 영속성 컨텍스트에 데이터를 저장하고 조회하는 모든 기준은 데이터베이스 primary key 값이다.
  • find() 메서드를 호출하면 먼저 1차 캐시에서 엔티티를 찾고, 결과가 없으면 데이터베이스에서 조회한다.

1차 캐시 조회

image

  • 1차 캐시에서 식별자 값으로 엔티티를 조회한다.

데이터베이스에서 조회

  • find() 를 호출했는데 1차 캐시에 엔티티가 없으면 엔티티 매니저는 데이터베이스를 조회해서 엔티티를 생성한다.
    • 그리고 1차 캐시에 저장한 후 영속 상태의 엔티티를 반환한다.

image

  • find() 를 호출했을 당시 1차 캐시에는 member2 인스턴스가 없기 때문에 DB에서 조회한다.
  • 조회한 데이터로 member2 엔티티를 생성하여 1차 캐시에 저장한다.
  • 조회한 엔티티를 반환한다.

영속 엔티티의 동일성 보장

Member a = em.find(Member.class, "member1");
Member b = em.find(Member.class, "member1");
  • 위 코드에서 a==b 는 참일까 거짓일까?
    • find() 를 반복해서 호출해도 영속성 컨텍스트는 1차 캐시에 있는 같은 엔티티 인스턴스를 반환한다.
    • 따라서 위의 결과는 참이다.
    • 즉, 영속성 컨텍스트는 성능상 이점과 엔티티의 동일성을 보장한다.

JPA는 1차 캐시를 통해 REPEATABLE READ 등급의 트랜잭션 격리 수준을 데이터베이스가 아닌 어플리케이션 차원에서 제공한다는 장점이 있다.

엔티티 등록

  • 엔티티 매니저는 트랜잭션을 커밋하기 직전까지 데이터베이스에 엔티티를 저장하지 않고 내부 쿼리 저장소에 INSERT SQL을 모아둔다.
  • 트랜잭션을 커밋할 때 모아둔 쿼리를 데이터베이스에 보낸다.
    • 이것을 쓰기 지연(Transactional write-behind) 이라 한다.

image

  • persist() 를 호출하면 엔티티를 영속화하여 1차 캐시에 엔티티를 저장한다.
  • 동시에 엔티티 정보로 INSERT SQL을 생성하여 쓰기 지연 SQL 저장소 에 보관한다.

  • transaction을 commit하면 엔티티 매니저는 영속성 컨텍스트를 flush한다.
  • flush 는 영속성 컨텍스트의 변경 내용을 데이터베이스에 동기화하는 작업이다.
    • 이 때 등록, 수정, 삭제한 엔티티를 데이터베이스에 반영한다.
    • 즉, 쓰기 지연 SQL 저장소 에 모인 쿼리를 데이터베이스에 보낸다.
  • flush 작업이 완료되면 데이터베이스 트랜잭션을 commit한다.

엔티티 수정

변경 감지

  • JPA로 엔티티를 수정할 때는 단순히 엔티티를 조회해서 해당 인스턴스의 데이터만 변경하면 된다.

    Member member = em.find(Member.class, "member1");
    member.setName("name1");
    member.setAge(10);
    
    • update() 메서드를 실행하지 않아도 된다.
  • 변경 감지(dirty checking) : 엔티티의 변경사항을 데이터베이스에 자동으로 반영하는 기능

    • 변경 감지는 영속성 컨텍스트가 관리하는 영속 상태의 엔티티에만 적용되므로 비영속, 준영속 상태의 엔티티는 값을 변경해도 데이터베이스에 반영되지 않는다.

image

  • JPA는 엔티티를 영속성 컨텍스트에 저장할 때, 최초 상태를 복사해서 저장해두는데 이것을 snapshot이라고 한다.
  • 플러시 시점에 스냅샷과 엔티티를 비교하여 변경된 엔티티를 찾는다.
  1. 트랜잭션을 커밋하면 엔티티 매니저 내부에서 flush() 가 호출된다.
  2. 엔티티와 스냅샷을 비교해서 변경된 엔티티를 찾는다.
  3. 변경된 엔티티가 있으면 UPDATE SQL을 생성해서 쓰기 지연 SQL 저장소에 저장한다.
  4. 쓰기 지연 SQL 저장소의 SQL을 데이터베이스에 보낸다.
  5. 데이터베이스 트랜잭션을 커밋한다.
  • JPA가 변경 감지로 실행하는 UPDATE SQL은 엔티티의 모든 필드를 업데이트한다.
    • 모든 필드를 수정하게 되면 수정 쿼리가 항상 같아 어플리케이션 로딩 시점에 수정 쿼리를 미리 생성해두고 재사용할 수 있다.
    • 데이터베이스에 동일한 쿼리를 보내면 데이터베이스는 이전에 한 번 파싱된 쿼리를 재사용할 수 있다.
  • 수정된 필드만 사용해서 동적으로 UPDATE SQL을 생성하는 전략을 사용하고 싶으면 하이버네이트 확장 기능을 사용할 수 있다.
    • @DynamicUpdate 어노테이션을 엔티티 클래스에 선언해주면 수정된 데이터만 사용해서 동적으로 UDPATE SQL을 생성한다.
    • 데이터가 null 이 아닌 필드만으로 INSERT SQL을 동적으로 생성하는 @DynamicInsert 어노테이션도 있다.
  • 컬럼이 대략 30개 이상이 되면 기본 방법인 정적 수정 쿼리보다 동적 수정 쿼리가 빠르다고 한다.
    • 일반적으로 기본 전략을 사용하고, 최적화가 필요할 정도로 느리면 전략을 수정하는 것이 좋다.

엔티티 삭제

  • remove() 를 호출하면 DELETE SQL을 생성해서 쓰기 지연 SQL 저장소에 등록한다.
    • 이후 트랜잭션을 커밋하면 실제 데이터베이스에 삭제 쿼리를 전달한다.
  • 단, remove() 를 호출하는 순간 해당 엔티티는 영속성 컨텍스트에서 제거된다.
    • 이렇게 제거된 엔티티는 재사용하지 말고 GC의 대상이 되도록 두는 것이 좋다.

플러시

  • 플러시는 영속성 컨텍스트의 변경 내용을 데이터베이스에 반영한다.
  1. dirty checking을 통해 영속성 컨텍스트에 있는 모든 엔티티를 스냅샷과 비교해서 수정된 엔티티를 찾는다.
  2. 수정된 엔티티는 UPDATE SQL을 만들어 쓰기 지연 SQL 저장소에 등록한다.
  3. 쓰기 지연 SQL 저장소의 쿼리를 데이터베이스에 전송한다.
  • 플러시하는 방법은 아래 3가지가 있다.
    • flush() 를 직접 호출
    • transaction commit -> 플러시가 자동 호출된다.
    • JPQL 쿼리 실행 -> 플러시가 자동 호출된다.
  • 직접 호출

    • flush() 를 직접 호출해서 영속성 컨텍스트를 강제로 플러시한다.
    • 테스트나 다른 프레임워크와 JPA를 함께 사용할 때를 제외하고 거의 사용하지 않는다.
  • 트랜잭션 커밋 시 플러시 자동 호출

    • 트랜잭션을 커밋하기 전에 플러시를 호출해서 영속성 컨텍스트의 변경 내용을 데이터베이스에 반영한다.
  • JPQL 쿼리 실행시 플러시 자동 호출

    • JPQL이나 Criteria 같은 객체 지향 쿼리를 호출할 때 플러시가 자동 호출된다.
    em.persist(member1);
    em.persist(member2);
    em.persist(member3);
      
    query = em.createQuery("select m from Member m", Member.class);
    List<Member> members = query.getResultList();
    
    • 위 코드에서 member1 , member2 , member3 인스턴스는 영속성 컨텍스트에는 있지만 아직 데이터베이스에는 반영되지 않았다.
      • 이 때 JPQL을 실행하면 JPQL은 SQL로 변환되어 데이터베이스에서 엔티티를 조회하고, 위의 세 엔티티는 데이터베이스에 없으므로 조회되지 않는다.
    • JPQL 쿼리를 실행하기 전에 영속성 컨텍스트를 플러시해서 변경 내용을 데이터베이스에 반영해야 한다.

준영속

  • 영속성 컨텍스트가 관리하는 영속 상태의 엔티티가 영속성 컨텍스트에서 분리된 것을 준영속 상태라고 한다.
  • 준영속 상태의 엔티티는 영속성 컨텍스트가 제공하는 기능을 사용할 수 없다.
  • 준영속 상태로 만드는 방법은 다음 3가지가 있다.
    • detach(entity) : 특정 엔티티만 준영속 상태로 전환한다.
    • clear() : 영속성 컨텍스트를 완전히 초기화한다.
    • close() : 영속성 컨텍스트를 종료한다.

detach

  • detach() 를 호출하면 1차 캐시부터 쓰기 지연 SQL 저장소까지 해당 엔티티를 관리하기 위한 모든 정보가 제거된다.
    • 만약 쓰기 지연 SQL 저장소에 해당 엔티티의 INSERT SQL이 있었다면 제거되어 데이터베이스에 저장되지 않는다.

clear

  • clear() 는 영속성 컨텍스트를 초기화해서 해당 영속성 컨텍스트의 모든 엔티티를 준영속 상태로 만든다.
    • 영속성 컨텍스트를 제거하고 새로 만든 것과 같다.

close

  • 영속성 컨텍스트를 종료하면 해당 영속성 컨텍스트가 관리하던 영속 상태의 엔티티가 모두 준영속 상태가 된다.

준영속 상태의 특징

  • 거의 비영속 상태에 가깝다.
    • 1차 캐시, 쓰기 지연, 변경 감지, 지연 로딩을 포함한 영속성 컨텍스트가 제공하는 어떠한 기능도 동작하지 않는다.
  • 식별자 값을 가지고 있다.
    • 비영속 상태는 식별자 값이 없을 수도 있지만 준영속 상태는 이미 한 번 영속 상태였으므로 반드시 식별자 값을 가지고 있다.
  • 지연 로딩을 할 수 없다.
    • 지연 로딩 : 실제 객체 대신 프록시 객체를 로딩해두고 해당 객체를 실제 사용할 때 영속성 컨텍스트를 통해 데이터를 불러오는 방법
    • 준영속 상태의 엔티티는 영속성 컨텍스트가 관리하지 않으므로 지연 로딩시 문제가 발생한다.

merge

  • 준영속 상태의 엔티티를 다시 영속 상태로 변경하려면 병합을 사용하면 된다.

  • merge() 메서드를 호출하면 준영속 상태의 엔티티를 받아서 그 정보로 새로운 영속 상태의 엔티티를 반환한다.

    Member mergeMember = em.merge(member);
    
    • member 엔티티 인스턴스는 그대로 준영속 상태이고, 새로 반환받은 mergeMember 엔티티 인스턴스가 영속 상태이다.
    • 준영속 상태인 member 엔티티를 수정해도 데이터베이스에 반영되지 않는다.
  • merge의 동작 방식은 다음과 같다.

    1. merge(member) 를 실행한다.
    2. parameter로 넘어온 준영속 엔티티의 식별자 값으로 1차 캐시에서 엔티티를 조회한다.
      • 1차 캐시에 엔티티가 없으면 데이터베이스에서 조회하여 1차 캐시에 저장한다.
    3. 조회한 영속 엔티티(mergeMember)에 파라미터로 넘어온 준영속 엔티티(member) 값을 채워넣는다.
    4. 영속 엔티티를 반환한다.
  • merge는 비영속 엔티티도 영속 상태로 만들 수 있다.