Zustandsloses Ergebnis-Streaming mit JPA und Hibernate

Snippet

Zustandsloses Ergebnis-Streaming mit JPA und Hibernate

Das Streaming großer Datensätze erfordert ein Fine-Tuning von Hibernate, um OutOfMemoryErrors zu verhindern. Durch Setzen der fetchSize und Aktivieren des readOnly-Modus zwingen wir den Treiber, Zeilen in Blöcken abzurufen und den Overhead des 1st-Level-Caches von Hibernate zu umgehen.

snippet.java
java
@Repository
public interface LargeDataRepository extends JpaRepository<Entity, Long> {
    @QueryHints(value = {
        @QueryHint(name = "org.hibernate.fetchSize", value = "500"),
        @QueryHint(name = "org.hibernate.readOnly", value = "true"),
        @QueryHint(name = "org.hibernate.cacheable", value = "false")
    })
    @Query("select e from Entity e")
    Stream<Entity> streamAllByCustomQuery();
}
 
// Usage in Service
@Transactional(readOnly = true)
public void processBatch() {
    try (Stream<Entity> entityStream = repository.streamAllByCustomQuery()) {
        entityStream.forEach(e -> { /* process and detach */ });
    }
}

spring

Erklärung

Stream<Entity>

Rückgabetyp, der es ermöglicht, Ergebnisse einzeln zu verarbeiten, ohne die gesamte Liste in den RAM zu laden.

org.hibernate.fetchSize

Weist den JDBC-Treiber an, Ergebnisse in kleineren Blöcken statt alle auf einmal abzurufen.

try (Stream<Entity> ...)

KRITISCH: Der Stream muss innerhalb eines try-with-resources verwendet werden, um sicherzustellen, dass die zugrunde liegende Datenbankverbindung korrekt geschlossen wird.

Vorheriges Snippet

Mehr Java-Übungen für Experten →

Verwandt

Aus deiner Bibliothek