배치 프레임워크-Spring Batch 예시 및 설명 - 배치 애플리케이션의 필수요소, Spring Batch의 핵심기능, Spring Batch가 제공하는 저장소 관련 기술, Spring Batch의 핵심 컴포넌트, Spring Batch와 외부 시스템..

CODEDRAGON Development/Software Engineering

반응형

 

 

배치 프레임워크-Spring Batch 예시 및 설명

·       배치 애플리케이션의 필수요소

·       Spring Batch의 핵심기능

·       Spring Batch가 제공하는 저장소 관련 기술

·       Spring Batch의 핵심 컴포넌트

·       Spring Batch와 외부 시스템과의 관계

·       Spring Batch의 아키텍처

 

 

♣배치 애플리케이션의 필수요소

요소

설명

대용량 데이터

대용량의 데이터를 처리할 수 있어야 한다.

자동화

심각한 오류 상황 외에는 사용자의 개입 없이 동작해야 한다.

견고함

유효하지 않은 데이터의 경우도 처리해서 비정상적인 동작 중단이 발생하지 않아야 한다.

안정성

어떤 문제가 생겼는지 언제 발생했는지 등을 추적할 수 있어야 한다.

성능

주어진 시간 내에 처리를 완료할 수 있어야 하고 동시에 동작하고 있는 다른 애플리케이션을 방해하지 말아야 한다.

 

 

 

Spring Batch의 핵심기능

요소

설명

스프링 프레임워크 기반

스프링의 DI, AOP 및 다양한 엔터프라이즈 지원 기능을 사용 한다.

배치기반 처리

데이터를 읽고 쓸 때 가장 효과적인 방법을 이용하도록 강제 한다.

자체제공 컴포넌트

데이터베이스나 파일로부터 데이터를 읽거나 쓰는 등의 배치처리 시에 공통적으로 필요한 컴포넌트를 제공한다.

견고함과 안정성

선언적 생략과 처리 실패 후 재시도 설정을 제공한다.

성능

주어진 시간 내에 처리를 완료할 수 있어야 하고 동시에 동작하고 있는 다른 애플리케이션을 방해하지 말아야 한다.

 

 

 

Spring Batch가 제공하는 저장소 관련 기술

기능

설명

JDBC

페이징, 커서, 배치 업데이트 기능을 제공한다.

Hibernate

페이징, 커서 기능을 제공한다.

JPA(Java Persistence API)

페이징 기능을 제공한다.

iBatis

페이징 기능을 제공한다.

Flat File

델리미터 또는 고정 길이로 구분된 파일을 지원한다.

XML

스프링 OXM 기반의 StAX(Streaming API for XML)을 사용하여 파싱한다.

OXM JAXB(Java Architecture for XML Binding), XStream Castor를 지원한다.

 

 

 

Spring Batch의 핵심 컴포넌트

Spring Batch의 핵심 컴포넌트 구성 및 제공 기능은 다음과 같다

컴포넌트(구성요소)

설명

Job Repository

Job Execution 관련 메타데이터를 저장하는 기반 컴포넌트이다.

Job Launcher

Job Execution 을 실행하는 기반 컴포넌트이다.

JPA(Java Persistence API)

페이징 기능을 제공한다.

Job

배치 처리를 의미하는 애플리케이션 컴포넌트이다.

Step

Job의 각 단계를 의미한다.

Job은 일련의 연속된 Step으로 구성된다.

Tasklet

Step 내에서 반복 또는 트랜잭션 처리 용도로 사용된다.

Item

Datasource로부터 읽어 들인 또는 Datasource로 저장하는 각 레코드를 의미한다.

Chunk

특정 크기를 갖는 아이템 목록을 의미한다.

Item Reader

데이터 소스로부터 아이템을 읽어 들이는 컴포넌트이다.

Item Procesor

Item Reader로 읽어 들인 아이템을 Item Writer를 사용해 저장하기 전에 처리하는 컴포넌트이다.

Item Writer

Item Chunk를 데이터 소스에 저장하는 컴포넌트이다

 

 

Spring Batch와 외부 시스템과의 관계

Spring Batch Job Crontab 등과 같은 시스템 스케줄러, 스크립트(, Perl ) 등에 의해 발생된 다양한 이벤트에 의해 실행된다.

 

 

 

Spring Batch의 아키텍처

Spring Batch의 아키텍처는 Run, Job, Application, Data Tier로 구성되고, Tier 별 특성을 설명하면 다음과 같다.

 

tier

특성

Run

·       ApplicationScheduling 및 실행을 담당하는 Tier

·       스프링배치에서는 따로 Scheduling의 기능은 제공하지 않고 Quartz 같은 외부 모듈이나 Cron을 이용하도록 권고하고 있다.

Job

·       전체적인 Job의 수행을 책임지는 Tier

·       Job 내의 각 Step들을 지정한 상태와 정책에 따라 순차적으로 수행한다.

Application

·       Job을 수행하는 데 필요한 Component로 구성된다.

Data

·       Database, File 등 물리적 데이터소스와 결합이 이루어지는 영역이다.