亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

淺談Spring Batch在大型企業(yè)中的最佳實踐

 更新時間:2017年11月06日 11:12:41   作者:黃博文  
本篇文章主要介紹了淺談Spring Batch在大型企業(yè)中的最佳實踐,小編覺得挺不錯的,現(xiàn)在分享給大家,也給大家做個參考。一起跟隨小編過來看看吧

在大型企業(yè)中,由于業(yè)務復雜、數(shù)據(jù)量大、數(shù)據(jù)格式不同、數(shù)據(jù)交互格式繁雜,并非所有的操作都能通過交互界面進行處理。而有一些操作需要定期讀取大批量的數(shù)據(jù),然后進行一系列的后續(xù)處理。這樣的過程就是“批處理”。

批處理應用通常有以下特點:

  1. 數(shù)據(jù)量大,從數(shù)萬到數(shù)百萬甚至上億不等;
  2. 整個過程全部自動化,并預留一定接口進行自定義配置;
  3. 這樣的應用通常是周期性運行,比如按日、周、月運行;
  4. 對數(shù)據(jù)處理的準確性要求高,并且需要容錯機制、回滾機制、完善的日志監(jiān)控等。

什么是Spring batch

Spring batch是一個輕量級的全面的批處理框架,它專為大型企業(yè)而設計,幫助開發(fā)健壯的批處理應用。Spring batch為處理大批量數(shù)據(jù)提供了很多必要的可重用的功能,比如日志追蹤、事務管理、job執(zhí)行統(tǒng)計、重啟job和資源管理等。同時它也提供了優(yōu)化和分片技術(shù)用于實現(xiàn)高性能的批處理任務。

它的核心功能包括:

  1. 事務管理
  2. 基于塊的處理過程
  3. 聲明式的輸入/輸出操作
  4. 啟動、終止、重啟任務
  5. 重試/跳過任務
  6. 基于Web的管理員接口

筆者所在的部門屬于國外某大型金融公司的CRM部門,在日常工作中我們經(jīng)常需要開發(fā)一些批處理應用,對Spring Batch有著豐富的使用經(jīng)驗。近段時間筆者特意總結(jié)了這些經(jīng)驗。

使用Spring Batch 3.0以及Spring Boot

在使用Spring Batch時推薦使用最新的Spring Batch 3.0版本。相比Spring Batch2.2,它做了以下方面的提升:

  1. 支持JSR-352標準
  2. 支持Spring4以及Java8
  3. 增強了Spring Batch Integration的功能
  4. 支持JobScope
  5. 支持SQLite

支持Spring4和Java8是一個重大的提升。這樣就可以使用Spring4引入的Spring boot組件,從而開發(fā)效率方面有了一個質(zhì)的飛躍。引入Spring-batch框架只需要在build.gradle中加入一行代碼即可:

compile("org.springframework.boot:spring-boot-starter-batch")

而增強Spring Batch Integration的功能后,我們就可以很方便的和Spring家族的其他組件集成,還可以以多種方式來調(diào)用job,也支持遠程分區(qū)操作以及遠程塊處理。

而支持JobScope后我們可以隨時為對象注入當前Job實例的上下文信息。只要我們制定Bean的scope為job scope,那么就可以隨時使用jobParameters和jobExecutionContext等信息。

 <bean id="..." class="..." scope="job">
  <property name="name" value="#{jobParameters[input]}" />
</bean>
        
<bean id="..." class="..." scope="job">
  <property name="name" value="#{jobExecutionContext['input.name']}.txt" />
</bean>

使用Java Config而不是xml的配置方式

之前我們在配置job和step的時候都習慣用xml的配置方式,但是隨著時間的推移發(fā)現(xiàn)問題頗多。

  1. xml文件數(shù)急劇膨脹,配置塊長且復雜,可讀性很差;
  2. xml文件缺少語法檢查,有些低級錯誤只有在運行集成測試的時候才能發(fā)現(xiàn);
  3. 在xml文件中進行代碼跳轉(zhuǎn)時IDE的支持力度不夠;

我們漸漸發(fā)現(xiàn)使用純Java類的配置方式更靈活,它是類型安全的,而且IDE的支持更好。在構(gòu)建job或step時采用的流式語法相比xml更加簡潔易懂。

    @Bean
    public Step step(){
        return stepBuilders.get("step")
                .<Partner,Partner>chunk(1)
                .reader(reader())
                .processor(processor())
                .writer(writer())
                .listener(logProcessListener())
                .faultTolerant()
                .skipLimit(10)
                .skip(UnknownGenderException.class)
                .listener(logSkipListener())
                .build();
    }

在這個例子中可以很清楚的看到該step的配置,比如reader/processor/writer組件,以及配置了哪些listener等。

本地集成測試中使用內(nèi)存數(shù)據(jù)庫

Spring batch在運行時需要數(shù)據(jù)庫支持,因為它需要在數(shù)據(jù)庫中建立一套schema來存儲job和step運行的統(tǒng)計信息。而在本地集成測試中我們可以借助Spring batch提供的內(nèi)存Repository來存儲Spring batch的任務執(zhí)行信息,這樣即避免了在本地配置一個數(shù)據(jù)庫,又可以加快job的執(zhí)行。

 <bean id="jobRepository"
 class="org.springframework.batch.core.repository.support.MapJobRepositoryFactoryBean">
  <property name="transactionManager" ref="transactionManager"/>
</bean>

我們在build.gradle中加入對hsqldb的依賴:

runtime(‘org.hsqldb:hsqldb:2.3.2')

然后在測試類中添加對DataSource的配置。

 @EnableAutoConfiguration
@EnableBatchProcessing
@DataJpaTest
@Import({DataSourceAutoConfiguration.class, BatchAutoConfiguration.class})
public class TestConfiguration {
  
}

并且在applicaton.properties配置中添加初始化Database的配置:

spring.batch.initializer.enable=true

合理的使用Chunk機制

Spring batch在配置Step時采用的是基于Chunk的機制。即每次讀取一條數(shù)據(jù),再處理一條數(shù)據(jù),累積到一定數(shù)量后再一次性交給writer進行寫入操作。這樣可以最大化的優(yōu)化寫入效率,整個事務也是基于Chunk來進行。

當我們在需要將數(shù)據(jù)寫入到文件、數(shù)據(jù)庫中之類的操作時可以適當設置Chunk的值以滿足寫入效率最大化。但有些場景下我們的寫入操作其實是調(diào)用一個web service或者將消息發(fā)送到某個消息隊列中,那么這些場景下我們就需要設置Chunk的值為1,這樣既可以及時的處理寫入,也不會由于整個Chunk中發(fā)生異常后,在重試時出現(xiàn)重復調(diào)用服務或者重復發(fā)送消息的情況。

使用Listener來監(jiān)視job執(zhí)行情況并及時做相應的處理

Spring batch提供了大量的Listener來對job的各個執(zhí)行環(huán)節(jié)進行全面的監(jiān)控。

在job層面Spring batch提供了JobExecutionListener接口,其支持在Job開始或結(jié)束時進行一些額外處理。在step層面Spring batch提供了StepExecutionListener,ChunkListener,ItemReadListener,ItemProcessListener,ItemWriteListener,SkipListener等接口,同時對Retry和Skip操作也提供了RetryListener及SkipListener。

通常我們會為每個job都實現(xiàn)一個JobExecutionListener,在afterJob操作中我們輸出job的執(zhí)行信息,包括執(zhí)行時間、job參數(shù)、退出代碼、執(zhí)行的step以及每個step的詳細信息。這樣無論是開發(fā)、測試還是運維人員對整個job的執(zhí)行情況了如指掌。

如果某個step會發(fā)生skip的操作,我們也會為其實現(xiàn)一個SkipListener,并在其中記錄skip的數(shù)據(jù)條目,用于下一步的處理。

實現(xiàn)Listener有兩種方式,一種是繼承自相應的接口,比如繼承JobExecutionListener接口,另一種是使用annoation(注解)的方式。經(jīng)過實踐我們認為使用注解的方式更好一些,因為使用接口你需要實現(xiàn)接口的所有方法,而使用注解則只需要對相應的方法添加annoation即可。

下面的這個類采用了繼承接口的方式,我們看到其實我們只用到了第一個方法,第二個和第三個都沒有用到。但是我們必須提供一個空的實現(xiàn)。

 public class CustomSkipListener implements SkipListener<String, String> {
  @Override
  public void onSkipInRead(Throwable t) {
    // business logic
  }

  @Override
  public void onSkipInWrite(String item, Throwable t) {
    // no need
  }

  @Override
  public void onSkipInProcess(String item, Throwable t) {
    // no need
  }
}

而使用annoation的方式可以簡寫為:

 public class CustomSkipListener {
  
  @OnSkipInRead
  public void onSkipInRead(Throwable t) {
    // business logic
  }
}

使用Retry和Skip增強批處理工作的健壯性

在處理百萬級的數(shù)據(jù)過程過程中難免會出現(xiàn)異常。如果一旦出現(xiàn)異常而導致整個批處理工作終止的話那么會導致后續(xù)的數(shù)據(jù)無法被處理。Spring Batch內(nèi)置了Retry(重試)和Skip(跳過)機制幫助我們輕松處理各種異常。適合Retry的異常的特點是這些異??赡軙S著時間推移而消失,比如數(shù)據(jù)庫目前有鎖無法寫入、web服務當前不可用、web服務滿載等。所以對這些異常我們可以配置Retry機制。而有些異常則不應該配置Retry,比如解析文件出現(xiàn)異常等,因為這些異常即使Retry也會始終失敗。

即使Retry多次仍然失敗也無需讓整個step失敗,可以對指定的異常設置Skip選項從而保證后續(xù)的數(shù)據(jù)能夠被繼續(xù)處理。我們也可以配置SkipLimit選項保證當Skip的數(shù)據(jù)條目達到一定數(shù)量后及時終止整個Job。

有時候我們需要在每次Retry中間隔做一些操作,比如延長Retry時間,恢復操作現(xiàn)場等,Spring Batch提供了BackOffPolicy來達到目的。下面是一個配置了Retry機制、Skip機制以及BackOffPolicy的step示例。

 @Bean
public Step step(){
  return stepBuilders.get("step")
      .<Partner,Partner>chunk(1)
      .reader(reader())
      .processor(processor())
      .writer(writer())
      .listener(logProcessListener())
      .faultTolerant()
      .skipLimit(10)
      .skip(UnknownGenderException.class)
      .retryLimit(5)
      .retry(ServiceUnavailableException.class)
      .backOffPolicy(backoffPolicy)
      .listener(logSkipListener())
      .build();
}

使用自定義的Decider來實現(xiàn)Job flow

在Job執(zhí)行過程中不一定都是順序執(zhí)行的,我們經(jīng)常需要根據(jù)某個job的輸出數(shù)據(jù)或執(zhí)行結(jié)果來決定下一步的走向。以前我們會把一些判斷放置在下游step中進行,這樣可能會導致有些step實際運行了,但其實并沒有做任何事情。比如一個step執(zhí)行過程中會將失敗的數(shù)據(jù)條目記錄到一個報告中,而下一個step會判斷有沒有生成報告,如果生成了報告則將該報告發(fā)送給指定聯(lián)系人,如果沒有則不做任何事情。這種情況下可以通過Decider機制來實現(xiàn)Job的執(zhí)行流程。在Spring batch 3.0中Decider已經(jīng)從Step中獨立出來,和Step處于同一級別。

 public class ReportDecider implements JobExecutionDecider {
  @Override
  public FlowExecutionStatus decide(JobExecution jobExecution, StepExecution stepExecution) {
    if (report.isExist()) {
      return new FlowExecutionStatus(“SEND");
    }
    
    return new FlowExecutionStatus(“SKIP");
  }
}

而在job配置中可以這樣來使用Decider。這樣整個Job的執(zhí)行流程會更加清晰易懂。

 public Job job() {
  return new JobBuilder("petstore")
      .start(orderProcess())
      .next(reportDecider)
      .on("SEND").to(sendReportStep)
      .on("SKIP").end().build()
      .build()
}

采用多種機制加速Job的執(zhí)行

批處理工作處理的數(shù)據(jù)量大,而執(zhí)行窗口一般又要求比較小。所以必須要通過多種方式來加速Job的執(zhí)行。一般我們有四種方式來實現(xiàn):

  1. 在單個step中多線程執(zhí)行任務
  2. 并行執(zhí)行不同的Step
  3. 并行執(zhí)行同一個Step
  4. 遠程執(zhí)行Chunk任務

在單個step多線程執(zhí)行任務可以借助于taskExecutor來實現(xiàn)。這種情況適合于reader、writer是線程安全的并且是無狀態(tài)的場景。我們還可以設置線程數(shù)量。 

 public Step step() {
  return stepBuilders.get("step")
      .tasklet(tasklet)
      .throttleLimit(20)
      .build();
}

上述示例中的tasklet需要實現(xiàn)TaskExecutor,Spring Batch提供了一個簡單的多線程TaskExecutor供我們使用:SimpleAsyncTaskExecutor。

并行執(zhí)行不同的Step在Spring batch中很容易實現(xiàn),以下是一個示例:

 public Job job() {
  return stepBuilders.get("parallelSteps")
      .start(step1)
      .split(asyncTaskExecutor).add(flow1, flow2)
      .next(step3)
      .build();
}

在這個示例中我們先執(zhí)行step1,然后并行執(zhí)行flow1和flow2,最后再執(zhí)行step3。

Spring batch提供了PartitionStep來實現(xiàn)對同一個step在多個進程中實現(xiàn)并行處理。通過PartitonStep再配合PartitionHandler可以將一個step擴展到多個Slave上實現(xiàn)并行運行。

遠程執(zhí)行Chunk任務則是將某個Step的processer操作分割到多個進程中,多個進程通過一些中間件進行通訊(比如采用消息的方式)。這種方式適合于Processer是瓶頸而Reader和Writer不是瓶頸的場景。

結(jié)語

Spring Batch對批處理場景進行了合理的抽象,封裝了大量的實用功能,使用它來開發(fā)批處理應用可以達到事半功倍的效果。在使用的過程中我們?nèi)孕枰獔猿挚偨Y(jié)一些最佳實踐,從而能夠交付高質(zhì)量的可維護的批處理應用,滿足企業(yè)級應用的苛刻要求。

以上就是本文的全部內(nèi)容,希望對大家的學習有所幫助,也希望大家多多支持腳本之家。

相關(guān)文章

  • Java封裝數(shù)組之動態(tài)數(shù)組實現(xiàn)方法詳解

    Java封裝數(shù)組之動態(tài)數(shù)組實現(xiàn)方法詳解

    這篇文章主要介紹了Java封裝數(shù)組之動態(tài)數(shù)組實現(xiàn)方法,結(jié)合實例形式詳細分析了java動態(tài)數(shù)組的實現(xiàn)原理、操作步驟與相關(guān)注意事項,需要的朋友可以參考下
    2020-03-03
  • SpringBoot項目打包為JAR文件的實現(xiàn)

    SpringBoot項目打包為JAR文件的實現(xiàn)

    本文主要介紹了SpringBoot項目打包為JAR文件的實現(xiàn),文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧
    2024-09-09
  • 基于SpringBoot使用MyBatis插件的問題

    基于SpringBoot使用MyBatis插件的問題

    MyBatis-Plus并不能為我們解決所有問題,例如一些復雜的SQL,多表聯(lián)查,我們就需要自己去編寫代碼和SQL語句,我們該如何快速的解決這個問題呢,這個時候可以使用MyBatisX插件,今天小編給大家?guī)砹薙pringBoot使用MyBatis插件問題,感興趣的朋友一起看看吧
    2022-03-03
  • maven私服搭建的實現(xiàn)步驟

    maven私服搭建的實現(xiàn)步驟

    本文主要介紹了maven私服搭建的實現(xiàn)步驟,文中通過示例代碼介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們可以參考一下
    2021-10-10
  • java.net.ConnectException: Connection refused問題解決辦法

    java.net.ConnectException: Connection refused問題解決辦法

    這篇文章主要介紹了java.net.ConnectException: Connection refused問題解決辦法的相關(guān)資料,需要的朋友可以參考下
    2016-12-12
  • Java中的cglib原理解析

    Java中的cglib原理解析

    這篇文章主要介紹了Java中的cglib原理解析,由于代理類繼承了被代理類,所以調(diào)用sayHello()方法時會直接調(diào)用代理類的sayHello()方法,而在代理類的方法中,調(diào)用了Callback的邏輯,需要的朋友可以參考下
    2023-10-10
  • 解讀maven配置阿里云鏡像問題

    解讀maven配置阿里云鏡像問題

    這篇文章主要介紹了解讀maven配置阿里云鏡像問題,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教
    2022-11-11
  • Spring Boot集成springfox-swagger2構(gòu)建restful API的方法教程

    Spring Boot集成springfox-swagger2構(gòu)建restful API的方法教程

    這篇文章主要給大家介紹了關(guān)于Spring Boot集成springfox-swagger2構(gòu)建restful API的相關(guān)資料,文中介紹的非常詳細,對大家具有一定的參考學習價值,需要的朋友們下面跟著小編一起來學習學習吧。
    2017-06-06
  • @CacheEvict + redis實現(xiàn)批量刪除緩存

    @CacheEvict + redis實現(xiàn)批量刪除緩存

    這篇文章主要介紹了@CacheEvict + redis實現(xiàn)批量刪除緩存方式,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教
    2021-10-10
  • 基于SpringBoot實現(xiàn)驗證碼功能的代碼及思路

    基于SpringBoot實現(xiàn)驗證碼功能的代碼及思路

    SpringBoot技術(shù)是目前市面上從事JavaEE企業(yè)級開發(fā)過程中使用量最大的技術(shù),下面這篇文章主要給大家介紹了如何基于SpringBoot實現(xiàn)驗證碼功能的相關(guān)資料,文中通過代碼介紹的非常詳細,需要的朋友可以參考下
    2024-07-07

最新評論