Java函數(shù)式編程(七):MapReduce
譯注:map(映射)和reduce(歸約,化簡)是數(shù)學上兩個很基礎(chǔ)的概念,它們很早就出現(xiàn)在各類的函數(shù)編程語言里了,直到2003年Google將其發(fā)揚光大,運用到分布式系統(tǒng)中進行并行計算后,這個組合的名字才開始在計算機界大放異彩(那些函數(shù)式粉可能并不這么認為)。本文我們會看到Java 8在搖身一變支持函數(shù)式編程后,map和reduce組合的首次亮相(這里只是初步介紹,后續(xù)還會有針對它們的專題)。
對集合進行歸約
現(xiàn)在為止我們已經(jīng)介紹了幾個操作集合的新技巧了:查找匹配元素,查找單個元素,集合轉(zhuǎn)化。這些操作有一個共同點,它們都是對集合中的單個元素進行操作。不需要對元素進行比較,或者對兩個元素進行運算。本節(jié)中我們來看一下如何比較元素,以及在遍歷集合過程中動態(tài)維護一個運算結(jié)果。
我們先從簡單的例子開始,然后再循序漸進。在第一個例子中,我們先來遍歷一下friends集合,計算出所有名字的總字符數(shù)。
System.out.println("Total number of characters in all names: " + friends.stream()
.mapToInt(name -> name.length())
.sum());
要算出所有字符的總數(shù)我們得知道每個名字的長度。通過mapToInt()方法可以輕松的完成這個。當我們已經(jīng)把名字轉(zhuǎn)化成了對應(yīng)的長度之后,最后只需要把它們加到一塊就行了。我們有一個內(nèi)置的sum()方法來完成這個。下面是最后的輸出:
Total number of characters in all names: 26
我們使用了map操作的一個變種,mapToInt()方法(這種的有mapToInt, mapToDouble等,會對應(yīng)生成具體類型的流,比如IntStream,DoubleStream),然后根據(jù)返回的長度計算出總的字符數(shù)。
除了使用sum方法,還有很多類似的方法可以使用,比如用max()可以求出最大的長度,用min()是最小長度,sorted()對長度進行排序,average()求平均長度,等等。
上述這個例子還有一個吸引人的地方就是現(xiàn)在越來越流行的MapReduce模式,map()方法進行映射,而sum()方法是一個比較常用的reduce操作。事實上,JDK中sum()方法的實現(xiàn)用的就是reduce()方法。我們來看下reduce操作更常用的一些形式。
比方說,我們遍歷所有的名字,然后打印出名字最長的那個。如果最長的名字有好幾個,我們就打印出最開始找到的那個。一種方法是,我們計算出最大的長度,然后選出匹配這個長度的第一個元素。不過這樣做需要遍歷兩次列表——效率太低了。這正是reduce操作上場的時候了。
我們可以用reduce操作來比較兩個元素的長度,然后返回最長的那個,再和剩下的元素做進一步比較。跟我們之前看到的別的高階函數(shù)一樣,reduce()方法同樣也是遍歷了整個集合。除此之外,它還記錄了lambda表達式返回的計算結(jié)果。有個例子的話可以幫助我們更好的理解這點,那我們先來看一段代碼吧。
final Optional<String> aLongName = friends.stream()
.reduce((name1, name2) ->
name1.length() >= name2.length() ? name1 : name2);
aLongName.ifPresent(name ->
System.out.println(String.format("A longest name: %s", name)));
傳給reduce()方法的lambda表達式接收兩個參數(shù),name1和name2,它會比較它們的長度,返回最長的那個。reduce()方法根本不知道我們要干什么。這個邏輯被剝離到我們傳遞進去的lambda表達式里面了——這是策略模式的一個輕量級的實現(xiàn)。
這個lambda表達式正好能適配成JDK中一個BinaryOperator的函數(shù)式接口的apply方法。這正是reduce方法要接受的參數(shù)類型。我們來運行下這個reduce方法,看看它能否正確地在兩個最長的名字中選出第一個來。
A longest name: Brian
在reduce()方法遍歷集合的過程中,它先對集合的前兩個元素調(diào)用了lambda表達式,調(diào)用返回的結(jié)果繼續(xù)用于下一次調(diào)用。在第二次調(diào)用中,name1的值被綁定成上次調(diào)用的結(jié)果,name2的值則是集合的第三個元素。剩余的元素也這樣依次調(diào)用下去。最后一次lambda表達式調(diào)用的結(jié)果,就是整個reduce()方法返回的結(jié)果。
reduce()方法返回的是一個Optional值,因為傳遞給它的集合可能是空的。那樣的話,也不存在什么最長的名字了。如果列表只有一個元素,reduce方法直接返回那個元素,不會對lambda表達式進行調(diào)用。
從這個例子中我們可以推斷出,reduce的結(jié)果最多只可能是集合中的一個元素。如果我們希望能返回一個默認值或者基礎(chǔ)值的話,我們可以使用reduce()方法的一個變種,它可以接收一個額外的參數(shù)。比如,如果最短的名字是Steve,我們可以把它傳給reduce()方法,像這樣:
final String steveOrLonger = friends.stream()
.reduce("Steve", (name1, name2) ->
name1.length() >= name2.length() ? name1 : name2);
如果有名字比它長的,那么這個名字會被選中;否則的話就返回這個基礎(chǔ)值Steve。這個版本的reduce()方法不會返回Optional對象,因為如果集合是空的,會返回一個默認值;不用考慮沒有返回值的情況。
在我們結(jié)束這章之前 ,我們再來看一下集合操作里面一個很基礎(chǔ)的卻又不是那么容易的操作:合并元素。
合并元素
我們已經(jīng)學習了如何進行元素的查找,遍歷,以及集合的轉(zhuǎn)化。不過還有一個常見的操作——將集合元素進行拼接——如果沒有這個新添加的join()函數(shù)的話,之前說的簡潔和優(yōu)雅的代碼只能成為泡影了。這個簡單的方法非常實用以至于它成為JDK里最常用的函數(shù)之一。我們來看下如何用它來打印列表中的元素,用逗號進行分隔。
我們還是用這個friends列表。如果用JDK庫里的舊方法的話,想要打印出所有名字并用逗號隔開的話,要做哪些工作?
我們得遍歷列表并且挨個打印元素。Java 5中的for循環(huán)比之前的有所改進,我們就用它吧。
for(String name : friends) {
System.out.print(name + ", ");
}
System.out.println();
代碼很簡單,我們看下它的輸出是什么。
Brian, Nate, Neal, Raju, Sara, Scott,
該死,最后多出了一個討厭的逗號(我們難道要怪最后的那個Scott?)。怎么能讓Java別放一個逗號在這呢?不幸的是,循環(huán)會按步就班的執(zhí)行,想讓它在最后特殊處理一下可不容易。為了解決這個問題,我們可以用回原來的那種循環(huán)方式。
for(int i = 0; i < friends.size() - 1; i++) {
System.out.print(friends.get(i) + ", ");
}
if(friends.size() > 0)
System.out.println(friends.get(friends.size() - 1));
我們來看下這個版本的輸出是不是OK。
Brian, Nate, Neal, Raju, Sara, Scott
結(jié)果還是不錯的,不過這個代碼就不敢恭維了。救救我們吧,Java。
我們不用再忍受這種痛苦了。Java 8里的StringJoiner類幫我們搞定了這些難題,不止如此,String類還增加了一個join方法方便我們可以用一行代碼來替代掉上面那坨東西。
System.out.println(String.join(", ", friends));
快來看下吧,結(jié)果跟代碼一樣令人滿意。
Brian, Nate, Neal, Raju, Sara, Scott
結(jié)果還是不錯的,不過這個代碼就不敢恭維了。救救我們吧,Java。
我們不用再忍受這種痛苦了。Java 8里的StringJoiner類幫我們搞定了這些難題,不止如此,String類還增加了一個join方法方便我們可以用一行代碼來替代掉上面那坨東西。
System.out.println(String.join(", ", friends));
快來看下吧,結(jié)果跟代碼一樣令人滿意。
Brian, Nate, Neal, Raju, Sara, Scott
在底層實現(xiàn)中,String.join()方法調(diào)用了StringJoiner類來將第二個參數(shù)傳進來的值(這是個變長參數(shù))拼接成一個長的字符串,用第一個參數(shù)作為分隔符。這個方法當然不止是能拼接逗號這么簡單了。比如說,我們可以傳入一堆路徑,然后很容易的拼出一個類路徑(classpath),這可真是多虧了這些新增加的方法和類。
我們已經(jīng)知道如何去連接列表元素了,在進行列表連接前,我們還可以先對元素進行轉(zhuǎn)化,當然我們也知道如何使用map方法來進行列表轉(zhuǎn)化了。接下來還可以用filter()方法過濾出我們想要的那些元素。最后一步的連接列表元素,用逗號還是什么分隔符,不過就是一個簡單的reduce操作而已了。
我們可以用reduce()方法將元素拼接成一個字符串,不過這需要我們費點工夫。JDK有一個十分方便的collect()方法,它也是reduce()的一個變種,我們可以用它來把元素合并成一個想要的值。
collect()方法來執(zhí)行歸約操作,不過它把具體的操作委托給一個collector來執(zhí)行。我們可以把轉(zhuǎn)化后的元素合并成一個ArrayList。繼續(xù)剛才那個例子,我們可以將轉(zhuǎn)化后的元素,拼接成一個用逗號分隔的字符串。
System.out.println(
friends.stream()
.map(String::toUpperCase)
.collect(joining(", ")));
我們在轉(zhuǎn)化后的列表上調(diào)用了collect()方法,給它傳入了一個joining()方法返回的collector,joining是Collectors工具類里的一個靜態(tài)方法。collector就像是個接收器,它接收collect傳進來的對象,并把它們存儲成你想要的格式:ArrayList, String等。我們會在52頁的collect方法及Collectors類中進一步探索這個方法。
這是輸出的名字,現(xiàn)在它們是大寫的,并用逗號隔開。
BRIAN, NATE, NEAL, RAJU, SARA, SCOTT
總結(jié)
集合在編程中十分常見,有了lambda表達式后,Java的集合操作變得更加簡單容易了。那些拖沓的集合操作的老代碼都可以換成這種優(yōu)雅簡潔的新方式。內(nèi)部迭代器使得集合遍歷,轉(zhuǎn)化都變得更加方便,遠離了可變性的煩惱,查找集合元素也變得異常輕松。使用這些新方法可以少寫不少代碼。這使得代碼更容易維護,更聚焦于業(yè)務(wù)邏輯,編程中的那些基本操作也變得更少了。
下一章中我們會看到lambda表達式如何簡化程序開發(fā)中的另一個基本操作:字符串操作以及對象比較。
相關(guān)文章
MyBatis-Plus通過插件將數(shù)據(jù)庫表生成Entiry,Mapper.xml,Mapper.class的方式
今天小編就為大家分享一篇關(guān)于MyBatis-Plus通過插件將數(shù)據(jù)庫表生成Entiry,Mapper.xml,Mapper.class的方式,小編覺得內(nèi)容挺不錯的,現(xiàn)在分享給大家,具有很好的參考價值,需要的朋友一起跟隨小編來看看吧2019-02-02
SpringBoot集成Validation參數(shù)校驗
這篇文章主要為大家詳細介紹了SpringBoot集成Validation參數(shù)校驗,文中示例代碼介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們可以參考一下2022-01-01
JAVA如何判斷上傳文件后綴名是否符合規(guī)范MultipartFile
這篇文章主要介紹了JAVA判斷上傳文件后綴名是否符合規(guī)范MultipartFile,文中通過實例代碼介紹了java實現(xiàn)對上傳文件做安全性檢查,需要的朋友可以參考下2023-11-11
mybaties plus實體類設(shè)置typeHandler不生效的解決
這篇文章主要介紹了mybaties plus實體類設(shè)置typeHandler不生效的解決方案,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教2022-08-08

