解決java調(diào)用python代碼返回值中文亂碼問題
網(wǎng)上現(xiàn)有的無法正確解決的方法
如下:
- data.encode(‘utf-8’, errors=‘ignore’).decode(‘utf-8’)。(使用python中的編碼和解碼)
- 在頭部加上# encoding:utf-8等方式
- 修改python文件的編碼格式(在setting里面設(shè)置file Ecoding編碼)修改java的虛擬機(jī)輸出參數(shù)
- 使用new String(result.getBytes(“iso8859-1”),“utf-8”)轉(zhuǎn)換等
一、亂碼原因分析
通常出現(xiàn)亂碼情況的時(shí)候,我們第一反應(yīng)是文件編碼設(shè)置是不是一樣的,但這里通過Java調(diào)用python代碼執(zhí)行時(shí),所有編碼格式都是“UTF-8”,所以不存在這樣的問題。
而之所以亂碼,是因?yàn)閜ython的print函數(shù)機(jī)制問題。
我們通過執(zhí)行如下python代碼,可以輸出print函數(shù)輸出的默認(rèn)編碼格式。
Python代碼
import locale print(locale.getdefaultlocale())
代碼執(zhí)行結(jié)果
('zh_CN', 'cp936')
通過查閱我們可以知道“cp936”代表的是GB2312,即為中文編碼。
二、正確解決方案
測試可用的方法有兩種,一種在Java代碼設(shè)置,另一種在Python代碼中設(shè)置。
2.1 方法1——在Java代碼中設(shè)置編碼格式
這里使用Process和Runtime調(diào)用python代碼,然后將獲取到的輸入流編碼設(shè)置為"gb2312"
try { String result = ""; //這個(gè)方法是類似隱形開啟了命令執(zhí)行器,輸入指令執(zhí)行python腳本 String exe = "python解釋器所處的絕對(duì)路徑"; String py = "python代碼文件絕對(duì)地址"; Process process = Runtime.getRuntime().exec(exe + " " + py); //這種方式獲取返回值的方式是需要用python打印輸出,然后java去獲取命令行的輸出,在java返回 //獲取結(jié)果的同時(shí)設(shè)置輸入流編碼格式"gb2312" InputStreamReader isr = new InputStreamReader(process.getInputStream(),"gb2312"); LineNumberReader input = new LineNumberReader(isr); result = input.readLine(); input.close(); isr.close(); int re = process.waitFor(); System.out.println(result); } catch (InterruptedException | IOException e) { System.out.println("調(diào)用python腳本并讀取結(jié)果時(shí)出錯(cuò):" + e.getMessage()); }
注意: 不能讀取完字節(jié)流再次使用getByte重新編碼,否則將會(huì)得到另一種亂碼輸出。
錯(cuò)誤代碼如下:
InputStreamReader isr = new InputStreamReader(process.getInputStream(),"gb2312"); LineNumberReader input = new LineNumberReader(isr); result = input.readLine(); result1 = new String(result.getBytes("iso8859-1"),"utf-8"); input.close(); isr.close(); System.out.println(result1);
2.2 方法2——在Python代碼中設(shè)置編碼格式
當(dāng)不確定在Java中會(huì)使用什么方式調(diào)用python代碼時(shí)(如不使用Process),可以在python代碼中直接設(shè)置編碼格式。
設(shè)置代碼如下:
import sys import io sys.stdout = io.TextIOWrapper(sys.stdout.buffer, encoding='utf-8')
總結(jié)
至此,亂碼問題得到解決。
以上為個(gè)人經(jīng)驗(yàn),希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。
相關(guān)文章
關(guān)于HttpClient 引發(fā)的線程太多導(dǎo)致FullGc的問題
這篇文章主要介紹了關(guān)于HttpClient 引發(fā)的線程太多導(dǎo)致FullGc的問題,本文給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2021-01-01maven項(xiàng)目打jar包并包含所有依賴詳細(xì)教程
maven打包生成的普通jar包,只包含該工程下源碼編譯結(jié)果,不包含依賴內(nèi)容,下面這篇文章主要給大家介紹了關(guān)于maven項(xiàng)目打jar包并包含所有依賴的相關(guān)資料,需要的朋友可以參考下2023-05-05springboot+thymeleaf+druid+mybatis 多模塊實(shí)現(xiàn)用戶登錄功能
這篇文章主要介紹了springboot+thymeleaf+druid+mybatis 多模塊實(shí)現(xiàn)用戶登錄功能,本文通過示例代碼圖文相結(jié)合給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2020-07-07Spring Boot 使用 logback、logstash、ELK 記錄日志文件的方法
這篇文章主要介紹了Spring Boot 使用 logback、logstash、ELK 記錄日志文件的思路詳解,文中給大家提到了logback 取代 log4j的理由,需要的朋友可以參考下2017-12-12spring中@ComponentScan自動(dòng)掃描并指定掃描規(guī)則
本文主要介紹了spring中@ComponentScan自動(dòng)掃描并指定掃描規(guī)則,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2023-04-04Feign實(shí)現(xiàn)多文件上傳,Open?Feign多文件上傳問題及解決
這篇文章主要介紹了Feign實(shí)現(xiàn)多文件上傳,Open?Feign多文件上傳問題及解決,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2022-11-11Java使用Graphics2D實(shí)現(xiàn)字符串文本自動(dòng)換行
這篇文章主要為大家詳細(xì)介紹了Java如何使用Graphics2D實(shí)現(xiàn)字符串文本自動(dòng)換行,文中的示例代碼講解詳細(xì),感興趣的小伙伴可以跟隨小編一起學(xué)習(xí)一下2024-04-04