利用Python實現(xiàn)命令行版的火車票查看器
接口設(shè)計
一個應(yīng)用寫出來最終是要給人使用的,哪怕只是給你自己使用。所以,首先應(yīng)該想想你希望怎么使用它?讓我們先給這個小應(yīng)用起個名字吧,既然及查詢票務(wù)信息,那就叫它tickets
好了。我們希望用戶只要輸入出發(fā)站,到達站以及日期就讓就能獲得想要的信息,所以tickets
應(yīng)該這樣被使用:
$ tickets from to date
另外,火車有各種類型,高鐵、動車、特快、快速和直達,我們希望可以提供選項只查詢特定的一種或幾種的火車,所以,我們應(yīng)該有下面這些選項:
-g 高鐵
-d 動車
-t 特快
-k 快速
-z 直達
這幾個選項應(yīng)該能被組合使用,所以,最終我們的接口應(yīng)該是這個樣子的:
$ tickets [-gdtkz] from to date
接口已經(jīng)確定好了,剩下的就是實現(xiàn)它了。
開發(fā)環(huán)境
寫Python程序的一個良好實踐是使用virtualenv
這個工具建一個虛擬的環(huán)境。我們的程序使用Python3開發(fā),下面在你的工作目錄下建一個文件夾tickets
,進去創(chuàng)建一個虛擬環(huán)境:
$ virtualenv -p /usr/bin/python3 venv
通過下面的命令激活它:
$ . venv/bin/activate
解析參數(shù)
Python有很多寫命令行應(yīng)用的工具,如argparse, docopt, options…這里,我們選用docopt
這個簡單易用的工具,我們先安裝它:
$ pip3 install docopt
docopt
可以按我們在文檔字符串中定義的格式來解析參數(shù),在tickets.py
中:
# coding: utf-8 """Train tickets query via command-line. Usage: tickets [-gdtkz] <from> <to> <date> Options: -h,--help 顯示幫助菜單 -g 高鐵 -d 動車 -t 特快 -k 快速 -z 直達 Example: tickets 南京 北京 2016-07-01 tickets -dg 南京 北京 2016-07-01 """ from docopt import docopt def cli(): """command-line interface""" arguments = docopt(__doc__) print(arguments) if __name__ == '__main__': cli()
下面我們運行一下這個程序:
$ python3 tickets.py 上海 北京 2016-07-01
我們得到下面的參數(shù)解析結(jié)果:
{‘-d': False, ‘-g': False, ‘-k': False, ‘-t': False, ‘-z': False, ‘<date>': ‘2016-07-01', ‘<from>': ‘上海', ‘<to>': ‘北京'}
獲取數(shù)據(jù)
參數(shù)已經(jīng)解析好了,下面就是如何獲取數(shù)據(jù)了,這也是最主要的部分。首先我們打開12306,進入余票查詢頁面,如果你使用chrome,那么按F12打開開發(fā)者工具,選中Network一欄,在查詢框鐘我們輸入上海到北京,日期2016-07-01, 點擊查詢,我們在調(diào)試工具發(fā)現(xiàn),查詢系統(tǒng)實際上請求了這個URL
https://kyfw.12306.cn/otn/lcxxcx/query?purpose_codes=ADULT&queryDate=2016-07-01&from_station=SHH&to_station=BJP
并且返回的是Json格式的數(shù)據(jù)!接下來問題就簡單了,我們只需要構(gòu)建請求URL然后解析返回的Json數(shù)據(jù)就可以了。但是我們發(fā)現(xiàn),URL里面from_station
和to_station
并不是漢字,而是一個代號,而用戶輸入的是漢字,我們要如何獲取代號呢?我們打開網(wǎng)頁源碼看看有沒有什么發(fā)現(xiàn)。
啊哈!果然,我們在網(wǎng)頁里面找到了這個鏈接:點我。這里面貌似是包含了所有車站的中文名,拼音,簡寫和代號等信息, 我們在項目目錄下將它保存為stations.html
。但是這些信息擠在一起,而我們只想要中文名和大寫字母的代號信息,怎么辦呢?
BINGO!正則表達式,我們寫個小腳本來匹配提取出想要的信息吧, 在parse.py
中:
# coding: utf-8 import re from pprint import pprint with open('stations.html', 'r') as f: text = f.read() stations = re.findall(u'([\u4e00-\u9fa5]+)\|([A-Z]+)', text) pprint(dict(stations), indent=4)
我們運行這個腳本,它將以字典的形式返回所有車站和它的大寫字母代號, 我們將結(jié)果重定向到stations.py
中,
$ python3 parse.py > stations.py
我們?yōu)檫@個字典加名字,stations
, 最終,stations.py
文件是這樣的:
stations = { '一間堡': 'YJT', '一面坡': 'YPB', ... '龍鎮(zhèn)': 'LZA', '龍骨甸': 'LGM' }
現(xiàn)在,用戶輸入車站的中文名,我們就可以直接從這個字典中獲取它的字母代碼了:
... from stations import stations def cli(): arguments = docopt(__doc__) from_staion = stations.get(arguments['<from>']) to_station = stations.get(arguments['<to>']) date = arguments['<date>'] # 構(gòu)建URL url = 'https://kyfw.12306.cn/otn/lcxxcx/query?purpose_codes=ADULT&queryDate={}&from_station={}&to_station={}'.format( date, from_staion, to_station )
萬事俱備,下面我們來請求這個URL獲取數(shù)據(jù)吧!這里我們使用requests
這個庫, 先安裝它:
$ pip3 install requests
它提供了非常簡單易用的接口,
... import requests def cli(): ... # 添加verify=False參數(shù), 不驗證證書 r = requests.get(url, verify=False) print(r.json())
從結(jié)果中,我們可以觀察到,與車票有關(guān)的信息需要進一步提取:
def cli(): ... r = requsets.get(url); rows = r.json()['data']['datas']
顯示結(jié)果
數(shù)據(jù)已經(jīng)獲取到了,剩下的就是提取我們要的信息并將它顯示出來。prettytable
這個庫可以讓我們它像MySQL數(shù)據(jù)庫那樣格式化顯示數(shù)據(jù)。
$ pip3 install prettytable
這樣使用它:
... from prettytable import PrettyTable def cli(): ... headers = '車次 車站 時間 歷時 商務(wù) 一等 二等 軟臥 硬臥 軟座 硬座 無座'.split() pt = PrettyTable() pt._set_field_names(headers) for row in rows: # 從row中根據(jù)headers過濾信息, 然后調(diào)用pt.add_row()添加到表中 ... print(pt)
總結(jié)
以上就是用Python寫一個命令行版的火車票查看器的全部內(nèi)容,對于Python學(xué)習(xí)是個不錯的例子,希望能對大家學(xué)習(xí)Python有所幫助。
相關(guān)文章
http通過StreamingHttpResponse完成連續(xù)的數(shù)據(jù)傳輸長鏈接方式
這篇文章主要介紹了http通過StreamingHttpResponse完成連續(xù)的數(shù)據(jù)傳輸長鏈接方式,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教2022-02-02python使用arp欺騙偽造網(wǎng)關(guān)的方法
這篇文章主要介紹了python使用arp欺騙偽造網(wǎng)關(guān)的方法,涉及Python偽造網(wǎng)關(guān)的相關(guān)技巧,需要的朋友可以參考下2015-04-04Python詳細對比講解break和continue區(qū)別
這篇文章主要介紹了python循環(huán)控制語句 break 與 continue,break就像是終止按鍵,不管執(zhí)行到哪一步,只要遇到break,不管什么后續(xù)步驟,直接跳出當前循環(huán)2022-06-06關(guān)于Python 3中print函數(shù)的換行詳解
最近在學(xué)習(xí)python3,發(fā)現(xiàn)了一個問題想著總結(jié)出來,所以下面這篇文章主要給大家介紹了關(guān)于Python 3中print函數(shù)換行的相關(guān)資料,文中通過示例代碼介紹的非常詳細,對需要的朋友們具有一定的參考學(xué)習(xí)價值,感興趣的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧。2017-08-08