亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

搞定這套Python爬蟲面試題(面試會so easy)

 更新時間:2019年04月03日 10:09:51   作者:學(xué)好Python吧  
Python 是一門開源的解釋性語言,相比 Java C++ 等語言,Python 具有動態(tài)特性,非常靈活。這篇文章主要介紹了搞定這套Python爬蟲面試題,面試會so easy,需要的朋友可以參考下

先來一份完整的爬蟲工程師面試考點:

一、 Python 基本功

1、簡述Python 的特點和優(yōu)點

Python 是一門開源的解釋性語言,相比 Java C++ 等語言,Python 具有動態(tài)特性,非常靈活。

2、Python 有哪些數(shù)據(jù)類型?

Python 有 6 種內(nèi)置的數(shù)據(jù)類型,其中不可變數(shù)據(jù)類型是Number(數(shù)字), String(字符串), Tuple(元組),可變數(shù)據(jù)類型是 List(列表),Dict(字典),Set(集合)。

3、列表和元組的區(qū)別

列表和元組都是可迭代對象,能夠?qū)ζ溥M行循環(huán)、切片等,但元組 tuple 是不可變的。元組不可變的特性,使得它可以成為字典 Dict 中的鍵。

4、Python 是如何運行的

CPython:

Python 程序運行時,會先進行編譯,將 .py 文件中的代碼編譯成字節(jié)碼(byte code),編譯結(jié)果儲存在內(nèi)存的 PyCodeObject 中,然后由 Python 虛擬機解釋運行。當程序運行結(jié)束后,Python 解釋器會將 PyCodeObject 保存到 pyc 文件中。每一次運行時 Python 都會先尋找與文件同名的 pyc 文件,如果 pyc 存在則比對修改記錄,根據(jù)修改記錄決定直接運行或再次編譯后運行,最后生成 pyc 文件 。

5、Python 運行速度慢的原因

a). Python 不是強類型的語言,所以解釋器運行時遇到變量以及數(shù)據(jù)類型轉(zhuǎn)換、比較操作、引用變量時都需要檢查其數(shù)據(jù)類型。

b). Python 的編譯器啟動速度比 JAVA 快,但幾乎每次都要啟動編譯。

c). Python 的對象模型會導(dǎo)致訪問內(nèi)存效率變低。Numpy 的指針指向緩存區(qū)數(shù)據(jù)的值,而 Python 的指針指向緩存對象,再通過緩存對象指向數(shù)據(jù):

6、面對 Python 慢的問題,有什么解決辦法

a). 可以使用其他的解釋器,比如 PyPy 和 Jython 等。

b). 如果對性能要求較高且靜態(tài)類型變量較多的應(yīng)用程序,可以使用 CPython。

c). 對于 IO 操作多的應(yīng)用程序,Python 提供 asyncio 模塊提高異步能力。

7、描述一下全局解釋器鎖 GIL

每個線程在執(zhí)行時候都需要先獲取 GIL,保證同一時刻只有一個線程可以執(zhí)行代碼,即同一時刻只有一個線程使用 CPU,也就是說多線程并不是真正意義上的同時執(zhí)行。但是在 IO 操作時,是可以釋放鎖的(這也是 Python 能夠異步的原因)。而且如果想要利用多核 CPU,那么可以使用多進程。

8、深拷貝 淺拷貝

深拷貝是將對象本身復(fù)制給另一個對象,淺拷貝則是將對象的引用復(fù)制給另一個對象。所以當復(fù)制后的對象改變時,深拷貝的原對象值不會改變,而淺拷貝原對象的值會被改變。

9、is 和 == 的區(qū)別

is 表示的是對象標示符(object identity),而 == 表示的是相等(equality)。

is 的作用是用來檢查對象的標示符是否一致,也就是比較兩個對象在內(nèi)存中的地址是否一樣,而 == 是用來檢查兩個對象是否相等。但是為了提高系統(tǒng)性能,對于較小的字符串 Python 會保留其值的一個副本,當創(chuàng)建新的字符串的時候直接指向該副本即可。如:

a = 8
b = 8
a is b

10、文件讀寫

簡述文件讀取時 read 、readline、readlines 的區(qū)別和作用

他們的區(qū)別除了讀取內(nèi)容范圍不同外,返回的內(nèi)容類型也不同。

read()會讀取整個文件,將讀取到底的文件內(nèi)容放到一個字符串變量,返回 str 類型。

readline()讀取一行內(nèi)容,放到一個字符串變量,返回 str 類型。

readlines() 讀取文件所有內(nèi)容,按行為單位放到一個列表中,返回 list 類型。

11、請用一行代碼實現(xiàn)

請分別使用匿名函數(shù)和推導(dǎo)式這兩種方式將 [0, 1, 2, 3, 4, 5] 中的元素求乘積,并打印輸出元組。

print(tuple(map(lambda x: x * x, [0, 1, 2, 3, 4, 5])))
print(tuple(i*i for i in [0, 1, 2, 3, 4, 5]))

12、請用一行代碼實現(xiàn)

用 reduce 計算 n 的階乘(n!=1×2×3×...×n)

print(reduce(lambda x, y: x*y, range(1, n)))

13、請用一行代碼實現(xiàn)

篩選并打印輸出 100 以內(nèi)能被 3 整除的數(shù)的集合

print(set(filter(lambda n: n % 3 == 0, range(1, 100))))

14、請用一行代碼實現(xiàn)

text = 'Obj{"Name": "pic", "data": [{"name": "async", "number": 9, "price": "$3500"}, {"name": "Wade", "number": 3, "price": "$5500"}], "Team": "Hot"'

打印文本中的球員身價元組,如 (  5500)

print(tuple(i.get("price") for i in json.loads(re.search(r'[(.*)]', text).group(0))))

15、請寫出遞歸的基本骨架

def recursions(n):
 if n == 1:
 # 退出條件
 return 1
 # 繼續(xù)遞歸
 return n * recursions(n - 1)

16、切片

請寫出下方輸出結(jié)果

tpl = [0, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95]
print(tpl[3:])
print(tpl[:3])
print(tpl[::5])
print(tpl[-3])
print(tpl[3])
print(tpl[::-5])
print(tpl[:])
del tpl[3:]
print(tpl)
print(tpl.pop())
tpl.insert(3, 3)
print(tpl)
[15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95]
[0, 5, 10]
[0, 25, 50, 75]
85
15
[95, 70, 45, 20]
[0, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95]
[0, 5, 10]
10
[0, 5, 3]

17、文件路徑

打印輸出當前文件所在目錄路徑

import os
print(os.path.dirname(os.path.abspath(__file__)))

打印輸出當前文件路徑

import os
print(os.path.abspath(__file__))

打印輸出當前文件上兩層文件目錄路徑

import os
print(os.path.dirname(os.path.dirname(os.path.abspath(__file__))))

18、請寫出運行結(jié)果,并回答問題

tpl = (1, 2, 3, 4, 5)
apl = (6, 7, 8, 9)
print(tpl.__add__(apl))

問題:tpl 的值發(fā)生變化了嗎?

運行結(jié)果如下:

(1, 2, 3, 4, 5, 6, 7, 8, 9)

答:元組是不可變的,它是生成新的對象

19、請寫出運行結(jié)果,并回答問題

name = ('James', 'Wade', 'Kobe')
team = ['A', 'B', 'C']
tpl = {name: team}
print(tpl)
apl = {team: name}
print(apl)

問題:這段代碼能運行完畢嗎?為什么?它的運行結(jié)果是?

答:這段代碼不能完整運行,它會在 apl 處拋出異常,因為字典的鍵只能是不可變對象,而 list 是可變的,所以不能作為字典的鍵。運行結(jié)果是:

{('James', 'Wade', 'Kobe'): ['A', 'B', 'C']}
TypeError

20、裝飾器

請寫出裝飾器代碼骨架

def log(func):
 def wrapper(*args, **kw):
 print('call %s():' % func.__name__)
 return func(*args, **kw)
 return wrapper

簡述裝飾器在 Python 中的作用:

在不改動原函數(shù)代碼的情況下,為其增加新的功能。

21、多進程 多線程

多進程更穩(wěn)定還是多線程更穩(wěn)定?為什么?

多進程更穩(wěn)定,它們是獨立運行的,不會因為一個崩潰而影響其他進程。

多線程的致命缺點是什么?

因為所有線程共享進程的內(nèi)存,所以任何一個線程掛掉都可能直接造成整個進程崩潰。

進程間通信有哪些方式?

共享變量、隊列、管道。

好了,本文就給大家介紹到這里,祝大家面試so easy!

相關(guān)文章

  • No module named ‘win32gui‘ 的解決方法(踩坑之旅)

    No module named ‘win32gui‘ 的解決方法(踩坑之旅)

    這篇文章主要介紹了No module named ‘win32gui‘ 的解決方法(踩坑之旅),文中通過示例代碼介紹的非常詳細,對大家的學(xué)習或者工作具有一定的參考學(xué)習價值,需要的朋友們下面隨著小編來一起學(xué)習學(xué)習吧
    2021-02-02
  • python3+opencv生成不規(guī)則黑白mask實例

    python3+opencv生成不規(guī)則黑白mask實例

    今天小編就為大家分享一篇python3+opencv生成不規(guī)則黑白mask實例,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2020-02-02
  • Python常用的爬蟲技巧總結(jié)

    Python常用的爬蟲技巧總結(jié)

    本文給大家匯總介紹了Python編寫爬蟲的時候經(jīng)常需要用到的一些技巧,非常的實用,有需要的小伙伴可以參考下
    2016-03-03
  • Pyinstaller打包.py生成.exe的方法和報錯總結(jié)

    Pyinstaller打包.py生成.exe的方法和報錯總結(jié)

    今天小編就為大家分享一篇關(guān)于Pyinstaller打包.py生成.exe的方法和報錯總結(jié),小編覺得內(nèi)容挺不錯的,現(xiàn)在分享給大家,具有很好的參考價值,需要的朋友一起跟隨小編來看看吧
    2019-04-04
  • Python基于pygame實現(xiàn)圖片代替鼠標移動效果

    Python基于pygame實現(xiàn)圖片代替鼠標移動效果

    這篇文章主要介紹了Python基于pygame實現(xiàn)圖片代替鼠標移動效果,可實現(xiàn)將鼠標箭頭轉(zhuǎn)換成圖形的功能,涉及pygame圖形操作的相關(guān)技巧,具有一定參考借鑒價值,需要的朋友可以參考下
    2015-11-11
  • Python通過kerberos安全認證操作kafka方式

    Python通過kerberos安全認證操作kafka方式

    這篇文章主要介紹了Python通過kerberos安全認證操作kafka方式,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2020-06-06
  • python+gdal+遙感圖像拼接(mosaic)的實例

    python+gdal+遙感圖像拼接(mosaic)的實例

    這篇文章主要介紹了python+gdal+遙感圖像拼接(mosaic)的實例,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2020-03-03
  • Python random模塊常用方法

    Python random模塊常用方法

    這篇文章主要介紹了Python random模塊常用方法,本文羅列了最常用的方法,需要的朋友可以參考下
    2014-11-11
  • Django修改端口號與地址的三種方式

    Django修改端口號與地址的三種方式

    Django是一個開放源代碼的Web應(yīng)用框架,由Python寫成,下面這篇文章主要給大家介紹了關(guān)于Django修改端口號與地址的三種方式,文中通過實例代碼介紹的非常詳細,需要的朋友可以參考下
    2023-02-02
  • Python字符編碼判斷方法分析

    Python字符編碼判斷方法分析

    這篇文章主要介紹了Python字符編碼判斷方法,結(jié)合實例形式分析了Python字符編碼的判斷技巧,并給出了chardet的安裝與使用方法,需要的朋友可以參考下
    2016-07-07

最新評論