亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

Python批量寫入ES索引數(shù)據(jù)的示例代碼

 更新時(shí)間:2024年02月28日 08:10:40   作者:1024點(diǎn)線面  
這篇文章主要為大家詳細(xì)介紹了如何使用python腳本批量寫ES數(shù)據(jù)(需要使用pip提前下載安裝es依賴庫),感興趣的小伙伴可以學(xué)習(xí)一下

背景

由于使用官方性能壓測工具esrally并不能隨心所欲地控制創(chuàng)建索引的內(nèi)容、索引的結(jié)構(gòu)和數(shù)據(jù)量,無法創(chuàng)建指定的測試數(shù)據(jù)集,或者直接投入生產(chǎn)使用。使用java或者spark則需編譯使用,修改麻煩,人生苦短,我用python。本文介紹使用python腳本批量寫ES數(shù)據(jù),需要使用pip提前下載安裝es依賴庫。

在線安裝pip

這主要是為了安裝python依賴。

wget [https://bootstrap.pypa.io/pip/2.7/get-pip.py](https://bootstrap.pypa.io/pip/2.7/get-pip.py)

python get-pip.py

[root@manager data]# pip --version

pip 20.3.4 from /usr/lib/python2.7/site-packages/pip (python 2.7)

pip install elasticsearch

Python腳本代碼

數(shù)據(jù)實(shí)例如下圖的效果:

代碼全文如下(大多數(shù)字段的內(nèi)容都會(huì)隨機(jī)變化):

(注意,示例中大部分中文內(nèi)容是為了增加存儲(chǔ)使用量,否則100萬條數(shù)據(jù)僅85MB,當(dāng)前百萬數(shù)據(jù)占用665MB,可酌情減少字段)

# coding: utf-8
from elasticsearch import Elasticsearch
from elasticsearch import helpers
import random
import time
import sys


reload(sys)
sys.setdefaultencoding('utf-8')
es = Elasticsearch(hosts='http://10.180.249.94:9200')
# print(es)

names = ['劉一', '陳二', '張三', '李四', '王五', '趙六', '孫七', '周八', '吳九', '鄭十']
names2 = ['劉一沒有曾用名', '陳二沒有曾用名', '張三沒有曾用名', '李四也沒有曾用名啊', '王五沒有曾用名', '趙六也沒有曾用名']
sexs = ['男', '女']
subjects = ['語文', '數(shù)學(xué)', '英語', '生物', '地理','物理','化學(xué)','思想','歷史']
grades = [85, 77, 96, 74, 85, 69, 84, 59, 67, 69, 86, 96, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86]
ages = [12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30]
likes = ['接天蓮葉無窮碧','映日荷花別樣紅','不識(shí)廬山真面目','只緣身在此山中','兩個(gè)黃鸝鳴翠柳','一行白鷺上青天','姑蘇城外寒山寺','夜半鐘聲到客船','窗含西嶺千秋雪','門泊東吳萬里船']
webs = ['https://api.paugram.com/help/acgm','https://docs.tenapi.cn/img.html','https://api.mz-moe.cn/img.php','https://www.jinrishici.com/doc/#instance-right','https://www.bookmarkearth.com','https://www.yijianlogo.com/template']
datas = ['西風(fēng)吹老洞庭波,一夜湘君白發(fā)多。醉后不知天在水,滿船清夢壓星河。','鑿破蒼苔地,偷他一片天。白云生鏡里,明月落階前。','春風(fēng)倚棹闔閭城,水國春寒陰復(fù)晴。細(xì)雨濕衣看不見,閑花落地聽無聲。','日斜江上孤帆影,草綠湖南萬里情。東道若逢相識(shí)問,青袍今日誤儒生。','浪花有意千里雪,桃李無言一隊(duì)春。一壺酒,一竿身,快活如儂有幾人?','岸闊檣稀波渺茫,獨(dú)憑危檻思何長。蕭蕭遠(yuǎn)樹疏林外 ,一半秋山帶夕陽。']
dates = ['2002-10-12-11:00:02','2022-12-12-15:18:09','2023-12-08-11:00:02','2022-11-22-16:01:01','2021-09-19-13:55:55','2019-11-11-15:07:06','2010-08-09-11:56:09','2023-06-18-01:06:01','2022-12-12-19:06:04','2023-10-15-16:13:02']

start = time.time()
# 開始批量寫入es數(shù)據(jù)庫
# 批量寫入數(shù)據(jù)
for j in range(2000):
    print(j)
    action = [
        {
            "_index": "grades_v3",
            "_type": "_doc",
            "_id": i,
            "_source": {
                "id": i,
                "name": random.choice(names),
                "old_name": random.choice(names2),
                "sex": random.choice(sexs),
                "subject": random.choice(subjects),
                "grade": random.choice(grades),
                "ages": random.choice(ages),
                "likes": random.choice(likes),
                "likes2": random.choice(likes),
                "others2": random.choice(datas),
                "websites": random.choice(webs),
                "others": random.choice(likes),
                "login_date":  random.choice(dates),
                "others3": random.choice(datas)
            }
        } for i in range(10000 * j, 10000 * j + 10000)
    ]
    helpers.bulk(es, action)
end = time.time()
print('Total Time Spent: ', end - start)

執(zhí)行

python esgen.py

寫入了2000萬條數(shù)據(jù)約13GB,足以模擬大多數(shù)測試需求了,耗時(shí)6330秒。

指定創(chuàng)建索引的分片數(shù)

默認(rèn)的索引自動(dòng)創(chuàng)建只有一個(gè)分片,指定分片的代碼如下:

# 定義要?jiǎng)?chuàng)建的索引及其設(shè)置,包括主分片數(shù)為3  
create_index_body = {  
    "settings": {  
        "index": {  
            "number_of_shards": 3,  # 設(shè)置主分片數(shù)為3  
            "number_of_replicas": 1  # 設(shè)置副本數(shù)為1,可以根據(jù)需要調(diào)整  
        }  
    }  
}  
  
# 創(chuàng)建索引  
if not es.indices.exists(index="my_index"):  
    es.indices.create(index="my_index", body=create_index_body)  

在后續(xù)寫入時(shí)指定為這個(gè)"my_index"即可,名字隨意。

到此這篇關(guān)于Python批量寫入ES索引數(shù)據(jù)的示例代碼的文章就介紹到這了,更多相關(guān)Python寫入ES索引數(shù)據(jù)內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • 在Pandas中更改DataFrame中的值

    在Pandas中更改DataFrame中的值

    這篇文章主要介紹了在Pandas中更改DataFrame中的值方式,具有很好的參考價(jià)值,希望對(duì)大家有所幫助,如有錯(cuò)誤或未考慮完全的地方,望不吝賜教
    2023-08-08
  • python?離散點(diǎn)圖畫法的實(shí)現(xiàn)

    python?離散點(diǎn)圖畫法的實(shí)現(xiàn)

    本文主要介紹了python?離散點(diǎn)圖畫法,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2022-04-04
  • 詳解Python中的文件操作

    詳解Python中的文件操作

    在日常生活中,文件操作主要包括打開、關(guān)閉、讀、寫等操作,這篇文章主要為大家詳細(xì)介紹了Python中這些文件操作的實(shí)現(xiàn),需要的可以了解下
    2023-07-07
  • 詳解圖像上的OpenCV算術(shù)運(yùn)算

    詳解圖像上的OpenCV算術(shù)運(yùn)算

    圖像可以進(jìn)行算術(shù)運(yùn)算,例如加法、減法和按位運(yùn)算(AND、OR、NOT、XOR)。這些操作可以幫助改善輸入圖像的屬性。本文主要介紹了OpenCV中常見的圖像算術(shù)運(yùn)算,需要的可以參考一下
    2022-10-10
  • python 提取視頻中的音頻工具類詳解

    python 提取視頻中的音頻工具類詳解

    本文主要介紹了如何利用Python的ffmpy庫實(shí)現(xiàn)提取視頻中的音頻,從而幫助大家更好的理解和學(xué)習(xí)使用python,感興趣的朋友可以了解下
    2021-11-11
  • Python 3.x基礎(chǔ)實(shí)戰(zhàn)檢查磁盤可用空間

    Python 3.x基礎(chǔ)實(shí)戰(zhàn)檢查磁盤可用空間

    這篇文章主要為大家介紹了Python 3.x基礎(chǔ)實(shí)戰(zhàn)之檢查磁盤可用空間實(shí)現(xiàn),有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪
    2023-05-05
  • Python調(diào)用Zoomeye搜索接口的實(shí)現(xiàn)

    Python調(diào)用Zoomeye搜索接口的實(shí)現(xiàn)

    本文主要介紹了Python調(diào)用Zoomeye搜索接口的實(shí)現(xiàn),文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2023-01-01
  • python實(shí)現(xiàn)數(shù)據(jù)寫入excel表格

    python實(shí)現(xiàn)數(shù)據(jù)寫入excel表格

    這篇文章主要為大家詳細(xì)介紹了python實(shí)現(xiàn)數(shù)據(jù)寫入excel表格,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下
    2018-03-03
  • Python+OpenCV實(shí)現(xiàn)基于顏色的目標(biāo)識(shí)別

    Python+OpenCV實(shí)現(xiàn)基于顏色的目標(biāo)識(shí)別

    這篇文章主要介紹了利用OpenCV實(shí)現(xiàn)基于顏色的目標(biāo)識(shí)別,即讓攝像頭識(shí)別到視野范圍內(nèi)的有顏色的氣球并返回每個(gè)氣球的中心點(diǎn)坐標(biāo),感興趣的可以跟隨小編學(xué)習(xí)一下
    2022-01-01
  • python實(shí)戰(zhàn)項(xiàng)目scrapy管道學(xué)習(xí)爬取在行高手?jǐn)?shù)據(jù)

    python實(shí)戰(zhàn)項(xiàng)目scrapy管道學(xué)習(xí)爬取在行高手?jǐn)?shù)據(jù)

    這篇文章主要為介紹了python實(shí)戰(zhàn)項(xiàng)目scrapy管道學(xué)習(xí)拿在行練手爬蟲項(xiàng)目,爬取在行高手?jǐn)?shù)據(jù),本篇博客的重點(diǎn)為scrapy管道pipelines的應(yīng)用,學(xué)習(xí)時(shí)請(qǐng)重點(diǎn)關(guān)注
    2021-11-11

最新評(píng)論