Python 實現訓練集、測試集隨機劃分
更新時間:2020年01月08日 14:52:38 作者:no_error_no_warn
今天小編就為大家分享一篇Python 實現訓練集、測試集隨機劃分,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
隨機從列表中取出元素:
import random dataSet = [[0], [1], [2], [3], [4], [5], [6], [7], [8], [9], [10]] trainDataSet = random.sample(dataSet, 3)
以下函數,使用于我最近的一個機器學習的項目,將數據集數據按照比例隨機劃分成訓練集數據和測試集數據:
import csv import random def getDataSet(proportion): """ :exception 獲取訓練集和測試集(將數據按比例隨機劃分) :parameter proportion - 測試集/數據集 :return trainDataSet - 訓練集 testDataSet - 測試集 author 肖政宇 modify 2019年5月10日 """ dataSet = open('數據集.csv') dataSetReader = csv.reader(dataSet) """ :exception 將數據保存到數組 """ dataSet = [] next(dataSetReader, 'none') # 跳過表頭 data = next(dataSetReader, 'none') while (data != 'none'): dataSet.append(data) data = next(dataSetReader, 'none') """ :exception 按照比例隨機劃分出訓練集和測試集 """ dataNumber = dataSet.__len__() # 數據集數據條數 testNumber = int(dataNumber * proportion) # 測試集數據條數 testDataSet = [] # 測試數據集 trainDataSet = [] # 訓練數據集 testDataSet = random.sample(dataSet, testNumber) # 測試集 for testData in testDataSet: # 將已經選定的測試集數據從數據集中刪除 dataSet.remove(testData) trainDataSet = dataSet # 訓練集 return trainDataSet, testDataSet
以上這篇Python 實現訓練集、測試集隨機劃分就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支持腳本之家。
相關文章
將Python的Django框架與認證系統(tǒng)整合的方法
這篇文章主要介紹了將Python的Django框架與認證系統(tǒng)整合的方法,包括指定認證后臺和編寫認證后臺等內容,需要的朋友可以參考下2015-07-07Python編程在flask中模擬進行Restful的CRUD操作
今天小編就為大家分享一篇關于Python編程在flask中模擬進行Restful的CRUD操作,小編覺得內容挺不錯的,現在分享給大家,具有很好的參考價值,需要的朋友一起跟隨小編來看看吧2018-12-12