腳本之家服務(wù)器常用軟件

快捷導(dǎo)航

軟件下載

android MAC 驅(qū)動(dòng)下載字體下載 DLL

源碼下載

PHP ASP.NET ASP JSP

軟件編程

C# JAVA C 語言 Delphi Android

網(wǎng)絡(luò)編程

PHP ASP.NET ASP JavaScript

在線工具

CSS格式化 JS格式化 Html轉(zhuǎn)化為Js

數(shù)據(jù)庫

MYSQL MSSQL oracle DB2 MARIADB

CMS

PHPCMS DEDECMS 帝國CMS WordPress

常用工具

PHP開發(fā)工具 python Photoshop 必備軟件

MAC下Anaconda+Pyspark安裝配置詳細(xì)步驟

更新時(shí)間：2021年12月01日 15:36:23 作者：Sun_Sherry

一般MAC上使用的是zsh的shell工具，需要修改zshrc文件來使環(huán)境變量永久生效(若不修改該文件，在命令行中輸入相應(yīng)的命令即可，本文給大家介紹MAC下Anaconda+Pyspark安裝配置詳細(xì)步驟，感興趣的朋友跟隨小編一起看看吧

在MAC的Anaconda上使用pyspark,主要包括以下步驟：

在MAC下安裝Spark,并配置環(huán)境變量。
在Anaconda中安裝引用pyspark。

1. MAC下安裝Spark

??到Apark Spark官網(wǎng)上下載Spark文件，無論是windows系統(tǒng)，還是MAC系統(tǒng)，亦或者Linux系統(tǒng)，都可以下載這個(gè)文件(獨(dú)立于系統(tǒng))。

在這里插入圖片描述

將下載的文件進(jìn)行解壓(可以使用命令行進(jìn)行解壓，也可以使用解壓軟件)。解壓之后的文件如下：

在這里插入圖片描述

配置環(huán)境變量。打開MAC命令行窗口，輸入如下命令：

sudo vi ~/.bash_profile #bash_profile是當(dāng)前用戶的環(huán)境變量文件

打開bash_profile文件，并在該文件中增加以下兩行命令：

export SPARK_HOME="/Users/sherry/documents/spark/spark-3.1.2-bin-hadoop2.7" #spark文件的完整解壓目錄
export PATH=${PATH}:${SPARK_HOME}/bin

如下圖

在這里插入圖片描述

保存并退出之后，運(yùn)行以下命令：

source ~/.bash_profile #讓修改的bash_profile生效
echo $PATH #查看環(huán)境變量，可以看到新增的路徑名

一般MAC上使用的是zsh的shell工具，需要修改zshrc文件來使環(huán)境變量永久生效(若不修改該文件，在命令行中輸入spark- shell或者pyspark時(shí)可能會(huì)提示zsh:command not found:pyspark 或 zsh:command not found spark-shell )。輸入以下命令：

vi ~/.zshrc

修改該文件，添加如下命令：

if [ -f ~/.bash_profile ]; then
        source ~/.bash_profile
fi

保存并退出即可。下面來驗(yàn)證spark是否正確安裝，具體如下：
(1)命令行中輸入spark-shell

在這里插入圖片描述

(2)命令行中輸入pyspark

在這里插入圖片描述

至此，spark已經(jīng)安裝成功。

2.在Anaconda中引用pyspark

??想要在Anacond中使用pyspark, 只需將spark解壓文件中python文件夾下的pyspark復(fù)制到Anaconda下的site-packages文件中。下面來驗(yàn)證一下是否能在spyder中使用pyspark, 使用如下代碼：

from pyspark import SparkContext, SparkConf

if __name__ == "__main__":
    spark_conf = SparkConf()\
        .setAppName('Python_Spark_WordCount')\
        .setMaster('local[2]') 
    #使用spark最原始的API進(jìn)行數(shù)據(jù)分析
    sc = SparkContext(conf=spark_conf)
    sc.setLogLevel('WARN')
    print (sc)
   # ------創(chuàng)建RDD，需要分析的數(shù)據(jù) --------------------------------------
    def local_rdd(spark_context):
        datas = ['hadoop spark','hadoop hive spark','hadoop hive spark',\
                 'hadoop python spark','hadoop python spark',]
        return spark_context.parallelize(datas)

    rdd = local_rdd(sc)
    print (rdd.count())
    print (rdd.first())
    sc.stop()

運(yùn)行發(fā)現(xiàn)提示如下錯(cuò)誤：

在這里插入圖片描述

從提示信息可以知道，找不到SPARK_HOME?？梢栽谏鲜鲋骱瘮?shù)中增加如下代碼：

import os
#添加spark安裝目錄
os.environ['SPARK_HOME'] ='/Users/sherry/documents/spark/spark-3.1.2-bin-hadoop2.7'

重新運(yùn)行即可得到如下結(jié)果：

5

hadoop spark

到此這篇關(guān)于MAC+Anaconda+Pyspark安裝配置教程的文章就介紹到這了,更多相關(guān)Anaconda Pyspark安裝配置內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家！

您可能感興趣的文章:

亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

軟件下載

源碼下載

軟件編程

網(wǎng)絡(luò)編程

在線工具

數(shù)據(jù)庫

CMS

常用工具

MAC下Anaconda+Pyspark安裝配置詳細(xì)步驟

1. MAC下安裝Spark

2.在Anaconda中引用pyspark

相關(guān)文章

最新評論

大家感興趣的內(nèi)容

最近更新的內(nèi)容

常用在線小工具