百木园-与人分享,
就是让自己快乐。

安装Spark与Python练习

一、安装Spark

检查jdk和spark运行测试

 

 二、Python编程练习:英文文本的词频统计

源代码:

import string
dict={}
txt=open(\'test.txt\',\'r\',encoding=\"UTF-8\").read().lower()
for ch in string.punctuation:
txt=txt.replace(ch,\"\")
list=[]
list=txt.split(\" \")
for i in list:
if i in dict:
dict[i]+=1
else:
dict[i]=1
dict= sorted(dict.items(),key=lambda d:d[1],reverse= True)
f = open(\'res.txt\',\'w\')
for items in dict:
f.writelines(\'{}--{}\'.format(items[0],items[1]) + \'\\n\')

运行结果:

 


来源:https://www.cnblogs.com/xtrblog/p/15975403.html
本站部分图文来源于网络,如有侵权请联系删除。

未经允许不得转载:百木园 » 安装Spark与Python练习

相关推荐

  • 暂无文章