博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
[Spark][Python][DataFrame][SQL]Spark对DataFrame直接执行SQL处理的例子
阅读量:7038 次
发布时间:2019-06-28

本文共 618 字,大约阅读时间需要 2 分钟。

[Spark][Python][DataFrame][SQL]Spark对DataFrame直接执行SQL处理的例子

$cat people.json

{"name":"Alice","pcode":"94304"} {"name":"Brayden","age":30,"pcode":"94304"} {"name":"Carla","age":19,"pcoe":"10036"} {"name":"Diana","age":46} {"name":"Etienne","pcode":"94104"}

 

$ hdfs dfs -put people.json

$pyspark

sqlContext = HiveContext(sc)

peopleDF = sqlContext.read.json("people.json")

peopleDF.registerTempTable("people")

tmpDF=sqlContext.sql(""" select * FROM people WHERE name like "A%" """)

tmpDF.limit(3).show()

+----+-----+-----+----+ | age| name|pcode|pcoe| +----+-----+-----+----+ |null|Alice|94304|null| +----+-----+-----+----+
 
 
 
 
 
 
 
 

转载地址:http://dtial.baihongyu.com/

你可能感兴趣的文章
iOS 10 的推送 User Notifications Framework
查看>>
技术工坊|区块链中的p2p网络(上海)
查看>>
df命令、du命令、磁盘分区
查看>>
面试题:
查看>>
zabbix安装
查看>>
关于数据库设计的思考
查看>>
ubuntu安装svn
查看>>
OSChina 周三乱弹 —— 我在 if 里,你却在 else
查看>>
OSChina 周五乱弹 —— 但愿老死电脑间,不愿鞠躬老板前
查看>>
OSChina 周四乱弹 ——小小编辑教你装逼斗气
查看>>
CRS-4402(Doc ID 1212703.1) 续
查看>>
Maven项目中添加jFinal包以及源文件
查看>>
Android实用笔记——使用ViewPager实现导航
查看>>
Orcale无奈的Char与Varchar
查看>>
深入理解Java虚拟机 读书笔记 之 how to STW
查看>>
有关数据库事务的一些理解
查看>>
clang: error: exit code 1 错误详解
查看>>
MyEclipse Web Project转Eclipse Dynamic Web Project
查看>>
ELK之权限管理
查看>>
×_7_12_2013 I: Light on or off
查看>>