3.sql
from odps import ODPS
o = ODPS(access_id="LTASVb3aOF3ghjek",
secret_access_key="FeUozVDFSvtEgcpzPUZHIT9vyWyX7W",
project="satori",
endpoint="http://service.odps.aliyun.com/api")
'''
pyodps支持odps sql的查询,并可以读取执行的结果。
execute_sql或者run_sql方法,返回一个运行实例
但并非所有在ODPS Consol 中可以执行的命令都是 ODPS 可以接受的 SQL 语句。
o.execute_sql() 会同步执行,直到查询完成
o.run_sql() 会异步执行
'''
# 注意:一般情况下,不建议直接使用select *
# 所以要使用的话,需要指定分区
# 同步的方式执行,会阻塞
instance = o.execute_sql("select * from girls where pt='test'")
print(instance)
<Instance 20180826051816538gg3l6392>
# 异步的方式执行
instance = o.run_sql('select * from girls where pt="test"')
# 获取logview的地址
print(instance.get_logview_address)
<bound method Instance.get_logview_address of <Instance 20180826052031717gd48148>>
# 阻塞直到完成 instance.wait_for_success()
with instance.open_reader() as reader:
for record in reader:
print(dict(record))
# 输出
{'name': '椎名真白', 'age': 16, 'anime': '樱花庄的宠物女孩', 'pt': 'test'}
{'name': '雨宫优子', 'age': 16, 'anime': '悠久之翼', 'pt': 'test'}
{'name': '宫村宫子', 'age': 17, 'anime': '悠久之翼', 'pt': 'test'}
{'name': '四方茉莉', 'age': 400, 'anime': 'sola', 'pt': 'test'}
{'name': '森宫苍乃', 'age': 17, 'anime': 'sola', 'pt': 'test'}
{'name': '牧濑红莉栖', 'age': 20, 'anime': '命运石之门', 'pt': 'test'}
{'name': '椎名真由理', 'age': 18, 'anime': '命运石之门', 'pt': 'test'}
{'name': '漆原琉华', 'age': 18, 'anime': '命运石之门', 'pt': 'test'}
{'name': '春日野穹', 'age': 17, 'anime': '缘之空', 'pt': 'test'}
{'name': '坂上智代', 'age': 19, 'anime': 'clannad', 'pt': 'test'}
{'name': '古河渚', 'age': 20, 'anime': 'clannad', 'pt': 'test'}
{'name': '立华奏', 'age': 17, 'anime': 'AngelBeats', 'pt': 'test'}
{'name': '和泉纱雾', 'age': 16, 'anime': '埃罗芒阿老师', 'pt': 'test'}
{'name': '宫园薰', 'age': 17, 'anime': '四月是你的谎言', 'pt': 'test'}
{'name': '秋月爱莉', 'age': 16, 'anime': '鬼父', 'pt': 'test'}
--------------------------------------------------------------
# 当然在运行的时候,可以通过hints设置参数
# o.execute_sql('select * from girls', hints={'odps.sql.mapper.split.size': 16})
# 或者设置sql.settings,每次运行自动添加
# from odps import options
# options.sql.settings = {'odps.sql.mapper.split.size': 16}
# o.execute_sql('select * from girls') # 会根据全局配置添加hints
# 也可以直接读取sql执行结果
with o.execute_sql("select * from girls where pt='test' limit 5").open_reader() as reader:
for record in reader:
print(f"my name is {record.name}, age is {record['age']}, come from {record[2]}")
# 输出
my name is 椎名真白, age is 16, come from 樱花庄的宠物女孩 my name is 雨宫优子, age is 16, come from 悠久之翼 my name is 宫村宫子, age is 17, come from 悠久之翼 my name is 四方茉莉, age is 400, come from sola my name is 森宫苍乃, age is 17, come from sola
'''
如果 options.tunnel.use_instance_tunnel == True,
调用 open_reader 时,PyODPS 会默认调用 Instance Tunnel,
否则会调用旧的 Result 接口。
如果使用了版本较低的 MaxCompute 服务,或者调用 Instance Tunnel 出现了问题,
PyODPS 会给出警告并自动降级到旧的 Result 接口
可根据警告信息判断导致降级的原因。
如果 Instance Tunnel 的结果不合预期, 请将该选项设为 False
在调用 open_reader 时,也可以使用 tunnel 参数来指定使用何种结果接口
'''
with o.execute_sql("select * from girls where pt='test' limit 5").open_reader(tunnel=True) as reader:
for record in reader:
print(f"my name is {record.name}, age is {record['age']}, come from {record[2]}")
print("--------------------------------------------")
with o.execute_sql("select * from girls where pt='test' limit 5").open_reader(tunnel=False) as reader:
for record in reader:
print(f"name = {record.name}, age = {record['age']}, anime = {record[2]}")
my name is 椎名真白, age is 16, come from 樱花庄的宠物女孩 my name is 雨宫优子, age is 16, come from 悠久之翼 my name is 宫村宫子, age is 17, come from 悠久之翼 my name is 四方茉莉, age is 400, come from sola my name is 森宫苍乃, age is 17, come from sola -------------------------------------------- name = 椎名真白, age = 16, anime = 樱花庄的宠物女孩 name = 雨宫优子, age = 16, anime = 悠久之翼 name = 宫村宫子, age = 17, anime = 悠久之翼 name = 四方茉莉, age = 400, anime = sola name = 森宫苍乃, age = 17, anime = sola
''' PyODPS 默认不限制能够从 Instance 读取的数据规模。 对于受保护的 Project,通过 Tunnel 下载数据受限。 此时, 如果 options.tunnel.limit_instance_tunnel 未设置,会自动打开数据量限制。 此时,可下载的数据条数受到 Project 配置限制, 通常该限制为 10000 条。 如果你想要手动限制下载数据的规模,可以为 open_reader 方法增加 limit 选项, 或者设置 options.tunnel.limit_instance_tunnel = True 。 如果你所使用的 MaxCompute 只能支持旧 Result 接口,同时你需要读取所有数据, 可将 SQL 结果写入另一张表后用读表接口读取 (可能受到 Project 安全设置的限制)。 '''
3.sql的更多相关文章
- 最近帮客户实施的基于SQL Server AlwaysOn跨机房切换项目
最近帮客户实施的基于SQL Server AlwaysOn跨机房切换项目 最近一个来自重庆的客户找到走起君,客户的业务是做移动互联网支付,是微信支付收单渠道合作伙伴,数据库里存储的是支付流水和交易流水 ...
- SQL Server 大数据搬迁之文件组备份还原实战
一.本文所涉及的内容(Contents) 本文所涉及的内容(Contents) 背景(Contexts) 解决方案(Solution) 搬迁步骤(Procedure) 搬迁脚本(SQL Codes) ...
- Sql Server系列:分区表操作
1. 分区表简介 分区表在逻辑上是一个表,而物理上是多个表.从用户角度来看,分区表和普通表是一样的.使用分区表的主要目的是为改善大型表以及具有多个访问模式的表的可伸缩性和可管理性. 分区表是把数据按设 ...
- SQL Server中的高可用性(2)----文件与文件组
在谈到SQL Server的高可用性之前,我们首先要谈一谈单实例的高可用性.在单实例的高可用性中,不可忽略的就是文件和文件组的高可用性.SQL Server允许在某些文件损坏或离线的情况下,允 ...
- EntityFramework Core Raw SQL
前言 本节我们来讲讲EF Core中的原始查询,目前在项目中对于简单的查询直接通过EF就可以解决,但是涉及到多表查询时为了一步到位就采用了原始查询的方式进行.下面我们一起来看看. EntityFram ...
- 从0开始搭建SQL Server AlwaysOn 第一篇(配置域控)
从0开始搭建SQL Server AlwaysOn 第一篇(配置域控) 第一篇http://www.cnblogs.com/lyhabc/p/4678330.html第二篇http://www.cnb ...
- 从0开始搭建SQL Server AlwaysOn 第二篇(配置故障转移集群)
从0开始搭建SQL Server AlwaysOn 第二篇(配置故障转移集群) 第一篇http://www.cnblogs.com/lyhabc/p/4678330.html第二篇http://www ...
- 从0开始搭建SQL Server AlwaysOn 第三篇(配置AlwaysOn)
从0开始搭建SQL Server AlwaysOn 第三篇(配置AlwaysOn) 第一篇http://www.cnblogs.com/lyhabc/p/4678330.html第二篇http://w ...
- 从0开始搭建SQL Server AlwaysOn 第四篇(配置异地机房节点)
从0开始搭建SQL Server AlwaysOn 第四篇(配置异地机房节点) 第一篇http://www.cnblogs.com/lyhabc/p/4678330.html第二篇http://www ...
- SQL Server on Linux 理由浅析
SQL Server on Linux 理由浅析 今天的爆炸性新闻<SQL Server on Linux>基本上在各大科技媒体上刷屏了 大家看到这个新闻都觉得非常震精,而美股,今天微软开 ...
随机推荐
- Weblogic Linux jar包安装
环境/工具: 系统:CentOS 7 JDK:Oracle JDK fmw_12.2.1.2.0_wls.jar 0x01.新建普通用户weblogic 在Linux环境下建议使用普通用户安装,web ...
- [bzoj1999][noip2007]Core树网的核
好久没写题解了.这题不算太水就写一下题解. 话说回来,虽然不水但是挺裸.可以说题意即一半题解了. 我猜粘了题面也没有人去看的,所以直接人话题意了. 给一棵树,点数1e6,(当年noip的n当然是只有3 ...
- Linux命令学习总结(一)
命令 -选项 参数 如果选项是一个单词时,选项前面要加2个- modprobe -r pcspkr 在终端中输入的时候有声音,可以用这个命令屏蔽声音 ,需要root权限 useradd userd ...
- Redmine部署到Windows Azure
有幸,今天可以尝试将Redmine部署到Windows Azure中,记下点滴,方便大家查阅 步骤一:Windows Azure中安装Ubuntu VM 遇到的问题,创建VM时会提示云服务.云存储订阅 ...
- windows下使用RoboCopy命令进行文件夹增量备份
RoboCopy,它是一个命令行的目录复制命令,自从Windows NT 4.0 开始就成为windows 资源工具包的一部分,然后在Windows Vista.Windows 7和 Windows ...
- http协议--留
1.http消息结构 *http客户端,即web浏览器,链接到服务器,向服务器发送一个http请求的目的 *http服务器,即web服务,接受请求,并向客户端发送http响应数据 http统一资源标识 ...
- java开发环境的安装
1.Java是一门面向对象的编程语言,由sun公司开发的,目前公司已经被oracle公司收购.那么作为一门编程语言,它有自己的编程环境.并不是你编写了java代码后,就能在任何平台上运行,它的运行有自 ...
- Access连接字符串
Access2007没有密码连接: <connectionStrings> <add name="myconn" connectionString="P ...
- Java中常用的正则表达式判断,如IP地址、电话号码、邮箱等
java中我们会常用一些判断如IP.电子邮箱.电话号码的是不是符合,那么我们怎么来判断呢,答案就是利用正则表达式来判断了,因为本人对正则表达式没有太深的研究,所有感兴趣的朋友可以自行百度.我这就给基本 ...
- 【Python】- 第一行跟第二行的写法
第一行:目的就是指出,你想要你的这个文件中的代码用什么可执行程序去运行它,就这么简单 #!/usr/bin/python:告诉操作系统执行这个脚本的时候,调用/usr/bin下的python解释器: ...