Amazon Redshift Serverless – 现已正式推出新功能

news/2024/4/29 4:49:08/文章来源:https://blog.csdn.net/u012365585/article/details/131904978

去年在 re:Invent 上,我们推出了 Amazon Redshift Serverless 的预览版,这是 Amazon Redshift 的无服务器选项,可让您分析任何规模的数据,而无需管理数据仓库基础设施。您只需要加载和查询数据,并且只需为使用的内容付费。这使更多的公司能够制定现代数据策略,尤其适用于分析工作负载不全天候运行且数据仓库并非一直处于活动状态的使用案例。也适用于组织内数据使用量不断扩大、新部门的用户希望在不拥有数据仓库基础设施的情况下运行分析的公司。

亚马逊云科技开发者社区为开发者们提供全球的开发技术资源。这里有技术文档、开发案例、技术专栏、培训视频、活动与竞赛等。帮助中国开发者对接世界最前沿技术,观点,和项目,并将中国优秀开发者或技术推荐给全球云社区。如果你还没有关注/收藏,看到这里请一定不要匆匆划过,点这里让它成为你的技术宝库!

 

今天,我很高兴地与大家分享 Amazon Redshift Serverless 已正式推出,而且我们添加了许多新功能。与预览版相比,我们还降低了 Amazon Redshift Serverless 的计算成本。

现在,您可以使用命名空间和工作组为每个 Amazon 账户和区域创建多个无服务器端点:

  • 命名空间是数据库对象和用户的集合,例如数据库名称和密码、权限和加密配置。这是管理数据的地方,在这里您可以看到使用了多少存储空间。
  • 工作组是计算资源的集合,包括网络和安全设置。每个工作组都有一个无服务器端点,您可以将应用程序连接到该端点。配置工作组时,您可以设置私有或可公开访问的端点。

每个命名空间只能有一个与之关联的工作组。相反,每个工作组只能与一个命名空间关联。您可以拥有一个没有任何工作组与其关联的命名空间,例如,仅将其用于与同一或其他 Amazon 账户或区域中的其他命名空间共享数据。

在工作组配置中,您现在可以使用查询监控规则来帮助控制成本。此外,Amazon Redshift Serverless 自动扩展数据仓库容量的方式更加智能,能够快速为要求苛刻且不可预测的工作负载提供性能。

我们来通过一个快速演示了解下具体的工作原理。然后,我将向您展示如何使用命名空间和工作组。

使用 Amazon Redshift Serverless

在 Amazon Redshift 控制台中,我在导航窗格中选择了 Redshift serverless(Redshift 无服务器)。首先,我选择 Use default settings(使用默认设置)来配置命名空间和具有最常用选项的工作组。例如,我将能够使用我的默认 VPC 和默认安全组进行连接。

image.png

使用默认设置时,剩下的唯一配置选项是 Permissions(权限)。在这里,我可以指定 Amazon Redshift 如何与 S3、Amazon CloudWatch Logs、Amazon SageMaker 和 Amazon Glue 等其他服务进行交互。为了稍后加载数据,我授予 Amazon Redshift 访问 S3 存储桶的权限。我选择 Manage IAM roles(管理 IAM 角色),然后选择 Create IAM role(创建 IAM 角色)。

image.png

创建 IAM 角色时,我选择了授予 specific S3 buckets(特定 S3 存储桶)访问权限的选项,然后在同一 Amazon 区域中选择一个 S3 存储桶。 然后,我选择 Create IAM role as default(创建 IAM 角色作为默认角色)来完成角色的创建,并自动将其用作命名空间的默认角色。

image.png

我选择 Save configuration(保存配置),几分钟后数据库就可以使用了。在 Serverless dashboard(无服务器控制面板)中,我选择 Query data(查询数据)来打开 Redshift query editor v2(Redshift 查询编辑器 v2)。然后,我按照 Amazon Redshift 数据库开发人员指南中的说明加载示例数据库。如果您想做一个快速测试,sample_data_dev 数据库中已经有几个示例数据库(包括我在这里使用的数据库)。另请注意,运行查询不需要将数据加载到 Amazon Redshift 中。通过创建外部架构和外部表,我可以在查询中使用来自 S3 数据湖的数据。

示例数据库由七个表组成,跟踪虚构的“TICKIT”网站的销售活动,用户在该网站上买卖体育赛事、表演和音乐会的门票。

image.png

为了配置数据库架构,我运行了几个 SQL 命令来创建 usersvenuecategorydate eventlisting和 sales表。

image.png

然后,我下载了 tickitdb.zip 文件,其中包含数据库表的示例数据。我解压缩文件并将其加载到配置 IAM 角色时使用的同一 S3 存储桶中的 tickit文件夹。

现在,我可以使用 COPY 命令将 S3 存储桶中的数据加载到我的数据库中。例如,要将数据加载到 users表中,请执行以下操作:

SQL

copy users from 's3://MYBUCKET/tickit/allusers_pipe.txt' iam_role default;

包含 sales表数据的文件使用制表符分隔的值:

SQL

copy sales from 's3://MYBUCKET/tickit/sales_tab.txt' iam_role default delimiter '\t' timeformat 'MM/DD/YYYY HH:MI:SS';

在所有表中加载数据后,我开始运行一些查询。例如,以下查询联接五个表,以查找加利福尼亚州活动的前五名卖家(请注意,示例数据为 2008 年的数据):

SQL

select sellerid, username, (firstname ||' '|| lastname) as sellername, venuestate, sum(qtysold)
from sales, date, users, event, venue
where sales.sellerid = users.userid
and sales.dateid = date.dateid
and sales.eventid = event.eventid
and event.venueid = venue.venueid
and year = 2008
and venuestate = 'CA'
group by sellerid, username, sellername, venuestate
order by 5 desc
limit 5;

image.png

现在我的数据库已准备就绪,让我们看看通过配置 Amazon Redshift Serverless 命名空间和工作组可以做些什么。

使用和配置命名空间

命名空间是数据库数据及其安全配置的集合。在 Amazon Redshift 控制台的导航窗格中,我选择 Namespace configuration(命名空间配置)。在列表中,我选择我刚刚创建的 default命名空间。

在 Data backup(数据备份)选项卡中,我可以创建或恢复快照或从其中一个恢复点恢复数据,这些恢复点每 30 分钟自动创建一次,保留 24 小时。这对于在意外写入或删除的情况下恢复数据非常有用。

image.png

在 Security and encryption(安全和加密)选项卡中,我可以更新权限和加密设置,包括用于加密和解密我的资源的 AWS Key Management Service(AWS KMS)密钥。在此选项卡中,我还可以启用审计日志记录并导出用户、连接和用户活动日志。[[日志要导出到哪里? CloudWatch 日志? 从控制台的角度不清楚]]

image.png

在 Datashares(数据共享)选项卡中,我可以创建一个数据共享,以便与相同或不同区域中的其他命名空间和 AWS 账户共享数据。在此选项卡中,我还可以使用从其他命名空间或 AWS 账户收到的共享创建数据库,并且可以看到由 AWS Data Exchange 管理的数据共享的订阅。

image.png

当我创建数据共享时,我可以选择要包含哪些对象。例如,现在我只想共享 date和 event表,因为它们不包含敏感数据。

image.png

使用和配置工作组

工作组是计算资源及其网络和安全设置的集合。它们为其配置的命名空间提供无服务器端点。在 Amazon Redshift 控制台的导航窗格中,我选择 Workgroup configuration(工作组配置)。在列表中,我选择我刚刚创建的 default命名空间。

在 Data access(数据访问)选项卡中,我可以更新网络和安全设置(例如,更改 VPC、子网或安全组)或将端点设为可公开访问。在此选项卡中,我还可以启用 Enhanced VPC routing(增强型 VPC 路由),以便通过 VPC 而非互联网在我的无服务器数据库和我使用的数据存储库(例如,用于加载或卸载数据的 S3 存储桶)之间路由网络流量。要访问位于其他 VPC 或子网中的无服务器端点,我可以创建由 Amazon Redshift 管理的 VPC endpoint(VPC 端点)。

image.png

在 Limits(限制)选项卡中,我可以配置用于处理查询的基本容量(以 Redshift 处理单元或 RPU 表示)。Amazon Redshift Serverless 可扩展容量以应对更多用户的需求。在这里,我还可以选择增加基本容量以加快查询速度,或者减少基本容量以降低成本。

在此选项卡中,我还可以设置 Usage limits(使用限制),以配置每日、每周和每月阈值,以保持成本的可预测性。例如,我为计算资源配置了每日 200 RPU 小时的限制和每月 2,000 RPU 小时的限制。为了控制跨区域数据共享的数据传输成本,我将每日限制配置为 3 TB,每周限制配置为 10 TB。最后,为了限制每个查询使用的资源,我使用 Query limits(查询限制)将运行超过 60 秒的查询设为超时。

image.png

可用性和定价

Amazon Redshift Serverless 现已在以下 Amazon 区域正式推出:美国东部(俄亥俄州)、美国东部(弗吉尼亚州北部)、美国东部(俄勒冈州)、欧洲地区(法兰克福)、欧洲地区(爱尔兰)、欧洲地区(伦敦)、欧洲地区(斯德哥尔摩)和亚太地区(首尔)、亚太地区(新加坡)、亚太地区(悉尼)和亚太地区(东京)。

您可以使用自己喜欢的客户端工具通过 JDBC/ODBC 或使用 Amazon Redshift 查询编辑器 v2(在 Amazon Redshift 控制台上提供的基于 Web 的 SQL 客户端应用程序)连接到工作组端点。使用基于 Web 服务的应用程序(例如 AWS Lambda 函数或 Amazon SageMaker 笔记本)时,您可以使用内置的 Amazon Redshift 数据 API 访问数据库并执行查询。

使用 Amazon Redshift Serverless,您只需为数据库处于活动状态时消耗的计算容量付费。计算容量会根据您的工作负载自动扩展或缩减,并在闲置期间关闭,以节省时间和成本。您的数据存储在托管存储中,您需要按每月 GB 的费率付费。

为了提高性价比并灵活地将 Amazon Redshift Serverless 用于更广泛的使用案例,我们正在将美国东部(弗吉尼亚州北部)区域的每 RPU 小时价格从 0.5 美元降至 0.375 美元。同样,我们也会将其他区域的价格从预览版价格平均降低 25%。有关更多信息,请参阅 Amazon Redshift 定价页面。

为了帮助您练习自己的使用案例,我们还提供 300 美元的 AWS 服务抵扣金,为期 90 天,用于试用 Amazon Redshift Serverless。这些服务抵扣金仅用于支付 Amazon Redshift Serverless 的计算、存储和快照使用费用。

使用 Amazon Redshift Serverless,在几秒钟内从数据中获取见解。

— Danilo

文章来源:https://dev.amazoncloud.cn/column/article/6309a617afd24c6ba216ff92?sc_medium=regulartraffic&sc_campaign=crossplatform&sc_channel=CSDN 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_335770.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

基于linux下的高并发服务器开发(第三章)- 3.10 死锁

deadlock.c #include <stdio.h> #include <pthread.h> #include <unistd.h>// 全局变量&#xff0c;所有的线程都共享这一份资源。 int tickets 1000;// 创建一个互斥量 pthread_mutex_t mutex;void * sellticket(void * arg) {// 卖票while(1) {// 加锁pt…

伦敦金在非农双向挂单

对伦敦金投资有一定经验的投资者都知道&#xff0c;在非农时期&#xff0c;伦敦金市场会出现很大的波动&#xff0c;那么我们如何才能抓住这些波动呢&#xff1f;答案是很难的。但是&#xff0c;有些投资者在多年实践中发明了一种双向挂单的方法&#xff0c;这里和大家一切分享…

SpringBoot Redis 多数据源集成支持哨兵模式和Cluster集群模式

Redis 从入门到精通【应用篇】之SpringBoot Redis 多数据源集成支持哨兵模式Cluster集群模式、单机模式 文章目录 Redis 从入门到精通【应用篇】之SpringBoot Redis 多数据源集成支持哨兵模式Cluster集群模式、单机模式0.前言说明项目结构Pom 依赖 1. 配置1.1 通用配置&#xf…

android app控制ros机器人二

Ros-Mobile的使用基本熟悉&#xff0c;接下来熟悉代码&#xff0c;记录中间的问题。 GitHub - ROS-Mobile/ROS-Mobile-Android: Visualization and controlling application for Android 使用android studio打开项目后有bug。 BUG&#xff1a; 1.FAILURE: Build failed wit…

RL 实践(5)—— 二维滚球环境【REINFORCE Actor-Critic】

本文介绍如何用 REINFORCE 和 Actor-Critic 这两个策略梯度方法解二维滚球问题参考&#xff1a;《动手学强化学习》完整代码下载&#xff1a;6_[Gym Custom] RollingBall (REINFORCE and Actor-Critic) 文章目录 1. 二维滚球环境2. 策略梯度方法2.1 策略学习目标2.2 策略梯度定…

2023年深圳杯数学建模C题无人机协同避障航迹规划

2023年深圳杯数学建模 C题 无人机协同避障航迹规划 原题再现&#xff1a; 平面上A、B两个无人机站分别位于半径为500 m的障碍圆两边直径的延长线上&#xff0c;A站距离圆心1 km&#xff0c;B站距离圆心3.5 km。两架无人机分别从A、B两站同时出发&#xff0c;以恒定速率10 m/s…

gensim conherence model C_V 值与其他指标负相关BUG

在我用gensim3.8.3 conherence model分析京东评论主题模型时&#xff0c; C_V 与npmi、u_mass出现了强烈的皮尔逊负相关&#xff1a; 这些地方也反映了类似问题&#xff1a; https://github.com/dice-group/Palmetto/issues/12 https://github.com/dice-group/Palmetto/issue…

微软亚研院提出模型基础架构RetNet或将成为Transformer有力继承者

作为全新的神经网络架构&#xff0c;RetNet 同时实现了良好的扩展结果、并行训练、低成本部署和高效推理。这些特性将使 RetNet 有可能成为继 Transformer 之后大语言模型基础网络架构的有力继承者。实验数据也显示&#xff0c;在语言建模任务上&#xff1a; RetNet 可以达到与…

Rust vs Go:常用语法对比(十三)

题图来自 Go vs. Rust: The Ultimate Performance Battle 241. Yield priority to other threads Explicitly decrease the priority of the current process, so that other execution threads have a better chance to execute now. Then resume normal execution and call f…

SpringBoot 配置⽂件

1.配置文件作用 整个项⽬中所有重要的数据都是在配置⽂件中配置的&#xff0c;⽐如&#xff1a; 数据库的连接信息&#xff08;包含⽤户名和密码的设置&#xff09;&#xff1b;项⽬的启动端⼝&#xff1b;第三⽅系统的调⽤秘钥等信息&#xff1b;⽤于发现和定位问题的普通⽇…

VMware horizon 8 建立手动桌面池

准备一台win10的虚拟机&#xff0c;改静态IP,计算机名&#xff0c;加入域&#xff0c;把Agent软件上传到机器中。 2&#xff1a;右键管理员身份安装程序。 一般默认 根据自己实际情况选择 启用桌面远程功能 安装完成 安装完成以后创建一个快照&#xff0c;以后是好知道机…

模拟Stevens Lewis描述的小型飞机纵向动力学的非线性动态反演控制器研究(Matlab代码实现)

目录 &#x1f4a5;1 概述 &#x1f4da;2 运行结果 &#x1f389;3 参考文献 &#x1f308;4 Matlab代码实现 &#x1f4a5;1 概述 针对Stevens和Lewis描述的小型飞机纵向动力学的非线性动态&#xff0c;研究非线性动态反演控制器可以是一个有趣的课题。动态反演控制器的目标…

会捷通云视讯 list 目录文件泄露漏洞

劳动永远是医治精神创伤的良药。 漏洞描述 会捷通云视讯某个文件 list参数 存在目录文件泄露漏洞&#xff0c;攻击者通过漏洞可以获取一些敏感信息 漏洞复现 构造payload访问漏洞url&#xff1a; /him/api/rest/V1.0/system/log/list?filePath../漏洞证明&#xff1a; 文…

【iOS】KVOKVC原理

1 KVO 键值监听 1.1 KVO简介 KVO的全称是Key-Value Observing&#xff0c;俗称"键值监听"&#xff0c;可以用于监听摸个对象属性值得改变。 KVO一般通过以下三个步骤使用&#xff1a; // 1. 添加监听 [self.student1 addObserver:self forKeyPath:"age"…

音视频——帧内预测

H264编码(帧内预测) 在帧内预测模式中&#xff0c;预测块P是基于已编码重建块和当前块形成的。对亮度像素而言&#xff0c;P块用于44子块或者1616宏块的相关操作。44亮度子块有9种可选预测模式&#xff0c;独立预测每一个44亮度子块&#xff0c;适用于带有大量细节的图像编码&…

云安全攻防(二)之 云原生安全

云原生安全 什么是云原生安全&#xff1f;云原生安全包含两层含义&#xff1a;面向云原生环境的安全和具有云原生特征的安全 面向云原生环境的安全 面向云原生环境的安全的目标是防护云原生环境中的基础设施、编排系统和微服务系统的安全。这类安全机制不一定会具有云原生的…

交叉编译----宿主机x86 ubuntu 64位-目标机ARMv8 aarch64

1.交叉编译是什么&#xff0c;为什么要交叉编译 编译&#xff1a;在一个平台上生成在该平台上的可执行代码交叉编译&#xff1a;在一个平台上生成在另一个平台上的可执行代码交叉编译的例子&#xff1a;如51单片机的可执行代码&#xff08;hex文件&#xff09;是在集成环境kei…

【C#】医学实验室云LIS检验信息系统源码 采用B/S架构

基于B/S架构的医学实验室云LIS检验信息系统&#xff0c;整个系统的运行基于WEB层面&#xff0c;只需要在对应的工作台安装一个浏览器软件有外网即可访问&#xff0c;技术架构&#xff1a;Asp.NET CORE 3.1 MVC SQLserver Redis等。 一、系统概况 本系统是将各种生化、免疫、…

R语言无法调用stats.dll的问题解决方案[补充]

写在前面 在去年10月份&#xff0c;出过一起关于R语言无法调用stats.dll的问题解决方案,今天&#xff08;你看到后是昨天&#xff09;不知道为什么&#xff0c;安装包&#xff0c;一直安装不了&#xff0c;真的是炸裂了。后面再次把R与Rstuido升级。说实话&#xff0c;我是真不…

el-table 表格头部合并

<el-table v-loading"listLoading" :key"tableKey" :data"list" stripe border fit highlight-current-rowstyle"width: 100%;" size"mini"><el-table-column label"第一行" align"center">…