搜索内容

最新文章
  • Airflow UI界面操作流程
    技术

    Airflow UI界面操作流程

    Airflow操作流程 登录 使用账号、密码登录Airflow,登录成功后进到Airflow主页面。 (图1) 打开Dag开关 (图2) 选中需要执行的DAG,如图2中,数字1表示打……
    削笔刀 5天前
  • Sprak配置项详解:哪些参数会影响应用程序执行性能?
    技术

    Sprak配置项详解:哪些参数会影响应用程序执行性能?

    我们学习了Broadcast Join这种执行高效的Join策略。要想触发Spark SQL选择这类Join策略,可以利用SQL Functions中的broadcast函数来强制广播基表。在这种情况……
    削笔刀 2024年10月10日
  • 数据关联优化:都有哪些Join策略,开发者该如何取舍?
    技术

    数据关联优化:都有哪些Join策略,开发者该如何取舍?

    我们知道, 在分布式环境中,Spark支持两类数据分发模式。一类是我们在[第7讲]学过的Shuffle,Shuffle通过中间文件来完成Map阶段与Reduce阶段的数据交换,因……
    削笔刀 2024年10月10日
  • Spark存储系统
    技术

    Spark存储系统

    我们前面学了Shuffle管理、RDD Cache和广播变量,这些功能与特性,对Spark作业的执行性能有着至关重要的影响。而想要实现这些功能,底层的支撑系统正是Spark存……
    削笔刀 2024年9月27日
  • 内存管理:Spark如何使用内存?
    技术

    内存管理:Spark如何使用内存?

    我们拜访了斯巴克建筑集团的分公司,熟悉了分公司的办公环境与人员配置,同时用“工地搬砖的任务”作类比,介绍了Spark Shuffle的工作原理。 今天这一讲,我们再……
    削笔刀 2024年9月26日
  • Spark学习笔记
    技术

    Spark学习笔记

    spark和sparkContext spark和sparkContext分别是两种不同的开发入口实例: spark是开发入口SparkSession实例(Instance),SparkSession在spark-shel……
    削笔刀 2024年9月25日
  • BASE理论及一致性问题及应对
    技术

    BASE理论及一致性问题及应对

    BASE 理论 BASE 理论最初由 Brewer 及他的同事们提出。虽然比较久远,但在当前的互联网界活力更盛。各大互联网企业,在构建大中型规模的分布式互联网系统,包……
    削笔刀 2024年9月24日
  • 3种不同的Redis集群的分布式方案
    技术

    3种不同的Redis集群的分布式方案

    Redis 集群的分布式方案主要有 3 种。分别是 Client 端分区方案,Proxy 分区方案,以及原生的 Redis Cluster 分区方案。 Client 端分区 Client 端分区方案就……
    削笔刀 2024年9月24日
  • 如何大幅成倍提升Redis处理性能?
    技术

    如何大幅成倍提升Redis处理性能?

    主线程 Redis 自问世以来,广受好评,应用广泛。但相比, Memcached 单实例压测 TPS 可以高达百万,线上可以稳定跑 20~40 万而言,Redis 的单实例压测 TPS 不……
    削笔刀 2024年9月24日
  • Redis崩溃后,如何进行数据恢复的?
    技术

    Redis崩溃后,如何进行数据恢复的?

    Redis 持久化是一个将内存数据转储到磁盘的过程。Redis 目前支持 RDB、AOF,以及混合存储三种模式。 RDB Redis 的 RDB 持久化是以快照的方式将内存数据存储到……
    削笔刀 2024年9月24日