您现在的位置是:首页 > 个人中心 > 潇潇江南的日志

上传资源列表

  • Dataset API 详解

    大小:16K 更新时间:2026-05-09 下载积分:2分

    一、Dataset API 概述Dataset API 是一种用于数据处理和管理的编程接口,广泛应用于机器学习、数据分析等领域。它提供了统一的数据访问方式,支持对结构化、半结构化和非结构化数据的高效处理,帮助开发者简化数据加...

    标签:dataset
  • DataFrame 概述

    大小:15K 更新时间:2026-05-09 下载积分:2分

    DataFrame 是 pandas 库中用于数据处理的核心数据结构,类似于表格或电子表格,由行和列组成,可存储多种类型数据(如数值、字符串、日期等)。它兼具 NumPy 数组的高效运算能力和表格数据的灵活结构,是数据分析、...

    标签:dataframe
  • Spark Core 技术解析

    大小:15K 更新时间:2026-05-09 下载积分:2分

    一、Spark Core 概述Spark Core 是 Apache Spark 的核心组件,提供了分布式任务调度、内存计算、数据抽象等基础功能,是整个 Spark 生态系统的基石。它基于内存计算模型,相比传统的 MapReduce 框架,能显著提升数据...

    标签:spark core
  • Kafka 技术详解

    大小:17K 更新时间:2026-05-09 下载积分:2分

    一、Kafka 概述Kafka 是由 Apache 软件基金会开发的分布式流处理平台,最初由 LinkedIn 公司设计并开源。它基于发布/订阅(Publish/Subscribe)模式,主要用于处理高吞吐量、低延迟的实时数据流。Kafka 的核心设计目...

    标签:kafka
  • 基于微批处理的流处理引擎

    大小:19K 更新时间:2026-05-09 下载积分:2分

    一、引言随着大数据时代的到来,实时数据处理需求日益增长,流处理技术应运而生。流处理引擎作为处理连续数据流的核心工具,需要在低延迟、高吞吐量和容错性之间取得平衡。微批处理(Micro-Batch)作为流处理的一种...

    标签:流处理引擎
Displaying 681-685 of 1000 results.