JindoData 使用文档§

JindoData 是阿里云开源大数据团队自研的数据湖存储加速套件,面向大数据和 AI 生态,为阿里云和业界主要数据湖存储系统提供全方位访问加速解决方案。

JindoData 套件基于统一架构和内核实现,支持通过数据湖万能的 SDK(JindoSDK) 访问 OSS/OSS-HDFS。JindoSDK 兼容 HCFS 接口,对象存储接口 和 POSIX 接口、也支持 Python、Tensorflow 等,拥有全面兼容的生态工具(Jindo Cli、JindoFuse、JindoDistCp)和插件支持。

JindoData

下载安装 JindoSDK§

JindoSDK 是访问 JindoData 组件的标准客户端,请参考 JindoSDK 下载JindoSDK 快速入门 进行安装和验证。

关于多平台支持,请参考JindoSDK 多平台支持

升级 JindoSDK§

JindoSDK 是活跃更新的客户端,持续为用户带来阿里云EMR数据湖的最新功能和最佳性能。 因此我们推荐客户使用新版 JindoSDK,以获取持续支持和更好的使用体验。 我们提供了便捷的脚本帮助用户升级集群里的 JindoSDK,请参考 JindoSDK升级文档

分场景使用说明§

在 Hadoop 生态使用JindoSDK

在 AI 生态使用JindoSDK

Jindo Python SDK 使用

Jindo TensorFlow Connector 使用

JindoFuse 使用

Jindo Flink Sink 使用

在 Fluid 中使用 JindoRuntime

JindoData 鉴权方案

数据拷贝工具 JindoDistCp

数仓迁移工具 JindoTable MoveTo

数仓分层存储管理工具 JindoTable SetStorage

OSS-HDFS服务(JindoFS)客户端工具

常见问题§

请参见JindoData 常见问题

历史版本§

请参见JindoSDK 版本记录