matlab.io.datastore.HadoopFileBased 类
命名空间: matlab.io.datastore
(不推荐)为数据存储添加 Hadoop 文件支持
不推荐使用 matlab.io.datastore.HadoopFileBased
。请改用 matlab.io.datastore.HadoopLocationBased
。
描述
matlab.io.datastore.HadoopFileBased
是一个抽象的 mixin 类,可为您的自定义数据存储添加 Hadoop® 支持。
要使用此 mixin 类,除了从 matlab.io.Datastore
基类继承之外,还必须从 matlab.io.datastore.HadoopFileBased
类继承。键入以下语法作为类定义文件的第一行:
classdef MyDatastore < matlab.io.Datastore & ... matlab.io.datastore.HadoopFileBased ... end
要添加 Hadoop 支持和并行处理支持,请在您的类定义文件中使用以下行:
classdef MyDatastore < matlab.io.Datastore & ... matlab.io.datastore.Partitionable & ... matlab.io.datastore.HadoopFileBased ... end
要为自定义数据存储添加 Hadoop 支持,您还必须:
定义这些附加方法:
getLocation
、initializeDatastore
和isfullfile
有关创建支持 Hadoop 的自定义数据存储的详细信息和步骤,请参阅Develop Custom Datastore。
方法
getLocation | (不推荐)Hadoop 中文件的位置 |
initializeDatastore | (不推荐)使用 Hadoop 中的信息初始化数据存储 |
isfullfile | (不推荐)检查数据存储是否读取完整文件 |
示例
版本历史记录
在 R2017b 中推出
另请参阅
mapreduce
| matlab.io.datastore.Partitionable
| matlab.io.Datastore
| matlab.io.datastore.DsFileSet
| tall
主题
- Add Support for Hadoop
- Use Tall Arrays on a Spark Cluster (Parallel Computing Toolbox)
- Big Data Workflow Using Tall Arrays and Datastores (Parallel Computing Toolbox)