matlab.io.datastore.HadoopLocationBased 类
命名空间: matlab.io.datastore
为数据存储添加 Hadoop 支持
描述
matlab.io.datastore.HadoopLocationBased
是一个抽象的 mixin 类,它增加了对存储在文件或其他非基于文件的数据源(如数据库)中数据的 Hadoop® 支持。
要使用此 mixin 类,除了从 matlab.io.Datastore
基类继承之外,还必须从 matlab.io.datastore.HadoopLocationBased
类继承。键入以下语法作为类定义文件的第一行:
classdef MyDatastore < matlab.io.Datastore & ... matlab.io.datastore.HadoopLocationBased ... end
要添加 Hadoop 支持和并行处理支持,请在您的类定义文件中使用以下行:
classdef MyDatastore < matlab.io.Datastore & ... matlab.io.datastore.Partitionable & ... matlab.io.datastore.HadoopLocationBased ... end
要为自定义数据存储添加 Hadoop 支持,您还必须:
定义这些附加方法:
getLocation
和initializeDatastore
。
有关创建支持 Hadoop 的自定义数据存储的详细信息和步骤,请参阅Develop Custom Datastore。
方法
getLocation | Hadoop 中的位置 |
initializeDatastore | 使用 Hadoop 中的信息初始化数据存储 |
isfullfile | 检查数据存储是否读取完整文件 |
示例
版本历史记录
在 R2019a 中推出
另请参阅
mapreduce
| matlab.io.datastore.Partitionable
| matlab.io.Datastore
| matlab.io.datastore.DsFileSet
| tall
主题
- Add Support for Hadoop
- Use Tall Arrays on a Spark Cluster (Parallel Computing Toolbox)
- Big Data Workflow Using Tall Arrays and Datastores (Parallel Computing Toolbox)