HadoopファイルシステムAPI定義

これは、ファイルシステムの内容をディレクトリ、シンボリックリンク、またはファイルのいずれかのパス集合としてモデル化するHadoopファイルシステムAPIの仕様です。

この分野には驚くほど先行事例が少ないです。ノードのツリーとしてのUnixファイルシステムの複数の仕様がありますが、「データストレージアクセスのための概念モデルとしてのUnixファイルシステム」という概念を定義する公開されたものは何もありません。

この仕様は、それを試みます。HadoopファイルシステムモデルとAPIを定義して、複数のファイルシステムがAPIを実装し、アプリケーションに一貫したデータモデルを提供できるようにします。これは、Hadoopクライアントアプリケーションによって一般的に期待されるものとして、HDFSによって示される動作を文書化する以外、ファイルシステムの同時実行動作を正式に指定しようとはしません。

  1. はじめに
  2. 表記法
  3. モデル
  4. FileSystemクラス
  5. OutputStream、Syncable、およびStreamCapabilities
  6. Abortable
  7. FSDataInputStreamクラス
  8. PathCapabilitiesインターフェース
  9. FSDataOutputStreamBuilderクラス
  10. ファイルシステム仕様によるテスト
  11. 仕様とそのテストの拡張
  12. 複数パートを使用したファイルのアップロード
  13. IOStatistics
  14. openFile()
  15. セーフモード
  16. LeaseRecoverable