アパッチHadoop

SBOMアーティファクト

このリリースから、HadoopはCycloneDX Mavenプラグインを使用してソフトウェア部品表（SBOM）を公開します。SBOMの詳細については、SBOMを参照してください。

HDFS Router-Router Based Federationは、HADOOP-18535のMySQLに委任トークンを格納することをサポートするようになりました。これにより、元のZookeeperベースの実装から、トークンの操作が向上します。

HADOOP-18671は、HDFS依存性のある特定のアプリケーションが他のHadoop互換ファイルシステム上で実行できるように、HDFS固有のAPIをHadoop Commonに多数移行しました。

特に、recoverLease()とisFileClosed()はLeaseRecoverableインターフェースを介して公開され、setSafeMode()はSafeModeインターフェースを介して公開されます。

ユーザーは、リリース 3.3.5 以降の主な変更の概要を参照することをお勧めします。前の 3.3.5 リリース以降の 117 個のバグ修正、改善、その他の機能強化の詳細については、リリースノートと変更ログを確認してください。

ApacheHadoop3.3ラインのリリースです。

重要な変更点としては、次のようなものがあります。

依存関係の大規模な更新。真の CVE と誤検知の両方の伝達 CVE の報告を制御しようとします。
ABFS 入力ストリームのプレフェッチに関する重大な修正。正しい読み取りを可能にします。
file:// と s3a:// ファイルシステム用の high-performance バージョンを使用した、すべて FSDataInputStream 実装用のベクトル IO API。file:// は Java ネイティブ IO を介し、s3a:// はパラレル GET リクエストになります。
Arm64 バイナリ。注意:Arm64 リリースは別のプラットフォーム上にあるため、jar ファイルは x86 リリースのファイルと一致しない場合があります。したがって、maven アーティファクトも一致しない場合があります。
Hadoop 独自のコードのセキュリティ修正。

Apache Hadoop 3.3.4 以前のユーザーはこのリリースにアップグレードする必要があります。

すべてのユーザーに、リリース 3.3.4 以降の主な変更の概要を参照することをお勧めします。

以前の 3.3.4 リリース以降のバグ修正、改善、およびその他の拡張機能については、リリースノートと変更ログを確認してください。

ABFS コネクタには、重大なバグ修正 https://issues.apache.org/jira/browse/HADOOP-18546 があります: ABFS. abfs ストリームの close() において進行中の読み取りのリストの削除を無効化します。

Hadoop リリース 3.3.2 以降の abfs コネクタを使用するすべてのユーザーは、このリリースにアップグレードするか、fs.azure.readaheadqueue.depth を 0 に設定してプレフェッチを無効にする必要があります。

ApacheHadoop3.3ラインのリリースです。

3.3.3 以降の少数のセキュリティ修正と重要な統合修正が含まれています。

Apache Hadoop 3.3.3 のユーザーはこのリリースにアップグレードする必要があります。

Hadoop 2.x と Hadoop 3.2 のユーザーもまた、3.3.x ラインにアップグレードする必要があります。機能の拡張に加え、これは重大なセキュリティ/データ整合性問題以外のものに対して修正を受け取る唯一のブランチです。

ユーザーは、リリース 3.3.3 以降の主な変更の概要を参照することをお勧めします。前の 3.3.3 リリース以降のバグ修正、改善、およびその他の拡張機能については、リリースノートと変更ログを確認してください。

これは、Apache Hadoop 3.2 ラインの 3 番目の安定したリリースです。

3.2.3 以降の 153 個のバグ修正、改善、および拡張機能が含まれています。

ユーザーは、3.2.3 以降の主な変更の概要を参照することをお勧めします。前の 3.2.3 リリース以降の 153 個のバグ修正、改善、およびその他の拡張機能については、リリースノートと変更ログを確認してください。

プロジェクトには次のモジュールが含まれています。

Hadoop Common: 他の Hadoop モジュールをサポートする一般的なユーティリティ。
Hadoop Distributed File System (HDFS™): アプリケーションデータへの高スループットアクセスを提供する分散ファイルシステムです。
Hadoop YARN: ジョブスケジューリングとクラスターリソース管理のためのフレームワーク。
Hadoop MapReduce: 大規模なデータセットを並列処理するための YARN ベースのシステム。

さまざまな企業や組織が調査や運用に Hadoop を使用しています。ユーザーは Hadoop の PoweredBy ウィキページに自身を追加することを推奨されています。