2007年10月09日

UDF1.02 1-12 OSTA Compressed Unicode

UDF では、dstring 用の文字セットに、"OSTA Compressed Unicode" (OSTA圧縮ユニコード) を使います。

OSTA Compressed Unicode format
RBP大きさ名称内容
01unsigned charCompression ID圧縮方法
1〜lenlenunsigned char[len]Compressed Bit Stream圧縮データ

データの長さ (len) は、別の場所に書かれているか、 記述子内に固定長の領域として確保されています。

Compression ID は、圧縮方法を示します。

Compression ID
Compression ID定義
0〜7予約
81文字は8ビット
9〜15予約
161文字は16ビット
17〜255予約

圧縮前の文字列は Unicode 1.1 です。 ただし、0xFEFF 〜 0xFFFE を除きます。 数値と同様、リトルエンディアンです。 日本語を使用する場合、Compression ID に 16 を指定します。 実際の圧縮、展開には OSTA の UDF 仕様書に載っている C 言語のソースコードを そのまま使うのが楽です。

どうもこれ、先頭に 16 を入れているだけで、実際の長さより 1 バイト大きくなっています。"Compressed" じゃないじゃん。

posted by 七癖 at 11:33| Comment(0) | TrackBack(0) | ファイルシステム | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
コメントを書く
お名前:

メールアドレス:

ホームページアドレス:

コメント:

認証コード: [必須入力]


※画像の中の文字を半角で入力してください。

この記事へのトラックバック
×

この広告は90日以上新しい記事の投稿がないブログに表示されております。