ReadJEnc

C#(.NET)用テキストファイル文字エンコード自動判別・読出ライブラリ DLL/ソースコード/動作サンプル同梱

  • ソフト名 :ReadJEnc
  • バージョン :1.3.1.2
  • ライセンス :フリーソフト(寄付歓迎):1,188円
  • OS :Windows
  • 開発 :hnx8

ダウンロード

ReadJEnc詳細

C#(.NET Framework)向けテキストファイル文字エンコード自動判別&読出ライブラリです。
コンパイル済みDLL版/C#ソースコード版のお好きなほうをお使いいただけます。
また、ライブラリ使用例のサンプルアプリケーションも同梱しています。

<特徴>
(1)アプリケーションへの組み込みに適したコンパクトなライブラリ(DLL版サイズ17KB)
(2)BOMあり/BOMなしUTF、ShiftJIS、EUC、JIS(補助漢字可)のほか、ANSI(CP1252)も判別
非テキストファイル(バイナリファイル)の種類識別にも対応
※モード切替により、日本語以外(ISO8859各種・中国語等)のテキストファイルも判別可
(3)軽量高速のわりに高精度な文字コード判定
どの文字コードとみなすのがより妥当か、直前に出てきた文字との整合性をもとに判定、
誤判定が起こる可能性を低減
(4)ファイル読み出し~stringテキスト取り出しまで一括実行

<判別可能な文字エンコード>
(1)BOMつきUnicode(UTF-8/UTF-16/UTF-16B/UTF-32/UTF-32B)
(2)BOMなしUnicode(UTF-8N、およびASCII文字始まりのUTF-16BE/UTF-16LE)
(3)ASCII : 非ASCII文字が1文字も登場しないテキストファイル
(4)ANSI1252 : 欧米版WindowsのISO-8859-1(CP1252)
(5)ShiftJIS : MS版(CP932)
(6)EUCJP : MS版(CP51932)/0x8F補助漢字ありEUC(CP20932相当)の2種類を識別
(7)JIS : MS版(CP50221/CP50222)/JIS90補助漢字(CP20932相当)
(8)ISO2022KR(CP50225)
(9)日本語以外を自動判別対象とするようモードを切り替えた場合、以下の文字エンコード
・繁体字中国語 : Big5(CP950)/EUC-TW(CP20000)
・簡体字中国語 : GB18030(CP54936)
・ハングル : UHC(CP949)
・中欧東欧言語 : ISO-8859-2(CP1250)
・キリル言語 : (CP1251)
・ギリシャ語 : ISO-8859-7(CP1253)
・トルコ語 : ISO-8859-9(CP1254)
・ヘブライ語 : ISO-8859-8(CP1255)
・アラビア語 : (CP1256)
・バルト言語 : ISO-8859-13(CP1257)
・ベトナム語 : TCVN-5712 (CP1258)
・タイ語 : TIS-620(CP874)
(10)非テキストファイルの識別
・画像ファイル(BMP/GIF/JPEG/PNG/TIFF/ICON)
・圧縮ファイル(ZIP/GZIP/7z/RAR/CAB/BZIP2/Z)
・PDFファイル
・Java(classファイル)
・Windowsバイナリ(exe,dll等)
・Windowsショートカットファイル

<対応.NET Framework>
.NET Framework 2.0以降(2.0/3.5、4.0/4.5.x/4.6.x/4.7.x)
.Net Core 1.0/1.1/2.0以降
.Net Standard 1.3以降、2.0以降

Leave a Reply

メールアドレスが公開されることはありません。 が付いている欄は必須項目です