Unicode エスケープ / アンエスケープ

Unicode エスケープ / アンエスケープは、テキストを \uXXXX エスケープシーケンスに相互変換します。テキストを貼り付けてエスケープをクリックすると非ASCII文字を符号化し、アンエスケープで元に戻せます。すべての処理はブラウザ内でローカルに行われ、サーバーには何も送信されません。

コピーしました!

Unicode エスケープについて

Unicode エスケープは、文字をそのコードポイントの16進数を使って \uXXXX シーケンスとして表します。JSON・JavaScript・Java などの言語で、中国語・日本語・絵文字などの非ASCIIテキストをソースコードやデータに安全に埋め込むために広く使われています。

Unicode エスケープは、ASCII だけを想定した場所に非ASCIIテキストを埋め込むときに役立ちます。JSON 設定ファイル、Java の properties ファイル、JavaScript や CSS の文字列、データベースのマイグレーションスクリプトなどです。文字列に潜む不可視文字やそっくりな文字を素早く可視化する手段にもなります。

エスケープは各文字を16進数のコードポイント形式に変換し、必要に応じて ASCII はそのまま残します。アンエスケープはそれらの列を、追加面のコードポイントやバイトエスケープも含めて、読める文字へ復元します。絵文字や珍しい CJK 文字のサロゲートペアも双方向で正しく処理されます。

よくある質問

Unicode エスケープシーケンスとは何ですか?

文字をその16進数コードポイントで表す方式で、JSON・JavaScript・Java が非ASCIIテキストを ASCII のみのファイルに安全に埋め込むために使う形式です。

非ASCII文字だけをエスケープできますか?

はい。既定では ASCII はそのまま残し、ASCII を超える文字だけをエスケープするので出力が読みやすくなります。設定を切り替えればすべてをエスケープできます。

絵文字や CJK 文字にも対応していますか?

はい。絵文字や珍しい中国語・日本語・韓国語の文字で使われるサロゲートペアを、双方向で正しく符号化・復号します。