Unicode Escape / Unescape
Unicode Escape / Unescape chuyển văn bản thành chuỗi escape \uXXXX và ngược lại. Dán văn bản và nhấp Escape để mã hóa ký tự không phải ASCII, hoặc Unescape để giải mã chúng. Mọi xử lý đều diễn ra cục bộ trong trình duyệt của bạn và không có gì được gửi đến máy chủ.
Giới thiệu về Unicode Escape
Unicode escape biểu diễn ký tự dưới dạng chuỗi \uXXXX bằng điểm mã của chúng ở dạng thập lục phân. Nó được dùng rộng rãi trong JSON, JavaScript, Java và các ngôn ngữ khác để nhúng an toàn văn bản không phải ASCII như tiếng Trung, tiếng Nhật hay emoji vào mã nguồn và dữ liệu.
Unicode escape quan trọng mỗi khi bạn nhúng văn bản không phải ASCII vào nơi chỉ chấp nhận ASCII: tệp cấu hình JSON, tệp Java properties, chuỗi JavaScript và CSS, và script di trú cơ sở dữ liệu. Nó cũng là cách nhanh để lộ ra các ký tự vô hình hoặc trông giống nhau ẩn trong một chuỗi.
Escape biến mỗi ký tự thành dạng điểm mã thập lục phân, tùy chọn giữ nguyên ASCII, trong khi unescape giải mã các chuỗi đó, gồm cả điểm mã ngoài mặt cơ bản và escape byte, trở lại văn bản đọc được. Các cặp thay thế cho emoji và ký tự CJK hiếm được xử lý đúng theo cả hai chiều.
Câu hỏi thường gặp
Chuỗi escape Unicode là gì?
Nó biểu diễn một ký tự bằng điểm mã thập lục phân, dạng được dùng trong JSON, JavaScript và Java để nhúng an toàn văn bản không phải ASCII vào tệp chỉ chứa ASCII.
Nó có thể chỉ escape ký tự không phải ASCII không?
Có. Mặc định nó giữ nguyên ASCII và chỉ escape các ký tự trên vùng ASCII, giúp kết quả dễ đọc. Bạn có thể tắt tùy chọn này để escape mọi thứ.
Nó có xử lý emoji và ký tự CJK không?
Có. Các cặp thay thế dùng cho emoji và ký tự Trung, Nhật, Hàn hiếm gặp được mã hóa và giải mã đúng theo cả hai chiều.