Unicode đủ mã cho bộ chữ toàn cầu. Tại sao người ta lại dùng UTF?
- Khi có Unicode, đã có rất nhiều ứng dụng sử dụng các loại mã khác, đặc biệt là ASCII 8 bit. Các ứng dụng xử lí văn bản như thư điện tử, soạn thảo, cơ sở dữ liệu dùng với ASCII và một số bảng mã khác đã tồn tại từ trước đó để lại một khối lượng dữ liệu khổng lồ, không thể vứt bỏ. Việc sửa các phần mềm chỉ sử dụng Unicode có nghĩa là sẽ mất rất nhiều dữ liệu. Mặt khác, khi dùng Unicode thì khối lượng lưu trữ cho dữ liệu văn bản sẽ tăng hơn hai lần.
- Vì thế cần có một cách mã hoá đồng thời Unicode và một số bảng mã khác, đặc biệt là ASCII để có thể sử dụng được các dữ liệu cũ và không nhất thiết phải dùng mã nhiều byte trong các ứng dụng phổ biến để tiết kiệm lưu trữ.
- UTF là cách giải quyết các yêu cầu trên. Vì thế UTF cũng được coi là đối tượng của Unicode (Unicode Transformation Format).
Gói VIP thi online tại VietJack (chỉ 400k/1 năm học), luyện tập gần 1 triệu câu hỏi có đáp án chi tiết
Unicode mã hoá mỗi kí tự bởi
A. 1 byte.
B. 2 byte
C. 4 byte.
D. Từ 1 đến 4 byte.
Việc phân loại các kiểu dữ liệu căn cứ chủ yếu vào tiêu chí nào?
A. Cách mã hoá.
B. Cùng chung các phép xử lí dữ liệu cơ bản.
C. Cả A và B đều đúng.
D. Cả A và B đều sai.
Em hãy tìm mã nhị phân và mã thập phân (số thứ tự của kí tự trong bảng mã ASCII) của các kí tự trong từ Computer.
Tìm hiểu 32 kí tự đầu tiên của bảng mã ASCII theo những gợi ý sau:
- Chúng được sử dụng với mục đích gì?
- Các kí tự đó có "mặt chữ" không? Hình ảnh trong ô là các kí tự Latinh (Ví dụ EOT, CR, ...) có phải là "mặt chữ" không?
Ngày nay mã QR (QR code) được sử dụng rất rộng rãi. Đây là mã hoá của xâu kí tự, có thể giải mã được bằng các ứng dụng đọc QR code, tải từ "chợ ứng dụng" xuống điện thoại thông minh. Ví dụ Hình 3.1 là mã QR của chuỗi kí tự http://en.m.wikipedia.org. Kiểu dữ liệu của QR Code thuộc loại gì? hình ảnh hay xâu kí tự?
Kể ra 10 tên dữ liệu có trong học bạ có các kiểu văn bản, hình ảnh, số nguyên và số thập phân.
Với 134 kí tự riêng phát sinh so với bảng chữ cái tiếng Anh, hoàn toàn có khả năng sắp xếp trong bảng chữ 8 bit với 256 kí tự. Theo em, tại sao Việt Nam vẫn cần sử dụng bảng mã Unicode?