Ẩn bản văn bản là một cách tiếp cận ẩn tin nhắn văn bản bí mật trong một văn bản khác dưới dạng tin nhắn che hoặc tạo tin nhắn che được liên kết với tin nhắn bí mật ban đầu.
Thuật toán ẩn văn bản có thể bao gồm mọi thứ, từ việc chuyển đổi định dạng của một văn bản hiện có, thay đổi các từ trong văn bản, tạo chuỗi ký tự ngẫu nhiên hoặc sử dụng ngữ pháp không có ngữ cảnh để làm cho văn bản có thể đọc được.
Tính năng ẩn văn bản được coi là khó nhất vì thiếu dữ liệu dư thừa có trong tệp hình ảnh, âm thanh hoặc video. Cơ chế của tài liệu văn bản giống hệt với những gì nó có thể nhận dạng, trong khi ở các loại tài liệu khác kể cả trong ảnh, cấu trúc của tài liệu khác với những gì nó có thể nhận dạng.
Do đó, trong các tài liệu như vậy, nó có thể ẩn thông tin bằng cách tìm hiểu những thay đổi trong cấu trúc của tài liệu mà không tạo ra sự thay đổi nổi tiếng trong đầu ra liên quan.
Những thay đổi không thể nhận ra có thể được tạo thành hình ảnh hoặc tệp âm thanh, nhưng trong tệp văn bản, ngay cả một chữ cái hoặc dấu câu bổ sung cũng có thể được người đọc bình thường chú ý. Nó có thể được lưu tệp văn bản yêu cầu ít bộ nhớ hơn và giao tiếp nhanh hơn cũng như đơn giản hơn tạo ra nó thích hợp hơn so với các loại phương pháp mật mã khác.
Thuật ngữ ẩn văn bản có thể được định nghĩa chung thành ba loại bao gồm Tạo ngẫu nhiên và thống kê dựa trên định dạng, các phương pháp ngôn ngữ như sau -
Phương pháp dựa trên định dạng - Các phương pháp dựa trên định dạng bao gồm thay đổi về mặt vật lý định dạng của văn bản để che giấu dữ liệu. Phương pháp này có những sai sót cụ thể. Nếu tệp stego được mở bằng trình xử lý văn bản, các lỗi chính tả và khoảng trắng bổ sung sẽ được xác định.
Kích thước phông chữ thay đổi có thể kích thích sự nghi ngờ đối với người đọc. Hơn nữa, nếu bản rõ ban đầu có thể truy cập được, thì việc so sánh bản rõ này với văn bản ẩn bị nghi ngờ có thể tạo ra phần tử được thao tác của văn bản khá rõ ràng.
Tạo ngẫu nhiên và thống kê - Trong Tạo ngẫu nhiên và Thống kê, nó có thể được ngăn chặn tương ứng với một bản rõ đã biết, các nhà phân tích mật mã cung cấp cách tạo các văn bản trang bìa của riêng họ. Một phương pháp là giấu dữ liệu trong chuỗi ký tự xem ngẫu nhiên.
Trong một phương pháp khác, các tính năng thống kê về độ dài từ và tần số chữ cái được sử dụng để tạo ra các từ sẽ có đặc tính thống kê tương tự như các từ thực tế trong ngôn ngữ nhất định.
Steganography ngôn ngữ học - Thuật ngữ ẩn ngữ ngôn ngữ đặc biệt xem xét các thuộc tính ngôn ngữ của văn bản được tạo ra và thay đổi, và trong một số trường hợp, sử dụng cơ chế ngôn ngữ làm không gian trong đó thông điệp là bí mật.
CFG có thể tạo cấu trúc cây có thể được sử dụng để che giấu các bit trong đó nhánh trái xác định ‘0’ và nhánh phải tương quan với ‘1’.
Một ngữ pháp trong GNF cũng có thể được sử dụng trong đó lựa chọn đầu tiên trong sản xuất xác định bit 0 và lựa chọn thứ hai xác định bit 1. Phương pháp này có một số nhược điểm. Đầu tiên, một ngữ pháp nhỏ sẽ dẫn đến việc lặp lại nhiều đoạn văn bản.
Thứ hai, mặc dù văn bản hoàn hảo về mặt ngữ pháp, nhưng có một mặt hạn chế về kiến trúc ngữ nghĩa. Kết quả là một chuỗi các câu không có liên kết với nhau.