Computer >> Máy Tính >  >> Lập trình >> Java

Làm cách nào để xóa các thẻ HTML khỏi một chuỗi đã cho trong Java?

A Chuỗi lớp cuối cùng trong Java và nó là bất biến , có nghĩa là chúng ta không thể thay đổi bản thân đối tượng, nhưng chúng ta có thể thay đổi tham chiếu đến đối tượng. Có thể xóa các thẻ HTML khỏi một chuỗi nhất định bằng cách sử dụng ReplaceAll () phương thức của lớp String. Chúng tôi có thể xóa các thẻ HTML khỏi một chuỗi nhất định bằng cách sử dụng biểu thức chính quy . Sau khi xóa các thẻ HTML khỏi một chuỗi, nó sẽ trả về một chuỗi dưới dạng văn bản bình thường.

Cú pháp

public String replaceAll(String regex, String replacement)

Ví dụ

public class RemoveHTMLTagsTest {
   public static void main(String[] args) {
      String str = "<p><b>Welcome to Tutorials Point</b></p>";
      System.out.println("Before removing HTML Tags: " + str);
      str = str.replaceAll("\\<.*?\\>", "");
      System.out.println("After removing HTML Tags: " + str);
   }
}

Đầu ra

Before removing HTML Tags: <p><b>Welcome to Tutorials Point</b></p>
After removing HTML Tags: Welcome to Tutorials Point