Computer >> Máy Tính >  >> Lập trình >> Lập trình

Khai thác sử dụng Web là gì?

Khai thác sử dụng web được sử dụng để lấy dữ liệu, thông tin, kiến ​​thức hữu ích từ dữ liệu nhật ký web và giúp xác định các thiết kế truy cập của người dùng cho các trang web.

Trong Khai thác, quản lý tài nguyên web, cá nhân đang suy nghĩ về dữ liệu yêu cầu của khách truy cập trang web được tạo thành nhật ký máy chủ web. Trong khi nội dung và cơ chế của tập hợp các trang web tuân theo ý định của tác giả của các trang, các yêu cầu đơn cho thấy cách người dùng xem các trang này. Khai thác sử dụng web có thể tiết lộ các mối quan hệ không được người thiết kế trang đề xuất.

Máy chủ web thường đăng ký mục nhập nhật ký (Web), hoặc mục nhập Nhật ký web, cho mỗi lần truy cập vào một trang Web. Nó chứa URL được yêu cầu, địa chỉ IP mà từ đó yêu cầu được đưa ra và một dấu thời gian.

Đối với các máy chủ thương mại điện tử dựa trên Web, một số lượng lớn dữ liệu nhật ký truy cập Web đang được thu thập. Có những trang web nổi tiếng có thể đăng ký bản ghi Weblog theo thứ tự hàng nghìn MB mỗi ngày. Cơ sở dữ liệu nhật ký web hỗ trợ dữ liệu phong phú về động lực của Web. Do đó, điều cần thiết là phải tạo ra các phương pháp khai thác Weblog phức tạp.

Trong việc phát triển các phương pháp khai thác sử dụng Web, có thể xem xét những điều sau. Đầu tiên, mặc dù việc hình thành một số ứng dụng của phân tích tệp Weblog là điều đáng khuyến khích và kích thích. Điều cần thiết là phải hiểu rằng sự thành công của các ứng dụng đó dựa trên kiến ​​thức chân chính và đáng tin cậy có thể tìm được từ những bản ghi nhật ký thô lớn.

Thứ hai, với URL, thời gian, địa chỉ IP và dữ liệu nội dung trang web có sẵn, chế độ xem đa chiều có thể được xây dựng trên cơ sở dữ liệu Weblog và phân tích OLAP đa chiều có thể được thực hiện để khám phá N người dùng hàng đầu, N trang web được truy cập hàng đầu, hầu hết khoảng thời gian được truy cập thông thường, v.v., sẽ giúp tìm kiếm khách hàng tiềm năng, người dùng, thị trường, v.v.

Thứ ba, khai thác dữ liệu có thể được thực hiện trên các bản ghi Weblog để khám phá các mẫu liên kết, các mẫu tuần tự và xu hướng truy cập Web. Đối với khai thác mẫu truy cập Web, điều cần thiết là phải thực hiện các biện pháp khác để thu được nhiều dữ liệu hơn về chuyển tải của người dùng nhằm đơn giản hóa việc phân tích Weblog chính xác.

Nhiều dữ liệu hơn như vậy có thể bao gồm trình tự duyệt web của người dùng trong bộ đệm máy chủ internet. Với nhu cầu của các tài liệu nhật ký web như vậy, các nghiên cứu đã được hướng vào phân tích triển khai hệ thống, tăng cường thiết kế hệ thống bằng cách lưu vào bộ nhớ đệm web, tìm nạp trước trang web và hoán đổi trang web; hiểu tính năng của lưu lượng truy cập Web; và hiểu được phản ứng và động lực của khách hàng.

Ví dụ, một số nghiên cứu đã đề xuất các trang web thích ứng - các trang web tự nâng cao bằng cách hiểu từ các mẫu truy cập của người dùng. Phân tích nhật ký web cũng có thể giúp xây dựng các dịch vụ web tùy chỉnh cho người dùng đơn lẻ.