Cách lấy dữ liệu của 1 trang web

     

Tính năng lấy dữ liệu từ một website cho phép người dùng dễ dàng trích xuất dữ liệu từ các trang web. Tuy nhiên, dữ liệu nằm trên các trang web lại thường không được sắp xếp gọn gàng trong các bảng để trích xuất. Chính vì vậy, việc lấy dữ liệu là tương đối khó khăn, ngay cả với dữ liệu có cấu trúc và phù hợp.

Bạn đang xem: Cách lấy dữ liệu của 1 trang web

Giải pháp được Power BI cung cấp là tính năng Get Data from Web by example.

Về cơ bản, bạn có thể cung cấp cho Power BI Desktop dữ liệu nào mà bạn muốn trích xuất bằng cách cung cấp một hoặc nhiều ví dụ trong hộp thoại kết nối. Power BI Desktop dữ liệu khác trên trang phù hợp với các ví dụ bạn đã cung cấp. Với giải pháp này, bạn dễ dàng trích xuất tất cả dữ liệu từ các trang web, bao gồm dữ liệu trong và ngoài bảng.

*

Thông tin giá chỉ nhằm mục đích ví dụ.

Để sử dụng tính năng này trong Power BI Desktop, bạn chọn Get Data từ tab Home. Trong hộp thoại xuất hiện, chọn Other từ danh mục bên trái và sau đó chọn Web, tiếp tục chọn Connect.

*

Trong hộp thoại From Web, nhập URL của trang Web mà bạn muốn lấy dữ liệu. Trong bài viết này, chúng ta sẽ dùng trang Microsoft Store Web để minh họa.

HTTP:

https://www.microsoft.com/store/top-paid/games/xbox?category=classics

*

Khi bạn chọn OK, bạn sẽ được dẫn đến hộp thoại Navigator nơi chứa tất cả các bạn được chọn tự động từ trang Web. Trong trường hợp này, không có bảng nào được tìm thấy, tiếp tục chọn Add table using examples.

Xem thêm: Đồng Tính Nữ Hôn Nhau Say Đắm Trên Phố Đi Bộ Nguyễn Huệ, Ghim Trên Lgbt

*

Add table using examples hiển thị một cửa sổ không tương tác nơi bạn có thể xem nội dung của các trang Web. Nhập các giá trị ví dụ về dữ liệu mà bạn muốn trích xuất.

Trong ví dụ này, chúng ta sẽ trích xuất Name và Price cho mỗi trò chơi trong trang. Chúng ta làm điều đó bằng cách xác định một cặp ví dụ từ trang cho mỗi cột. Khi bạn nhập các ví dụ, Power Query trích xuất dữ liệu phù hợp với mẫu của các mục nhập mẫu bằng các thuật toán trích xuất dữ liệu thông minh.

*

Lưu ý: Giá trị đề xuất chỉ bao gồm các giá trị có độ dài nhỏ hơn hoặc bằng 128 ký tự.

Khi bạn đã hài lòng với dữ liệu trích xuất từ trang Web, nhấn OK để đi đến Power Query Editor. Bạn có thể áp dụng nhiều biến đổi và định hình dữ liệu như là kết hợp dữ liệu này với dữ liệu khác.

*

Đến đây, bạn đã có thể tạo ra các trực quan hoặc sử dụng dữ liệu trang Web khi tạo báo cáo Power BI Desktop của mình.

Trên đây là hướng dẫn lấy dữ liệu từ trang web bằng cách cung cấp ví dụ cho Power BI, hy vọng rằng bài viết đã cung cấp những thông tin hữu ích cho bạn đọc. Các bạn quan tâm lĩnh vực phân tích dữ liệu nói chung và Power BI nói riêng, hãy tham gia khóa học Power BI tại BAC ngay để trang bị cho mình những kiến thức bổ ích về dữ liệu.

Nguồn tham khảo:

https://docs.microsoft.com/

Nhu cầu đào tạo doanh nghiệp

BAClà đơn vị đào tạo BA đầu tiên tại Việt Nam. Đối tác chính thức củaIIBAquốc tế. Ngoài các khóa học public,BACcòn có các khóa học in house dành riêng cho từng doanh nghiệp. Chương trình được thiết kế riêng theo yêu cầu của doanh nghiệp, giúp doanh nghiệp giải quyết những khó khăn và tư vấn phát triển.