NetForVBA: Trích xuất dữ liệu từ Website

Với control dnWebBrowser trong NetForVBA bạn có thể mở và tương tác với mọi website.

Các đối tượng trong WebBrowser như ảnh, textBox, text, link, …. đều có chung kiểu dữ liệu là dnHtmlElement (Xem chi tiết về HtmlElement). Với đối tượng này bạn có thể GET/SET dữ liệu cho nó để lấy hoặc làm thay đổi nội dung hiển thị trên Website. Bạn cũng có thể gửi các sự kiện lên đối tượng HtmlElement như Click, Submit, Focus, … để thực hiện các hành động như click nút tìm kiếm/đăng nhập, submit web form, …

Để tìm kiếm một htmlElement trên WebBrowser bạn có thể dụng hàm WebBrowser.GetElementById(“id-của-thẻ-html”) hoặc dùng hàm GetElementsByTagName(“tên-thẻ”) để lấy ra danh sách các thẻ con có tên là “tên-thẻ” (tên thẻ thường là: DIV, A, TABLE, TR, TD, BUTTON, …).

Như hình minh họa phía dưới là trang web của Bộ Tài chính để tra cứu thông tin người nộp thuế. Với NetForVBA bạn hoàn toàn có thể lấy một mã số thuế thừ excel, tự động nhập vào ô mã số thuế cho bạn. Với captcha tất nhiên là bạn phải tự nhập thủ công. Sau khi nhập thì bạn click nút tra cứu (hoặc viết hàm kiểm tra nhập đủ 6 ký tự trong ô captcha thì tự động click tra cứu). Sau khi có kết quả thì bạn hoàn toàn có thể tìm đến bảng kết quả và lấy về excel.

Để bài viết không quá dài, phần code VBA ví dụ tôi sẽ để trong file Excel đính kèm.

Author: autoDN

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *