Từ coder đến developer – Tôi đi code dạo

2017-12-19T09:48:47+07:00

Hóng phần sau của bác 🙂

LikeLike

Reply

2017-12-19T12:25:54+07:00

lót dép đợi s2 của a. e đã thử, nhưng chưa biết cách làm sao để set window size = viewport size.

LikeLike

Reply

2017-12-19T13:17:15+07:00

Set viewport size là đủ rồi e nhé. Sau này mình chạy headless nên ko cần mở window lên làm gì hihi 😀

LikeLike

Reply

2017-12-20T06:28:45+07:00

ahihi, cũng tại em muốn nhìn nó chạy như thế nào. em có dùng selenium để viết auto upload cho mấy trang bán áo thun. giờ thấy a chia sẻ thằng này nên e muốn tìm hiểu xem nó ngon hơn không.

LikeLike

2017-12-19T15:59:45+07:00

Hi Hoàng, Cảm ơn Hoàng bài viết này. Hiện mình muốn thử tự làm 1 chrome extension sử dụng code của bài viết này. Giả sử download toàn bộ 1 ảnh từ 1 bài viết của Kênh 14 chằng hạn (người dùng nhập URL vào) thì có được ko nhỉ?

LikeLike

Reply

2017-12-19T17:08:05+07:00

Chrome extension thì dùng code khác bạn nhé 😉
https://developer.chrome.com/extensions/downloads

LikeLike

Reply

2017-12-19T17:11:41+07:00

Thế nào mà em test trên Chorme lại không ra được mảng như thế mà chạy code lại vẫn cứ oke :v

LikeLike

Reply

2017-12-19T17:30:27+07:00

Ahihi do ăn ở :3

LikeLike

Reply

2017-12-20T17:29:45+07:00

làm thế nào để lọc được kết quả như anh vậy ạ? Của em nó ra rất nhiều thuộc tính luôn
http://www.upsieutoc.com/image/4DK0Nt

LikeLike

Reply

2017-12-20T20:48:03+07:00

In ra biến articles mới đúng e nhé 😉

LikeLike

2017-12-22T21:30:51+07:00

Anh Hoàng ơi làm bài viết về career path và quá trình tích lũy kiến thức của anh đi 😀 😀

LikeLike

Reply

2017-12-22T22:39:32+07:00

Quá trình làm việc của a thì e xem trong mục About Me nhé 😉

LikeLike

Reply

2017-12-31T13:14:48+07:00

Hóng part 3 bác ơi

LikeLike

Reply

2018-01-02T08:57:38+07:00

Sự khác nhau giữa cái này và selenium là gì hả các bác

LikeLike

Reply

2018-01-02T09:16:45+07:00

Chờ phần 3 sẽ biết e nhé 😉

LikeLike

Reply

2018-01-08T14:46:43+07:00

Anh ơi, em làm xong thì bị lỗi như trong hình, là do gì vậy anh.
https://upanhtocdo.com/image/iaLv

LikeLike

Reply

2018-01-09T22:16:35+07:00

Anh có thể làm demo 1 ví dụ về việc lấy dữ liệu trong trường hợp load ajax chẳng hạn như nút xem thêm k anh? Hay anh cho em ý tưởng cách làm với ạ.

LikeLike

Reply

2018-01-09T22:48:02+07:00

E xem phần 3 nhé 😉

LikeLike

Reply

2018-01-10T19:57:49+07:00

anh có thể viết bài về giao thức DevTool của chrome ko.
vì puppeteer nó quá dễ rồi. project nó cũng nói rõ là puppeter chỉ là cái để demo thôi.
em muốn implement trên một ngôn ngữ khác, nhưng đọc chả hiểu gì.

LikeLike

Reply

2018-01-29T10:36:47+07:00

Hóng phần 3 của bác, mình đang bị vướng chỗ mấy trang web scrolling để load page @@

LikeLike

Reply

2018-03-09T16:18:09+07:00

Anh ơi em là newbie laravel , em tạo file js và return kết quả ra console của trang blade . Nhưng lại bị lỗi này :
+ require.js:5 Uncaught Error: Module name “puppeteer” has not been loaded yet for context: _. Use require([])
Em vừa include require js vào file script của trang blade .

LikeLike

Reply

2018-07-17T16:43:17+07:00

Nếu để cào dữ liệu là audio (.mp3,..) thì dùng module nào thay thế image-downloader vậy anh ?

LikeLike

Reply

2018-07-17T19:37:12+07:00

Tìm cái nào tải được file thôi e 😀

LikeLike

Reply

2018-09-16T18:17:34+07:00

ok cảm ơn anh, do mạng yếu, chèn thêm đoạn đợi link là ok

LikeLike

2018-09-25T22:49:17+07:00

Uncaught SyntaxError: Identifier ‘titleLinks’ has already been declared
Hoàng ơi cho mình hỏi khi mình chép đoạn lệnh lên console thi nó báo lỗi này bạn à!

LikeLike

Reply

2018-10-27T11:52:53+07:00

Anh ơi ạnh làm phần 3 demo cho ae cách lấy dữ liệu khi scroll và khi ấn xem thêm gửi request ajax được k a?

LikeLike

Reply

2018-10-29T14:54:30+07:00

À puppeteer có API để scroll với click vào button đó em 😉

LikeLiked by 2 people

Reply

2018-12-10T18:01:24+07:00

Làm 1 phần về cào AJax và các trang chưa Javascript đi anh ơi

LikeLike

Reply

2020-05-13T18:45:18+07:00

tải ảnh về mà Status Code: 403 thì phải làm sao để tải về đc vậy anh

LikeLike

Reply

	// Select tất cả các element chứa tiêu đề bài viết
	let titleLinks = document.querySelectorAll('h3.knswli-title > a');
	// Chuyển node list thành 1 mảng
	titleLinks = [...titleLinks];
	// Với mỗi phần tử trong mảng, ta lấy attribute title và link, chuyển thành object
	let articles = titleLinks.map(link => ({
	title: link.getAttribute('title'), url: link.getAttribute('href')
	}));

	const puppeteer = require('puppeteer');

	(async() => {

	// Mở trình duyệt mới và tới trang của kenh14
	const browser = await puppeteer.launch({ headless: false });
	const page = await browser.newPage();
	await page.goto('http://kenh14.vn');

	// Chạy đoạn JavaScript trong hàm này, đưa kết quả vào biến article
	const articles = await page.evaluate(() => {
	let titleLinks = document.querySelectorAll('h3.knswli-title > a');
	titleLinks = [...titleLinks];
	let articles = titleLinks.map(link => ({
	title: link.getAttribute('title'),
	url: link.getAttribute('href')
	}));
	return articles;
	});

	// In ra kết quả và đóng trình duyệt
	console.log(articles);
	await browser.close();
	})();

	const puppeteer = require('puppeteer');
	const download = require('image-downloader');

	(async() => {
	const browser = await puppeteer.launch();
	console.log('Browser openned');
	const page = await browser.newPage();
	const url = 'http://kenh14.vn/ai-roi-cung-khac-cac-hot-girl-nay-cung-khong-ngoai-le-khi-vong-1-cu-ngay-cang-phong-phao-20171207193958533.chn';
	await page.goto(url);
	console.log('Page loaded');

	const imgLinks = await page.evaluate(() => {
	let imgElements = document.querySelectorAll('.sp-img-zoom > img, .sp-img-lightbox > img, .detail-img-lightbox > img');
	imgElements = [...imgElements];
	let imgLinks = imgElements.map(i => i.getAttribute('src'));
	return imgLinks;
	});
	console.log(imgLinks);

	// Tải các ảnh này về thư mục hiện tại
	await Promise.all(imgLinks.map(imgUrl => download.image({
	url: imgUrl,
	dest: __dirname
	})));

	await browser.close();
	})();

Từ coder đến developer – Tôi đi code dạo

Làm trò với Puppeteer – Phần 2: Cùng cào dữ liệu và vếu từ kênh 14

Giới thiệu về API của Puppeteer

Nào mình cùng đào móc mương 14

Phức tạp hơn, tải hình vếu về ngắm!

Kết

Discover more from Từ coder đến developer - Tôi đi code dạo

29 thoughts on “Làm trò với Puppeteer – Phần 2: Cùng cào dữ liệu và vếu từ kênh 14”

Leave a comment Cancel reply

Lập trình viên giỏi không phải chỉ biết code

Giới thiệu về API của Puppeteer

Nào mình cùng đào móc mương 14

Phức tạp hơn, tải hình vếu về ngắm!

Kết

Discover more from Từ coder đến developer - Tôi đi code dạo

Rate this:

Related

29 thoughts on “Làm trò với Puppeteer – Phần 2: Cùng cào dữ liệu và vếu từ kênh 14”

Leave a comment Cancel reply

Lập trình viên giỏi không phải chỉ biết code