Khám phá Learn Stream About Jokes
Stream
Liên kết

Trình duyệt headless siêu nhanh cho AI và tự động hóa

· github

TL;DR

Lightpanda là browser được viết lại từ đầu bằng ngôn ngữ Zig, không dùng Chromium. Nó nhẹ hơn Chrome 9 lần, chạy nhanh hơn 11 lần, dùng được với Puppeteer và Playwright qua CDP protocol.

Nói đơn giản: Browser không cần giao diện, dùng để scrape web, train AI, hoặc automation — nhưng tiết kiệm RAM và CPU hơn Chrome rất nhiều.

Bài này dành cho ai?

1. Người chạy AI automation

Vấn đề: Dùng Chrome headless để scrape web thì tốn RAM quá nhiều, mỗi instance chiếm cả GB Khi nào cần: Khi cần chạy hàng chục browser instances cùng lúc để scrape data hoặc automate workflows Được gì: Giảm 9x memory usage, chạy nhanh hơn 11x, tiết kiệm cloud server cost

2. Người build AI products

Vấn đề: Cần thu thập data từ web để train model hoặc làm RAG, nhưng Chrome quá nặng cho server Khi nào cần: Khi build scraper, data pipeline, hoặc cần browser cho agent navigate web Được gì: Browser nhẹ, khởi động tức thì, API tương thích với Puppeteer/Playwright

3. Dev cần browser cho testing

Vấn đề: Chrome tốn resource khi chạy automated tests Khi nào cần: Khi cần chạy E2E tests hoặc web scraping tests Được gì: Test chạy nhanh hơn, ít RAM hơn

Các điểm chính

1. Không phải Chromium fork Lightpanda viết lại từ đầu bằng Zig — ngôn ngữ lập trình low-level. Không dùng Blink, WebKit, hay bất kỳ engine nào của Google. → Làm gì: Thử nghiệm thay Chrome bằng Lightpanda cho những job nhẹ trước.

2. Memory usage thấp kỷ lục Test với Puppeteer request 100 pages trên AWS EC2 m5.large: Lightpanda dùng 9x ít RAM hơn Chrome. → Làm gì: Nếu đang chạy hàng chục browser instances → tính toán lại infra cost.

3. Tốc độ nhanh gấp 11 lần Benchmark cho thấy execution time nhanh hơn Chrome đáng kể, startup gần như tức thì. → Làm gì: Dùng cho scraping jobs cần tốc độ cao.

4. Tương thích Puppeteer/Playwright Dùng CDP (Chrome DevTools Protocol) nên có thể kết nối qua browserWSEndpoint của Puppeteer hoặc Playwright. → Làm gì: Code hiện tại viết cho Puppeteer không cần sửa nhiều, chỉ đổi endpoint.

5. Đang trong giai đoạn Beta Hỗ trợ JavaScript, XHR, Fetch, form input, cookies, proxy. Nhưng chưa đầy đủ Web APIs — còn nhiều website chưa hoạt động hoàn hảo. → Làm gì: Test kỹ trước khi dùng vào production, theo dõi GitHub issues.

6. Tuân thủ robots.txt Có option —obey_robots để tôn trọng quy định của website. → Làm gì: Dùng khi scrape có trách nhiệm, tránh bị ban.

Quick Start

  1. Tải binary và chạy thử:
curl -L -o lightpanda https://github.com/lightpanda-io/browser/releases/download/nightly/lightpanda-x86_64-linux && chmod a+x ./lightpanda
./lightpanda fetch --obey_robots https://demo-browser.lightpanda.io/campfire-commerce/
  1. Kết nối với Puppeteer:
const browser = await puppeteer.connect(`{
  browserWSEndpoint: "ws://127.0.0.1:9222",
}`);
  1. Chạy Docker cho nhanh:
docker run -d --name lightpanda -p 9222:9222 lightpanda/browser:nightly
#headless-browser #automation #scraping #ai-agents #zig #performance
0:00

Chia sẻ ảnh

Bắt đầu gõ để tìm kiếm...