Hóng ngay Firecrawl nha ae! 🔥
Đọc được tin này từ tweet của bác @akshay_pachaar mà thấy phấn khích ghê luôn: Firecrawl là công cụ giúp biến bất kỳ website nào thành dữ liệu sạch trong 2 phút.
Mấy điểm nổi bật:
  • Hỗ trợ định dạng ngon lành cho LLM: Markdown, HTML.
  • Xử lý dữ liệu phức tạp với mấy vụ Proxy, anti-bots và dynamic content.
  • Tuỳ chỉnh linh hoạt: loại bỏ tag, header, thiết lập độ sâu.
  • Đảm bảo kết quả chính xác, ổn định.
  • Có thể chạy hàng loạt URL cùng lúc.
  • Phân tích media như PDF, DOCX, ảnh...
  • Hoạt động tự động như click, scroll, nhập liệu, chờ đợi.
Ai thích tự dùng thì có mã "DDODS" giảm 10% cho dịch vụ quản lý nhé.
Check thử repo trên GitHub rồi vọc vạch nha!