跳到主要内容

web-scraping

Beautifulsoup4

此规则文件概述了在 Python 中使用 beautifulsoup4 库的最佳实践,涵盖了代码组织、性能、安全、测试和常见陷阱。

Cheerio

本规则提供了在 JavaScript 中使用 Cheerio 进行网页抓取和 HTML 解析的最佳实践,涵盖了代码组织、性能、安全、测试和常见陷阱。

Puppeteer

本规则文件概述了 Puppeteer 的最佳实践,涵盖代码组织、性能、安全性、测试和常见陷阱。它旨在指导开发人员构建健壮且可维护的 Puppeteer 应用程序。

Scrapy

此规则提供了 Scrapy 开发的全面最佳实践,包括代码组织、性能、安全、测试和常见的陷阱规避。它旨在指导开发人员使用 Scrapy 构建健壮、高效且可维护的 Web 抓取应用程序。

Selenium

此规则提供了在 Python 中使用 Selenium 库的最佳实践和编码标准。它涵盖了代码组织、性能、安全性、测试、常见陷阱和工具,以确保 Selenium 项目的可维护性和效率。