此示例演示如何使用多个线程同时控制多个浏览器进行采集。
✅️️ 页面分析
目标网址:
按F12
,可以看到每个标题元素的class
属性均为title project-namespace-path
,可批量获取。
✅️️ 编码思路
虽然 gitee 开源项目列表可以用 s 模式采集,但现在为了演示多标签页操作,还是使用浏览器进行操作。
使用ChromiumOptions
的auto_port()
方法,可设置独立的浏览器环境,每个浏览器需一个ChromiumOptions
对象。
✅️️ 示例代码