博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
cdp4j使用记录
阅读量:4298 次
发布时间:2019-05-27

本文共 1728 字,大约阅读时间需要 5 分钟。

文章目录

cdp4j使用记录

一、前言

  • cdp4j

cdp4j是Java库,具有清晰简洁的API,可自动执行基于Chrome / Chromium的浏览器。它使用Google Chrome DevTools协议来自动化基于Chrome / Chromium的浏览器。

  • 开发环境
  1. Google Chrome 浏览器
  2. JDK 1.8+

(其它要求,请查看 github 页面)

  • 参考:
  • cdp4j(github):

  • cdp4j-Samples(github):

  • cdp4j-javadoc:

  • Chrome DevTools Protocol:

  • Google Chrome:

  • Chrome 命令行参数:

  • XPath:

  • Java 正则表达式:

  • Jsoup官网:

二、正文

  • 下载并安装 Google Chrome 浏览器

资源下载:

  • 添加依赖
io.webfolder
cdp4j
3.0.15
org.jvnet.winp
winp
1.28
  • 通过 chrome 的命令行参数,运行 headless 模式的 chrome 浏览器

“–disable-gpu”:不使用 GPU 加速

“–headless”:启动 chrome 的 headless 模式,即不会弹出浏览器界面

import static java.util.Locale.ENGLISH;import io.webfolder.cdp.Launcher;import io.webfolder.cdp.session.Session;import io.webfolder.cdp.session.SessionFactory;public class Bing {
public static void main(String[] args) {
Launcher launcher = new Launcher(); try (SessionFactory factory = launcher.launch(Arrays.asList("--disable-gpu", "--headless")); Session session = factory.create()) {
session .navigate("https://www.bing.com") .waitDocumentReady() .enableNetworkLog() .click("input[type='search']") .sendKeys("Microsoft") .sendEnter() .wait(1000); String firstResult = session.getText("strong").toLowerCase(ENGLISH); System.out.println("Query String : " + session.getQueryString()); System.out.println("Path name : " + session.getPathname()); System.out.println(firstResult); } finally {
launcher.kill(); } }}

转载地址:http://gwnws.baihongyu.com/

你可能感兴趣的文章
使用python-aiohttp爬取网易云音乐
查看>>
使用python-aiohttp爬取今日头条
查看>>
从github下载WDK项目的坑
查看>>
.gitignore设置跟踪忽略文件夹中文件
查看>>
《CUDA并行程序设计-GPU编程指南》读书笔记--(1)线程网格、线程块以及线程
查看>>
《CUDA并行程序设计-GPU编程指南》读书笔记--(2)CUDA内存处理
查看>>
C++类的内存分配
查看>>
CCSv4新建C6455工程
查看>>
VC调用Matlab生成的dll
查看>>
VC调用Matlab生成的c
查看>>
Matlab生成exe文件
查看>>
VC调用exe文件
查看>>
《C陷阱与缺陷》读书笔记
查看>>
相同程序不同进程下实现数据共享
查看>>
不同进程通过共享内存实现数据共享
查看>>
C++之POD数据类型
查看>>
C++中的struct与class
查看>>
C++之const关键字
查看>>
C++之函数返回指针
查看>>
C++之extern关键字
查看>>