当前位置：首页 > Java技术

爬虫技术 selenium 入门 ----模拟百度搜索

canca4年前 (2022-07-09)Java技术755

1 获取方式

1.1 maven 构建的依赖

 <dependency>
        <groupId>org.seleniumhq.selenium</groupId>
        <artifactId>selenium-java</artifactId>
        <version>3.12.0</version>
    </dependency>
    <dependency>
        <groupId>org.seleniumhq.selenium</groupId>
        <artifactId>selenium-server</artifactId>
        <version>3.12.0</version>
    </dependency>

1.2 官网下载

下载地址

1.3 获取驱动

除了相关的jar包以外，selenium 开发，还需要下载相应的驱动程序关于驱动程序的下载，可以参考这个博客

<#ZC_BLOG_HOST#>blog/813.html

2 代码

  public static void main(String[] a) {
        //firefox 配置
        //系统中firefox的安装路径，如果是默认路径也可以不设置，本路径就是默认路径，路径的设置要在创建webdriver之前
        System.setProperty("webdriver.firefox.bin", "C:\\Program Files (x86)\\Mozilla Firefox\\firefox.exe");
 
 
        //fixfox需要的驱动所在路径，需要单独下载
        System.setProperty("webdriver.gecko.driver", "C:\\Users\\ckl\\Desktop\\Inventory\\_221\\src\\main\\resources\\geckodriver.exe");
 
 
        //该操作会打开浏览器
        WebDriver webDriver = new FirefoxDriver();
 
        // chrome 与 ie 的设置与之类似
        //chrome 的配置
//        System.setProperty("webdriver,chrome.driver", chromedriverPath);
//        System.setProperty("webdriver,chrome.bin", path);
        //ie的配置
//        System.setProperty("webdriver.ie.driver", path);
//        System.setProperty("webdriver.ie.bin", path);
 
        //浏览器构建
//        WebDriver webDriver = new InternetExplorerDriver();
//        WebDriver webDriver = new ChromeDriver();
 
       //获取页面
        webDriver.navigate().to("https://www.baidu.com/");
 
        // 根据id 找到对应的搜索框
      WebElement input= webDriver.findElement(By.id("kw"));
 
      //输入要搜索的内容
        input.sendKeys("selenium");
 
        //使用css选择器找到 "百度一下" 按钮 并点击
        webDriver.findElement(By.cssSelector("input[value=百度一下]")).click();
 
        //获取搜索到的页面源代码
        String html=webDriver.getPageSource();
        System.out.println(html);
 
        //浏览器退出,如果不执行该命令，在程序运行结束后，浏览器不会关闭，可以看到搜索页面
        webDriver.quit();
 
    }

引用原文：https://blog.csdn.net/qq_34661726/article/details/80644777

扫描二维码推送至手机访问。

本文链接：https://iant.work/post/814.html

标签: selenium

分享给朋友：

“爬虫技术 selenium 入门 ----模拟百度搜索” 的相关文章

对象序列化与反序列化

序列化，并不是JAVA独有的。因此，在这里我用比较通俗的话说了。序列化就是把一个对象转换成有规则的二进制流。而反序列化就是把有规则的二进制数据重整成一个对象。其好处不难看见：1.可以把一个对象...…

JSP与Servlet的对应关系

以前在QQzone写下的文章现在贴到这里来了... 最近比较忙啊！现在抽身写一篇文章。是关于JSP与Servlet的对应关系的。希望对大家有所帮助。其实我也是刚刚学的......-------Servlet--------------JSP----------1.ServletContext&nbs…

JAVA获得一个文件夹大小

在JAVA里没有现成的方法获取一个文件夹的大小，那么我们可以用递归的方法，获取文件夹的大小。 import java.util.*; import java.io.*; class GetFileSi…

IM技术(1)

做项目了，NetCL今天开工了，在这些日子里，我会将自己研究的内容写下来。做个记录，以下是我在网上搜到的。关于管理用户状态的解决方案，当然，我都有一个方案。不过对客户端的任务有点重吧，我方法是客...…

过滤网页HTML标记

JAVA过滤HTML中的所有标记。非常好用！！ package canca.regex; import java.util.regex.Matcher;import java.util.regex.Pattern; public class HtmlFilter { priva…

字符，字节和编码

转自:http://www.regexlab.com/zh/encoding.htm------------------------------------------------------------- 级别：中级摘要：本文介绍了字符与编码的发展过程，相关概念的正确理解。举例说明了一些实际应…

爬虫技术 selenium 入门 ----模拟百度搜索

“爬虫技术 selenium 入门 ----模拟百度搜索” 的相关文章

对象序列化与反序列化

JSP与Servlet的对应关系

JAVA获得一个文件夹大小

IM技术(1)

过滤网页HTML标记

字符，字节和编码

发表评论

Copyright © iAnt.Work. All Rights Reserved. 粤ICP备16116550号-5

Powered By Z-BlogPHP. Theme by TOYEAN.

爬虫技术 selenium 入门 ----模拟百度搜索

“爬虫技术 selenium 入门 ----模拟百度搜索” 的相关文章

对象序列化与反序列化

JSP与Servlet的对应关系

JAVA获得一个文件夹大小

IM技术(1)

过滤网页HTML标记

字符，字节和编码

发表评论取消回复

Powered By Z-BlogPHP. Theme by TOYEAN.

发表评论