当前位置:首页 > Java技术 > 正文内容

爬虫技术 selenium 入门 ----模拟百度搜索

canca3年前 (2022-07-09)Java技术577

1 获取方式

1.1 maven 构建的依赖

 <dependency>
        <groupId>org.seleniumhq.selenium</groupId>
        <artifactId>selenium-java</artifactId>
        <version>3.12.0</version>
    </dependency>
    <dependency>
        <groupId>org.seleniumhq.selenium</groupId>
        <artifactId>selenium-server</artifactId>
        <version>3.12.0</version>
    </dependency>

1.2 官网下载

下载地址

1.3 获取驱动

 除了相关的jar包以外,selenium 开发,还需要下载相应的驱动程序 关于驱动程序的下载,可以参考这个博客

<#ZC_BLOG_HOST#>blog/813.html

2 代码

  public static void main(String[] a) {
        //firefox 配置
        //系统中firefox的安装路径,如果是默认路径也可以不设置,本路径就是默认路径,路径的设置要在创建webdriver之前
        System.setProperty("webdriver.firefox.bin", "C:\\Program Files (x86)\\Mozilla Firefox\\firefox.exe");
 
 
        //fixfox需要的驱动所在路径,需要单独下载
        System.setProperty("webdriver.gecko.driver", "C:\\Users\\ckl\\Desktop\\Inventory\\_221\\src\\main\\resources\\geckodriver.exe");
 
 
        //该操作会打开浏览器
        WebDriver webDriver = new FirefoxDriver();
 
        // chrome 与 ie 的设置与之类似
        //chrome 的配置
//        System.setProperty("webdriver,chrome.driver", chromedriverPath);
//        System.setProperty("webdriver,chrome.bin", path);
        //ie的配置
//        System.setProperty("webdriver.ie.driver", path);
//        System.setProperty("webdriver.ie.bin", path);
 
        //浏览器构建
//        WebDriver webDriver = new InternetExplorerDriver();
//        WebDriver webDriver = new ChromeDriver();
 
       //获取页面
        webDriver.navigate().to("https://www.baidu.com/");
 
        // 根据id 找到对应的搜索框
      WebElement input= webDriver.findElement(By.id("kw"));
 
      //输入要搜索的内容
        input.sendKeys("selenium");
 
        //使用css选择器找到 "百度一下" 按钮 并点击
        webDriver.findElement(By.cssSelector("input[value=百度一下]")).click();
 
        //获取搜索到的页面源代码
        String html=webDriver.getPageSource();
        System.out.println(html);
 
        //浏览器退出,如果不执行该命令,在程序运行结束后,浏览器不会关闭,可以看到搜索页面
        webDriver.quit();
 
    }

引用原文:https://blog.csdn.net/qq_34661726/article/details/80644777

扫描二维码推送至手机访问。

版权声明:本文由Ant.Master's Blog发布,如需转载请注明出处。

本文链接:https://iant.work/post/814.html

标签: selenium
分享给朋友:

“爬虫技术 selenium 入门 ----模拟百度搜索” 的相关文章

对象序列化与反序列化

    序列化,并不是JAVA独有的。因此,在这里我用比较通俗的话说了。序列化就是把一个对象转换成有规则的二进制流。而反序列化就是把有规则的二进制数据重整成一个对象。其好处不难看见:1.可以把一个对象保存在一个文件里。例如,下载软件。当您关闭了软件,下次再打开...

Socket与ServerSocket的问题

//服务器端:import java.io.BufferedReader;import java.io.IOException;import java.io.InputStreamReader;import java.io.PrintStream;import java.net.ServerSock...

Java语言的反射机制

    由于项目的需要,在项目中要实现即插即用的方式,也就是说可以动态地加载包,不用设置CLASSPATH路径。当项目发布时,不可能要用户来设置环境变量吧!因此,就要用到JAVA的反射机制了。昨天,我是在研究JAVA的JNI技术。由于没有时间,所以过几天才写JNI。今天...

JSP与Servlet的对应关系

以前在QQzone写下的文章现在贴到这里来了... 最近比较忙啊!现在抽身写一篇文章。是关于JSP与Servlet的对应关系的。希望对大家有所帮助。其实我也是刚刚学的......-------Servlet--------------JSP----------1.ServletContext&nbs...

JAVA获得一个文件夹大小

在JAVA里没有现成的方法获取一个文件夹的大小,那么我们可以用递归的方法,获取文件夹的大小。    import  java.util.*;  import  java.io.*;  class  GetFileSi...

Java代理详话简说

        Java的代理,使项目实现低藕合成为可能。Spring框架中的AOP,内部就是用Java代理来实现。因此,认识JAVA代理原理对学习学Spring AOP是有密切关系的。    &nb...

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。