使用HttpURLConnection请求multipart/form-data类型的form提交


写一个小程序,模拟Http POST请求来从网站中获取数据。使用Jsoup(http://jsoup.org/)来解析HTML

Jsoup封装了HttpConnection的功能,可以向服务器提交请求。但分析了目标网站(http://www.w3.org/TR/html401/interact/forms.html#h-17.13.4.2

 3、jsoup解析数据:

  jsoup解析HTML代码的方式类似于javascript。

  可以将HttpUrlConnection接收到的html字符串来组装 Document:

Document doc = Jsoup.parse(html);
//获取html中id为tools_converter的元素
//假设html代码如:http://localhost">测试
Element element = doc.getElementById("tools_converter");
//可获取text的数据为:测试
String text = element.text();
//可获得attr的数据为:http://localhost
String attr = element.attr("href");

//也可以直接使用Jsoup封装的HttpConnection来请求数据器:
Document document = Jsoup.connect(url)
                .userAgent("Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/41.0.2272.118 Safari/537.36").get();

  Jsoup提供的部分方法如下:

  getElementsByTag(String):按Tag标签来获取:Elements divs = document.getElementsByTag("div")

  getElementById(String):按id标签来获取:Element idEle = document.getElementById("blogId")

  getElementsByClass(String):按CSS的Class名称来获取:Elements divs = document.getElementsByClass("redClass")

  children():返回Elements,某元素的所有子元素。

  child(int index):返回Element,某元素的第几个子元素:

  参考Jsoup API

  链接:

  JDK中的URLConnection参数详解