这篇文章主要介绍了java 读取网页内容的实例详解的相关资料,希望通过本文能帮助到大家,让大家学习理解这部分内容,需要的朋友可以参考下
java 读取网页内容的实例详解
import java.io.bufferedreader;
import java.io.ioexception;
import java.io.inputstreamreader;
import java.net.*;
public class loadurl {
public static void main(string args[]) {
string a = null;
try {
string url = "(这里替换成任意网页的网址)";
bufferedreader in = new bufferedreader(new inputstreamreader(
new url(url).openconnection().getinputstream(), "gb2312"));//gb2312可以根据需要替换成要读取网页的编码
while ((a = in.readline()) != null) {
system.out.println(a);
}
} catch (malformedurlexception e) {
} catch (ioexception e) {
}
}
}
以上的代码程序是把一个网页的源代码,包括html与xml读取到java的一个字符串string a中。
java中字符串string类型的空间很大,基本能够容纳一个网页源代码的内容。
从网页读取内容同样是对于输入流的操作。
不同于标准的输入源,在:
bufferedreader in = new bufferedreader(new inputstreamreader(...))
inputstreamreader中输入system.in就可以。
此处的输入源应该为:
(new url(url).openconnection().getinputstream(), "gb2312")
之后的操作与处理与载入标准输入源完全相同。
bufferedreader在java中要求必须捕获ioexception异常,而使用url源除了必须引入java.net.*包之外,还必须捕获malformedurlexception异常。
以上就是java实现读取网页内容的案例的详细内容。