今天给各位分享java网页开发的知识,其中也会对java获取网页源码进行解释,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始吧!
java中如何根据一个网址获得该网页的源代码?
本文贡献者:【陌南尘】, 疑问关键字:java网页开发, 下面就让重庆云诚科技小编为你解答,希望本文能找到您要的答案!
最佳答案package test;
import java.io.BufferedReader;
import java.io.InputStreamReader;
import java.net.HttpURLConnection;
import java.net.URL;
public class HttpTest {
private String u;
private String encoding;
public static void main(String[] args) throws Exception {
HttpTest client = new HttpTest(";, "UTF-8");
client.run();
}
public HttpTest(String u, String encoding) {
this.u = u;
this.encoding = encoding;
}
public void run() throws Exception {
URL url = new URL(u);// 根据链接(字符串格式),生成一个URL对象
HttpURLConnection urlConnection = (HttpURLConnection) url
.openConnection();// 打开URL
BufferedReader reader = new BufferedReader(new InputStreamReader(
urlConnection.getInputStream(), encoding));// 得到输入流,即获得了网页的内容
String line; // 读取输入流的数据,并显示
while ((line = reader.readLine()) != null) {
System.out.println(line);
}
}
}
以上就是重庆云诚科技小编解疑贡献者:(陌南尘)分析的关于“java中如何根据一个网址获得该网页的源代码?”的问题了,不知是否已经解决你的问题?如果没有,下一篇内容可能是你想要的答案,现在接着继续解读下文用户【孤城傲影】分析的“java 怎样获取一个网页的内容 要网页里面的表格数据 (通过源码不能直接获取数据),请教?”的一些相关问题做出分析与解答,如果能找到你的答案,可以关注本站。

java 怎样获取一个网页的内容 要网页里面的表格数据 (通过源码不能直接获取数据),请教?
本文贡献者:【孤城傲影】, 疑问关键字:java网页开发, 下面就让重庆云诚科技小编为你解答,希望本文能找到您要的答案!
最佳答案根据java网络编程相关的内容,使用jdk提供的相关类可以得到url对应网页的html页面代码。
针对得到的html代码,通过使用正则表达式即可得到我们想要的内容。
比如,我们如果想得到一个网页上所有包括“java”关键字的文本内容,就可以逐行对网页代码进行正则表达式的匹配。最后达到去除html标签和不相关的内容,只得到包括“java”这个关键字的内容的效果。
从网页上爬取图片的流程和爬取内容的流程基本相同,但是爬取图片的步骤会多一步。
需要先用img标签的正则表达式匹配获取到img标签,再用src属性的正则表达式获取这个img标签中的src属性的图片url,然后再通过缓冲输入流对象读取到这个图片url的图片信息,配合文件输出流将读到的图片信息写入到本地即可。
上文就是重庆云诚科技小编解答贡献者:(孤城傲影)分析的关于“java 怎样获取一个网页的内容 要网页里面的表格数据 (通过源码不能直接获取数据),请教?”的问题了,不知是否已经解决你的问题?如果没有,下一篇内容可能是你想要的答案,接下来继续论述下文用户【心亦凉】贡献的“如何通过java,javascript获得某一指定URL的网页源码?”的一些相关疑问做出分析与解答,如果能找到你的答案,可以关注本站。
如何通过java,javascript获得某一指定URL的网页源码?
本文贡献者:【心亦凉】, 疑问关键字:java网页开发, 下面就让重庆云诚科技小编为你解答,希望本文能找到您要的答案!
最佳答案javascript获取网页源码,测试了能通过的,你试下!
你把& l t ; & g t;的空格删了,因为百度不允许那些字符。
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=gb2312" />
<title>test</title>
</head>
<body>
关于百度页面源码内容如下:<br />
<div id="t1"></div>
<script type="text/javascript">
function createXmlHttpRequest()
{
try {return new XMLHttpRequest();}
catch(e)
{
return new ActiveXObject("Microsoft.XMLHTTP");}
}
var xmlHttp = createXmlHttpRequest();
xmlHttp.open("get", ";,false);
xmlHttp.send();
if(xmlHttp.readyState == 4 && xmlHttp.status == 200)
{
str = xmlHttp.responseText;//str即为返回的html内容
var str1 = new RegExp(">","g");
var str2 = new RegExp("<","g");
var str3 = new RegExp("\r","g");
str=str.replace(str2,"& l t ;"); //把空格删了,百度会把那些字符替换掉,不得已打空格
str=str.replace(str1,"& g t ;"); //把空格删了,百度会把那些字符替换掉,不得已打空格
str=str.replace(str3,"<br />");
document.getElementById("t1").innerHTML = str;
}
</script>
</body>
</html>
以上就是重庆云诚科技小编解答(心亦凉)贡献关于“如何通过java,javascript获得某一指定URL的网页源码?”的答案,接下来继续为你详解体育用户(梦里花落)贡献“Java访问指定URL并获取网页源代码”的一些相关解答,希望能解决你的问题!
Java访问指定URL并获取网页源代码
本文贡献者:【梦里花落】, 疑问关键字:java网页开发, 下面就让重庆云诚科技小编为你解答,希望本文能找到您要的答案!
最佳答案1.编写useSourceViewer 类的基本框架,该类仅包括无返回值的main ()方法,该方法从参数中获取URL,通过输入缓冲和输出缓冲将该URL 原码输出。
2.编写useSourceViewer 类,代码如下:
import java.net.*;
import java.io.*;
public class useSourceViewer
{
public static void main (String[] args)
{
if (args.length > 0)
{
try
{
//读入URL
URL u = new URL(args[0]);
InputStream in = u.openStream( );
// 为增加性能存储输入流
in = new BufferedInputStream(in);
// 将输入流连接到阅读器
Reader r = new InputStreamReader(in);
int c;
while ((c = r.read( )) != -1)
{
System.out.print((char) c);
}
Object o = u.getContent( );
System.out.println("I got a " + o.getClass().getName( ));
}
catch (MalformedURLException e)
{
System.err.println(args[0] + " is not a parseable URL");
}
catch (IOException e)
{
System.err.println(e);
}
} // end if
} // end main
} // end SourceViewer}
今天有关内容《〈java网页开发〉java获取网页源码》先分享到这里了,如果想要了解更多,请关注www.cqycseo.com,您的关注是给小编最大的鼓励。
推荐文章:
本文由网上采集发布,不代表我们立场,转载联系作者并注明出处:https://www.cqycseo.com/kangadmin/makehtml_archives_action.php?endid=0&startid=-1&typeid=15&totalnum=6115&startdd=680&pagesize=20&seltime=0&sstime=1679321406&stime=&etime=&uptype=&mkvalue=0&isremote=0&serviterm=
