`
Luob.
  • 浏览: 1574077 次
  • 来自: 上海
社区版块
存档分类
最新评论

java 根据URL获取网页源码

阅读更多
import java.io.BufferedReader;
import java.io.InputStreamReader;
import java.net.URL;


public class webPageResource {

	/**
	 * @param args
	 */
	public static void main(String[] args) {
		// TODO Auto-generated method stub
		webPageResource t6=new webPageResource();
		String htmls= t6.getPageSource("http://www.no5.com.cn/browse/specialprice_p2.html","GBK");
		System.out.println(htmls);
	}
	
	public String getPageSource(String pageUrl,String encoding) {  
        StringBuffer sb = new StringBuffer();  
        try {  
            //构建一URL对象  
            URL url = new URL(pageUrl);  
            //使用openStream得到一输入流并由此构造一个BufferedReader对象  
            BufferedReader in = new BufferedReader(new InputStreamReader(url  
                    .openStream(), encoding));  
            String line;  
            //读取www资源  
            while ((line = in.readLine()) != null) {  
                sb.append(line);  
                sb.append("\n");
            }  
            in.close();  
        } catch (Exception ex) {  
            System.err.println(ex);  
        }  
        return sb.toString();  
    } 

}
0
8
分享到:
评论
3 楼 Luob. 2012-09-21  
写的不对的地方  请大家指出!!谢了
2 楼 lsjinpeng 2012-09-21  
先通过3w字符串获取一个URL对象,然后open URL流,交给InputStreamReader字符流写入处理,并指定编码格式,再封装给BufferReader字符串流读取对象处理,while循环,读取line,append到sb
最后输出String
1 楼 leavesforeye 2012-09-21  
怎么会这样。

相关推荐

Global site tag (gtag.js) - Google Analytics