首页 | 互联网 | IT动态 | IT培训 | Cisco | Windows | Linux | Java | .Net | Oracle | 软件测试 | C/C++ | 嵌入式开发 | 存储世界 | 服务器
网络设备 | IDC | 安全 | 求职招聘 | 数字网校 | 网页设计 | 平面设计 | 技术专题 | 电子书下载 | 教学视频 | 源码下载 | 搜索 | 博客 | 论坛
中国IT实验室Linux频道
中国IT教育
Google
首页 资讯动态 认证考试 新手入门 核心技术 高级技术 J2EE J2ME Java&XML 开源技术 其他技术 RSS订阅 论坛 专题
您现在的位置: 中国IT实验室 >> Java >> 新手入门 >> 基础入门 >> 正文

用 JAVA 判断一个URL是否有效

  最近因项目需求,需要针对一些URL地址进行检测是否可用,刚开始考滤的是用InputStream 以流的形式来实现,读取网页的<title></title>元素做出判断,但这种方式试了几次就没有再考滤使用,因通过这种方式检测网页的 title 可能会有几种形式出现,比如大小写问题,那这样写代码就要进行多一些的判断,这个不行就判断下一个,但这样不但会消耗系统资源,而且更脑火的是有时检测不出来一个URL是否可连接,因为有些网页连接后失败有可能会转发到另一个网页, 后来就考滤用 java.net 下的类来实现,说实在的 java.net 下的类我还从来没用过,以前开发项目也没搞过这一块,所以就研究了一下,在网上也找了一些资料,都没找到相关的处理方式,所以这个文章就产生了,我们用到了 URL和HttpURLConnection 二个类 ,URL 是统一资源标识符的引用,一个URL实例代表着一个url的引用, HttpURLConnection : 通常一个HttpURLConnection 的实例可以生成一个请求,它有个方法 getResponseCode();可以得到请求的响应状态,该方法返回一个 int 分别是 200 and 404 如无法从响应中识别任何代码则返回 -1,现在就让我们来实现一下吧! 请看代码清单一:                                                                                                                                   

   清单一: URLAvailability.java

 package com.xxxxxxxxxxxxxxxxxxxxx;
import java.net.HttpURLConnection;
import java.net.URL;

import org.apache.log4j.Logger;

/**
 *
 *
 * 文件名称为:URLAvailability.java
 *
 * 文件功能简述: 描述一个URL或图片地址是否有效
 *
 * @author ChenTao
 * @version
 * @time 2008-5-29 上午10:00:35
 * @copyright  */
@SuppressWarnings("unused")
public class URLAvailability {

 private static Logger logger = Logger.getLogger(URLAvailability.class);

 private static URL urlStr;

 private static HttpURLConnection connection;

 private static int state = -1;

 private static String succ;

 /**
  * 功能描述 : 检测当前URL是否可连接或是否有效,
  * 最多连接网络 5 次, 如果 5 次都不成功说明该地址不存在或视为无效地址.
  *
  * @param url
  *            指定URL网络地址
  *
  * @return String
  */
 private synchronized String isConnect(String url) {
  int counts = 0;
  succ = null;                  if (url == null || url.length() <= 0) {                        return succ;                  }
  while (counts < 5) {
   try {
    urlStr = new URL(this.getUrl());
    connection = (HttpURLConnection) urlStr.openConnection();
    state = connection.getResponseCode();
    if (state == 200) {
     succ = connection.getURL().toString();
    }
    break;
   } catch (Exception ex) {
    counts++; logger.info("loop :" + counts);
    continue;
   }
  }
                   return succ;
 }
}
 


   问题解决了,循环是因为怕网络连接状态忙,第一次可能连接不上,但很少,一千个地址有可能只有那么一二个,大家可能看到该方法实现了同步,这个必须要加,要不能会造成多线程问题,后果就不说了。

【责编:landy】

中国IT教育

相关产品和培训
文章评论
 友情推荐链接
 认证培训
 专题推荐

 ·关于Java框架技术专题
 ·XML全攻略技术专题
 ·JAVA开源技术介绍专题
 ·Java嵌入式开发之J2ME技术专题
 ·超前体验 Oracle 11g的5个新特性…
 ·揭密使用VB.NET的五个实用技巧
 ·Oracle和SQL Server常用函数对比专题…
 ·展现C#世界 C#程序设计专题…
 ·Java入门 Tomcat的配置技巧精华专题…
 ·Oracle RMAN物理备份技术详解…
 今日更新
 社区讨论
 博客论点
 频道精选
 Java 频道导航