前端之家收集整理的这篇文章主要介绍了
使用正则表达式抓取网页中的email地址,
前端之家小编觉得挺不错的,现在分享给大家,也给大家做个参考。
import java.io.BufferedReader;
import java.io.FileNotFoundException;
import java.io.FileReader;
import java.io.IOException;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
/*
* 根据抓取的网页,获取其中包含的Email地址
* 主要是正则表达式应用
* */
public class EmailSpider {
public static void main(String[] args) {
String filePath = "E:\\email.html";
getEmail(filePath);
}
private static void getEmail(String filePath) {
BufferedReader br = null;
Pattern p = null;
Matcher m = null;
//构建邮件的正则表达式
p = Pattern.compile("[\\w[.-]]+@[\\w[.-]]+\\.[\\w]+");
try {
br = new BufferedReader(new FileReader(filePath));
String line = "";
while((line = br.readLine()) != null) {
m = p.matcher(line);
if(m.find()) {
System.out.println(m.group());
}
}
} catch (FileNotFoundException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
} finally {
try {
if(br != null) {
br.close();
br = null;
}
} catch (IOException e) {
e.printStackTrace();
}
}
}
}