当前位置: 代码迷 >> HTML/CSS >> JAVA除去HTML代码
  详细解决方案

JAVA除去HTML代码

热度:320   发布时间:2012-10-08 19:54:56.0
JAVA去除HTML代码
import java.util.regex.Matcher;
import java.util.regex.Pattern;


public class Test {

	/**
	 * @param args
	 */
	public static void main(String[] args) {
		// TODO Auto-generated method stub
        String content="<p>郎酒15年陈红花郎酒53°500ML,楼兰蛇龙珠戈壁干红(铁盒)750ML,组合
                                  价699元。</p>";
    	Pattern patt=Pattern.compile("<[^>]+>([^<]*)</[^>]+>");
    	Matcher m=patt.matcher(content);
    	while(m.find()){
    		content=content.replaceFirst("<[^>]+>([^<]*)</[^>]+>", m.group(1).toString());
    	}
    	System.out.println(content);
         //郎酒15年陈红花郎酒53°500ML,楼兰蛇龙珠戈壁干红(铁盒)750ML,组合价699元。
	}

}

?

  相关解决方案