熱點推薦:
您现在的位置: 電腦知識網 >> 編程 >> Java編程 >> JSP教程 >> 正文

java匹配中文漢字的正則表達式

2013-11-15 12:08:15  來源: JSP教程 
代碼如下  

  [uEuFA]漢字?[uFEuFFA]全角字符

  [uEuFA]漢字?[uFEuFFA]全角字符

  匹配中文字符的正則表達式 [ueufa]

  匹配雙字節字符(包括漢字在內)[^xxff]

  應用計算字符串的長度(一個雙字節字符長度計ASCII字符計)

代碼如下   Stringprototypelen=function(){return thisreplace([^xxff]/g"aa")length;}

  匹配空行的正則表達式n[s| ]*r

  匹配HTML標記的正則表達式/<(*)>*|<(*) />/

  匹配首尾空格的正則表達式(^s*)|(s*$)

  知道它了我們就好解決了

代碼如下 復制代碼

  public static void regxChinese(){
// 要匹配的字符串
String source = "<span title= 星級酒店 class=dx dx>";
// 將上面要匹配的字符串轉換成小寫
// source = sourcetoLowerCase();
// 匹配的字符串的正則表達式
String reg_charset = "<span[^>]*?title=([]*[\s|\S]*[uEuFA]*)[\s|\S]

  *class=[az]*[\s|\S]*[az]*[]*";

Pattern p = Patterncompile(reg_charset);
Matcher m = pmatcher(source);
while (mfind()) {
Systemoutprintln(mgroup());
}
}
public static void regxChinese(){
// 要匹配的字符串
String source = "<span title= 星級酒店 class=dx dx>";
// 將上面要匹配的字符串轉換成小寫
// source = sourcetoLowerCase();
// 匹配的字符串的正則表達式
String reg_charset = "<span[^>]*?title=([]*[\s|\S]*[uEuFA]*)[\s|\S]

  *class=[az]*[\s|\S]*[az]*[]*";

Pattern p = Patterncompile(reg_charset);
Matcher m = pmatcher(source);
while (mfind()) {
Systemoutprintln(mgroup());
}
}

  Java的正則表達式是可以匹配中文字符的同時用中文字符來寫表達式也是可以的

代碼如下 復制代碼

  String reg_charset = "<span[^>]*?title=([]*[\s|\S]*星級酒店)[\s|\S]*class=[az]*[\s|\S]

  *[az]*[]*";

  String reg_charset = "<span[^>]*?title=([]*[\s|\S]*星級酒店)[\s|\S]*class=[az]*

  [\s|\S]*[az]*[]*";

  一些常用的正則匹配規則

  匹配中文字符的正則表達式 [ueufa]

  評注匹配中文還真是個頭疼的事有了這個表達式就好辦了

  匹配雙字節字符(包括漢字在內)[^xxff]

  評注可以用來計算字符串的長度(一個雙字節字符長度計ASCII字符計)

  匹配空白行的正則表達式ns*r

  評注可以用來刪除空白行

  匹配HTML標記的正則表達式<(S*?)[^>]*>*?|<*? />

  評注網上流傳的版本太糟糕上面這個也僅僅能匹配部分對於復雜的嵌套標記依舊無能為力

  匹配首尾空白字符的正則表達式^s*|s*$

  評注可以用來刪除行首行尾的空白字符(包括空格制表符換頁符等等)非常有用的表達式

  匹配Email地址的正則表達式w+([+]w+)*@w+([]w+)*w+([]w+)*

  評注表單驗證時很實用

  匹配網址URL的正則表達式[azAz]+://[^s]*

  評注網上流傳的版本功能很有限上面這個基本可以滿足需求

  匹配帳號是否合法(字母開頭允許字節允許字母數字下劃線)^[azAZ][azAZ_]{}$

  評注表單驗證時很實用

  匹配國內電話號碼d{}d{}|d{}d{}

  評注匹配形式如

  匹配騰訊QQ號[][]{}

  評注騰訊QQ號從開始

  匹配中國郵政編碼[]d{}(?!d)

  評注中國郵政編碼為位數字

  匹配身份證d{}|d{}

  評注中國的身份證為位或

  匹配ip地址d+d+d+d+

  評注提取ip地址時有用


From:http://tw.wingwit.com/Article/program/Java/JSP/201311/20374.html
    推薦文章
    Copyright © 2005-2013 電腦知識網 Computer Knowledge   All rights reserved.