Java中的拉丁字母正则表达式

tal*_*inq 1 java regex unicode latin

我需要一个Java中的正则表达式来匹配拉丁字母和一些特殊字符.

我不想列出这些角色.

例子:

应符合以下大写和小写: äöü ç ??????ó?

不应该匹配: £

我尝试了几种模式和小组,但是几小时后我就没有想法了

任何帮助将不胜感激.

Boa*_*ann 9

\p{IsLatin}字符类会做到这一点.

也就是说, System.out.println(someString.matches("\\p{IsLatin}+"));

它在Pattern类文档中命名.

使用快速循环迭代所有可能的字符表明它匹配的完整字符集是:

ABCDEFGHIJKLMNOPQRSTU VWXYZ abcdefghijklmnopqrstu vwxyzª¢Ã¢Ã¢ÃÇÈËËÌÏÏТԢ֢֢ڢÕçÕ I I I dñO O O O O O U U U U第y Y A A A A A A C C C C C C C C d dĐđE E E E E E E E E E G G G G G G G G H H H H I I I I I I I I I IIJijĴĴķķĸL L L L L L L L L L N N N N N NʼnN N O O O O O O œœR R R R R R S S S S S S S S T T [T T [T T [U U U U U U U U U U U U W W Y Y Y Z Z Z Z Z Z小号ɃƁƂƂ ƄƄƆƇƇƉƊƌƌƍƎəɛƒƒƓɣƕƖƗƙƙƚƛƜƝƞƟ○○ƢƣƥƥƦƨƨΣƪƫƬƬƮU UƱƲƳƴž žʒƹƹƺƻƽƽƾƿ|!ǁǂdždždžljljljnjnjnjǎǎǐǐǒǒǔǔǖǖǘǘǚǚǜǜǝǟǟǡǡǣǣǥǥǧǧ ǨǩǫǬǭǮǯǰDZDzdzǵǶǷǸǹǹǹ ǺǼǽǾǾȀȁȂȃȄȅȆȇȈȉȊȋȌȍȎȏȐȑȒȓȔȕȖȗššT T [ȜȝȞȟƞȡȢȣȤȥ埃埃ȨȩȪȫȬ ȭȮȯȰȱȳȴȵȶȷȸȹ ȺȻȼȽȾȿɀɁɂɃɄʌɆɇɈɉɊɋɌɍɎɏɐɑɒɓɔɕɖɗɘəɚɛɜɝɞɟɠɡɢɣɤɥɦɧɨɩɪɫ ɬɭɮɯɰɱɲɳɴɵɶɷɸɹɺɻɼɽɾɿʀʁʂʃʄʅʆʇʈʉʊʋʌʍʎʏʐʑʒʓʔʕʖʗʘʙʚʛʜʝ ʞʟʠʡʢʣʤʥʦʧʨʩʪʫʬʭʮʯʰʱʲʳʴʵʶʷʸˠˡˢˣˤᴀᴁᴂᴃᴄᴅᴆᴇᴈᴉᴊᴋᴌᴍᴎᴏᴐᴑ ᴒᴓᴔᴕᴖᴗᴘᴙᴚᴛᴜᴝᴞᴟᴠᴡᴢᴣᴤᴥᴬᴭᴮᴯᴰᴱᴲᴳᴴᴵᴶᴷᴸᴹᴺᴻᴼᴽᴾᴿᵀᵁᵂᵃᵄᵅᵆᵇᵈᵉ ᵊᵋᵌᵍᵎᵏᵐᵑᵒᵓᵔᵕᵖᵗᵘᵙᵚᵛᵜᵢᵣᵤᵥᵫᵬᵭᵮᵯᵰᵱᵲᵳᵴᵵᵶᵷᵹᵺᵻᵼᵽᵾᵿᶀᶁᶂᶃᶄᶅᶆ ᶇᶈᶉᶊᶋᶌᶍᶎᶏᶐᶑᶒᶓᶔᶕᶖᶗᶘᶙᶚᶛᶜᶝᶞᶟᶠᶡᶢᶣᶤᶥᶦᶧ ᶨᶩᶪᶫᶬᶭᶮᶯᶰᶱᶲᶳᶴᶵᶶᶷᶸᶹᶺᶻᶼᶽᶾA A B B B B B B C C d d d d d d d d d d E E E E E EÈ E E E F F G G H H H H H H H H H H I I I I KķķķL个K L L L LḺL L L M M M M M M N N N N N N N Nö ○○○○○○○ṕṕṖṗR R R R R R R R五六S S S S S S S S T T [T T [T T [T T [U U U U U U U U U U V V V,V,W W W W W W W W W W ^ X X X X Y Y Z Z Z Z Z Z H T w ^ýA FẜẝẞẟA A A A A A A A A A A A A A A A A A A A A A A A E E E E E E E E E E E E E E E E I I I I O O O O O O O O O O O O O O O O O O○○ ○○○○U U U U U U U U U U U U U U Y Y Y Y Y Y Y YỺỻỽỽỿỿⁱⁿₐₑₒₓₔₕₖₗₘₙₚₛₜK AℲ ⅎⅰⅱⅲⅳⅴⅵⅶⅷⅸⅹⅺⅻⅼⅽⅾⅿⅰⅱⅲⅳⅴⅵⅶⅷⅸⅹⅺⅻⅼⅽⅾⅿↀↁↂↄↄↅↆↇↈⱡⱡⱢⱣɽⱥⱦⱧ ⱨⱪⱪⱬⱬɑⱮⱯⱰⱱⱳⱳⱴⱶⱶⱷⱸⱹⱺⱻⱼⱽⱾⱿꜣꜣꜥꜥꜧꜧꜨꜩꜫꜫꜭꜭꜮꜯꜰꜱꜲꜳꜴꜵꜷꜷꜹꜹꜻꜻ ꜼꜽꜾꜿꝀꝁꝂꝃꝄꝅꝆꝇꝈꝉꝊꝋꝌꝍꝎꝏꝐꝑꝒꝓꝔꝕꝖꝗꝘꝙꝚꝛꝜꝝꝞꝟꝠꝡꝢꝣꝤꝥꝦꝧꝨꝩꝪꝫꝬꝭ ꝯꝯꝰꝱꝲꝳꝴꝵꝶꝷꝸꝺꝺꝼꝼꝽꝿꝿꞁꞁꞃꞃꞅꞅꞇꞇꞌꞌꞍꞎꞑꞑꞒꞓꞠꞡꞢꞣꞥꞥꞦꞧꞩꞩꞪꟸꟹꟺꟻꟼ ꟽꟽꟾfffi ffi ffl ft st A B C D E F G H I J K L M N O P Q R S T U V W X Y Z a b c d e f g h i j k l m n o p q r s t u v w x y z Y Y Z Z Z Z Z Z H T w ^ýA FẜẝẞẟA A A A A A A A A A A A A A A A A A A A A A A A E E E E E E EÈ èE E E E E E E I I I I O O O O O O O O O O O O O O O O O O O O O O O O U U U U U U U U U U U U U U Y Y Y Y Y Y Y YỻỻỼỽỾỿⁱⁿₐₑₒₓₔₕₖₗₘₙₚₛₜK Aⅎⅎⅰⅱⅲⅳⅴⅵⅶⅷⅸⅹⅺⅻⅼⅽⅾⅿⅰ ⅱⅲⅳⅴⅵⅶⅷⅸⅹⅺⅻⅼⅽⅾⅿↀↁↂↄↄↅↆↇↈⱡⱡⱢⱣɽⱥⱦⱨⱨⱪⱪⱬⱬɑⱮⱯⱰⱱⱳⱳⱴⱶⱶⱷⱸⱹ ⱺⱻⱼⱽⱾⱿꜣꜣꜥꜥꜧꜧꜩꜩꜫꜫꜬꜭꜮꜯꜰꜱꜲꜳꜴꜵꜶꜷꜸꜹꜺꜻꜼꜽꜿꜿꝀꝁꝃꝃꝄꝅꝆꝇꝉꝉꝋꝋꝍꝍ ꝎꝏꝐꝑꝒꝓꝔꝕꝖꝗꝘꝙꝚꝛꝜꝝꝞꝟꝠꝡꝢꝣꝤꝥꝦꝧꝨꝩꝪꝫꝬꝭꝮꝯꝰꝱꝲꝳꝴꝵꝶꝷꝸꝹꝺꝻꝼꝽꝾꝿ ꞁꞁꞂꞃꞅꞅꞇꞇꞌꞌꞍꞎꞑꞑꞓꞓꞡꞡꞢꞣꞥꞥꞧꞧꞩꞩꞪꟸꟹꟺꟻꟼꟽꟾꟿFF音响FL FFI ffl第英尺ST A B C d E F G H I J K L M N O P Q R S T U V W X Y Z a b c d e f g h i j k l m n o p q r s t u v w x y z Y Y Z Z Z Z Z Z H T w ^ýA FẜẝẞẟA A A A A A A A A A A A A A A A A A A A A A A A E E E E E E EÈ èE E E E E E E I I I I O O O O O O O O O O O O O O O O O O O O O O O O U U U U U U U U U U U U U U Y Y Y Y Y Y Y YỻỻỼỽỾỿⁱⁿₐₑₒₓₔₕₖₗₘₙₚₛₜK Aⅎⅎⅰⅱⅲⅳⅴⅵⅶⅷⅸⅹⅺⅻⅼⅽⅾⅿⅰ ⅱⅲⅳⅴⅵⅶⅷⅸⅹⅺⅻⅼⅽⅾⅿↀↁↂↄↄↅↆↇↈⱠⱡⱢⱣɽⱥⱦⱨⱨⱪⱪⱬⱬɑⱮⱯⱰⱱⱲⱳⱴⱵⱶⱷⱸⱹ ⱺⱻⱼⱽⱾⱿꜣꜣꜥꜥꜧꜧꜩꜩꜫꜫꜭꜭꜯꜯꜰꜱꜳꜳꜵꜵꜷꜷꜹꜹꜻꜻꜽꜽꜿꜿꝁꝁꝃꝃꝅꝅꝇꝇꝉꝉꝋꝋꝍꝍ ꝎꝏꝐꝑꝒꝓꝔꝕꝖꝗꝘꝙꝚꝛꝜꝝꝞꝟꝠꝡꝢꝣꝤꝥꝦꝧꝨꝩꝪꝫꝬꝭꝮꝯꝰꝱꝲꝳꝴꝵꝶꝷꝸꝹꝺꝻꝼꝽꝾꝿ ꞁꞁꞃꞃꞅꞅꞇꞇꞌꞌꞍꞎꞑꞑꞒꞓꞠꞡꞣꞣꞥꞥꞧꞧꞩꞩꞪꟸꟹꟺꟻꟼꟽꟾꟿFF音响FL FFI ffl第英尺ST A B C d E F G H I J K L M N O P Q R S T U V W X Y Z a b c d e f g h i j k l m n o p q r s t u v w x y z A A A A A E E E E E E E E E E E E E E E E I I I I O O O O O O O O O O O O O O O O O O O O O O O Où üU U U U U U U U U U U U Y Y Y Y Y Y Y YỻỻỽỽỿỿⁱⁿₐₑₒₓₔₕₖₗₘₙₚₛₜK Aⅎⅎⅰⅱⅲⅳ ⅴⅵⅶⅷⅸⅹⅺⅻⅼⅽⅾⅿⅰⅱⅲⅳⅴⅵⅶⅷⅸⅹⅺⅻⅼⅽⅾⅿↀↁↂↄↄↅↆↇↈⱡⱡⱢⱣɽⱥⱦⱨⱨⱪⱪⱬⱬ ɑⱮⱯⱰⱱⱳⱳⱴⱶⱶⱷⱸⱹⱺⱻⱼⱽⱾⱿꜢꜣꜤꜥꜧꜧꜨꜩꜪꜫꜬꜭꜮꜯꜰꜱꜳꜳꜵꜵꜷꜷꜸꜹꜻꜻꜼꜽꜿꜿꝀ ꝁꝃꝃꝅꝅꝇꝇꝉꝉꝋꝋꝍꝍꝏꝏꝑꝑꝓꝓꝕꝕꝗꝗꝙꝙꝛꝛꝜꝝꝟꝟꝡꝡꝣꝣꝥꝥꝦꝧꝨꝩꝪꝫꝭꝭꝯꝯꝰꝱꝲ ꝳꝴꝵꝶꝷꝸꝹꝺꝻꝼꝽꝾꝿꞀꞁꞂꞃꞄꞅꞆꞇꞋꞌꞍꞎꞐꞑꞒꞓꞠꞡꞢꞣꞤꞥꞦꞧꞨꞩꞪꟸꟹꟺꟻꟼꟽꟾꟿFF音响fl ffi ffl ft st A B C D E F G H I J K L M N O P Q R S T U V W X Y Z a b c d e f g h i j k l m n o p q r s s t u v w x y z A A A A A E E E E E E E E E E E E E E E E I I I I O O O O O O O O O O O O O O O O O O O O O O O Où üU U U U U U U U U U U U Y Y Y Y Y Y Y YỺỻỽỽỾỿⁱⁿₐₑₒₓₔₕₖₗₘₙₚₛₜK AℲⅎⅰⅱⅲⅳ ⅴⅵⅶⅷⅸⅹⅺⅻⅼⅽⅾⅿⅰⅱⅲⅳⅴⅵⅶⅷⅸⅹⅺⅻⅼⅽⅾⅿↀↁↂↄↄↅↆↇↈⱡⱡⱢⱣɽⱥⱦⱧⱨⱪⱪⱬⱬ ɑⱮⱯⱰⱱⱲⱳⱴⱶⱶⱷⱸⱹⱺⱻⱼⱽⱾⱿꜢꜣꜥꜥꜧꜧꜩꜩꜫꜫꜭꜭꜯꜯꜰꜱꜳꜳꜴꜵꜶꜷꜸꜹꜻꜻꜼꜽꜿꜿꝀ ꝁꝃꝃꝅꝅꝇꝇꝉꝉꝋꝋꝍꝍꝎꝏꝑꝑꝒꝓꝕꝕꝗꝗꝙꝙꝛꝛꝝꝝꝞꝟꝡꝡꝣꝣꝥꝥꝧꝧꝩꝩꝫꝫꝭꝭꝯꝯꝰꝱꝲ ꝳꝴꝵꝶꝷꝸꝹꝺꝻꝼꝽꝾꝿꞀꞁꞂꞃꞄꞅꞆꞇꞋꞌꞍꞎꞐꞑꞒꞓꞠꞡꞢꞣꞤꞥꞦꞧꞨꞩꞪꟸꟹꟺꟻꟼꟽꟾꟿFF音响fl ffi ffl ft st A B C D E F G H I J K L M N O P Q R S T U V W X Y Z a b c d e f g h i j k l m n o p q r s s t u v w x y z ỼỽỾỿⁱⁿₐₑₒₓₔₕₖₗₘₙₚₛₜK AℲⅎⅠⅡⅢⅣⅤⅥⅦⅧⅨⅩⅪⅫⅬⅭⅮⅯⅰⅱⅲⅳⅴⅵⅶⅷⅸⅹⅺ ⅻⅼⅽⅾⅿↀↁↂↄↄↅↆↇↈⱠⱡⱢⱣɽⱥⱦⱧⱨⱪⱪⱫⱬɑⱮⱯⱰⱱⱳⱳⱴⱵⱶⱷⱸⱹⱺⱻⱼⱽⱾⱿꜣꜣꜥꜥ ꜧꜧꜨꜩꜪꜫꜬꜭꜯꜯꜰꜱꜲꜳꜴꜵꜶꜷꜸꜹꜻꜻꜽꜽꜾꜿꝁꝁꝃꝃꝅꝅꝇꝇꝉꝉꝊꝋꝌꝍꝏꝏꝐꝑꝒꝓꝕꝕꝖꝗ ꝙꝙꝛꝛꝝꝝꝟꝟꝡꝡꝣꝣꝤꝥꝦꝧꝩꝩꝪꝫꝬꝭꝮꝯꝰꝱꝲꝳꝴꝵꝶꝷꝸꝺꝺꝼꝼꝽꝿꝿꞀꞁꞂꞃꞄꞅꞇꞇꞌꞌ ꞍꞎꞑꞑꞓꞓꞡꞡꞣꞣꞥꞥꞧꞧꞩꞩꞪꟸꟹꟺꟻꟼꟽꟾꟿFF音响FL FFI ffl第英尺ST A B C d E F G H I J K L M N 2 O P Qř S T U V W X Y Z a b c d e f g h i j k l m n o p q r s t u v w x y z ỼỽỾỿⁱⁿₐₑₒₓₔₕₖₗₘₙₚₛₜK AℲⅎⅠⅡⅢⅣⅤⅥⅦⅧⅨⅩⅪⅫⅬⅭⅮⅯⅰⅱⅲⅳⅴⅵⅶⅷⅸⅹⅺ ⅻⅼⅽⅾⅿↀↁↂↄↄↅↆↇↈⱠⱡⱢⱣɽⱥⱦⱨⱨⱩⱪⱫⱬɑⱮⱯⱰⱱⱲⱳⱴⱶⱶⱷⱸⱹⱺⱻⱼⱽⱾⱿꜢꜣꜤꜥ ꜧꜧꜩꜩꜫꜫꜭꜭꜯꜯꜰꜱꜳꜳꜵꜵꜷꜷꜹꜹꜻꜻꜽꜽꜿꜿꝁꝁꝃꝃꝅꝅꝇꝇꝉꝉꝋꝋꝍꝍꝏꝏꝑꝑꝓꝓꝕꝕꝗꝗ ꝙꝙꝛꝛꝝꝝꝟꝟꝡꝡꝣꝣꝥꝥꝧꝧꝩꝩꝫꝫꝭꝭꝯꝯꝰꝱꝲꝳꝴꝵꝶꝷꝸꝹꝺꝻꝼꝽꝿꝿꞀꞁꞃꞃꞅꞅꞆꞇꞌꞌ ꞍꞎꞑꞑꞓꞓꞡꞡꞣꞣꞥꞥꞧꞧꞩꞩꞪꟸꟹꟺꟻꟼꟽꟾꟿFF音响FL FFI ffl第英尺ST A B C d E F G H I J K L M N 2 O P Qř S T U V W X Y Z a b c d e f g h i j k l m n o p q r s t u v w x y z

如果这太多了,你可以将它与一些命名的Unicode块相交.

例如,这个字符类:

[\p{IsLatin}&&[\p{InBasic_Latin}\p{InLatin_1_Supplement}\p{InLatin_Extended_A}\p{InLatin_Extended_B}]]
Run Code Online (Sandbox Code Playgroud)

将匹配:

ABCDEFGHIJKLMNOPQRSTU VWXYZ abcdefghijklmnopqrstu vwxyzª¢Ã¢Ã¢ÃÇÈËËÌÏÏТԢ֢֢ڢÕçÕ I I I dñO O O O O O U U U U第y Y A A A A A A C C C C C C C C d dĐđE E E E E E E E E E G G G G G G G G H H H H I I I I I I I I I IIJijĴĴķķĸL L L L L L L L L L N N N N N NʼnN N O O O O O O œœR R R R R R S S S S S S S S T T [T T [T T [U U U U U U U U U U U U W W Y Y Y Z Z Z Z Z Z小号ɃƁƂƂ ƄƄƆƇƇƉƊƌƌƍƎəɛƒƒƓɣƕƖƗƙƙƚƛƜƝƞƟ○○ƣƣƥƥƦƧƨΣƪƫƬƬƮU UƱƲƴƴž žʒƹƹƺƻƼƽƾƿ|!ǁǂDŽDždžljljljnjnjnjǎǎǐǐǒǒǔǔǖǖǗǘǚǚǜǜǝǟǟǡǡǣǣǥǥǧǧ ǨǩǫǬǭǮǯǰDZDzdzǵǶǷǸǹǹǹ ǺǼǽǾǾȀȁȂȃȄȅȆȇȈȉȊȋȌȍȎȏȐȑȒȓȔȕȖȗššT T [ȜȝȞȟƞȡȢȣȤȥ埃埃ȨȩȪȫȬ ȭȮȯȰȱȳȴȵȶȷȸȹ