Perl 6字符匹配的所有Unicode属性是什么?

bri*_*foy 8 unicode perl6

.uniprop返回单个属性:

put join ', ', 'A'.uniprop;
Run Code Online (Sandbox Code Playgroud)

我找回一个属性(一般类别):

Lu
Run Code Online (Sandbox Code Playgroud)

环顾四周,我没有看到获得所有其他属性的方法(包括派生的ID_Start等等).我错过了什么?我知道我可以查看数据文件,但我宁愿使用一个返回列表的方法.

我最感兴趣的是因为正则表达式了解属性并匹配正确的属性.我想拍摄任何角色,并展示它将匹配哪些属性.

Sam*_* M. 2

"A".uniprop("Alphabetic")将获得 Alphabetic 属性。您是否想知道还有哪些其他可能的属性?

所有带有复选标记的这些都可能会起作用。这只是显示了烘焙测试的状态https://github.com/perl6/roast/issues/195

这可能对您更有用,https://github.com/rakudo/rakudo/blob/master/src/core/Cool.pm6#L396-L483 第一个哈希只是将属性名称的别名映射到全名。第二个哈希指定该属性是否为 B(布尔值)、S(字符串)、I(整数)、nv(数值)、na(Unicode 名称)以及其他一些特殊属性。

如果我不明白你的问题,请告诉我,我会修改这个答案。

更新:似乎您想找出所有匹配的属性。您想要做的是迭代所有https://github.com/rakudo/rakudo/blob/master/src/core/Cool.pm6#L396-L483并仅查看字符串、整数和布尔属性。这是完整的内容:https://gist.github.com/samcv/ae09060a781bb4c36ae6cac80ea9325f

sub MAIN {
    use Test;
    my $char = 'a';
    my @result = what-matches($char);
    for @result {
        ok EVAL("'$char' ~~ /$_/"), "$char ~~ /$_/";
    }
}
use nqp;
sub what-matches (Str:D $chr) {
    my @result;
    my %prefs = prefs();
    for %prefs.keys -> $key {
        given %prefs{$key} {
            when 'S' {
                my $propval = $chr.uniprop($key);
                if $key eq 'Block' {
                    @result.push: "<:In" ~ $propval.trans(' ' => '') ~ ">";
                }
                elsif $propval {
                    @result.push: "<:" ~ $key ~ "<" ~ $chr.uniprop($key) ~ ">>";
                }
            }
            when 'I' {
                @result.push: "<:" ~ $key ~ "<" ~ $chr.uniprop($key) ~ ">>";
            }
            when 'B' {
                @result.push: ($chr.uniprop($key) ?? "<:$key>" !! "<:!$key>");
            }

        }
    }
    @result;

}
sub prefs {
    my %prefs = nqp::hash(
          'Other_Grapheme_Extend','B','Titlecase_Mapping','tc','Dash','B',
          'Emoji_Modifier_Base','B','Emoji_Modifier','B','Pattern_Syntax','B',
          'IDS_Trinary_Operator','B','ID_Continue','B','Diacritic','B','Cased','B',
          'Hangul_Syllable_Type','S','Quotation_Mark','B','Radical','B',
          'NFD_Quick_Check','S','Joining_Type','S','Case_Folding','S','Script','S',
          'Soft_Dotted','B','Changes_When_Casemapped','B','Simple_Case_Folding','S',
          'ISO_Comment','S','Lowercase','B','Join_Control','B','Bidi_Class','S',
          'Joining_Group','S','Decomposition_Mapping','S','Lowercase_Mapping','lc',
          'NFKC_Casefold','S','Simple_Lowercase_Mapping','S',
          'Indic_Syllabic_Category','S','Expands_On_NFC','B','Expands_On_NFD','B',
          'Uppercase','B','White_Space','B','Sentence_Terminal','B',
          'NFKD_Quick_Check','S','Changes_When_Titlecased','B','Math','B',
          'Uppercase_Mapping','uc','NFKC_Quick_Check','S','Sentence_Break','S',
          'Simple_Titlecase_Mapping','S','Alphabetic','B','Composition_Exclusion','B',
          'Noncharacter_Code_Point','B','Other_Alphabetic','B','XID_Continue','B',
          'Age','S','Other_ID_Start','B','Unified_Ideograph','B','FC_NFKC_Closure','S',
          'Case_Ignorable','B','Hyphen','B','Numeric_Value','nv',
          'Changes_When_NFKC_Casefolded','B','Expands_On_NFKD','B',
          'Indic_Positional_Category','S','Decomposition_Type','S','Bidi_Mirrored','B',
          'Changes_When_Uppercased','B','ID_Start','B','Grapheme_Extend','B',
          'XID_Start','B','Expands_On_NFKC','B','Other_Uppercase','B','Other_Math','B',
          'Grapheme_Link','B','Bidi_Control','B','Default_Ignorable_Code_Point','B',
          'Changes_When_Casefolded','B','Word_Break','S','NFC_Quick_Check','S',
          'Other_Default_Ignorable_Code_Point','B','Logical_Order_Exception','B',
          'Prepended_Concatenation_Mark','B','Other_Lowercase','B',
          'Other_ID_Continue','B','Variation_Selector','B','Extender','B',
          'Full_Composition_Exclusion','B','IDS_Binary_Operator','B','Numeric_Type','S',
          'kCompatibilityVariant','S','Simple_Uppercase_Mapping','S',
          'Terminal_Punctuation','B','Line_Break','S','East_Asian_Width','S',
          'ASCII_Hex_Digit','B','Pattern_White_Space','B','Hex_Digit','B',
          'Bidi_Paired_Bracket_Type','S','General_Category','S',
          'Grapheme_Cluster_Break','S','Grapheme_Base','B','Name','na','Ideographic','B',
          'Block','S','Emoji_Presentation','B','Emoji','B','Deprecated','B',
          'Changes_When_Lowercased','B','Bidi_Mirroring_Glyph','bmg',
          'Canonical_Combining_Class','S',
    );
}
Run Code Online (Sandbox Code Playgroud)

  • 我想获得它满足的所有属性的列表,而无需提前知道其中任何一个的名称。 (2认同)