在给定位置拆分字符串

Hol*_*lli 9 raku

我如何在位置列表中很好地/惯用地拆分字符串?

我拥有的:

.say for split-at( "0019ABX26002", (3, 4, 8) ); 

sub split-at( $s, @positions )
{
  my $done = 0;

  gather 
  {
    for @positions -> $p
    {
      take $s.substr($done, $p - $done );
      $done = $p;
    }
    take $s.substr( $done, * );
  }
}
Run Code Online (Sandbox Code Playgroud)

这是合理的。不过,我对此缺乏语言支持感到困惑。如果“split on”是一回事,为什么“split at”也不是?我认为这应该是一个核心操作。我应该可以写

.say for "0019ABX26002".split( :at(3, 4, 8) );
Run Code Online (Sandbox Code Playgroud)

或者也许我忽略了什么?

编辑:到目前为止我们所拥有的一些基准

O------------O---------O------------O--------O-------O-------O
|            | Rate    | array-push | holli  | raiph | simon |
O============O=========O============O========O=======O=======O
| array-push | 15907/s | --         | -59%   | -100% | -91%  |
| holli      | 9858/s  | 142%       | --     | -100% | -79%  |
| raiph      | 72.8/s  | 50185%     | 20720% | --    | 4335% |
| simon      | 2901/s  | 1034%      | 369%   | -98%  | --    |
O------------O---------O------------O--------O-------O-------O
Run Code Online (Sandbox Code Playgroud)

代码:

use Bench;

my $s = "aaaaaaaaaaaaaaaaaaaaaaaaaaaaabbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbccccddddddddddddddddddddddddddddddddddddefggggggggggggggggggg";
my @p = 29, 65, 69, 105, 106, 107;

Bench.new.cmpthese(1000, {
  holli  => sub { my @ = holli($s, @p); },
  simon => sub { my @ = simon($s, @p); },
  raiph => sub { my @ = raiph($s, @p); },
  array-push => sub { my @ = array-push($s, @p); },
});

#say user($s, @p);


sub simon($str, *@idxs ) {
    my @rotors = @idxs.map( { state $l = 0; my $o = $_ - $l; $l = $_; $o } );
    $str.comb("").rotor( |@rotors,* ).map(*.join(""));
}

sub raiph($s, @p) {
    $s.split( / <?{$/.pos == any(@p)}> / )
}

sub holli( $s, @positions )
{
  my $done = 0;

  gather
  {
    for @positions -> $p
    {
      take $s.substr($done, $p - $done );
      $done = $p;
    }
    take $s.substr( $done, * );
  }
}

sub array-push( $s, @positions )
{
  my $done = 0;
  my @result;

  for @positions -> $p
  {
    @result.push: $s.substr($done, $p - $done );
    $done = $p;
  }
  @result.push: $s.substr( $done, * );

  @result;
}
Run Code Online (Sandbox Code Playgroud)

Sci*_*mon 9

我个人将它分成一个列表,用于rotor划分列表并加入结果:

"0019ABX26002".comb().rotor(3,1,4,*).map(*.join)
Run Code Online (Sandbox Code Playgroud)

如果您想在函数处进行拆分(使用给定的索引):

sub split-at( $str, *@idxs ) { 
    my @rotors = @idxs.map( { state $l = 0; my $o = $_ - $l; $l = $_; $o } );
    $str.comb("").rotor( |@rotors,* ).map(*.join("")); 
}
Run Code Online (Sandbox Code Playgroud)

基本上,如果我想做列表类型的东西,我会使用列表。

我从函数式编程的角度想出了另一个我非常喜欢的版本:

sub split-at( $str, *@idxs ) {
    (|@idxs, $str.codes)
    ==> map( { state $s = 0;my $e = $_ - $s;my $o = [$s,$e]; $s = $_; $o } )
    ==> map( { $str.substr(|$_) } );
}
Run Code Online (Sandbox Code Playgroud)

它比另一个稍微慢一点。

  • 嗯,好吧。我们的想法相似,而且几乎同时:-) (2认同)

rai*_*iph 4

单程:

\n\n
.say for "0019ABX26002" .split: / <?{ $/.pos \xe2\x88\x88 (3,4,8) }> /\n
Run Code Online (Sandbox Code Playgroud)\n\n

显示:

\n\n
001\n9\nABX2\n6002\n
Run Code Online (Sandbox Code Playgroud)\n