Notepad ++正则表达式替换混合字符

Ale*_*nev 5 regex notepad++

请帮我在记事本中为这种文本编写正则表达式

我有一个混合俄语和德语句子和单词的文本,我需要在俄语标签<"RUSSIAN">中的 一个句子之前和德语标签<"GERMAN">中的句子之前插入.像这样:

INPUT:

????? ?? ???????, ??? ??? ???, german text - ??????? ?????: german text - some other german text ??????? ????? = ??? ??????? ?????. ??????? ????? ?? ???????. A long text on german
Run Code Online (Sandbox Code Playgroud)

OUTPUT:

<"RUSSIAN">????? ?? ???????, ??? ??? ???, <"GERMAN">german text - <"RUSSIAN">??????? ?????: <"GERMAN">german text - some other german text <"RUSSIAN">??????? ????? = ??? ??????? ?????. ??????? ????? ?? ???????. <"GERMAN">A long text on german
Run Code Online (Sandbox Code Playgroud)

我猜它可以通过搜索以某种方式完成

西里尔字母,如"А,а,Б,б,В,в,Г,г,Д,д,Е,е,Ё,ё,Ж,ж,З,з,И,и,Й,й,К, к,л,л,М,м,Н,н,О,о,П,п,р,р,с,с,Т,т,У,у,Ф,ф,х,х,Ц,ц, ч,ч,Ш,ш,щ,щ,ъ,ъ,ы,ы,Ь,ь,э,э,Ю,ю,я,я"

和德语字符如"A,a,B,b,C,c,D,d,E,e,F,f,G,g,H,h,I,i,J,j,K,k,L ,L,M,M,N,N,O,O,P,P,q,q,R,R,S,S,T,T,U,U,V,V,W,W,X,X ,Y,Y,Z,Z,A,A,O,O,U,U,?"

Ale*_* K. 3

标点符号和数字使这有点不确定,但您可以匹配任何西里尔字符并捕获直到拉丁字符;

\n\n

查找: ([\xd0\x90-\xd1\x8f].+?)([a-z])
\n替换为:<ru>\\1</ru>\\2

\n\n

那么另一种语言是在</ru>和之间<ru>

\n