在某些情况下,来自服务器的响应被包装在 DIV 标签中,如下所示:
<div id="marker-aab44ba9d64a41398ed97a251dfb938e-629">42</div>
Run Code Online (Sandbox Code Playgroud)
标签的内容可以是任何内容:字符串、数字、URL、javascript 数组、javascript 对象。
标签的格式始终为:
<div id="marker-[random string here]">content</div>
Run Code Online (Sandbox Code Playgroud)
我想使用正则表达式去除标签,我该怎么做?
请记住:服务器的响应可能只是没有包装 DIV 的内容,因此正则表达式应该考虑到这一点。
我有一个 CSV 文件,我正在阅读该文件,如下所示。我需要获取所有字符串的第一个单词。我知道如何获得第一个字母,但我不确定如何获得单词。
['diffuse systemic sclerosis', 'back', 'public on july 15 2008']
['diffuse systemic sclerosis', 'forearm', 'public on may 9 2014']
Run Code Online (Sandbox Code Playgroud)
我希望我的输出是
diffuse
back
public
forearm
Run Code Online (Sandbox Code Playgroud) 我正在使用Ruby on Rails 4.2.7。我无法从变量中删除空白。我不知道它是哪种空白。有没有万无一失的剥离方法?当我从某个变量剪切并粘贴时,我无法剥离空格,但是,当我键入空格时,一切都很好。请参阅下面的控制台:
2.3.0 :004 > test = " 21"
=> " 21"
2.3.0 :005 > test.strip
=> " 21"
Run Code Online (Sandbox Code Playgroud)
我已经从其他来源剪切并粘贴了空白,并且没有剥离空白。有什么办法可以对变量使用某种万无一失的剥离方法吗?
我有一个像这样的字符串:
la lala 135 1039 921\r\n
Run Code Online (Sandbox Code Playgroud)
我无法删除\r\n.
最初这个字符串是一个字节对象,但后来我将它转换为字符串
我试着用.strip("\r\n")与.replace("\r\n", "")但没有...
给定一个示例数据框,其中包含自由文本的第二列和第三列
>>> import pandas as pd
>>> lol = [[1,2,'abc','foo\nbar'], [3,1, 'def\nhaha', 'love it\n']]
>>> pd.DataFrame(lol)
0 1 2 3
0 1 2 abc foo\nbar
1 3 1 def\nhaha love it\n
Run Code Online (Sandbox Code Playgroud)
目标是替换为\nto (空格)并剥离第2列和第3列中的字符串,以实现:
>>> pd.DataFrame(lol)
0 1 2 3
0 1 2 abc foo bar
1 3 1 def haha love it
Run Code Online (Sandbox Code Playgroud)
如何通过熊猫数据框用特定列的空格替换换行符?
我已经试过了:
>>> import pandas as pd
>>> lol = [[1,2,'abc','foo\nbar'], [3,1, 'def\nhaha', 'love it\n']]
>>> replace_and_strip = lambda x: x.replace('\n', ' ').strip()
>>> lol2 = …Run Code Online (Sandbox Code Playgroud) 我正在使用Ruby 2.4.如何将复杂函数映射到我的字符串数组中的每个元素?功能是
elt.gsub!(/\A\p{Space}+|\p{Space}+\z/, '')
Run Code Online (Sandbox Code Playgroud)
假设"elt"是我的字符串数组中的一个元素.这是一个美化的"条带"功能.我想将它应用于我的数组中的每个项目.
我正在尝试\n使用strip()命令从句子中删除字符,但它似乎不起作用。
str1 = "Hello World \n, I\n am \nhere"
print(str1.strip())
Run Code Online (Sandbox Code Playgroud)
输出
Hello World
, I
am
here
Run Code Online (Sandbox Code Playgroud) 我有一对绳子。在这种情况下,让我们将它们视为分配给唯一变量的两个单独的字符串。这些字符串具有相同的长度:
var1 = 'AnAppleADayKeepsTheDoctorAway'
var2 = '000Ig00000noranceIsBliss00000'
Run Code Online (Sandbox Code Playgroud)
我知道在 Python 中从字符串中去除开头和结尾字符的最有效方法是以下方法strip():
print(var2.strip('0'))
'Ig00000noranceIsBliss'
Run Code Online (Sandbox Code Playgroud)
我想从字符串中删除相同数量的字符var1,因为它们是“对”。在这种情况下,将删除前三个字符和尾随五个字符,即
'ppleADayKeepsTheDocto'
Run Code Online (Sandbox Code Playgroud)
有没有一种方法可以让我有效地去除像 in 这样的字符var1,然后跟踪这些字符的数量,以便对第二个字符串执行相同的操作var2?我不确定strip()这是否是完成这项任务的最佳方法。
编辑:显然,有一个解决方案。
例如
length_original = len(var2)
num_left_chars = len(var2) - len(var2.lstrip('0'))
num_right_chars = len(var2.rstrip('0'))
edited = var1[num_left_chars:num_right_chars]
print(edited)
## printed
## 'ppleADayKeepsTheDocto'
Run Code Online (Sandbox Code Playgroud)
我正在寻找有效的解决方案。是否有更快的 Pythonic 方法?
我只想删除我的数据(整个数据帧)中的空格。
import pandas as pd
fileName = 'home/filepath.xlsx'
df = pd.read_excel(fileName, sheet_name='october2018')
Run Code Online (Sandbox Code Playgroud)
df = df.apply(lambda x: x.str.strip() if x.dtype == "object" else x)
Run Code Online (Sandbox Code Playgroud)
如果有帮助的话,每行中的 ID 号都是一个超链接。整个列中的数据被擦除,只留下具有 NaN 值的列名称,如上所示。在另一列AppID中,数据例如“123456”也被删除。如何去除整个数据框中的空格而不必删除其他任何内容?
Date AppID App Name IDNumber Decision
2018-10-01 com.android myapp1 NaN Approve
2018-10-01 com.android myapp2 NaN Approve
2018-10-01 com.android myapp3 NaN Approve
2018-10-01 com.android myapp4 NaN Approve
2018-10-01 NaN iOSapp1 NaN Approve
Run Code Online (Sandbox Code Playgroud) 我的问题很简单,我试图从字符串中删除任何不是 AZ 或 0-9 的字符。
基本上这是我想要做的过程:
whitelist=['a',...'z', '0',...'9']
name = '_abcd!?123'
name.strip(whitelist)
print(name)
>>> abcd123
Run Code Online (Sandbox Code Playgroud)
重要的是要知道我不能只打印名称中的有效字符。我需要实际使用处于更改状态的变量。
strip ×10
python ×7
string ×5
python-3.x ×4
pandas ×2
replace ×2
ruby ×2
arrays ×1
html ×1
javascript ×1
list ×1
newline ×1
regex ×1
split ×1
whitespace ×1