如何使用正则表达式从字符串中提取double值.
import re
pattr = re.compile(???)
x = pattr.match("4.5")
Run Code Online (Sandbox Code Playgroud) 我试图在两个不同的数据框中仅提取数字和字符串。我正在使用正则表达式来提取数字和字符串。
\nimport pandas as pd\n\ndf_num = pd.DataFrame({\n \'Colors\': [\'lila1.5\', \'rosa2.5\', \'gelb3.5\', \'gr\xc3\xbcn4\', \'rot5\', \'schwarz6\', \'grau7\', \'wei\xc3\x9f8\', \'braun9\', \'hellblau10\'],\n \'Animals\': [\'hu11nd\', \'12welpe\', \'13katze\', \'s14chlange\', \'vo15gel\', \'16papagei\', \'ku17h\', \'18ziege\', \'19pferd\',\n \'esel20\']\n })\n\nfor column in df_num.columns:\n df_num[column] = df_num[column].str.extract(\'(\\d+)\').astype(float)\n\nprint(df_num)\nRun Code Online (Sandbox Code Playgroud)\n我也尝试过使用\'([\\d+][\\d+\\.\\d+])\' and \'([\\d+\\.\\d+])\'
在这里我得到了输出,但不是我所期望的。虽然我期待浮点数,但我没有得到 1.5 或 2.5。
\n我得到如下图所示的内容:
\n\ndf_str = pd.DataFrame({\n \'Colors\': [\'lila1.5\', \'rosa2.5\', \'gelb3\', \'gr\xc3\xbcn4\', \'rot5\', \'schwarz6\', \'grau7\', \'wei\xc3\x9f8\', \'braun9\', \'hellblau10\'],\n \'Animals\': [\'hu11nd\', \'12welpe\', \'13katze\', \'s14chlange\', \'vo15gel\', \'16papagei\', \'ku17h\', \'18ziege\', \'19pferd\',\n \'esel20\']\n })\n\nfor column in df_str.columns:\n …Run Code Online (Sandbox Code Playgroud) 我BeautifulSoup在 Python 中使用。
我想从网页获取可下载文件的大小。例如,这个页面有一个下载txt文件的链接(通过点击“保存”)。如何获得该文件的大小(以字节为单位)(最好不下载)?
如果 中没有选项BeautifulSoup,那么请建议 Python 内外的其他选项。
我有一个由一列字符串组成的数据框。我想提取这些字符串的数字。但是,有些值以米为单位,有些以公里为单位。我如何检测数字旁边是否有“m”或“km”,标准化单位然后将数字提取到新列?
details numbers
Distance 350m
Longest straight 860m
Top speed 305km
Full throttle 61 per cent
Run Code Online (Sandbox Code Playgroud)
期望的输出:
details numbers
Distance 350
Longest straight 860
Top speed 305000
Full throttle 61
Run Code Online (Sandbox Code Playgroud) 我想找到使用Python 3出现在字符串中的第一个浮点数.
我查看了其他类似的问题,但我无法理解它们,当我尝试实施它们时,它们不适合我的情况.
一个示例字符串
I would like 1.5 cookies please
我想从字符串中提取一个浮点数:
"{start Time : 123.24,"
Run Code Online (Sandbox Code Playgroud)
我试过这样使用re.findall:
number = re.findall("\d.\d", lines[i])
Run Code Online (Sandbox Code Playgroud)
哪里lines[i]是字符串上方。
只返回 3.2(第一个小数位)。
无论小数位数如何,如何提取浮点数?
python ×5
pandas ×2
python-3.x ×2
regex ×2
data-science ×1
dataframe ×1
file ×1
html-parsing ×1
size ×1