对于文本分类项目(年龄),我正在制作我的数据的子集.我用文件名制作了3个列表,按年龄排序.我想要对这些列表进行随机播放,然后将每个混洗列表中的5000个文件名附加到新列表中.结果应该是具有15000个文件(5000 10s,5000 20s,5000 30s)的数据子集.你可以看到我到目前为止所写的内容.但我知道random.shuffle返回none和无类型对象不可迭代.我怎么解决这个问题?
def seed():
return 0.47231099848
teens = [list of files]
tweens = [list of files]
thirthies = [list of files]
data = []
for categorie in random.shuffle([teens, tweens, thirthies],seed):
data.append(teens[:5000])
data.append(tweens[:5000])
data.append(thirthies[:5000])
Run Code Online (Sandbox Code Playgroud) 我想知道在OpenStreetMap上绘制多个坐标(150 万)的直接和最快的方法是什么。
它必须能够在Jupyter Notebook 中内联显示。
我一直在尝试Folium模块和列表理解:
import folium
import datetime as dt
import random as rnd
t0 = dt.datetime.now()
#New York City Coordinates
NYC_COORD = [40.7128, -74.0059]
# Sample (0.33% over 1.5 million)
sample_coords = rnd.sample(list(coords),5000)
# Build map
map_nyc = folium.Map(location=NYC_COORD, zoom_start=12,
tiles='cartodbpositron', width=640, height=480)
# Plot coordinates using comprehension list
[folium.CircleMarker(sample_coords[i], radius=1,
color='#0080bb', fill_color='#0080bb').add_to(map_nyc)
for i in range(len(sample_coords))]
# Display map in Jupyter
map_nyc
t1 = dt.datetime.now()
print('Total time: %i seconds' % …Run Code Online (Sandbox Code Playgroud) 我已经在桌面上下载了OpenStreetMap文件,并在jupyter笔记本中使用了OSM文件。
我的代码:
import xml.etree.cElementTree as ET
osm_file = "ahmedabad_india.osm"
for event, elem in ET.iterparse(osm_file, events=("start",)):
print(elem)
# prints the Element 'osm' at 0x03A7DC08>
#<Element 'bounds' at 0x03A7DDA0>
#<Element 'node' at 0x03A7DE90>
#<Element 'tag' at 0x03A7DF08> and so on ...
Run Code Online (Sandbox Code Playgroud)
我想查看所有tagsie
<'node', 'id', 'name', ...>等的内容。
我尝试使用elem标签,但没有打印任何内容。
任何人都可以帮助我找出谁来获取标记的内容,例如节点,方式等。