我有 2 个文本文件 (*.txt),其中包含以下格式的唯一字符串:
udtvbacfbbxfdffzpwsqzxyznecbqxgebuudzgzn:refmfxaawuuilznjrxuogrjqhlmhslkmprdxbascpoxda
ltswbjfsnejkaxyzwyjyfggjynndwkivegqdarjg:qyktyzugbgclpovyvmgtkihxqisuawesmcvsjzukcbrzi
Run Code Online (Sandbox Code Playgroud)
第一个文件包含5000 万行(4.3 GB),第二个包含100 万行(112 MB)。一行包含 40 个字符、分隔符 : 和另外 45 个字符。
任务:获取两个文件的唯一值。也就是说,您需要一个csv 或 txt文件,其中的行在第二个文件中而不在第一个文件中。
我正在尝试使用vaex ( Vaex )来做到这一点:
import vaex
base_files = ['file1.txt']
for i, txt_file in enumerate(base_files, 1):
for j, dv in enumerate(vaex.from_csv(txt_file, chunk_size=5_000_000, names=['data']), 1):
dv.export_hdf5(f'hdf5_base/base_{i:02}_{j:02}.hdf5')
check_files = ['file2.txt']
for i, txt_file in enumerate(check_files, 1):
for j, dv in enumerate(vaex.from_csv(txt_file, chunk_size=5_000_000, names=['data']), 1):
dv.export_hdf5(f'hdf5_check/check_{i:02}_{j:02}.hdf5')
dv_base = vaex.open('hdf5_base/*.hdf5')
dv_check = vaex.open('hdf5_check/*.hdf5')
dv_result = dv_check.join(dv_base, on='data', …Run Code Online (Sandbox Code Playgroud) 我有一个很大的域列表,我需要检查域现在是否可用。我这样做:
import requests
list_domain = ['google.com', 'facebook.com']
for domain in list_domain:
result = requests.get(f'http://{domain}', timeout=10)
if result.status_code == 200:
print(f'Domain {domain} [+++]')
else:
print(f'Domain {domain} [---]')
Run Code Online (Sandbox Code Playgroud)
但是检查太慢了。有没有办法让它更快?也许有人知道检查域是否存在的替代方法?
我有下拉列表。我想将“标题 1234 ”放在下拉列表的第一个位置。重要的是,当选择“标题1234”时,它的值为1234。我应该怎么做?
要像这样得到它:
现在列表看起来像这样:
Vue.createApp({
data: () => ({
model: 'title 1234',
options: {
1234: 'title 1234',
1: 'title 1',
2: 'title 2',
3: 'title 3',
10: 'title 10',
},
})
}).mount('#app')Run Code Online (Sandbox Code Playgroud)
<div id="app">
<select v-model="model">
<option v-for="option in options">
{{ option }}
</option>
</select>
<span>Value: {{ model }}</span>
</div>
<script src="https://unpkg.com/vue@next"></script>
<script src="app.js"></script>Run Code Online (Sandbox Code Playgroud)