我如何在 Julia 中进行网页抓取？

我想从这个站点中提取大学及其网站的名称到列表中。

在 Python 中，我使用 BeautifulSoup v4 做到了：

import requests
from bs4 import BeautifulSoup
import pandas as pd

page = requests.get('https://thebestschools.org/features/best-computer-science-programs-in-the-world/')
content = BeautifulSoup(page.text, 'html.parser')

college_name = []
college_link = []
college_name_list = content.find_all('h3',class_='college')
for college in college_name_list:
    if college.find('a'):
        college_name.append(college.find('a').text)
        college_link.append(college.find('a')['href'])

Run Code Online (Sandbox Code Playgroud)

我真的很喜欢用 Julia 编程，因为它与 Python 非常相似，我想知道我是否也可以在 Julia 中进行网络抓取。任何帮助，将不胜感激。

web-scraping julia

Pse*_*erd

2020 01-21

15
推荐指数

2
解决办法

3677
查看次数

我可以通过什么方式对 Julia 函数进行基准测试？

背景

我自学了机器学习，最近开始深入研究 Julia 机器学习生态系统。

来自 python 背景并且有一些 Tensorflow 和OpenCV /skimage经验，我想将 Julia ML 库（Flux/JuliaImages）与它的同行进行基准测试，看看它真正执行CV（任何）任务的速度有多快或多慢，并决定是否我应该转而使用 Julia。

我知道如何使用这样的timeit模块来获取在 python 中执行函数所花费的时间：

#Loading an Image using OpenCV

s = """\
img = cv2.imread('sample_image.png', 1)
"""
setup = """\
import timeit
"""
print(str(round((timeit.timeit(stmt = s, setup = setup, number = 1))*1000, 2)) + " ms")
#printing the time taken in ms rounded to 2 digits

Run Code Online (Sandbox Code Playgroud)

如何使用适当的库（在本例中为JuliaImages）比较在 Julia 中执行相同任务的函数的执行时间。

Julia 是否为 …

julia flux.jl

Pse*_*erd

2021 07-21

12
推荐指数

2
解决办法

1099
查看次数