小编Pse*_*erd的帖子

我如何在 Julia 中进行网页抓取?

我想从这个站点中提取大学及其网站的名称到列表中。

在 Python 中,我使用 BeautifulSoup v4 做到了:

import requests
from bs4 import BeautifulSoup
import pandas as pd

page = requests.get('https://thebestschools.org/features/best-computer-science-programs-in-the-world/')
content = BeautifulSoup(page.text, 'html.parser')

college_name = []
college_link = []
college_name_list = content.find_all('h3',class_='college')
for college in college_name_list:
    if college.find('a'):
        college_name.append(college.find('a').text)
        college_link.append(college.find('a')['href'])
Run Code Online (Sandbox Code Playgroud)

我真的很喜欢用 Julia 编程,因为它与 Python 非常相似,我想知道我是否也可以在 Julia 中进行网络抓取。任何帮助,将不胜感激。

web-scraping julia

15
推荐指数
2
解决办法
3677
查看次数

我可以通过什么方式对 Julia 函数进行基准测试?

背景

我自学了机器学习,最近开始深入研究 Julia 机器学习生态系统。


来自 python 背景并且有一些 Tensorflow 和OpenCV /skimage经验,我想将 Julia ML 库(Flux/JuliaImages)与它的同行进行基准测试,看看它真正执行CV(任何)任务的速度有多快或多慢, 并决定是否我应该转而使用 Julia。

我知道如何使用这样的timeit模块来获取在 python 中执行函数所花费的时间:

#Loading an Image using OpenCV

s = """\
img = cv2.imread('sample_image.png', 1)
"""
setup = """\
import timeit
"""
print(str(round((timeit.timeit(stmt = s, setup = setup, number = 1))*1000, 2)) + " ms")
#printing the time taken in ms rounded to 2 digits
Run Code Online (Sandbox Code Playgroud)

如何使用适当的库(在本例中为JuliaImages)比较在 Julia 中执行相同任务的函数的执行时间。

Julia 是否为 …

julia flux.jl

12
推荐指数
2
解决办法
1099
查看次数

标签 统计

julia ×2

flux.jl ×1

web-scraping ×1