小编tha*_*rey的帖子

将元素添加到初始化 C# 之外的元组

我是编程新手,我创建了一个元组列表

var tupleList = new List<Tuple<string, string>> { };
Run Code Online (Sandbox Code Playgroud)

稍后在代码中,我想添加一个元素,如

tupleList.Add(string1,string2);
Run Code Online (Sandbox Code Playgroud)

但是 .Add 不知何故不支持这个?

基本上,我正在经历一个循环并添加到元组,然后我想在元组中搜索示例字符串,所以我的第二个问题是我将如何搜索 tupleList.Item1 并获得所有相等的对,例如示例字符串 10?我看到了一个关于字典值的答案,但我可以对元组做同样的事情吗?

var matches = tupleList.Where(pair => pair.Item1.Equals(string10))
                  .Select(pair => Item2.Key);
Run Code Online (Sandbox Code Playgroud)

我不知道这是否有意义,这是原始代码:

var matches = dict.Where(pair => pair.Value == "abc")
                  .Select(pair => pair.Key);
Run Code Online (Sandbox Code Playgroud)

c# tuples

2
推荐指数
1
解决办法
2761
查看次数

Python 网页抓取,如果错误则跳过 url

我正在尝试抓取一个网站(大约 7000 个链接,全部在一个列表中),由于我的方法,它需要很长时间,我想我对此没有意见(因为这意味着不被发现)。但是,如果我在尝试检索页面时遇到任何类型的错误,我可以跳过它吗?现在,如果出现错误,代码就会中断并给出一堆错误消息。这是我的代码:

Collection是列表的列表和结果文件。基本上,我试图运行一个循环get_url_data()(我有一个之前的问题要感谢),我的所有网址都在urllist. 我有一个叫做HTTPError但似乎不能处理所有错误的东西,因此这篇文章。在相关的支线任务中,获得无法处理的网址列表也很好,但这不是我主要关心的问题(但如果有人能告诉我如何处理,那就太酷了)。

Collection=[]
def get_url_data(url):

    try:
        r = requests.get(url, timeout=10)
        r.raise_for_status()

    except HTTPError:
        return None

    site = bs4.BeautifulSoup(r.text)
    groups=site.select('div.filters')
    word=url.split("/")[-1]

    B=[]
    for x in groups:
        B.append(word)
        T=[a.get_text() for a in x.select('div.blahblah [class=txt]')]
        A1=[a.get_text() for a in site.select('div.blah [class=txt]')]
        if len(T)==1 and len(A1)>0 and T[0]=='verb' and A1[0]!='as in':
            B.append(T)
            B.append([a.get_text() for a in x.select('div.blahblah [class=ttl]')])
            B.append([a.get_text() for a in x.select('div.blah [class=text]')])
            Collection.append(B)
        B=[]

for url in urllist:
    get_url_data(url)
Run Code Online (Sandbox Code Playgroud)

我认为主要的错误代码是这个,它触发了其他错误,因为有一堆以During handling …

python error-handling web-scraping python-requests

0
推荐指数
1
解决办法
5863
查看次数