问题列表 - 第8000页

使用Regex从html链接获取"标题"属性

我有以下正则表达式匹配从我们的自定义cms生成的页面上的所有链接标记

<a\s+((?:(?:\w+\s*=\s*)(?:\w+|"[^"]*"|'[^']*'))*?\s*href\s*=\s*(?<url>\w+|"[^"]*"|'[^']*')(?:(?:\s+\w+\s*=\s*)(?:\w+|"[^"]*"|'[^']*'))*?)>.+?</a>
Run Code Online (Sandbox Code Playgroud)

我们使用c#循环遍历所有匹配项,并在呈现页面内容之前为每个链接添加onclick事件(用于跟踪软件).我需要解析链接并向onclick函数添加一个参数,即"链接名称".

我打算修改正则表达式以获得以下子组

  • 链接的title属性
  • 如果链接包含图像标记,请获取图像的替代文本
  • 链接的文字

然后,我可以检查每个子组的匹配,以获取链接的相关名称.

我如何修改上述正则表达式来执行此操作,还是可以使用c#代码实现相同的思路?

.net html c# regex

0
推荐指数
1
解决办法
6747
查看次数

替代换行符?蟒蛇

我正在寻找一种只用一个字符代表'\n'的方法.我正在编写一个使用字典来"加密"文本的程序.因为每个字符都在字典中表示,当我的程序到达字符串中的'\n'时,我遇到了问题,但是将其读作'\''n'.是否有替代方式来表示换行符,即只有一个字符?这是我的下面的代码,对不起,如果某些缩进搞砸了.我不完全理解如何在此窗口中输入代码.:)

##################################
#This program will take an input and encrypt it or decrypt it
#A cipher is used to transform the text, which can either be
#input or from a text file.
#The cipher can be any letter a-z, as well as most commonly used special characters
#numbers and spaces are not allowed.
#For the text, a-z, most special characters, space, and new line may be used.
#no numbers can be encrypted.
##################################

#These three dictionaries are used during the …
Run Code Online (Sandbox Code Playgroud)

python

0
推荐指数
1
解决办法
9587
查看次数

Subversion状态符号"〜"是什么意思?

当我做一个时,我会得到一个波浪符号svn status.

这是在XCode中编辑项目后的项目输出.

svn status
M      build/Currency_Converter.build/Currency_Converter.pbxindex/imports.pbxbtree
M      build/Currency_Converter.build/Currency_Converter.pbxindex/pbxindex.header
M      build/Currency_Converter.build/Currency_Converter.pbxindex/symbols0.pbxsymbols
~      build/Currency_Converter.build/Currency_Converter.pbxindex/strings.pbxstrings
M      main.m
//more changed files
Run Code Online (Sandbox Code Playgroud)

知道这意味着什么吗?似乎无法在谷歌或任何svn备忘单上找到它.

有趣的是,我只编辑了main.m,但是有很多修改过的文件.不知道为什么会这样.任何人有任何使用SVN和XCode的技巧?我应该只将我的源文件置于版本控制之下吗?

编辑: - 由已在版本控制下的文件替换为另一种类型的文件引起的.在这种情况下,strings.pbxstrings曾经是一个文件,现在变成了一个目录.故事的道德是不要将您的构建文件夹置于版本控制中.

svn xcode status

109
推荐指数
6
解决办法
7万
查看次数

奇怪的python行为

我很无聊并且玩ipython控制台并且遇到了以下我不太了解的行为

In [1]: 2**2
Out[1]: 4

In [2]: 2**2**2
Out[2]: 16

In [3]: 2**2**2**2
Out[3]: 65536

In [4]: 2**2**2**2**2 
Run Code Online (Sandbox Code Playgroud)

[4]的答案不是 4294967296L,这是一个非常长的数字,但我无法弄清楚为什么.

这个数字可以在这里找到:http://pastie.org/475714

(Ubuntu 8.10,python 2.5.2,ipython 0.8.4)
(Mac OS X 10.5.6,Python 2.5.1)

python ipython

7
推荐指数
2
解决办法
362
查看次数

如何使用SQL查找表中的第一列和第一行

我被问到这个问题而无法得出答案.

有没有办法在表格的第一行和第一列找到条目?

(在矩阵表示法中,那将是[1,1]th位置)

mysql sql database oracle

2
推荐指数
1
解决办法
2万
查看次数

我应该如何为从Django调用的长时间进程存储状态?

我正在开发一个允许用户上传文件的Django应用程序.我需要在将这些文件发送到Amazon S3之前对这些文件执行一些服务器端处理.在阅读了对这个问题本博客文章的回复之后,我决定处理这个问题的最佳方式是让我的视图处理程序在Pyro远程对象上调用一个方法来异步执行处理,然后立即将Http 200返回给客户端.我有这个原型的,它似乎运作良好,但是,我也想保存处理的状态,使客户可以轮询应用程序,查看该文件已被处理并上传到S3.

我可以很容易地处理轮询,但我不确定存储进程状态的适当位置.它需要由Pyro进程写入并且可以通过我的轮询视图读取.

  • 我不愿意在数据库中添加列,这些数据应该只持续30到60秒.
  • 我曾考虑使用Django的低级缓存API并使用文件ID作为密钥,但是,我不相信这正是缓存框架的设计目标,我不确定可能存在哪些无法预料的问题.这条路线.
  • 最后,我已经考虑在Pyro对象中存储状态进行处理,但是我似乎还需要添加一个布尔"processing_complete"数据库列,以便视图知道是否从Pyro对象查询状态.

当然,还有一些数据完整性问题与数据库的解耦状态(如果服务器发生故障并且所有这些数据都在内存中会发生什么?).我将听到更多经验丰富的Web应用程序开发人员将如何处理这种状态处理.

python django asynchronous amazon-s3 pyro

5
推荐指数
2
解决办法
1565
查看次数

从维基百科获取信息 - 如何获取HTML表单?

我正在使用curl从维基百科中检索信息.到目前为止,我已成功检索基本文本信息,但我真的想要用HTML检索它.

这是我的代码:

$s = curl_init();       

$url = 'http://boss.yahooapis.com/ysearch/web/v1/site:en.wikipedia.org+'.$article_name.'?appid=myID';
curl_setopt($s,CURLOPT_URL, $url);
curl_setopt($s,CURLOPT_HEADER,false);
curl_setopt($s,CURLOPT_RETURNTRANSFER,1);

$rs = curl_exec($s);

$rs = Zend_Json::decode($rs);

$rs = ($rs['ysearchresponse']['resultset_web']);

$rs = array_shift($rs);
$article= str_replace('http://en.wikipedia.org/wiki/', '', $rs['url']);

$url = 'http://en.wikipedia.org/w/api.php?';
$url.='format=json';
$url.=sprintf('&action=query&titles=%s&rvprop=content&prop=revisions&redirects=1', $article);

curl_setopt($s,CURLOPT_URL, $url);
curl_setopt($s,CURLOPT_HEADER,false);
curl_setopt($s,CURLOPT_RETURNTRANSFER,1);

$rs = curl_exec($s);
//curl_close( $s );
$rs = Zend_Json::decode($rs);

$rs = array_pop(array_pop(array_pop($rs)));
$rs = array_shift($rs['revisions']);
$articleText = $rs['*'];
Run Code Online (Sandbox Code Playgroud)

然而,以这种方式检索的文本不足以显示:(它全部采用这种格式

'''Aix-les-Bains'''[[Savoie]] [[法国部门]] [[罗纳 - 阿尔卑斯]] [[地区] [[Communes of France | commune]法国|地区]]在东南[[法国]].

铁路北[尚贝里]它位于靠近[紫胶杜歇] {简称=上} {转换| 9 |千米| |英里}.

==历史=='''Aix''源于[[拉丁文]]''Aquae''(字面意思是"水";''cf''[[Aix-la-Chapelle]](亚琛)或[[Aix] -en-Provence]]),Aix在[[罗马帝国]]期间洗澡,甚至在它被重新命名为'Aquae Gratianae'以纪念[[格拉蒂安皇帝]],在不远处被暗杀, [[里昂]],[[383]].许多罗马遗体幸存下来.[[Image:IMG 0109 Lake …

php wikipedia zend-framework

2
推荐指数
1
解决办法
3393
查看次数

find命令的"exec"功能可以在后台启动程序吗?

我想做的事情如下:

find . -iname "*Advanced*Linux*Program*" -exec kpdf {} & \;
Run Code Online (Sandbox Code Playgroud)

可能?还有其他可比的方法吗?

unix linux bash

2
推荐指数
1
解决办法
2726
查看次数

以编程方式从iPhone检索运营商名称

有没有办法以编程方式知道iPhone上的手机载体?

我正在寻找iPhone连接的运营商名称.

iphone cocoa-touch core-telephony

44
推荐指数
3
解决办法
3万
查看次数

将List <String>编码为纯String并将其解码回来的最简单方法是什么?

我想我已经遇到过这个要求十几次了.但我永远找不到令人满意的解决方案.例如,有一个字符串集合,我想通过一个只允许普通字符串的通道序列化(到磁盘或通过网络).我几乎总是最终使用"分裂"和"加入"与荒谬的分隔符

"::: == - == :::".

像这样:

public static string encode(System.Collections.Generic.List<string> data)
{
    return string.Join(" :::==--==::: ", data.ToArray());
}
public static string[] decode(string encoded)
{
    return encoded.Split(new string[] { " :::==--==::: " }, StringSplitOptions.None);
}
Run Code Online (Sandbox Code Playgroud)

但这个简单的解决方案显然存在一些缺陷.该字符串不能包含分隔符字符串.因此,编码的字符串不能再重新编码.

AFAIK,全面的解决方案应该包括在编码时转义分隔符并在解码时取消转换.虽然问题听起来很简单,但我相信完整的解决方案可能会占用大量代码.我想知道是否有任何技巧允许我在很少的代码行中构建编码器和解码器?

c# serialization

5
推荐指数
3
解决办法
4649
查看次数