问题列表 - 第25377页

如何使用标准库在python中解析格式错误的HTML

python中内置了很多html和xml库,很难相信不支持实际的HTML解析.

我已经为这个任务找到了很多很棒的第三方库,但是这个问题是关于python标准库的.

要求:

  • 仅使用Python标准库组件(任何2.x版本)
  • DOM支持
  • 处理HTML实体( )
  • 手柄部分文件(如:Hello, <i>World</i>!)

奖励积分:

  • XPATH支持
  • 处理未封闭/格式错误的标签.(<big>does anyone here know <html ???

根据要求,这是我的90%解决方案.这适用于我尝试过的有限的HTML集,但正如每个人都可以清楚地看到的那样,这并不完全可靠.因为我通过盯着文档15分钟和一行代码来做到这一点,我想我可以咨询stackoverflow社区以获得类似但更好的解决方案......

from xml.etree.ElementTree import fromstring
DOM = fromstring("<html>%s</html>" % html.replace('&nbsp;', '&#160;'))
Run Code Online (Sandbox Code Playgroud)

html python parsing dom html-parsing

37
推荐指数
2
解决办法
1万
查看次数

Mysql - 想知道如何扩展类似Twitter的应用程序?

我正在开发一个与twitter模糊相似的应用程序,因为它允许用户互相关注.我想使用谷歌应用程序引擎来实现这一点,因为它的可扩展性承诺,但由于几个不同的原因,它被证明很难运行.

如果我使用mysql这样做,我会有一个_users表和一个_followers表.用户进入用户表,关注者关系进入_followers.问题是,当用户开始跟随彼此时,users表中的每一行可能在_followers表中有100个相应的记录.所以行数会迅速爆炸.

使用app引擎,卷[不应该]是一个问题.

如果我使用mysql,并且我确实开始获得一些牵引力,我该如何扩展它?我最终还是会最终转移到分布式数据库?我应该用谷歌应用引擎来解决这个问题吗?我读到Twitter正在使用mysql,他们遇到了这个问题,现在转向cassandra.

谢谢

mysql

2
推荐指数
1
解决办法
173
查看次数

Android:你会如何让Buttons在一段时间内无法点击?

我有一些我想要无法点击的按钮(但仍然出现在屏幕上),直到另一个进程(线程)完成其工作?你会怎么做?

目标是避免我的用户继续点击此按钮,因此,每次点击它时都会启动一个新线程...

android onclick button

3
推荐指数
1
解决办法
4435
查看次数

在php中检测iPad?

如何为iPad观众提供不同的页面?

php ipad

5
推荐指数
2
解决办法
2万
查看次数

Android - 生命周期并保存实例状态问题

因此,在我的应用程序中是一个用于创建新用户的表单,其中包含有关用户的相关详细信息和信息.这里没有问题,只是当用户离开活动而没有按下确认按钮时会发生什么.

这就是我想要做的事情:

  1. 如果用户按下后退按钮,则尝试将所有数据保存到数据库并通知用户.
  2. 如果活动中断(即通过电话呼叫),将所有数据保存到临时位置,这样当活动再次位于堆栈顶部时,似乎没有任何更改(但数据仍未保存)到数据库).
  3. 如果活动在后台获取更多资源而被杀死,请执行与上面第2点相同的操作(即,当活动再次启动时,似乎没有任何更改).
  4. 如果再次启动整个应用程序(再次单击图标)并且存在从上面的点2或3存储的临时数据,则导航到"创建用户"活动并显示数据,就好像未更改.

以下是我目前正在尝试的方法:

  • 使用onDestroy()isFinishing()函数来查找活动被杀死的时间,以覆盖上面的第1点(然后尝试并保存所有数据).
  • 将所有数据保存onSaveInstanceState到一个包中(以覆盖上面的第2点)
  • 创建的包是否会onSaveInstanceState因为更多资源而被杀死的活动存活下来,因此当重新创建它时,可以检索以前的状态(如上面的第3点)?
  • 不知道如何实施第4点.

任何帮助都将受到大力赞赏.

干杯!

lifecycle android

6
推荐指数
1
解决办法
5513
查看次数

恢复git-svn克隆

我开始使用git-svn的克隆操作克隆SVN存储库.导入大约6个小时后(这是一个很大的回购),我的电脑就睡着了.有没有办法在不重做所有初始工作的情况下恢复操作?

git git-svn

113
推荐指数
4
解决办法
2万
查看次数

覆盖继承的泛型方法

我在基类中有这个代码

 protected virtual bool HasAnyStuff<TObject>(TObject obj) where TObject:class 
  {
      return false;
  }
Run Code Online (Sandbox Code Playgroud)

在儿童班,我压倒一切

protected override bool HasAnyStuff<Customer>(Customer obj) 
  {
    //some stuff
      if Customer.sth etc
      return false;
  }
Run Code Online (Sandbox Code Playgroud)

我收到了这个错误

'''类型参数声明必须是标识符而不是类型'''

我在这做错了什么?

c# generics

25
推荐指数
2
解决办法
3万
查看次数

PHP MySQL查询

该代码有什么问题?

$ sql =“选择*来自博客的地方blog_id = $'blog_id'”;
$ result = mysql_query($ sql);
$ rows = mysql_fetch_array($ result);
$ content = $ rows ['blog_content'];

echo $ content;

错误是:警告:mysql_fetch_array():提供的参数在第3行的C:\ Program Files \ xampp \ htdocs \ jordan_pagaduan \ blog_delete_edit.php中不是有效的MySQL结果资源。

php mysql

0
推荐指数
1
解决办法
171
查看次数

应用一些基本宏来简化大型项目中的代码是一个好主意吗?

我已经在基础c ++库上工作了一段时间,而且我有很多想法可以真正简化代码编写和管理过程.其中之一是引入一些宏来帮助简化经常出现的语句,但比必要时复杂一点.

例如,我想出了这个基本宏来简化最常见的for循环类型:

#define loop(v,n) for(unsigned long v=0; v<n; ++v)
Run Code Online (Sandbox Code Playgroud)

这将使您能够替换那些看起来如此笨重的笨重的循环:

for (int i = 0; i < max_things; i++)
Run Code Online (Sandbox Code Playgroud)

使用更容易编写的内容,甚至更高效:

loop (i, max_things)
Run Code Online (Sandbox Code Playgroud)

使用这样的约定是一个好主意吗?使用不同类型的编译器可能会遇到任何问题吗?对于不熟悉宏的人来说,这会让人感到困惑吗?

c++ macros project-planning coding-style

8
推荐指数
1
解决办法
440
查看次数

蓝牙仿真器/模拟器

什么是最好的蓝牙模拟器/模拟器?

我有一个安全课程的项目,我选择了蓝牙作为我的主题。

我需要使用蓝牙模拟器创建加密算法并对其进行测试。我已经搜索过最好的模拟器,结果是谷歌的Android模拟器,还有NS2。

有没有其他选择?

我喜欢使用的编程语言是 C、C++ 和 C#。

Java 也不是问题,但我更喜欢可以让我使用上述任何一种语言的模拟器。

c c# bluetooth

5
推荐指数
1
解决办法
445
查看次数