我对使用Python进行网络抓取非常陌生,而且我真的很难从HTML中提取嵌套文本(确切地说是p在内部div).这是我到目前为止所得到的:
from bs4 import BeautifulSoup
import urllib
url = urllib.urlopen('http://meinparlament.diepresse.com/')
content = url.read()
soup = BeautifulSoup(content, 'lxml')
Run Code Online (Sandbox Code Playgroud)
这很好用:
links=soup.findAll('a',{'title':'zur Antwort'})
for link in links:
print(link['href'])
Run Code Online (Sandbox Code Playgroud)
这个提取工作正常:
table = soup.findAll('div',attrs={"class":"content-question"})
for x in table:
print(x)
Run Code Online (Sandbox Code Playgroud)
这是输出:
<div class="content-question">
<p>[...] Die Verhandlungen über die mögliche Visabefreiung für
türkische Staatsbürger per Ende Ju...
<a href="http://meinparlament.diepresse.com/frage/10144/" title="zur
Antwort">mehr »</a>
</p>
</div>
Run Code Online (Sandbox Code Playgroud)
现在,我想在p和中提取文本/p.这是我使用的代码:
table = soup.findAll('div',attrs={"class":"content-question"})
for x in table:
print(x['p'])
Run Code Online (Sandbox Code Playgroud)
然而,Python提出了一个KeyError.
我创建了一个文本文件并使用以下命令在Python中打开它:
for word_in_line in open("test.txt"):
Run Code Online (Sandbox Code Playgroud)
循环遍历txt文件中的一行中的单词.
文本文件只有一行,即:
int 111 = 3 ;
Run Code Online (Sandbox Code Playgroud)
当我使用.split()以下列表制作时:
print("Input: {}".format(word_in_line))
line_list = word_in_line.split()
Run Code Online (Sandbox Code Playgroud)
它创建:
['int', '111', '=', '3', ';']
Run Code Online (Sandbox Code Playgroud)
而我正在寻找一种方法来检查if line_list[1]('111')是否为整数.
但是,当我尝试时type(line_list[1]),它说它是str因为''.
我的目标是读取txt文件,看看它是整数还是str或其他数据类型等.
在passport.js 中有一些我不明白的东西。
1.
var passport = require('passport')
, LocalStrategy = require('passport-local').Strategy;
passport.use(new LocalStrategy(
function(username, password, done) {
User.findOne({ username: username }, function (err, user) {
if (err) { return done(err); }
if (!user) {
return done(null, false, { message: 'Incorrect username.' });
}
if (!user.validPassword(password)) {
return done(null, false, { message: 'Incorrect password.' });
}
return done(null, user);
});
}
));Run Code Online (Sandbox Code Playgroud)
null在done()函数中代表什么。它似乎总是第一个参数,我对它的实际作用感到困惑?
2.
passport.serializeUser(function(user, cb) {
cb(null, user);
});
passport.deserializeUser(function(obj, cb) {
cb(null, obj);
});Run Code Online (Sandbox Code Playgroud)
序列化和反序列化有什么作用?当会话存储在浏览器中时,是否在登录后调用序列化?反序列化是在访问页面时,会话在服务器上反序列化以验证该用户?
最后又是什么 …
因为在我的头脑中分解二次方程只是发生了,并且自从我学会了之后就已经这样做了 - 我将如何开始在Python中编写二次方因子?
代码看起来像这样:
<img style='border-color:green;border-radius:1px;' src='/Pic.jpg' width='25px' height='25px'/>
Run Code Online (Sandbox Code Playgroud)
这适用于IE 9,但不适用于Chrome版本28.0.1500.72.我没有得到绿色边框颜色.
这有什么不对?有没有解决此问题的解决方法?
我有一堆英语句子,我从文本文件中提取到MYSQL表.这就是我在MYSQL中创建表的方法:
create table sentences ( ID int NOT NULL AUTO_INCREMENT , sentence varchar (255) , primary key (ID) ) character set = utf8;
Run Code Online (Sandbox Code Playgroud)
这是我的python脚本
from bs4 import BeautifulSoup as b
import sys
from fixsentence import *
import MySQLdb as db
bound = sys.argv[1]
con = db.connect('localhost' , 'root' , 'ayrefik1' , 'knowledgebase2')
curs = con.cursor()
def gettext(file):
temp_file = open(file)
soup = b(temp_file)
list = get_sentences(soup.get_text())
for x in list:
curs.execute('SET NAMES utf8;')
curs.execute('insert ignore into sentences (sentence) values (%s);', …Run Code Online (Sandbox Code Playgroud) 我有一个 JSON 字符串,我将它作为字符串存储在数据库中。在前端,我将此 JSON 渲染为对象。
我在用:
JSON.parse(string);
Uncaught Syntax error: Unexpected Token
Run Code Online (Sandbox Code Playgroud)
细绳 :
{
"id": "295cd59f-4033-438c-9bf4-c571829f134e",
"from": "Shrisha S.<shrisha@s.com>",
"to": [
"Katie Porter <katie.porter@ss.com>"
],
"cc": [
"Jack d<jack.d@dd.com>, Keerthi<keerthi.s@dd.com>"
],
"bcc": [
]
}
Run Code Online (Sandbox Code Playgroud)
有什么方法可以检查 JSON 在 JAVA 中是否有效?
这里要注意的一件事是,我没有为 JSON 定义的模式可以映射到,即 JSON 可以容纳任何东西。
我目前正在尝试,JACKSON但为此我需要一个我没有的预定义模式。无论如何这可以解决吗?
我试图在<p>标签中添加占位符,我尝试了以下方式,但dint工作.
我需要在<p>标记中使用占位符,它应该替换为输入文本中的值.
$( "#incharge" )
.keyup(function() {
var value = $( this ).val();
$( "p#incharge" ).text( value );
})
.keyup();Run Code Online (Sandbox Code Playgroud)
<!-- Latest compiled and minified CSS -->
<link rel="stylesheet" href="https://maxcdn.bootstrapcdn.com/bootstrap/3.3.5/css/bootstrap.min.css">
<!-- Optional theme -->
<link rel="stylesheet" href="https://maxcdn.bootstrapcdn.com/bootstrap/3.3.5/css/bootstrap-theme.min.css">
<!-- Latest compiled and minified JavaScript -->
<script src="https://maxcdn.bootstrapcdn.com/bootstrap/3.3.5/js/bootstrap.min.js"></script>
<script src="https://ajax.googleapis.com/ajax/libs/jquery/2.1.1/jquery.min.js"></script>
<input type="text" placeholder="The manager in charge name" data-toggle="tooltip" data-placement="right" id="incharge" name="incharge" title="Provide The manager in charge name">
<br>
<br>
<p id="incharge" placeholder="Some Placeholder text comes here"></p>Run Code Online (Sandbox Code Playgroud)
在iOS 9中,当我从表格导航到导航控制器时,导航栏和标签栏消失.结果,我的用户将被软管.怎么解决?
我的StoryBoard结构基本上是这样的:
->Tab Bar Controller->Nav Controller->Table View->Nav Controller->Table View->....
Run Code Online (Sandbox Code Playgroud)
当我在第一个表视图中选择一行时,会出现segue,但标签栏和后退按钮会消失.
请注意右图中缺少的部分.
已提交DTS请求,几个月前已报告错误等.
我有这个简单的小程序,它不起作用.我希望程序不断询问用户我的名字,直到他们猜到.
第一次尝试后,程序将抛出错误消息.我无法解决问题所在.
name = "not_aneta"
while name != "aneta":
name = input("What is my name? ")
if name == "aneta":
print "You guessed my name!"
Run Code Online (Sandbox Code Playgroud)
当我运行它时,我收到一条错误消息:
Traceback (most recent call last):
File "C:\Users\Aneta\Desktop\guess_my_name.py", line 4, in <module>
name = input("What is my name? ")
File "<string>", line 1, in <module>
NameError: name 'aneta' is not defined
Run Code Online (Sandbox Code Playgroud) python ×5
javascript ×2
browser ×1
css ×1
express ×1
html ×1
html5 ×1
ios ×1
ios9 ×1
jackson ×1
java ×1
jquery ×1
json ×1
math ×1
mysql ×1
node.js ×1
passport.js ×1
placeholder ×1
python-3.x ×1
quadratic ×1
uistoryboard ×1
user-input ×1
web-scraping ×1
while-loop ×1