我的网站有很多网页,我正在尝试清理我的样式表和脚本.每个js/css中约有10%或更多未被我网站上的任何html页面使用.我需要的是删除常见的未使用和冗余的css和js.我做了一些研究,发现了这一点.但它不是免费的.
注意:
我有一个包含许多行的文件.我正在读每行,分割每个单词/数字并存储在列表中.在此之后,我试图将此列表转换为1列熊猫数据帧.
但是在运行我的代码后,我只得到一行满是列表.我需要的是1列,可变行数和一些值.
这是我写的代码片段:
for line1 in file:
test_set=[]
test_set.append(next(file).split())
df1 = DataFrame({'test_set': [test_set]})
Run Code Online (Sandbox Code Playgroud)
我的输出是这样的:
test_set
0 [[1, 0, 0, 0, 0, 0, 1, 1, 1, 0]]
Run Code Online (Sandbox Code Playgroud)
但我想要的是:
test_set
0 1
1 0
2 0
3 0
4 0
5 0
6 1
7 1
8 1
9 0
Run Code Online (Sandbox Code Playgroud)
有什么建议我做错了或者我该如何实现?谢谢.
输入数据样本代码段
id1 id2 id3 id4
0 1 0 1
1 1 0 0
id10 id5 id6 id7
1 1 0 1
1 0 0 1
. …Run Code Online (Sandbox Code Playgroud) 我正在尝试将数据从kafka传递到spark streaming.
这就是我到目前为止所做的事情:
kafka和sparkzookeeper默认属性config开始kafka server默认属性config开始kafka producerkafka consumer./bin/spark-submit examples/src/main/python/kafka-spark.pykafka-spark.py -
from __future__ import print_function
import sys
from pyspark.streaming import StreamingContext
from pyspark import SparkContext,SparkConf
from pyspark.streaming.kafka import KafkaUtils
if __name__ == "__main__":
#conf = SparkConf().setAppName("Kafka-Spark").setMaster("spark://127.0.0.1:7077")
conf = SparkConf().setAppName("Kafka-Spark")
#sc = SparkContext(appName="KafkaSpark")
sc = SparkContext(conf=conf)
stream=StreamingContext(sc,1)
map1={'spark-kafka':1}
kafkaStream = KafkaUtils.createStream(stream, 'localhost:9092', "name", map1) #tried with localhost:2181 too
print("kafkastream=",kafkaStream)
sc.stop()
Run Code Online (Sandbox Code Playgroud)
完整日志包括运行spark-kafka.py时出错:
Using …Run Code Online (Sandbox Code Playgroud) 我正在使用JAVA的last.fm API,可以在这里找到.
我有一个巨大的数据集,我只使用该文件与用户的艺术家历史和播放.我用Java编写了一个代码,它提取这些艺术家的名字,并根据Artist.getSimilar()方法返回相似的艺术家.
我跑了一次但不是所有的艺术家.我终止了一半的调试.但是,下次,我的结果将从缓存中返回,并且不再将请求发送到Web服务器.问题是,这次我得到的结果只有我终止结果的艺术家.我尝试使用另一种方法artists=Artist.getTopAlbums(),我在中途终止,下次遇到同样的问题.我得到的错误是:
[Fatal Error] :513:9: <strong>XML document structures must start and end within the same entity.</strong>
Exception in thread "main" de.umass.lastfm.CallException: org.xml.sax.SAXParseException; lineNumber: 513; columnNumber: 9; XML document structures must start and end within the same entity.
Caused by: org.xml.sax.SAXParseException; lineNumber: 513; columnNumber: 9; XML document structures must start and end within the same entity.
at com.sun.org.apache.xerces.internal.parsers.DOMParser.parse(DOMParser.java:251)
at com.sun.org.apache.xerces.internal.jaxp.DocumentBuilderImpl.parse(DocumentBuilderImpl.java:300)
Run Code Online (Sandbox Code Playgroud)
还有一堆其他例外,这些不是重要的部分.
我尝试重新安装eclipse,在-clean模式下启动eclipse 并清理工作区.没有任何效果.我也创建了一个新的工作区,但缓存不断回来.我正在使用Eclipse 3.8.也许在eclipse中清除缓存的有效方法会有所帮助吗?我该怎么做 似乎没什么用.(此外,没有选项可以像在许多文章中所建议的那样在Window> Preferences中手动清理缓存).
或者我还需要做其他事情吗?任何帮助深表感谢.提前致谢.
我的java代码(工作正常,没有错误):
//in …Run Code Online (Sandbox Code Playgroud) 我有:
1234 2345 3456 4567
Run Code Online (Sandbox Code Playgroud)
当我尝试时String.split(" ",2),我得到:
{1234} , {2345 3456 4567}
Run Code Online (Sandbox Code Playgroud)
但是我需要:
{1234},{2345}
Run Code Online (Sandbox Code Playgroud)
我只想要前两个元素.我如何在Java中实现它?
提前致谢.
编辑:这只是一个庞大的数据集中的一行.
我有以下火花工作:
from __future__ import print_function
import os
import sys
import time
from random import random
from operator import add
from pyspark.streaming import StreamingContext
from pyspark import SparkContext,SparkConf
from pyspark.streaming.kafka import KafkaUtils
from pyspark.sql import SQLContext, Row
from pyspark.streaming import StreamingContext
from pyspark_cassandra import streaming,CassandraSparkContext
if __name__ == "__main__":
conf = SparkConf().setAppName("PySpark Cassandra Test")
sc = CassandraSparkContext(conf=conf)
stream = StreamingContext(sc, 2)
rdd=sc.cassandraTable("keyspace2","users").collect()
#print rdd
stream.start()
stream.awaitTermination()
sc.stop()
Run Code Online (Sandbox Code Playgroud)
当我运行它时,它给我以下错误:
ERROR StreamingContext: Error starting the context, marking it as …Run Code Online (Sandbox Code Playgroud) 我在127.0.1.1上运行自己的cassandra版本.我改变了rpc_address,也address改为127.0.1.1.
当我启动Opscenter时,我被提示安装agents,我是按照推荐的Fix now选项进行安装的.但是当我尝试安装它时,我会询问一些Node ssh凭据.我不知道这意味着什么.
在这里输入的正确凭据是什么?
我尝试在Linux上添加具有root权限的新用户,并尝试使用该用户名,但它不起作用.我手动尝试运行install_agent.sh它但它不起作用.
我错过了什么吗?
编辑:
address.yaml
stomp_interface: 127.0.1.1
agent_rpc_interface: "127.0.1.1"
cassandra-conf: /home/kaushaya/Dropbox/Work/ITNow/olderVersions/cassandra2.11/apache-cassandra-2.1.12/conf/cassandra.yaml
stomp_port: 61620
jmx_host: 127.0.1.1
jmx_port: 7199
Run Code Online (Sandbox Code Playgroud)
cassandra.yaml
EDIT2:
用户名和密码我正在使用我的datastax凭据.对于私钥,我正在使用/etc/ssh/ssh_host_rsa_key.pub@apesa提到的密钥.但它仍然无法安装代理.
我的address.yaml文件是否正确?
编辑3:
就像你在下图中看到的那样,当认为Opscenter没有连接到代理时,我仍然可以看到cassandra中的键空间和表格.
因为sudo netstat -p | grep 127.0.1.1我得不到输出.
xyz@ubuntu$ ps -ef | grep datastax-agent
xyz@ubuntu$ ps -ef | grep cassandra
Run Code Online (Sandbox Code Playgroud)
输出分别是这个和这个.简而言之,是的,我可以看到罐子,我猜环境变量也是如此.
你问我怎么开始cassandra?
sudo ./bin/cassandra来自cassandra的文件夹.之后,我使用spark stream将数据从kafka传输到cassandra.但这应该不重要.
Even if it is not connecting to the agent the opscenter should …
我想要从导航栏中选择部分或在滚动时查看部分时启动此动画.
示例代码:
HTML:
<section id="section-skills" class="section appear clearfix">
<div class="container">
<div class="row mar-bot40">
<div class="col-md-offset-3 col-md-6">
<div class="section-header">
<h2 class="section-heading animated" data-animation="bounceInUp">Skills</h2>
</div>
</div>
</div>
</div>
<div class="container">
<div class="row" >
<div class="col-md-6">
<div class="skillbar clearfix " data-percent="80%">
<div class="skillbar-title" style="background: #333333;"><span>Java</span></div>
<div class="skillbar-bar" style="background: #525252;"></div>
<div class="skill-bar-percent">75%</div>
</div> <!-- End Skill Bar -->
<!--REST OF THE CODE FOLLOWS AS IN THE EXAMPLE LINK PROVIDED-->
</section>
Run Code Online (Sandbox Code Playgroud)
我尝试waypoint在jQuery中使用,但它不起作用.
jQuery(document).ready(function(){
$('#section-skills').waypoint(function(direction) {
jQuery('.skillbar').each(function(){
jQuery(this).find('.skillbar-bar').animate({
width:jQuery(this).attr('data-percent')
},6000);
});
});
});
Run Code Online (Sandbox Code Playgroud)
任何解决方案都会非常有用.
我创建的Browser.inputBox只接受一个文本.但是我需要创建一个下拉列表,我可以从列表中选择,而不是自己键入字符串.
以下是我在单击Odoo(在菜单栏中)>设置时创建的inputBox的屏幕截图.
这是被触发的函数:
function menu_settings(params) {
if (!params){
params = [["url", "URL"], ["dbname", "Database Name"], ["username", "username"], ["password", "password"]];
}
for (var i = 0; i < params.length; i++){
var input = Browser.inputBox("Server Settings", params[i][1], Browser.Buttons.OK_CANCEL);
if (input === "cancel"){
break;
}
else{
ScriptProperties.setProperty(params[i][0], input);
}
}
}
Run Code Online (Sandbox Code Playgroud)
基本上不是键入文本,我需要一个具有预定义值的下拉列表.
我正在检查Browser类,我看到没有这样的下拉列表选项.我见过的大多数解决方案都是从单元格中输入的文本中使用DataValidation.但是我想给出我的代码中的下拉列表以及电子表格中的任何内容.我该如何实现?我是新手,所以我需要一些建议!
谢谢!
我正在尝试将 cat 的输出写入 R 中的文件,如下所示:
write(cat(as.character(i),"\n"),file="output.txt",append=TRUE)
Run Code Online (Sandbox Code Playgroud)
然而,它没有写任何东西。
注意 -cat(as.character(i),"\n"具有非空输出。
我在这里错过了什么或做错了什么?
apache-spark ×2
cassandra ×2
css ×2
datastax ×2
html ×2
java ×2
javascript ×2
apache-kafka ×1
code-cleanup ×1
eclipse ×1
function ×1
jquery ×1
kafka-python ×1
last.fm ×1
opscenter ×1
optimization ×1
pandas ×1
pyspark ×1
python ×1
r ×1
sax ×1
split ×1
string ×1
xml ×1