我使用下面提到的命令安装了facebook-sdk:
pip install facebook-sdk
Run Code Online (Sandbox Code Playgroud)
但在导入时,我遇到了一个问题:
import facebook
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "C:\Python33\lib\site-packages\facebook.py", line 222
except urllib2.HTTPError, e:
^
SyntaxError: invalid syntax
Run Code Online (Sandbox Code Playgroud)
我怎样才能解决这个问题?
我正在编写一个消费者应用程序,从 kafka 流中选取记录并使用 spring-kafka 对其进行处理。我的处理步骤如下:
Getting records from stream --> dump it into a table --> Fetch records and call API --> API will update records into a table --> calling Async Commit()
Run Code Online (Sandbox Code Playgroud)
在某些情况下,API 处理似乎需要更多时间,因为正在获取更多记录,并且我们收到以下错误?
由于消费者轮询超时已过期,成员 Consumer-prov-em-1-399ede46-9e12-4388-b5b8-f198a4e6a5bc 向协调器 apslt2555.uhc.com:9095(id:2147483577 机架:null)发送 LeaveGroup 请求。这意味着对 poll() 的后续调用之间的时间比配置的 max.poll.interval.ms 长,这通常意味着轮询循环花费了太多时间处理消息。您可以通过增加 max.poll.interval.ms 或通过使用 max.poll.records 减少 poll() 中返回的批次的最大大小来解决此问题。
org.apache.kafka.clients.consumer.CommitFailedException:提交无法完成,因为组已经重新平衡并将分区分配给另一个成员。这意味着后续调用 poll() 之间的时间比配置的 max.poll.interval.ms 长,这通常意味着 poll 循环花费了太多时间处理消息。您可以通过增加 max.poll.interval.ms 或通过使用 max.poll.records 减少 poll() 中返回的批次的最大大小来解决此问题。
我知道这可以通过减少 max.poll.records 或增加 max.poll.interval.ms 来解决。我想了解的是,如果我将 max.poll.records 设置为 10 那么 poll() 行为会是什么?是否需要从流中获取 10 条记录等待这些记录被提交,然后再获取下 10 条记录?当下一次轮询发生时?它是否也会影响性能,因为我们将 …
在mongoshell中,以下声明工作正常:
db.grades.find({'type':'homework'}).sort({$score:1})
Run Code Online (Sandbox Code Playgroud)
但是当我在pymongo尝试做同样的事情时,我面临一个错误:
itr= collection.find({'type':'homework'}).sort(['score', pymongo.ASCENDING])
Run Code Online (Sandbox Code Playgroud)
错误:
for (key, value) in index_list:
ValueError: too many values to unpack
Run Code Online (Sandbox Code Playgroud) 我写了这段代码来访问文件夹中的Excel文件:
strPath="C:\Test\"
Set objFso = CreateObject("Scripting.FileSystemObject")
Set objFolder = objFso.GetFolder (strPath)
Set objExcel= CreateObject("Excel.Application")
objExcel.Visible= False
For Each objFile In objFolder.Files
If objFso.GetExtensionName(objFile.Path) = "xls" Then
Run Code Online (Sandbox Code Playgroud)
现在我必须创建一些子文件夹并在其中放入一些.xls文件.
我应该在我的代码中进行哪些修改来搜索主文件夹和所有其他子文件夹中的文件(子文件夹中还有一些文件夹)?
我试图从文本文件中替换3个文本.我试过这个 -
Const ForReading = 1
Const ForWriting = 2
Set objFSO = CreateObject("Scripting.FileSystemObject")
Set objFile = objFSO.OpenTextFile("W:\Test.txt", ForReading)
strText = objFile.ReadAll
objFile.Close
strNewText = Replace(strText, "Aron_", "Lori_")
strNewText1 = Replace(strText, "Aron", "Jason") 'Not working
strNewText2 = Replace(strText, "Sketa", "Skicia") 'Not working
Set objFile = objFSO.OpenTextFile("W:\Test.txt", ForWriting)
objFile.WriteLine strNewText
objFile.WriteLine strNewText1 'Not working
objFile.WriteLine strNewText2 'Not working
objFile.Close
Run Code Online (Sandbox Code Playgroud)
我无法弄清楚如何进行多次更换.该代码适用于单个替换功能但不超过一个... plz帮助
我试图实现两个时间戳列值之间的差异。尝试使用 Spark 中可用的不同方法来获得相同的结果。我能够使用 Spark SQL 和普通函数获得相同的结果。但是,当我尝试将此函数注册为 UDF 时,它开始抛出错误。
数据:
id|end_date|start_date|location
1|2015-10-14 00:00:00|2015-09-14 00:00:00|CA-SF
2|2015-10-15 01:00:20|2015-08-14 00:00:00|CA-SD
3|2015-10-16 02:30:00|2015-01-14 00:00:00|NY-NY
4|2015-10-17 03:00:20|2015-02-14 00:00:00|NY-NY
5|2015-10-18 04:30:00|2014-04-14 00:00:00|CA-SD
Run Code Online (Sandbox Code Playgroud)
使用 SparkSQL:工作正常!!
data.createOrReplaceTempView("data_tbl")
query = "SELECT id, end_date, start_date,\
datediff(end_date,start_date) as dtdiff FROM data_tbl"
spark.sql(query).show()
Run Code Online (Sandbox Code Playgroud)
使用Python函数:工作正常!
from pyspark.sql.functions import datediff
def get_diff(x, y):
result = datediff(x,y)
return result
data.withColumn('differ',get_diff('end_date','start_date')).show()
Run Code Online (Sandbox Code Playgroud)
两种情况的结果:
+---+-------------------+-------------------+--------+------+
| id| end_date| start_date|location|differ|
+---+-------------------+-------------------+--------+------+
| 1|2015-10-14 00:00:00|2015-09-14 00:00:00| CA-SF| 30|
| 2|2015-10-15 01:00:20|2015-08-14 00:00:00| CA-SD| 62|
| 3|2015-10-16 02:30:00|2015-01-14 00:00:00| NY-NY| 275|
| …
Run Code Online (Sandbox Code Playgroud) 我是perl的新手.我试图执行下面提到的程序:
我正在尝试打开文件并从文件中读取内容.
$FILE=open(FILE,"\\10.82.71.28\Testing501\Test_Folder\834_KMS_FACE_834A.mms");
if($FILE)
{
print "The file: $FILE has opened successfully";
}
else
{
die "There is an error while opening the file :$!\n";
}
while($record=<FILE>)
{
print $record;
}
close(FILE);
Run Code Online (Sandbox Code Playgroud)
但在执行程序时,我遇到了一个错误:
打开文件时出错:参数无效
我正在尝试根据列值将一个大文件(大约有 1760 万个数据)拆分为 6-7 个小文件。目前,我正在使用 sql bcp 实用程序将所有数据转储到一个表中,并使用 bcp 创建单独的文件出效用。
但是有人建议我使用 Perl,因为它会更快,而且您不需要为此创建表。因为我不是 perl 人。我不知道如何在 perl 中做到这一点。任何帮助..
输入文件 :
输入文件.txt
0010|name|address|city|.........
0020|name|number|address|......
0030|phone no|state|street|...
Run Code Online (Sandbox Code Playgroud)
输出文件:
0010.txt
0010|name|address|city|.........
Run Code Online (Sandbox Code Playgroud)
0020.txt
0020|name|number|address|......
Run Code Online (Sandbox Code Playgroud)
0030.txt
0030|phone no|state|street|...
Run Code Online (Sandbox Code Playgroud) 我试图在VBScript中传递一个exe路径来自动调用它.请建议.
传递路径:
C:\Program Files\TSVN\bin\Tor.exe"/command:repobrowser
Dim objShell
Set objShell = WScript.CreateObject( "WScript.Shell" )
objShell.Run(""C:\Program Files\TSVN\bin\TProc.exe"/command:repobrowser"") 'Not working
Set objShell = Nothing
Run Code Online (Sandbox Code Playgroud) 我有一个文本文件,其中包含下述格式的数据.
@rectype='ABC' @recname='123' @rec_id='1K2j' etc...
@rectype='DEF' @recname='matin' @rec_id='458i' etc...
@rectype='ABC' @recname='John' @rec_id='lom0' etc...
@rectype='GHI' @recname='Kalme, @rec_id='pl90' etc...
@rectype='KLM' @recname='Kitty' @rec_id='987k' etc...
@rectype='ABC' @recname='OMR' @rec_id='lo09' etc...
Run Code Online (Sandbox Code Playgroud)
现在,我必须删除所有@ rectype ='ABC'的行.在输入文件中有这样的多行.这是一种紧急的,因为我不是一个perl编码器,我发现很难找出方法.
请建议!!!
注意:我只需要在输入文件中进行更改.我不需要创建一个单独的输出文件.
perl ×3
vbscript ×3
apache-kafka ×1
apache-spark ×1
directory ×1
mongodb ×1
pymongo ×1
pyspark ×1
python-3.x ×1
replace ×1
sorting ×1
spring-kafka ×1
text-files ×1