我正在使用Interactive-Haskell repl进入奇怪的行为emacs.当我获取文件时,emacs迷你缓冲区显示一系列交互式提示:
Start a new project named 'myproject'?
Cabal dir (guessed from myproject.cabal):
Build target (empty for default):
Set current directory:
Run Code Online (Sandbox Code Playgroud)
如果我将cabal目录或当前目录保留为项目目录的默认值,则repl将无响应.我在交互式Haskell窗口中得到一个lambda提示符,我可以输入,但是当我按下回车键时,它从不进行评估.光标停留在同一条线上,好像我根本没有按Enter键.
如果我将这两个目录更改为除项目目录之外的某个路径,则repl会正常运行并按预期方式计算表达式.
我一直在努力让聚合表工作.这是我的事实表看起来像:
employment_date_id
dimension1_id
dimension2_id
dimension3_id
dimension4
dimension5
measure1
measure2
measure3
Run Code Online (Sandbox Code Playgroud)
我将employment_date_id年度,季度和月份折叠成仅包括年份,但包括其他所有列.这是我的聚合表的样子:
yearquartermonth_year
dimension1_id
dimension2_id
dimension3_id
dimension4
dimension5
measure1
measure2
measure3
fact_count
Run Code Online (Sandbox Code Playgroud)
我只是把日期的那一部分搞砸了.其余字段保持原样.这是我的配置:
<AggFactCount column="FACT_COUNT"/>
<AggForeignKey factColumn="dimension1_id" aggColumn="dimension1_id"/>
<AggForeignKey factColumn="dimension2_id" aggColumn="dimension2_id"/>
<AggForeignKey factColumn="dimension3_id" aggColumn="dimension3_id"/>
<AggMeasure name="[Measures].[measure1]" column="measure1"/>
<AggMeasure name="[Measures].[measure2]" column="measure2"/>
<AggMeasure name="[Measures].[measure3]" column="measure3"/>
<AggLevel name="[dimension4].[dimension4]" column="dimension4"/>
<AggLevel name="[dimension5].[dimension5]" column="dimension5"/>
<AggLevel name="[EmploymentDate.yearQuarterMonth].[Year]" column="yearquartermonth_year"/>
Run Code Online (Sandbox Code Playgroud)
我大部分都是从文档中复制聚合表的第二个例子.我的大多数列都没有折叠到表中,而是维度表的外键.
我正在尝试执行的查询是这样的:
select {[Measures].[measure1]} on COLUMNS, {[EmploymentDate.yearQuarterMonth].[Year]} on ROWS from Cube1
Run Code Online (Sandbox Code Playgroud)
问题是,当我调试它并打开日志记录时,我看到看起来像这样的位键:
AggStar:agg_year_employment
bk=0x00000000000000000000000000000000000000000000000111111111101111100000000000000000000000000000000000000000000000000000000000000000
fbk=0x00000000000000000000000000000000000000000000000000000001101111100000000000000000000000000000000000000000000000000000000000000000
mbk=0x00000000000000000000000000000000000000000000000111111110000000000000000000000000000000000000000000000000000000000000000000000000
Run Code Online (Sandbox Code Playgroud)
我的查询的位模式是:
Foreign columns bit key=0x00000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000001
Measure bit key= 0x00000000000000000000000000000000000000000000000000000010000000000000000000000000000000000000000000000000000000000000000000000000 …Run Code Online (Sandbox Code Playgroud) 有了asyncio我见过的图书馆,
@asyncio.coroutine
def function():
...
Run Code Online (Sandbox Code Playgroud)
和
async def function():
...
Run Code Online (Sandbox Code Playgroud)
可互换使用.
这两者之间有什么功能差异吗?
我正在查看有关窗口函数的教程,但我不太明白为什么以下代码会生成NaN.
如果我理解正确,代码会创建一个大小为2的滚动窗口.为什么第一行,第四行和第五行都有NaN?起初,我认为这是因为添加另一个数字的NaN会产生NaN,但是我不知道为什么第二行不会是NaN.
dft = pd.DataFrame({'B': [0, 1, 2, np.nan, 4]},
index=pd.date_range('20130101 09:00:00', periods=5, freq='s'))
In [58]: dft.rolling(2).sum()
Out[58]:
B
2013-01-01 09:00:00 NaN
2013-01-01 09:00:01 1.0
2013-01-01 09:00:02 3.0
2013-01-01 09:00:03 NaN
2013-01-01 09:00:04 NaN
Run Code Online (Sandbox Code Playgroud) fileMain = open("dictionary_15k.txt", "r")
for line1 in fileMain:
dictWords.append(unicode(line1.strip(), "utf-8"))
Run Code Online (Sandbox Code Playgroud)
编译时显示
NameError: name 'unicode' is not defined
Run Code Online (Sandbox Code Playgroud) 我的参数n是一个整数的电话号码.
使用递归我想返回整数中的前三个数字.
我把整数变成了一个单独的数字字符列表,我试图一遍又一遍地删除最后一个数字,直到我离开最后三个,但我仍然坚持如何重复它.
def areaCodes(n):
n = str(n)
n = list(n)
del n[-1]
#n = reduce(opperator.add, n)
n = ''.join(n)
n = int(n)
return n
Run Code Online (Sandbox Code Playgroud)
我知道我应该以某种方式在回报中重复这个名字,但因为n不是我可以用来重复的整数.我该怎么办?
我在while循环中有以下代码.
if gender == 0 and len(men) < 51 :
height = float((random.uniform(1.3, 1.9) + (random.randint(10, 20)/100.)).__format__('.2f'))
weight = float((random.uniform(45, 100) * height).__format__('.2f'))
attr['height'] = height
attr['weight'] = weight
men.append(attr)
Run Code Online (Sandbox Code Playgroud)
所以这段代码总是给出一些随机高度和随机权重.但是outsite de loop(当它完成时).如果我这样做print men,我得到以下结果:
[{'weight': 76.64, 'height': 1.75}, {'weight': 76.64, 'height': 1.75}, {'weight': 76.64, 'height': 1.75}, {'weight': 76.64, 'height': 1.75}, {'weight': 76.64, 'height': 1.75}, {'weight': 76.64, 'height': 1.75}, {'weight': 76.64, 'height': 1.75}, {'weight': 76.64, 'height': 1.75}, {'weight': 76.64, 'height': 1.75}, {'weight': 76.64, 'height': 1.75}, {'weight': 76.64, 'height': 1.75}, …Run Code Online (Sandbox Code Playgroud) 我正在运行带有XX:+HeapDumpOnOutOfMemoryErrorJVM标志的Java进程并看到以下输出:
java.lang.OutOfMemoryError: Java heap space
Dumping heap to /local/disk2/heaps/heapdump.hprof ...
Dump file is incomplete: file size limit
Run Code Online (Sandbox Code Playgroud)
有办法解决这个问题吗?
在对词袋实现线性回归模型期间,python 返回了非常大/非常低的值。train_data_features包含训练数据中的所有单词。训练数据包含大约 400 条评论,每条评论少于 500 个字符,排名在 0 到 5 之间。之后,我为每个文档创建了一个词袋。在尝试对所有词袋的矩阵进行线性回归时,
from sklearn import linear_model
clf = linear_model.LinearRegression()
clf.fit(train_data_features, train['dim_hate'])
coef = clf.coef_
words = vectorizer.get_feature_names()
for i in range(len(words)):
print(str(words[i]) + " " + str(coef[i]))
Run Code Online (Sandbox Code Playgroud)
结果似乎很奇怪(只是 4000 中的 3 个示例)。它显示了为单词创建的回归函数的因素。
btw -0.297473967075
land 54662731702.0
landesrekord -483965045.253
Run Code Online (Sandbox Code Playgroud)
我很困惑,因为目标变量在 0 到 5 之间,但因子是如此不同。他们中的大多数都有非常高/低的数字,我只期待像btw.
你有什么想法,为什么结果是这样的?
我正在询问 Python 中的部分正则表达式匹配。
例如:
如果你有一个字符串:
string = 'foo bar cat dog elephant barn yarn p n a'
Run Code Online (Sandbox Code Playgroud)
和一个正则表达式:
pattern = r'foo bar cat barn yard p n a f'
Run Code Online (Sandbox Code Playgroud)
以下情况为真:
re.match(pattern, string)会回来None。re.search(pattern, string) 还会回来 None虽然我们都可以看到模式的第一部分与字符串的第一部分匹配。
因此,不是在字符串中搜索整个模式,有没有办法查看字符串与模式匹配的百分比?
python ×7
python-3.x ×2
async-await ×1
cabal ×1
emacs ×1
ghci ×1
haskell ×1
java ×1
jvm ×1
list ×1
mondrian ×1
nameerror ×1
numpy ×1
olap ×1
olap4j ×1
pandas ×1
python-2.7 ×1
python-3.5 ×1
recursion ×1
regex ×1
scikit-learn ×1
unicode ×1