小编Mar*_*vin的帖子

如何在 ```pandas.read_json(...)``` 期间修复 ```ValueError: Trailing data```？

我正在尝试将 JSON 文件读入 Pandas 数据帧，如下所示：

def read_JSON_into_dataframe( file_name ):
    with sys.stdin if file_name is None else open( file_name, "r", encoding='utf8', errors='ignore' ) as reader:
        df = pd.read_json( reader )
        print( df.describe(), file = sys.stderr )
        return df

Run Code Online (Sandbox Code Playgroud)

但是，我收到一个错误，底部堆栈帧是：

C:\ProgramData\Anaconda3\lib\site-packages\pandas\io\json\json.py in _parse_no_numpy(self)
    869         if orient == "columns":
    870             self.obj = DataFrame(
--> 871                 loads(json, precise_float=self.precise_float), dtype=None)
    872         elif orient == "split":
    873             decoded = {str(k): v for k, v in compat.iteritems(

ValueError: Trailing data

Run Code Online (Sandbox Code Playgroud)

“跟踪数据”指的是什么？如果它指的是 JSON 文件中的某个点，我可以做些什么来找出它在哪里以及它有什么问题？

json python-3.x pandas

Mar*_*vin

lucky-day

6
推荐指数

2
解决办法

8148
查看次数

使c ++变量为const

我爱"const".我希望"应该是const"的每个变量和方法都是"const".问题是变量或方法"应该是const"取决于调用树中进一步向下的方法/变量.是否有一些工具或某些过程用于静态检查代码体并进行"自下而上的整合"？

c++ static-analysis const

Mar*_*vin

lucky-day

5
推荐指数

1
解决办法

157
查看次数

为什么我的Kafka Transformer的StateStore无法访问？

我正在尝试实现一个Transformer类

public class StreamSorterByTimeStampWithDelayTransformer < V > 
    implements Transformer< Long, V, KeyValue< Long, V > >

Run Code Online (Sandbox Code Playgroud)

该类的构造函数为每个实例创建一个StateStore,因此:

this.state_store_name = "state_store_" + this.hashCode();

KeyValueBytesStoreSupplier key_value_store_supplier = Stores.persistentKeyValueStore( state_store_name );
StoreBuilder< KeyValueStore< String, V > > key_value_store_builder = 
    Stores.keyValueStoreBuilder( key_value_store_supplier, Serdes.String(), v_instance.getSerde() );
stream_builder.addStateStore( key_value_store_builder );

Run Code Online (Sandbox Code Playgroud)

Transformer init方法引用StateStore:

public void init(ProcessorContext context) {
    this.context = context;
    this.key_value_store = (KeyValueStore< String, V >) context.getStateStore( state_store_name );
    // schedule a punctuate() method every "poll_ms" (wall clock time)
    this.context.schedule( this.poll_ms, PunctuationType.WALL_CLOCK_TIME, 
            (timestamp) -> pushOutOldEnoughEntries() …

Run Code Online (Sandbox Code Playgroud)

apache-kafka-streams

Mar*_*vin

lucky-day

1
推荐指数

1
解决办法

716
查看次数

为什么 Python statsmodels...SARIMAX.predict 不起作用？

我正在尝试SARIMAX将 34 个元素的每月时间序列扩展到 35 个元素，假设有 12 个月的季节性成分。

但是，该predict方法因回溯而失败：

<ipython-input-40-151295bf5e3e> in approach_4_stationarity(data_file_name)
     27     sarima = SARIMAX( total_items_array, order = ( 1, 0, 0 ), seasonal_order = (0,0,0,12) )
     28     sarima.fit()
---> 29     next_month_item_cnt = sarima.predict( (1, 0, 0 ), start = 34, end = 34 )
     30     print( "next_month_item_cnt", next_month_item_cnt, file = sys.stderr )
     31     total_items_array = total_items_array.append( next_month_item_cnt )

/opt/conda/lib/python3.6/site-packages/statsmodels/base/model.py in predict(self, params, exog, *args, **kwargs)
    205         This is a placeholder intended to be overwritten by …

Run Code Online (Sandbox Code Playgroud)

time-series statsmodels

Mar*_*vin

lucky-day

1
推荐指数

1
解决办法

1562
查看次数

如何在没有三个嵌套循环的情况下编码三重和

我正在尝试有效地实现一个公式，如：

sum(i=1,n) sum(j=i+1,n) sum(k=j+1,n) x(i)*x(j)*x(k)

Run Code Online (Sandbox Code Playgroud)

做到这一点的直接方法是这样的：

sum = 0
for (int i=1; i<n; i++ )
    for( int j=i+1; j<n; j++ )
        for( int k=j+1; k<n; k++ )
            sum += x[i]*x[j]*x[k]

Run Code Online (Sandbox Code Playgroud)

问题是这是O(n^3). 我想知道是否有某种方法可以重写它，以便我可以使用一些递归关系消除一层甚至两层迭代。我尝试了以下方法，但没有运气：

for (int i=n; i>0; i-- )
    int sumK = 0
    for( int j=n; j>i; j-- ) {
         sum += sumK
         sumK += x[i]*x[j]*x[j]
    }

Run Code Online (Sandbox Code Playgroud)

它给出了与直接代码不同的答案，但它确实消除了一层迭代，所以我认为我在正确的轨道上（尽管出轨了）。有人可以帮忙吗？

java arrays iteration time-complexity

Mar*_*vin

2020 11-02

1
推荐指数

1
解决办法

79
查看次数

如何随机混合两个 PyTorch 张量

我有两个形状相同的 PyTorch 张量 A 和 B，我想创建一个形状相同的“随机混合”张量 C，其中 C[i,...] = A[i,...] 概率为 alpha或 B[i,...] 概率为 1-alpha。有没有一些 Pythonic 的方式来紧凑地做到这一点？

list pytorch tensor

Mar*_*vin

lucky-day

1
推荐指数

1
解决办法

166
查看次数

Tensorflow LSTM 返回什么？

我正在使用编码器/解码器模式编写德语-> 英语翻译器，其中编码器通过将其最后一个 LSTM 层的状态输出作为解码器的 LSTM 的输入状态传递来连接到解码器。

但是，我被卡住了，因为我不知道如何解释编码器 LSTM 的输出。一个小例子：

tensor = tf.random.normal( shape = [ 2, 2, 2 ])
lstm = tf.keras.layers.LSTM(units=4, return_sequences=True, return_state=True )
result = lstm( ( tensor )
print( "result:\n", result )

Run Code Online (Sandbox Code Playgroud)

在 Tensorflow 2.0.0 中执行这个会产生：

result:
[
<tf.Tensor: id=6423, shape=(2, 2, 3), dtype=float32, numpy=
array([[[ 0.05060377, -0.00500009, -0.10052835],
        [ 0.01804499,  0.0022153 ,  0.01820258]],
       [[ 0.00813384, -0.08705016,  0.06510869],
        [-0.00241707, -0.05084776,  0.08321179]]], dtype=float32)>,
<tf.Tensor: id=6410, shape=(2, 3), dtype=float32, numpy=
array([[ 0.01804499,  0.0022153 ,  0.01820258],
       [-0.00241707, -0.05084776,  0.08321179]], dtype=float32)>, …

Run Code Online (Sandbox Code Playgroud)

python lstm tensorflow

Mar*_*vin

lucky-day

0
推荐指数

1
解决办法

107
查看次数