我正在尝试将 JSON 文件读入 Pandas 数据帧,如下所示:
def read_JSON_into_dataframe( file_name ):
with sys.stdin if file_name is None else open( file_name, "r", encoding='utf8', errors='ignore' ) as reader:
df = pd.read_json( reader )
print( df.describe(), file = sys.stderr )
return df
Run Code Online (Sandbox Code Playgroud)
但是,我收到一个错误,底部堆栈帧是:
C:\ProgramData\Anaconda3\lib\site-packages\pandas\io\json\json.py in _parse_no_numpy(self)
869 if orient == "columns":
870 self.obj = DataFrame(
--> 871 loads(json, precise_float=self.precise_float), dtype=None)
872 elif orient == "split":
873 decoded = {str(k): v for k, v in compat.iteritems(
ValueError: Trailing data
Run Code Online (Sandbox Code Playgroud)
“跟踪数据”指的是什么?如果它指的是 JSON 文件中的某个点,我可以做些什么来找出它在哪里以及它有什么问题?
我爱"const".我希望"应该是const"的每个变量和方法都是"const".问题是变量或方法"应该是const"取决于调用树中进一步向下的方法/变量.是否有一些工具或某些过程用于静态检查代码体并进行"自下而上的整合"?
我正在尝试实现一个Transformer类
public class StreamSorterByTimeStampWithDelayTransformer < V >
implements Transformer< Long, V, KeyValue< Long, V > >
Run Code Online (Sandbox Code Playgroud)
该类的构造函数为每个实例创建一个StateStore,因此:
this.state_store_name = "state_store_" + this.hashCode();
KeyValueBytesStoreSupplier key_value_store_supplier = Stores.persistentKeyValueStore( state_store_name );
StoreBuilder< KeyValueStore< String, V > > key_value_store_builder =
Stores.keyValueStoreBuilder( key_value_store_supplier, Serdes.String(), v_instance.getSerde() );
stream_builder.addStateStore( key_value_store_builder );
Run Code Online (Sandbox Code Playgroud)
Transformer init
方法引用StateStore:
public void init(ProcessorContext context) {
this.context = context;
this.key_value_store = (KeyValueStore< String, V >) context.getStateStore( state_store_name );
// schedule a punctuate() method every "poll_ms" (wall clock time)
this.context.schedule( this.poll_ms, PunctuationType.WALL_CLOCK_TIME,
(timestamp) -> pushOutOldEnoughEntries() …
Run Code Online (Sandbox Code Playgroud) 我正在尝试SARIMAX
将 34 个元素的每月时间序列扩展到 35 个元素,假设有 12 个月的季节性成分。
但是,该predict
方法因回溯而失败:
<ipython-input-40-151295bf5e3e> in approach_4_stationarity(data_file_name)
27 sarima = SARIMAX( total_items_array, order = ( 1, 0, 0 ), seasonal_order = (0,0,0,12) )
28 sarima.fit()
---> 29 next_month_item_cnt = sarima.predict( (1, 0, 0 ), start = 34, end = 34 )
30 print( "next_month_item_cnt", next_month_item_cnt, file = sys.stderr )
31 total_items_array = total_items_array.append( next_month_item_cnt )
/opt/conda/lib/python3.6/site-packages/statsmodels/base/model.py in predict(self, params, exog, *args, **kwargs)
205 This is a placeholder intended to be overwritten by …
Run Code Online (Sandbox Code Playgroud) 我正在尝试有效地实现一个公式,如:
sum(i=1,n) sum(j=i+1,n) sum(k=j+1,n) x(i)*x(j)*x(k)
Run Code Online (Sandbox Code Playgroud)
做到这一点的直接方法是这样的:
sum = 0
for (int i=1; i<n; i++ )
for( int j=i+1; j<n; j++ )
for( int k=j+1; k<n; k++ )
sum += x[i]*x[j]*x[k]
Run Code Online (Sandbox Code Playgroud)
问题是这是O(n^3)
. 我想知道是否有某种方法可以重写它,以便我可以使用一些递归关系消除一层甚至两层迭代。我尝试了以下方法,但没有运气:
for (int i=n; i>0; i-- )
int sumK = 0
for( int j=n; j>i; j-- ) {
sum += sumK
sumK += x[i]*x[j]*x[j]
}
Run Code Online (Sandbox Code Playgroud)
它给出了与直接代码不同的答案,但它确实消除了一层迭代,所以我认为我在正确的轨道上(尽管出轨了)。有人可以帮忙吗?
我有两个形状相同的 PyTorch 张量 A 和 B,我想创建一个形状相同的“随机混合”张量 C,其中 C[i,...] = A[i,...] 概率为 alpha或 B[i,...] 概率为 1-alpha。有没有一些 Pythonic 的方式来紧凑地做到这一点?
我正在使用编码器/解码器模式编写德语-> 英语翻译器,其中编码器通过将其最后一个 LSTM 层的状态输出作为解码器的 LSTM 的输入状态传递来连接到解码器。
但是,我被卡住了,因为我不知道如何解释编码器 LSTM 的输出。一个小例子:
tensor = tf.random.normal( shape = [ 2, 2, 2 ])
lstm = tf.keras.layers.LSTM(units=4, return_sequences=True, return_state=True )
result = lstm( ( tensor )
print( "result:\n", result )
Run Code Online (Sandbox Code Playgroud)
在 Tensorflow 2.0.0 中执行这个会产生:
result:
[
<tf.Tensor: id=6423, shape=(2, 2, 3), dtype=float32, numpy=
array([[[ 0.05060377, -0.00500009, -0.10052835],
[ 0.01804499, 0.0022153 , 0.01820258]],
[[ 0.00813384, -0.08705016, 0.06510869],
[-0.00241707, -0.05084776, 0.08321179]]], dtype=float32)>,
<tf.Tensor: id=6410, shape=(2, 3), dtype=float32, numpy=
array([[ 0.01804499, 0.0022153 , 0.01820258],
[-0.00241707, -0.05084776, 0.08321179]], dtype=float32)>, …
Run Code Online (Sandbox Code Playgroud) arrays ×1
c++ ×1
const ×1
iteration ×1
java ×1
json ×1
list ×1
lstm ×1
pandas ×1
python ×1
python-3.x ×1
pytorch ×1
statsmodels ×1
tensor ×1
tensorflow ×1
time-series ×1