我感到困惑的时候,我应该使用CMD
VS RUN
.例如,要执行bash/shell命令(即ls -la
)我会一直使用CMD
或者是否存在我会使用的情况RUN
?试图了解这两个类似Dockerfile
指令的最佳实践.
我可以做这个:
./bin/kafka-avro-console-consumer --zookeeper 10.0.0.225:2181/kafka
--topic myTopic --property schema.registry.url=http://10.0.0.100:8081
--from-beginning
Run Code Online (Sandbox Code Playgroud)
但是我的消息太多了.我宁愿只得到最后的N个.我怎么能用kafka控制台消费者做到这一点?
我有一个数据集[String],需要转换为RDD [String].怎么样?
注意:我最近从spark 1.6迁移到spark 2.0.我的一些客户期待RDD,但现在Spark给了我数据集.
我能够找到很多关于multipart/form-data的信息,但没有太多关于multipart/related的信息.在协议/请求格式方面,有人可以解释这两个http规范在文件上传方面的差异吗?
我正在尝试编写一个 docker 镜像来通过 netcat 运行一个简单的网络服务器。
所以我在我的 docker build 文件夹中有:
Dockerfile
index.html
run_netcat_webserver.sh
Run Code Online (Sandbox Code Playgroud)
这run_netcat_webserver.sh
非常简单,而且工作正常:
Dockerfile
index.html
run_netcat_webserver.sh
Run Code Online (Sandbox Code Playgroud)
这是我的天真的 Dockerfile,当然它不起作用:
FROM ubuntu:14.04
CMD run_netcat_webserver.sh
Run Code Online (Sandbox Code Playgroud)
我应该如何继续在 docker 容器中进行这项工作?
我的问题很简单:我想在大文件上传到达时将其写入磁盘。我有两个大文件正在由同一个人上传multipart/form-data
表单上传。如何检测文件结尾,换句话说,如何检测边界------WebKitFormBoundaryuFPBAbBHzPMrZn8g
到达字节中间的边界?
拥有正在上传的文件的长度可以完全解决这个问题,但是这个信息不是由http请求给出的(只是完整的内容长度,而不是正在上传的单个文件的长度)。
\n\n那么当我将字节写入磁盘时检测边界的逻辑/策略/算法是什么。当然,我不想写边界,认为它是文件的一部分。我必须检测并停止写入磁盘。请注意,在开始写入磁盘之前,我无法将整个文件加载到内存中。这将使问题变得容易得多。
\n\n以下是包含两个文件的 multipart/form-data 的格式:
\n\n\nPOST / HTTP/1.1\n主机:本地主机:8000\n连接:保持活动\n内容长度:362\n缓存控制:max-age=0\n来源:null\n升级不安全请求:1\n用户代理:Mozilla/5.0(Macintosh;Intel Mac OS X 10_10_5)AppleWebKit/537.36(KHTML,如 Gecko)Chrome/53.0.2785.116 Safari/537.36\nContent-Type:multipart/form-data;border=----WebKitFormBoundaryuFPBAbBHzPMrZn8g\n接受:text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8\n接受-编码: gzip, deflate\n接受-语言:en-US,en;q=0.8,pt;q=0.6\n\n------WebKitFormBoundaryuFPBAbBHzPMrZn8g\n内容处置:表单数据;名称=“文件1”;filename="binary.dat"\n内容类型:application/octet-stream\n\na\xcf\x89b\n-----WebKitFormBoundaryuFPBAbBHzPMrZn8g\n内容处置:表单数据;名称=“文件2”;文件名 =“binary.dat”\n内容类型:application/octet-stream\n\na\xcf\x89b\n-----WebKitFormBoundaryuFPBAbBHzPMrZn8g--\n\n
所以我有一个非常简单的pom.xml:
<project>
<modelVersion>4.0.0</modelVersion>
<groupId>com.mycompany</groupId>
<artifactId>kafka-utils</artifactId>
<version>1.1.1</version>
<dependencies>
<dependency>
<groupId>org.apache.kafka</groupId>
<artifactId>kafka-clients</artifactId>
<version>0.10.0.0</version>
</dependency>
</dependencies>
</project>
Run Code Online (Sandbox Code Playgroud)
但eclipse给了我以下警告<project>
:
There is no schema defined for this pom.xml!
Run Code Online (Sandbox Code Playgroud)
见下图:
docker ×2
dockerfile ×2
file-upload ×2
http ×2
algorithm ×1
apache-kafka ×1
apache-spark ×1
eclipse ×1
forms ×1
java ×1
maven ×1
parsing ×1
pom.xml ×1
protocols ×1
scala ×1
upload ×1