mon*_*ter 5 amazon-ec2 apache-spark
我的程序,我在不同的集群上运行了很多次突然停止.日志:
15/04/20 19:19:59 INFO scheduler.TaskSetManager: Finished task 12.0 in stage 15.0 (TID 374) in 61 ms on ip-XXX.compute.internal (16/24)
15/04/20 19:19:59 INFO storage.BlockManagerInfo: Added rdd_44_14 in memory on ip-XXX.compute.internal:37999 (size: 16.0 B, free: 260.6 MB)
Killed
Run Code Online (Sandbox Code Playgroud)
"被杀"是什么意思,为什么会发生?没有其他错误.
“杀死”通常意味着操作系统已通过发送 SIGKILL 信号终止进程。这是一个不可阻止的信号,可立即终止进程。它经常被用作 OOM(内存不足)进程杀手——如果操作系统认为内存资源严重不足,它可以选择一个进程来终止,以尝试释放一些内存。
如果没有更多信息,就不可能判断您的进程是由于内存问题还是其他原因而被终止。您可以提供的信息有助于诊断正在发生的情况,包括:进程在被终止之前运行了多长时间?您可以启用并提供进程中更详细的调试输出吗?进程终止是否与任何特定的通信模式或处理活动相关?
归档时间: |
|
查看次数: |
493 次 |
最近记录: |