问题 在纱线群集模式下在YARN上运行Spark:控制台输出在哪里?


我按照这个页面在纱线集群模式下在YARN上运行SparkPi示例应用程序。

http://spark.apache.org/docs/latest/running-on-yarn.html

我最后没有看到程序的输出(这是本例计算的结果)。当我在yarn-client模式下运行它(--master yarn-client)时,我看到这样的输出:

Pi大约是3.138796

标准输出在纱线群集模式中的位置是什么?


10662
2017-10-12 04:34


起源



答案:


经过多次探索,我发现了这个 spark-0.9.0 doc

检查输出(使用上一个命令输出的“application identifier”替换下面的$ YARN_APP_ID)   (注意:YARN_APP_LOGS_DIR通常是/ tmp / logs或$ HADOOP_HOME / logs / userlogs,具体取决于Hadoop版本。)

$ cat $ YARN_APP_LOGS_DIR / $ YARN_APP_ID / container * _000001 / stdout

Pi约为3.13794

我希望他们把这个指示放在 1.1.0文档 太。


11
2017-10-12 06:38



日志信息位于文档的“调试应用程序”部分。它还介绍了如何使用“yarn logs”命令查看日志。 - Tom Panning


答案:


经过多次探索,我发现了这个 spark-0.9.0 doc

检查输出(使用上一个命令输出的“application identifier”替换下面的$ YARN_APP_ID)   (注意:YARN_APP_LOGS_DIR通常是/ tmp / logs或$ HADOOP_HOME / logs / userlogs,具体取决于Hadoop版本。)

$ cat $ YARN_APP_LOGS_DIR / $ YARN_APP_ID / container * _000001 / stdout

Pi约为3.13794

我希望他们把这个指示放在 1.1.0文档 太。


11
2017-10-12 06:38



日志信息位于文档的“调试应用程序”部分。它还介绍了如何使用“yarn logs”命令查看日志。 - Tom Panning