Spark常见问题解决-日志和排查办法 Spark日志与排查报错问题查看:

Spark日志与排查报错问题查看:

https://blog.csdn.net/qq_33588730/article/details/109353336

Spark常见问题

1. org.apache.spark.SparkException: Kryo serialization failed: Buffer overflow
原因:kryo序列化缓存空间不足。

解决方法:增加参数,--conf spark.kryoserializer.buffer.max=2047m。

2. org.elasticsearch.hadoop.rest.EsHadoopNoNodesLeftException: Connection error
原因:此时es.port可能为9300,因为ElasticSearch客户端程序除了Java使用TCP方式连接ES集群以外,其他语言基本上都是使用的Http方式,ES客户端默认TCP端口为9300,而HTTP默认端口为9200。elasticsearch-hadoop使用的就是HTTP方式连接的ES集群。

解决方法:可以将es.port设置为 9200。

3. Error in query: nondeterministic expressions are only allowed in Project, Filter, Aggregate or Window, found
解决方法:如果是SparkSQL脚本,则rand()等函数不能出现在join...on的后面。

4. driver端日志中频繁出现:Application report for application_xxx_xxx (stage: ACCEPTED)
解决方法:通过yarn UI左侧的“Scheduler”界面,搜索自己

相关推荐

  1. Linux中分析日志问题排查

    2024-01-26 06:12:03       16 阅读
  2. mysql日志查看

    2024-01-26 06:12:03       23 阅读
  3. Nginx 常见问题排查

    2024-01-26 06:12:03       29 阅读

最近更新

  1. TCP协议是安全的吗?

    2024-01-26 06:12:03       16 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-01-26 06:12:03       16 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-01-26 06:12:03       15 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-01-26 06:12:03       18 阅读

热门阅读

  1. Apache Spark

    2024-01-26 06:12:03       31 阅读
  2. Ubuntu 18.04 x86_64 上交叉编译 boost 库(ARMv7L)

    2024-01-26 06:12:03       30 阅读
  3. 迭代器模式-C#实现

    2024-01-26 06:12:03       30 阅读
  4. Unity截取UI

    2024-01-26 06:12:03       29 阅读
  5. 设计一套扑克牌

    2024-01-26 06:12:03       24 阅读
  6. Python3进行pdf文件分割及转word

    2024-01-26 06:12:03       32 阅读