SQL 窗口函数经常使用, 但是在修改历史代码时会经常忽略掉一些隐蔽的默认行为,使得代码留下 bug, 比如下面两个结果是一样的吗:
sum(..) over(partition by dimension_1)sum(..) over(partition by dimension_1 order
...
Case Class Encoder编写 Spark Job, 在从旧的 RDD API 到 DataSet API 的过程中,必然碰到 Encoder 的问题, 比如使用 case class Person(name: String, age: Long) :
import spark.impli
...