java – Spark Strutured Streaming自动将时间戳转换为本地时间

前端之家收集整理的这篇文章主要介绍了java – Spark Strutured Streaming自动将时间戳转换为本地时间前端之家小编觉得挺不错的,现在分享给大家,也给大家做个参考。
我有UTC和ISO8601的时间戳,但使用结构化流,它会自动转换为本地时间.有没有办法阻止这种转换?我想在UTC中使用它.

我正在从Kafka读取json数据,然后使用from_json Spark函数解析它们.

输入:

{"Timestamp":"2015-01-01T00:00:06.222Z"}

流:

SparkSession
  .builder()
  .master("local[*]")
  .appName("my-app")
  .getOrCreate()
  .readStream()
  .format("kafka")
  ... //some magic
  .writeStream()
  .format("console")
  .start()
  .awaitTermination();

架构:

StructType schema = DataTypes.createStructType(new StructField[] {
        DataTypes.createStructField("Timestamp",DataTypes.TimestampType,true),});

输出

+--------------------+
|           Timestamp|
+--------------------+
|2015-01-01 01:00:...|
|2015-01-01 01:00:...|
+--------------------+

如您所见,小时数自动增加.

PS:我试着尝试使用from_utc_timestamp Spark函数,但没有运气.

解决方法

对我来说它起作用了:
spark.conf.set("spark.sql.session.timeZone","UTC")

它告诉spark sql使用UTC作为时间戳的默认时区.我在spark sql中使用它,例如:

select *,cast('2017-01-01 10:10:10' as timestamp) from soMetable

我知道它在2.0.1中不起作用.但适用于Spark 2.2.我在sqlTransformer中也使用过它.

我不确定流媒体.

猜你在找的Java相关文章