Apache Spark grokking regex