question Re: Spark access remote HDFS in cross realm trust setup in Support Questions

question Re: Spark access remote HDFS in cross realm trust setup in Support Questions https://community.cloudera.com/t5/Support-Questions/Spark-access-remote-HDFS-in-cross-realm-trust-setup/m-p/325220#M229561 Hi <a href="https://community.cloudera.com/t5/user/viewprofilepage/user-id/11235">@Tomas79</a>  While launching spark-shell, you need to add spark.yarn.access.hadoopFileSystems parameter. And also ensure to add dfs.namenode.kerberos.principal.pattern parameter value * in core-site.xml file. For example,<LI-CODE lang="java"># spark-shell --conf spark.yarn.access.hadoopFileSystems="hdfs://c1441-node2.coelab.cloudera.com:8020" Setting default log level to "WARN". To adjust logging level use sc.setLogLevel(newLevel). For SparkR, use setLogLevel(newLevel). 21/09/24 07:23:25 WARN cluster.YarnSchedulerBackend$YarnSchedulerEndpoint: Attempted to request executors before the AM has registered! Spark context Web UI available at http://c2441-node2.supportlab.cloudera.com:4040 Spark context available as 'sc' (master = yarn, app id = application_1632395260786_0004). Spark session available as 'spark'. Welcome to ____ __ / __/__ ___ _____/ /__ _\ \/ _ \/ _ `/ __/ '_/ /___/ .__/\_,_/_/ /_/\_\ version 2.4.0.7.1.6.0-297 /_/ Using Scala version 2.11.12 (OpenJDK 64-Bit Server VM, Java 1.8.0_232) Type in expressions to have them evaluated. Type :help for more information. scala> val textDF = spark.read.textFile("hdfs://c1441-node2.coelab.cloudera.com:8020/tmp/ranga_clusterb_test.txt") textDF: org.apache.spark.sql.Dataset[String] = [value: string] scala> textDF.show(false) +---------------------+ |value | +---------------------+ |Hello Ranga, | | | +---------------------+</LI-CODE>   Fri, 24 Sep 2021 10:53:26 GMT RangaReddy 2021-09-24T10:53:26Z