【Databricks】PySparkでDeltaテーブルにアクセス

テーブル名やパスを指定する

まず一番簡単なのは下記コマンドかなと思います。

# salesテーブルをDataFrameとして取得
df = spark.table("sales")

物理パスがわかっている場合、下記の様にDelta テーブルを読み込むことも可能です。

df = spark.read.format("delta").load("/databricks/hoge/hello")

SQL文を実行する

SQL文を実行する場合はsqlメソッドを使います。

df = spark.sql("SELECT * FROM sales")

参考

Databricks公式

https://docs.databricks.com/aws/ja/pyspark/basics

コメント

タイトルとURLをコピーしました