- แสดงรายชื่อดาต้าเบส และตาราง
- ใช้ SQL อ่านไฟล์
- อ่านข้อมูลในไฟล์ CSV มาใส่ใน Delta Table
- อ่านข้อมูลในไฟล์ CSV มาสร้าง Temp View
- สร้าง external table โดยชี้ไปที่ไฟล์ CSV
- คำสั่ง CREATE VIEW
- คำสั่ง CREATE TABLE
แสดงรายชื่อดาต้าเบส และตาราง
แสดงรายชื่อดาต้าเบส
%sql SHOW DATABASES;
แสดงรายชื่อตารางในดาต้าเบส
%sql USE default; SHOW TABLES;
ใช้ SQL อ่านไฟล์
%sql SELECT * FROM delta.`${DA.paths.datasets}/nyctaxi-with-zipcodes/data` SELECT * FROM text.`dbfs:/databricks-datasets/Rdatasets/data-001/datasets.csv` SELECT * FROM csv.`dbfs:/databricks-datasets/Rdatasets/data-001/datasets.csv`
ใช้ SQL อ่านไฟล์แบบ text
ใช้ backtick ` ครอบ
%sql SELECT * FROM text.`dbfs:/databricks-datasets/Rdatasets/data-001/datasets.csv`
ใช้ SQL อ่านไฟล์แบบ CSV
%sql SELECT * FROM csv.`dbfs:/databricks-datasets/Rdatasets/data-001/datasets.csv`
อ่านข้อมูลในไฟล์ CSV มาใส่ใน Delta Table
สร้างตารางชื่อ table1
โดยดูชื่อคอลัมน์จากคิวรีด้านบน
%sql /*Table creation with schema*/ CREATE OR REPLACE TABLE table1 ( Package string, Item string, Title string, csv string, doc string );
SHOW TABLE
อีกทีจะเห็นตาราง table1
ลอง SHOW CREATE TABLE
%sql SHOW CREATE TABLE table1;
copy ข้อมูลจากไฟล์ csv ลงตาราง
%sql /*Copying dbfs csv data into table*/ COPY INTO table1 FROM "dbfs:/databricks-datasets/Rdatasets/data-001/datasets.csv" FILEFORMAT = csv FORMAT_OPTIONS('header'='true','inferSchema'='True');
คิวรีดูข้อมูล
%sql SELECT * FROM table1
อ่านข้อมูลในไฟล์ CSV มาสร้าง Temp View
%sql CREATE TEMPORARY VIEW view1 USING CSV OPTIONS ( path "/databricks-datasets/Rdatasets/data-001/datasets.csv", header "true" )
%sql CREATE TEMPORARY VIEW diamonds USING CSV OPTIONS ( path "/databricks-datasets/Rdatasets/data-001/csv/ggplot2/diamonds.csv", header "true" )
ลอง SHOW TABLES
จะเห็นว่าเป็น Temporary
สร้าง external table โดยชี้ไปที่ไฟล์ CSV
%sql CREATE TABLE table2 USING CSV OPTIONS ('header' = 'true') LOCATION '/databricks-datasets/Rdatasets/data-001/csv/ggplot2/diamonds.csv'
พาทไฟล์สามารถ กำหนดที่ LOCATION
หรือใน OPTIONS (path)
ก็ได้
%sql DROP TABLE IF EXISTS diamonds; CREATE TABLE diamonds USING CSV OPTIONS ( path "/databricks-datasets/Rdatasets/data-001/csv/ggplot2/diamonds.csv", header "true" )
ใน OPTIONS
เครื่องหมาย =
จะมีหรือไม่มีก็ได้
%sql DROP TABLE IF EXISTS diamonds; CREATE TABLE diamonds USING CSV OPTIONS ( path = "/databricks-datasets/Rdatasets/data-001/csv/ggplot2/diamonds.csv", header = "true" )
คำสั่ง CREATE VIEW
CREATE OR REPLACE TEMP VIEW demo_tmp_vw(name, value) AS VALUES ("Yi", 1), ("Ali", 2), ("Selina", 3); CREATE TEMPORARY VIEW diamonds USING CSV OPTIONS ( path "/databricks-datasets/Rdatasets/data-001/csv/ggplot2/diamonds.csv", header "true" );
คำสั่ง CREATE TABLE
CREATE OR REPLACE TABLE table1 ( Package string, Item string, Title string, csv string, doc string ); CREATE TABLE diamonds USING CSV OPTIONS ( path = "/databricks-datasets/Rdatasets/data-001/csv/ggplot2/diamonds.csv", header = "true" ); CREATE TABLE diamonds USING CSV OPTIONS ('header' = 'true') LOCATION '/databricks-datasets/Rdatasets/data-001/csv/ggplot2/diamonds.csv';