Data Engineering1 [Delta Lake] DB Sink ๋๋ ๊ฑด๋ค์ ๋ชจ์๋ฅผ ์ค์ฌ๋ณด๊ธฐ ๋๋ ๋ฐฑ์๋ ์์ง๋์ด์ด์ง๋ง, Databricks ํ์ฉํ ๋ฐ์ดํฐ ์์ง๋์ด๋ง ์ ๋ฌด๋ ๊ฒธํ๊ณ ์๋ค.์ถํ ๊ฐ๋ฐ ์ปค๋ฆฌ์ด๋ฅผ ๋ฐ์ดํฐ ์ชฝ์ผ๋ก ์ ํฅํ๊ณ ์ถ๊ธฐ๋ ํ์ฌ, ํ์ฌ ํ์ฌ์ ์ ์ฌ ์ดํ ์ง์์ ์ธ ๋ฉด๋ด์์ ๋ฐ์ดํฐ ์ ๋ฌด๋ฅผ ํ๊ณ ์ถ๋ค๊ณ ์ ๊ทน์ ์ผ๋ก ์ดํ์ ํ๊ณ , ์ฑํฐ ๋ฆฌ๋๋ถ์ ์ด๋ฅผ ํ์พํ ๋ฐ์๋ค์ฌ์ฃผ์ จ๋ค. ์ํ๋ ์ ๋ฌด๋ฅผ ๊ฒธํ๊ฒ ๋์ด ์ ๋ง ํ๋ณตํ๋ค. Databricks๋ฅผ ์ฌ์ฉํ๋ฉฐ ์ฌ์ฉํ๋ API๋ Apache Spark๋ฅผ ์ฌ์ฉํ๋ค.์ฌ์ค ์ ๊ทน์ ์ธ ๋ฐ์ดํฐ ์์ง๋์ด๋ง๋ณด๋ค๋ ๋ฐ์ดํฐ ํ๋ซํผ, ๋ฐ์ดํฐ ๋ถ์ํ์์ ๋ง๋ค์ด์ฃผ์ Raw Data๋ฅผ ์๋น์ค์ ๋ง๊ฒ ๊ฐ๊ณตํ์ฌ Delta table์ ์ ์ฌํ ํ, ์ด๋ฅผ DB Sink ํ๋ ์ฉ๋์ ๊ฐ๋ฐ์ ์งํํ๊ณ ์๋ค. ์ฒ์ ํ์ดํ๋ผ์ธ์ ๊ฐ๋ฐํ์ ๋๋, ์๋ฌด๊ฒ๋ ๋ชจ๋ฅด๋ ์ํ์์ ๊ณต๋ถํ๋ฉฐ ์งํํ์๊ธฐ์ ๋ชจ๋ .. 2024. 11. 30. ์ด์ 1 ๋ค์ ๋ฐ์ํ