使用 Azure Synapse Workspace 建立 Azure Synapse Link for Dataverse

您可以使用 Azure Synapse Link 將您的 Microsoft Dataverse 資料連線至 Azure Synapse Analytics,以探索您的資料並加快深入解析速度。 本文章將說明如何執行下列工作:

  1. 使用服務將您的 Dataverse 資料連線至帶有 Azure Synapse Link 服務的 Azure Synapse Analytics 工作區。
  2. 管理 Azure Synapse Link 中所含的 Dataverse 資料表。
  3. 監視您的 Azure Synapse Link。
  4. 解除 Azure Synapse Link 連結。
  5. 重新連結您的 Azure Synapse Link。
  6. 在 Azure Synapse Analytics 中檢視您的資料。

注意

Azure Synapse Link for Microsoft Dataverse 先前被稱為匯出至資料湖。 服務的重新命名已在 2021 年 5 月生效,並將繼續匯出資料至 Azure Data Lake 以及 Azure Synapse Analytics。

先決條件

  • Dataverse:您必須具備 Dataverse 系統管理員資訊安全角色。 此外,您要透過 Azure Synapse Link 匯出的表格必須已啟用追蹤變更屬性。 其他資訊:進階選項

  • Azure Data Lake Storage Gen2:您必須擁有 Azure Data Lake Storage Gen2 帳戶和 擁有者Storage Blob 資料參與者角色存取權。 您的儲存體帳戶必須啟用初始安裝和增量同步的階層命名空間。只有初始安裝需要允許儲存體帳戶金鑰存取

  • Synapse 工作區:您必須有 Synapse 工作區,以及 Synapse Studio 中的 Synapse 系統管理員角色存取權。 Synapse 工作區必須與您的 Azure Data Lake Storage Gen2 帳戶位於相同的區域。 在 Synapse Studio 中,必須將儲存帳戶新增為連結的服務。 若要建立 Synapse 工作區,請移至建立 Synapse 工作區

注意

  • 儲存體帳戶和 Synapse 工作區必須在與您的 Power Apps 租用戶相同的 Microsoft Entra 租用戶中建立。
  • 若要為連結的儲存體帳戶和工作區設定從選取的虛擬網路和 IP 位址啟用,您必須建立具有受管理識別的 Azure Synapse Link。 其他詳細資訊:將 Azure 受管理身分與 Azure data lake storage 搭配使用 (如果未設定受管理身分,則必須啟用初始設定和增量同步的 Azure 資源公用網路存取。)
  • 不支援出現受管理的專用端點、資料外流保護或受管理虛擬網路的 Synapse 工作區。
  • 您必須擁有具有儲存體帳戶和 Synapse 工作區的資源群組讀取者角色存取權。
  • 當您將多個使用者新增至 synapse 工作區時,他們必須具備 synapse Studio 中的 synapse 系統管理員角色存取權,以及 Azure Data Lake Storage Gen2 帳戶上的 Blob 儲存體參與者角色。
  • 在單一 DV 環境下建立 Synapse 連結設定檔的最大限制為 10 個。

將 Dataverse 連接至 Synapse 工作區

  1. 登入 Power Apps並選取您喜歡的環境。

  2. 在左側瀏覽窗格中,選取 Azure Synapse Link。 如果在側窗格中看不見 Azure Synapse Link,請選取 ... 更多,然後選擇探索全部。 在資料管理區段中選取 Azure Synapse Link

  3. 在命令列中,選取 + 新連結

  4. 選取連接至 Azure Synapse workspace 選項。

  5. 選取訂閱資源群組工作區名稱儲存體帳戶。 請確定 Synapse 工作區和儲存體帳戶符合先決條件 區段中指定的需求。 選取下一步

    連線到您的工作區。

    注意

    作為將環境連結至 Data Lake 的一部分,您可以授與 Azure Synapse Link 服務存取您的儲存體帳戶。 確定您已遵循建立和設定 Azure Data Lake Storage 帳戶的先決條件,並授與您自己在儲存體帳戶上的擁有者角色。 此外,您還會將 Power Platform 資料流程服務存取權限授與您的儲存體帳戶。 其他資訊:使用資料流程的自助資料準備

  6. 新增想要匯出的資料表,然後選取儲存。 只有已啟用變更追蹤的表格可匯出。 其他資訊:啟用變更追蹤

    新增資料表。

您可以依照上述步驟,將 Azure Data Lake 當作 Synapse 工作區上的連結服務,在 Azure 訂閱中建立一個環境到多個 Azure Synapse Analytics 工作區和 Azure Data Lake 的連結。 同樣地,您可以在相同的租用戶中,建立從多個環境到相同 Azure Synapse Analytics 工作區和 Azure Data Lake 的連結。

注意

該 Azure Synapse Link for Dataverse 服務作為開箱即用的功能,順暢地整合到 Power Platform 中。 它符合為 Power Platform 資料儲存體和治理設定的安全性與治理標準。 其他資訊:資料儲存體和治理

Azure Synapse Link 服務所匯出的資料會在傳輸時使用傳輸層安全性 (TLS) 1.2 或更新版本進行加密,並在 Azure Data Lake Storage Gen2 中進行待用加密。 此外,blob 儲存體中的暫時性數據也會加密待用。 Azure Data Lake Storage Gen2 中的加密協助您保護資料、實施企業資訊安全性原則及符合法規合規性需求。 詳細資訊:Azure 靜態加密 詳細資訊: 設定 Azure 儲存體防火牆和虛擬網路

管理資歷表資料至 Synapse 工作區

設定 Azure Synapse Link 之後,您可以使用下列兩種方式之一來管理匯出的資料表:

  • 在 Power Apps (make.powerapps.com) Azure Synapse Link 區域中,選取命令列上的 管理資料表,以新增或移除一個或多個連結資料表。

  • 在 Power Apps 製作入口網站表格區域中,選取 按一下表格旁邊,然後選取要匯出表格資料的連結 data lake。

    選取要匯出的資料表。

設定 Azure Synapse Link 之後,您可以在資料表索引標籤下監視 Azure Synapse Link。

監視 Azure Synapse Link

  • 將有一份資料表清單,其中的資料表是所選 Azure Synapse Link 的一部分。
  • 同步狀態將會在不同階段循環進行。 NotStarted 表示該資料表正在等待同步處理。 表格初始同步完成時,將會有一個後續處理階段,不會發生累加式更新。 這可能需要幾個小時,需視資料大小而定。 當累加式更新開始進行時,將會定期更新上次同步的日期。
  • 計數資料行顯示寫入的列數。 當限附加設為時,這為記錄的總數。 當限附加設為時,這為變更的總數。
  • 僅附加分割策略資料行會顯示不同進階設定的使用方式。
  1. 選取要取消連結的 Azure Synapse Link。

  2. 從命令列選取取消連結

  3. 若要同時刪除資料湖檔案系統以及 Synapse 資料庫,請鍵入連結名稱進行確認。

  4. 選取,並等待幾分鐘完成全部取消連結並刪除。

如果在解除連結時刪除了檔案系統,請依照上述步驟重新連結相同的 Synapse 工作區和資料湖。 如果在取消連結時未刪除檔案系統,則必須清除資料才能重新連結:

  1. 瀏覽至 Azure Synapse Analytics。

  2. 選取未連結資料庫的 ...,然後選取新增筆記本 > 空白筆記本

  3. 從下拉式功能表中選取一個集區,將筆記本附加到 Apache Spark 集區中。 如果您沒有 Apache Spark 集區,請選取管理集區來建立一個。

  4. 輸入以下指令碼,將 <DATABASE_NAME> 取代為要取消連結的資料庫名稱,並執行筆記本。

    %%sql
    DROP DATABASE <DATABASE_NAME> CASCADE
  1. 執行筆記本後,請從左面板重新整理資料庫清單。 如果資料庫仍然存在,請嘗試在資料庫上按一下滑鼠右鍵,然後選取刪除

  2. 瀏覽至 Power Apps,然後重新連結 Synapse 工作區和資料湖。

存取近即時資料和唯讀快照資料

建立 Azure Synapse Link 後,兩個版本的資料表資料就會根據預設在 Azure 訂閱中的 Azure Synapse Analytics 和/或 Azure Data Lake Storage Gen2 中同步,以確保您可以在任何指定時間可靠地使用資料湖中已更新的資料:

  • 近即時的資料:偵測自最初擷取或上次同步以來發生了哪些資料變更,透過 Azure Synapse Link 以有效率的方式提供從 Dataverse 同步的資料複本。
  • 快照資料:提供定期更新的近即時資料複本 (在此案例中為每隔一小時)。 

注意

若要建立唯讀快照資料,請確定已在從任何儲存體帳戶設定複製作業的允許範圍。 其他資訊:設定複製作業的允許範圍

  1. 選取所需的 Azure Synapse Link,然後選取頂端面板的 移至 Azure Synapse Analytics 工作區 。
  2. 從左面板展開 Lake 資料庫,選取 dataverse-environmentName-organizationUniqueName,然後展開 資料表

所有近即時資料資料表均已列出並可用於使用命名規範 DataverseTableName 進行分析。所有快照集資料資料表均已列出並可用於使用命名規範 DataverseTableName_partitioned 進行分析。

近即時和快照集資料表

下一步是什麼?

在成功使用 Azure Synapse Link for Dataverse 服務之後,請探索如何使用探索中心來分析和使用您的資料 。 若要存取探索中心,請移至Power Apps > Azure Synapse Link。 選取您連結的服務,然後選取探索中心索引標籤。您可以在此尋找建議的工具和策劃文件,以協助您讓資料發揮最大的價值。 探索中心。

請參閱

使用您的 Azure Data Lake 設定 Azure Synapse Link for Dataverse

Azure Synapse Link for Dataverse 進階設定

Azure Synapse Link 常見問題集

部落格:宣佈 Azure Synapse Link for Dataverse

注意

是否能請您告知您偏好的慣用文件語言? 請填寫問卷。 (請注意,本問卷為英文版)

完成問卷大約需要七分鐘。 本問卷將不會收集個人資料 (隱私權聲明)。