Tạo Azure Synapse Link for Dataverse bằng Azure Data Lake

Bạn có thể dùng Azure Synapse Link để kết nối dữ liệu Microsoft Dataverse của bạn với Azure Data Lake Storage Gen2 để hỗ trợ nhiều tình huống phân tích khác nhau. Bài viết này cho bạn biết cách thực hiện các nhiệm vụ sau:

  1. Kết nối dữ liệu Dataverse với tài khoản Azure Data Lake Storage Gen2 bằng dịch vụ Azure Synapse Link.
  2. Quản lý bảng Dataverse có trong Azure Synapse Link.
  3. Theo dõi Azure Synapse Link.
  4. Hủy liên kết Azure Synapse Link.
  5. Liên kết lại Azure Synapse Link.
  6. Xem dữ liệu trong Azure Data Lake và hiểu rõ cấu trúc tệp.

Lưu ý

Azure Synapse Link for Dataverse trước đây được gọi là Xuất sang kho dữ liệu. Dịch vụ này có tên mới từ tháng 5 năm 2021 và sẽ tiếp tục xuất dữ liệu sang Azure Data Lake cũng như Azure Synapse Analytics.

Điều kiện tiên quyết

  • Azure Data Lake Storage Gen2: Bạn phải có tài khoản Azure Data Lake Storage Gen2 và quyền truy nhập theo vai trò là Chủ sở hữuNgười đóng góp dữ liệu blob lưu trữ. Tài khoản lưu trữ của bạn phải bật Vùng chứa tên phân cấp cho cả thiết lập ban đầu và đồng bộ hóa delta. Cần phải cho phép truy cập khóa tài khoản lưu trữ chỉ dành cho thiết lập ban đầu.

Lưu ý

  • Tài khoản lưu trữ phải được tạo trong cùng một đối tượng thuê Microsoft Entra với đối tượng thuê Power Apps của bạn.
  • Để đặt Bật từ các mạng ảo và địa chỉ IP đã chọn để tài khoản lưu trữ được liên kết cấp quyền truy cập từ các địa chỉ IP đã chọn, bạn phải tạo một Azure Synapse Link với danh tính được quản lý .Sử dụng danh tính được quản lý cho Azure bằng bộ lưu trữ hồ dữ liệu Azure của bạn (nếu chưa thiết lập danh tính được quản lý, bạn phải bật quyền truy cập mạng công cộng cho tài nguyên Azure cho cả thiết lập ban đầu và đồng bộ hóa delta. )
  • Bạn phải có quyền truy nhập vai trò Người đọc vào nhóm nguồn lực với tài khoản lưu trữ.
  • Để liên kết môi trường với Azure Data Lake Storage thế hệ 2, bạn phải có vai trò bảo mật là quản trị viên hệ thống Dataverse.
  • Chỉ có thể xuất các bảng đã bật theo dõi thay đổi.
  • Việc tạo Azure Synapse Link hồ sơ trong một môi trường Dataverse duy nhất bị giới hạn ở mức tối đa là 10.

Kết nối Dataverse với Azure Data Lake Storage Gen2

  1. Đăng nhập vào Power Apps và chọn môi trường ưa dùng của bạn.

  2. Trên ngăn điều hướng bên trái, chọn Azure Synapse Link. Nếu Azure Synapse Link không hiển thị trong ngăn bảng điều khiển bên cạnh, hãy chọn …Thêm và chọn Khám phá tất cả. Azure Synapse Link nằm trong phần Quản lý dữ liệu .

  3. Trên thanh lệnh, chọn + Liên kết mới tới hồ dữ liệu.

  4. Chọn Gói đăng ký, Nhóm tài nguyênTài khoản lưu trữ. Đảm bảo rằng tài khoản lưu trữ đáp ứng các yêu cầu nêu trong phần Yêu cầu về điều kiện. Chọn Tiếp theo.

    Lưu ý

    Trong quá trình liên kết môi trường với một kho dữ liệu, bạn cấp quyền truy cập dịch vụ Azure Synapse Link cho tài khoản lưu trữ của bạn. Đảm bảo rằng bạn tuân thủ các điều kiện tiên quyết về tạo và cấu hình tài khoản Azure Data Lake Storage và cấp cho chính bạn vai trò chủ sở hữu trên tài khoản lưu trữ. Ngoài ra, bạn cấp quyền truy cập dịch vụ luồng dữ liệu Power Platform cho tài khoản lưu trữ của bạn. Thêm thông tin: Chuẩn bị dữ liệu tự phục vụ với luồng dữ liệu.

  5. Thêm các bảng bạn muốn xuất rồi chọn Lưu. Chỉ có thể xuất các bảng đã bật theo dõi thay đổi. Thêm thông tin: Bật tùy chọn theo dõi thay đổi.

    Chọn bảng để xuất.

Bạn có thể làm theo các bước trong bài viết này để tạo liên kết từ một môi trường đến nhiều hồ dữ liệu Azure trong đăng ký Azure của mình. Tương tự, bạn có thể tạo một liên kết từ nhiều môi trường đến cùng Azure Data Lake, tất cả đều nằm trong cùng một đối tượng thuê.

Lưu ý

Dịch vụ Azure Synapse Link for Dataverse được tích hợp liền mạch vào Power Platform như một tính năng có sẵn. Nó đáp ứng các tiêu chuẩn bảo mật và quản trị được đặt ra cho việc Power Platform lưu trữ và quản trị dữ liệu. Thông tin thêm: Lưu trữ và quản trị dữ liệu

Dữ liệu do dịch vụ Azure Synapse Link xuất ra được mã hóa khi truyền bằng cách sử dụng Bảo mật lớp truyền tải (TLS) 1.2 trở lên và được mã hóa ở phần lưu trữ trong Azure Data Lake Storage Gen2. Ngoài ra, dữ liệu chuyển tiếp trong bộ lưu trữ blob cũng được mã hóa ở phần còn lại. Mã hóa trong Azure Data Lake Storage Gen2 giúp bạn bảo vệ dữ liệu của mình, thực hiện các chính sách bảo mật doanh nghiệp và đáp ứng các yêu cầu tuân thủ quy định. Thêm thông tin: Mã hóa dữ liệu Azure tại phần còn lại

Quản lý dữ liệu bảng vào kho dữ liệu

Sau khi thiết lập Azure Synapse Link, bạn có thể quản lý các bảng được xuất theo một trong hai cách:

  • Trên cổng thông tin người tạo Power Apps, trong khu vực Azure Synapse Link, hãy chọn Quản lý bảng trên thanh lệnh để thêm hoặc xóa một hoặc nhiều bảng được liên kết.

  • Trên khu vực Bảng của cổng thông tin người tạo Power Apps, chọn bên cạnh một bảng, sau đó chọn kho dữ liệu được liên kết nơi bạn muốn xuất dữ liệu bảng.

    Chọn một bảng để xuất.

Sau khi thiết lập Azure Synapse Link, bạn có thể theo dõi Azure Synapse Link trong tab Bảng .

Azure Synapse Link giám sát

  • Sẽ có một danh sách các bảng thuộc Azure Synapse Link đã chọn.
  • Có nhiều giai đoạn khác nhau mà trạng thái đồng bộ hóa sẽ trải qua. NotStarted cho biết bảng đang chờ được đồng bộ hóa. Sau khi quá trình đồng bộ hóa ban đầu của bảng Hoàn thành, sẽ có một giai đoạn xử lý bài đăng trong đó các cập nhật gia tăng sẽ không diễn ra. Việc này có thể mất vài giờ tùy thuộc vào kích thước dữ liệu của bạn. Khi các bản cập nhật gia tăng bắt đầu diễn ra, ngày đồng bộ hóa gần nhất sẽ được cập nhật thường xuyên.
  • Cột Số hiển thị các hàng số được ghi. Khi chế độ Chỉ gắn thêm được đặt thành Không, đây là tổng số bản ghi. Khi chế độ Chỉ gắn thêm được đặt thành , đây là tổng số thay đổi.
  • Cột Chỉ gắn thêmChiến lược phân vùng hiển thị mức sử dụng các cấu hình nâng cao khác nhau.
  1. Chọn Azure Synapse Link muốn hủy liên kết.

  2. Chọn Hủy liên kết kho dữ liệu từ thanh lệnh.

  3. Để xóa cả hai hệ thống tệp kho dữ liệu, hãy chọn Xóa hệ thống tệp kho dữ liệu.

  4. Chọn rồi đợi vài phút để hệ thống hủy liên kết và xóa mọi thứ.

Nếu bạn đã xóa hệ thống tệp khi hủy liên kết, hãy làm theo các bước ở trên để liên kết lại kho dữ liệu đó. Nếu bạn không xóa hệ thống tập tin khi hủy liên kết, bạn phải xóa dữ liệu để liên kết lại:

  1. Truy cập vào Azure Data Lake.

  2. Xóa bộ chứa Dataverse.

  3. Truy cập vào Power Apps và liên kết lại kho dữ liệu.

Xem dữ liệu của bạn trong Azure Data Lake Storage thế hệ 2

  1. Chọn Azure Synapse Link mong muốn rồi chọn Truy cập vào Azure data lake từ bảng điều khiển ở trên cùng.

  2. Bung rộng Hệ thống tệp rồi chọn dataverse-environmentName-organizationUniqueName.

Tệp model.json, cùng với tên và phiên bản của nó, cung cấp danh sách các bảng đã được xuất sang kho dữ liệu. Tệp model.json cũng bao gồm trạng thái đồng bộ hóa ban đầu và thời gian hoàn thành đồng bộ hóa.

Một thư mục bao gồm các tệp ảnh tức thời được phân tách bằng dấu phẩy (định dạng CSV) được hiển thị cho mỗi bảng được xuất sang kho dữ liệu. Dữ liệu bảng trong kho Data Lake.

  1. Trong thanh địa chỉ của trình duyệt web, hãy thêm ?athena.updateLake=true vào địa chỉ web kết thúc bằng exporttodatalake.

  2. Chọn cấu hình hiện có từ khu vực Azure Synapse Link , sau đó chọn tùy chọn mở rộng.

  3. Chọn Liên kết đến Azure Synapse Analytics Không gian làm việc và đợi vài phút để mọi thứ được liên kết.

Cập nhật ảnh tức thời liên tục

Dữ liệu Microsoft Dataverse có thể liên tục thay đổi thông qua việc tạo, cập nhật và xóa các giao dịch. Ảnh tức thời cung cấp bản sao chỉ đọc của dữ liệu được cập nhật theo định kỳ, trong trường hợp này là mỗi giờ. Điều này đảm bảo rằng tại bất kỳ thời điểm nào, người dùng phân tích dữ liệu có thể sử dụng dữ liệu trong kho một cách đáng tin cậy.

Cập nhật ảnh tức thời liên tục.

Khi bảng được thêm vào như một phần của lần xuất ban đầu, dữ liệu bảng được ghi vào tệp table.csv trong các thư mục tương ứng trong kho dữ liệu. Đây là khoảng thời gian T1, trong đó tệp ảnh tức thời chỉ đọc có tên table-T1.csv—ví dụ: Account-T1.csv hoặc Contacts-T1.csv—được tạo ra. Ngoài ra, tệp model.json được cập nhật để trỏ đến các tệp ảnh tức thời này. Mở model.json, bạn có thể xem chi tiết ảnh tức thời.

Dưới đây là một ví dụ về một tệp phân vùng Account.csv và thư mục ảnh tức thời trong kho dữ liệu.

Ảnh tức thời bảng tài khoản.

Những thay đổi trong Dataverse được liên tục đẩy đến các tệp CSV tương ứng bằng cách sử dụng công cụ nguồn cấp từng phần. Đây là khoảng thời gian T2, trong đó một ảnh tức thời khác được chụp. table-T2.csv—ví dụ: Accounts-T2.csv hoặc Contacts-T2.csv (giả sử có những thay đổi đối với bảng) —và model.json được cập nhật lên các tệp ảnh tức thời mới. Bất kỳ người mới nào xem dữ liệu ảnh tức thời từ T2 trở đi đều được chuyển đến các tệp ảnh tức thời mới hơn. Bằng cách này, trình xem ảnh tức thời ban đầu có thể tiếp tục hoạt động trên các tệp ảnh tức thời T1 cũ hơn trong khi những người xem mới hơn có thể đọc các bản cập nhật mới nhất. Điều này rất hữu ích trong các tình huống có các quy trình xuôi tuyến chạy lâu hơn.

Lưu ý

Tệp ảnh chụp nhanh mới chỉ được tạo nếu có bản cập nhật dữ liệu. Chỉ có năm tệp ảnh chụp nhanh mới nhất sẽ được giữ lại. Dữ liệu trì trệ sẽ tự động bị xóa khỏi tài khoản Azure Data Lake Storage Gen 2 của bạn.

Dưới đây là một ví dụ về tệp model.json, tệp này luôn trỏ đến tệp ảnh tức thời của tài khoản được đóng dấu thời gian mới nhất.

Tệp mẫu model.json tức thời.

Tiếp theo là gì?

Sau khi sử dụng thành công dịch vụ Azure Synapse Link for Dataverse, hãy khám phá cách bạn có thể phân tích và sử dụng dữ liệu của mình với Trung tâm khám phá. Để truy nhập vào Trung tâm khám phá, hãy chuyển đến Power Apps > Azure Synapse Link. Chọn dịch vụ được liên kết của bạn và sau đó chọn tab Trung tâm khám phá. Tại đây, bạn có thể tìm thấy các công cụ được đề xuất và tài liệu được sắp xếp để giúp bạn tận dụng tối đa dữ liệu của mình. Trung tâm khám phá.

Xem thêm

Phân tích dữ liệu Dataverse trong kho dữ liệu với Power BI

Nhập dữ liệu Dataverse vào kho dữ liệu bằng Azure Data Factory

Cấu hình nâng cao trong Azure Synapse Link for Dataverse

Câu hỏi thường gặp về Azure Synapse Link

Lưu ý

Bạn có thể cho chúng tôi biết bạn thích dùng ngôn ngữ nào cho tài liệu không? Làm một cuộc khảo sát ngắn. (xin lưu ý, khảo sát này bằng tiếng Anh)

Cuộc khảo sát sẽ mất khoảng bảy phút. Không có dữ liệu cá nhân nào được thu thập (điều khoản về quyền riêng tư).