Mẫu thiết kế cho quy trình xác thực địa chỉ khối lượng lớn trên Google Cloud Platform

Mục tiêu

Hướng dẫn Xác thực địa chỉ khối lượng lớn đã hướng dẫn bạn qua các trường hợp có thể sử dụng tính năng xác thực địa chỉ khối lượng lớn. Trong hướng dẫn này, chúng tôi sẽ giới thiệu các mẫu thiết kế trong Google Cloud Platform để chạy tính năng Xác thực địa chỉ số lượng lớn.

Chúng ta sẽ bắt đầu bằng cách tìm hiểu tổng quan về cách chạy tính năng Xác thực địa chỉ khối lượng lớn trong Google Cloud Platform bằng Cloud Run, Compute Engine hoặc Google Kubernetes Engine cho các lượt thực thi một lần. Sau đó, chúng ta sẽ xem cách đưa chức năng này vào quy trình dữ liệu.

Khi kết thúc bài viết này, bạn đã nắm rõ các tuỳ chọn để chạy tính năng Xác thực địa chỉ với khối lượng lớn trong môi trường Google Cloud.

Cấu trúc tham chiếu trên Google Cloud Platform

Phần này sẽ trình bày kỹ hơn về các mẫu thiết kế dành cho tính năng Xác thực địa chỉ số lượng lớn bằng Google Cloud Platform. Khi chạy trên Google Cloud Platform, bạn có thể tích hợp với các quy trình và quy trình dữ liệu hiện có của mình.

Chạy tính năng Xác thực địa chỉ số lượng lớn một lần trên Google Cloud Platform

Dưới đây là cấu trúc tham khảo về cách xây dựng chế độ tích hợp trên Google Cloud Platform phù hợp hơn cho hoạt động một lần hoặc kiểm thử.

hình ảnh

Trong trường hợp này, bạn nên tải tệp CSV lên bộ chứa Cloud Storage. Sau đó, bạn có thể chạy tập lệnh Xác thực địa chỉ khối lượng lớn trong môi trường Cloud Run. Tuy nhiên, bạn có thể thực thi phương thức này trong bất kỳ môi trường thời gian chạy nào khác như Compute Engine hoặc Google Kubernetes Engine. Tệp CSV đầu ra cũng có thể được tải lên bộ chứa Cloud Storage.

Chạy dưới dạng quy trình dữ liệu của Google Cloud Platform

Mẫu triển khai được hiển thị trong phần trước rất phù hợp để kiểm tra nhanh tính năng Xác thực địa chỉ khối lượng lớn cho mục đích sử dụng một lần. Tuy nhiên, nếu cần sử dụng sản phẩm này thường xuyên trong quy trình dữ liệu, thì bạn có thể tận dụng tốt hơn các tính năng gốc của Google Cloud Platform để tăng hiệu quả. Một số thay đổi mà bạn có thể thực hiện bao gồm:

hình ảnh

  • Trong trường hợp này, bạn có thể kết xuất tệp CSV trong bộ chứa của Cloud Storage.
  • Công việc Dataflow có thể nhận các địa chỉ cần xử lý, sau đó lưu vào bộ nhớ đệm trong BigQuery.
  • Bạn có thể mở rộng thư viện Dataflow Python để có logic Xác thực địa chỉ khối lượng lớn nhằm xác thực địa chỉ từ công việc Dataflow.

Chạy tập lệnh từ quy trình dữ liệu như một quy trình định kỳ có tính bền vững và lâu dài

Một phương pháp phổ biến khác là xác thực một lô địa chỉ trong quy trình dữ liệu truyền trực tuyến dưới dạng quy trình định kỳ. Bạn cũng có thể có những địa chỉ trong kho dữ liệu BigQuery. Trong cách tiếp cận này, chúng ta sẽ xem xét cách xây dựng một quy trình dữ liệu định kỳ (cần được kích hoạt hằng ngày/hằng tuần/hằng tháng)

hình ảnh

  • Tải tệp CSV ban đầu lên bộ chứa Cloud Storage.
  • Sử dụng Memorystore làm kho dữ liệu ổn định để duy trì trạng thái trung gian trong quá trình chạy trong thời gian dài.
  • Lưu các địa chỉ cuối cùng vào bộ nhớ đệm trong kho dữ liệu BigQuery.
  • Thiết lập Cloud Scheduler để chạy tập lệnh định kỳ.

Cấu trúc này có các ưu điểm sau:

  • Khi sử dụng Trình lập lịch biểu đám mây, bạn có thể định kỳ xác thực địa chỉ. Bạn nên xác thực lại địa chỉ hằng tháng hoặc xác thực bất kỳ địa chỉ mới nào hằng tháng/hằng quý. Cấu trúc này giúp giải quyết trường hợp sử dụng đó.
  • Nếu dữ liệu khách hàng nằm trong BigQuery, thì các địa chỉ đã xác thực hoặc Cờ xác thực có thể được lưu vào bộ nhớ đệm trực tiếp ở đó. Lưu ý: Những gì có thể được lưu vào bộ nhớ đệm và cách mô tả chi tiết trong bài viết Xác thực địa chỉ khối lượng lớn

  • Việc sử dụng Memorystore giúp phục hồi và xử lý nhiều địa chỉ hơn. Các bước này sẽ cải thiện trạng thái cho toàn bộ quy trình xử lý cần thiết để xử lý các tập dữ liệu địa chỉ rất lớn. Bạn cũng có thể sử dụng các công nghệ cơ sở dữ liệu khác như Cloud SQL[https://cloud.google.com/sql] hoặc bất kỳ phiên bản cơ sở dữ liệu nào khác mà Google Cloud Platform cung cấp tại đây. Tuy nhiên, chúng tôi tin rằng tính năng memorystore hoàn hảo giúp cân bằng giữa nhu cầu mở rộng và đơn giản hoá, do đó, đây nên là lựa chọn hàng đầu.

Kết luận

Bằng cách áp dụng các mẫu được mô tả tại đây, bạn có thể dùng API xác thực địa chỉ cho nhiều trường hợp sử dụng và trong nhiều trường hợp sử dụng trên Google Cloud Platform.

Chúng tôi đã viết một thư viện Python nguồn mở để giúp bạn bắt đầu làm quen với các trường hợp sử dụng được mô tả ở trên. Bạn có thể gọi dịch vụ này từ một dòng lệnh trên máy tính hoặc từ Google Cloud Platform hoặc các nhà cung cấp dịch vụ đám mây khác.

Tìm hiểu thêm về cách sử dụng thư viện trong bài viết này.

Các bước tiếp theo

Tải sách trắng về Cải thiện quy trình thanh toán, giao hàng và hoạt động bằng địa chỉ đáng tin cậy rồi xem Hội thảo trên web Cải thiện quy trình thanh toán, giao hàng và hoạt động bằng tính năng Xác thực địa chỉ .

Bạn nên đọc thêm:

Người đóng góp

Google duy trì bài viết này. Những người đóng góp sau đây đã viết bài đăng này đầu tiên.
Tác giả chính:

Henrik Valve | Kỹ sư giải pháp
Thomas Anglaret | Kỹ sư giải pháp
Sarthak Ganguly | Kỹ sư giải pháp