Halaman ini menjelaskan harga untuk Dataflow. Untuk melihat harga produk lain, baca Dokumentasi harga.
Untuk mempelajari cara menghemat 40% dengan komitmen tiga tahun atau 20% dengan komitmen satu tahun, tinjau halaman diskon abonemen (CUD) kami.
Penggunaan Dataflow dikenai biaya untuk resource yang digunakan oleh tugas Anda. Bergantung pada model harga yang Anda gunakan, resource diukur dan ditagih secara berbeda.
| Unit Komputasi Data (DCU) (batch dan streaming) |
Unit Komputasi Data (DCU)
(batch dan streaming)
Resource Dataflow lain yang dikenai biaya untuk semua tugas mencakup Persistent Disk, GPU, dan snapshot.
Resource dari layanan lain dapat digunakan untuk tugas Dataflow. Layanan yang digunakan dengan Dataflow dapat mencakup BigQuery, Pub/Sub, Cloud Storage, dan Cloud Logging, serta layanan lainnya.
Meskipun tarif harganya adalah per jam, penggunaan Dataflow akan dikenakan biaya setiap kenaikan satu detik per tugas. Penggunaan dinyatakan dalam jam agar harga per jam diterapkan untuk penggunaan per detik. Misalnya, 30 menit adalah 0,5 jam. Worker dan tugas dapat menggunakan resource seperti yang dijelaskan di bagian berikut.
Rilis Dataflow mendatang mungkin memiliki biaya layanan yang berbeda atau paket layanan terkait.
Penagihan Dataflow untuk resource komputasi mencakup komponen berikut:
Untuk mengetahui informasi selengkapnya tentang region yang tersedia beserta zonanya, lihat halaman Region dan Zona Compute Engine.
Setiap tugas Dataflow menggunakan setidaknya satu worker Dataflow. Layanan Dataflow menyediakan dua jenis pekerja: batch dan streaming. Pekerja batch dan streaming memiliki biaya layanan terpisah.
Worker Dataflow menggunakan resource berikut, masing-masing dikenai biaya per detik:
Pekerja batch dan streaming adalah resource khusus yang menggunakan Compute Engine. Namun, tugas Dataflow tidak akan menghasilkan tagihan Compute Engine untuk resource Compute Engine yang dikelola oleh layanan Dataflow. Sebagai gantinya, biaya layanan Dataflow mencakup penggunaan resource Compute Engine tersebut.
Anda dapat mengganti jumlah pekerja default untuk suatu tugas. Jika menggunakan autoscaling, Anda dapat menentukan jumlah maksimum pekerja yang akan dialokasikan ke suatu tugas. Worker dan resource terkait ditambahkan dan dihapus secara otomatis berdasarkan aktuasi penskalaan otomatis.
Selain itu, Anda dapat menggunakan opsi pipeline untuk mengganti setelan resource default, seperti jenis mesin, jenis disk, dan ukuran disk, yang dialokasikan ke setiap pekerja dan yang menggunakan GPU.
Dataflow menyediakan opsi dengan harga CPU dan memori yang didiskon untuk batch processing. Penjadwalan Resource Fleksibel (FlexRS) menggabungkan VM reguler dan preemptible dalam satu pool worker Dataflow, sehingga pengguna dapat mengakses resource pemrosesan yang lebih murah. FlexRS juga menunda eksekusi tugas Dataflow batch dalam jangka waktu 6 jam untuk mengidentifikasi waktu terbaik untuk memulai tugas berdasarkan resource yang tersedia.
Meskipun Dataflow menggunakan kombinasi worker untuk menjalankan tugas FlexRS, Anda akan ditagih dengan tarif diskon seragam sekitar 40% untuk biaya CPU dan memori dibandingkan dengan harga Dataflow reguler, terlepas dari jenis worker. Anda dapat menginstruksikan Dataflow untuk menggunakan FlexRS untuk pipeline batch yang diskalakan secara otomatis dengan menentukan parameter FlexRS.
Untuk pipeline batch, Dataflow menyediakan fitur yang sangat skalabel, Dataflow Shuffle, yang mengacak data di luar pekerja. Untuk informasi selengkapnya, lihat Shuffle Dataflow.
Dataflow Shuffle mengenakan biaya berdasarkan volume data yang diproses selama shuffle.
Untuk pipeline streaming, Streaming Engine Dataflow memindahkan pemrosesan status dan pengacakan streaming dari VM pekerja ke backend layanan Dataflow. Untuk informasi selengkapnya, lihat Streaming Engine.
Dengan penagihan berbasis resource, resource Streaming Engine diukur dalam Unit Komputasi Streaming Engine. Dataflow mengukur resource Streaming Engine yang digunakan setiap tugas, lalu menagih berdasarkan total resource yang digunakan oleh tugas tersebut. Untuk mengaktifkan penagihan berbasis resource untuk tugas Anda, lihat Menggunakan penagihan berbasis resource. Saat Anda menggunakan penagihan berbasis resource, diskon yang ada akan diterapkan secara otomatis.
Saat Anda menggunakan Dataflow Prime dengan penagihan berbasis resource, Anda akan ditagih berdasarkan total resource yang digunakan setiap tugas, tetapi SKU Data Compute Unit (DCU) digunakan, bukan SKU Streaming Engine Compute Unit.
Dataflow terus mendukung penagihan data yang diproses lama. Kecuali jika Anda mengaktifkan penagihan berbasis resource, tugas akan ditagih menggunakan penagihan data yang diproses.
Tagihan data yang diproses Streaming Engine mengukur penggunaan berdasarkan volume data streaming yang diproses, yang bergantung pada faktor-faktor berikut:
Contoh yang dihitung sebagai byte yang diproses meliputi item berikut:
Harga resource komputasi Dataflow - Batch
Tabel berikut berisi detail harga untuk resource worker dan data Shuffle yang diproses untuk Batch.
Jenis tugas | Default (USD) |
---|---|
CPU | US$0,056 / 1 hour |
Memori | US$0,003557 / 1 gibibyte hour |
Data yang Diproses selama shuffle | US$0,011 / 1 gibibyte |
Setelan default pekerja batch: 1 vCPU, memori sebesar 3,75 GB, Persistent Disk sebesar 250 GB jika tidak menggunakan Shuffle Dataflow, Persistent Disk sebesar 25 GB jika menggunakan Shuffle Dataflow
Harga resource komputasi Dataflow - FlexRS
Tabel berikut berisi detail harga untuk resource worker dan data Shuffle yang diproses untuk tugas FlexRS.
Resource | Default (USD) |
---|---|
CPU | US$0,0336 / 1 hour |
Memori | US$0,0021342 / 1 gibibyte hour |
Data yang Diproses selama shuffle | US$0,011 / 1 gibibyte |
Setelan default pekerja FlexRS: 2 vCPU, memori sebesar 7,50 GB, Persistent Disk sebesar 25 GB per pekerja, dengan minimal dua pekerja
Tabel berikut berisi detail harga untuk resource worker, data Streaming Engine yang diproses (lama), dan Unit Komputasi Streaming Engine untuk tugas streaming.
Resource | Default* (USD) | Dataflow CUD - 1 Year* (USD) | Dataflow CUD - 3 Year* (USD) |
---|---|---|---|
CPU | US$0,069 / 1 hour | US$0,0552 / 1 hour | US$0,0414 / 1 hour |
Memori | US$0,003557 / 1 gibibyte hour | US$0,0028456 / 1 gibibyte hour | US$0,0021342 / 1 gibibyte hour |
Data yang diproses selama shuffle | US$0,018 / 1 gibibyte | US$0,0144 / 1 gibibyte | US$0,0108 / 1 gibibyte |
Streaming Engine | US$0,089 / 1 count | US$0,0712 / 1 count | US$0,0534 / 1 count |
Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda pada SKU Cloud Platform.
3Setelan default pekerja streaming: 4 vCPU, memori sebesar 15 GB, Persistent Disk sebesar 400 GB jika tidak menggunakan Streaming Engine, Persistent Disk sebesar 30 GB jika menggunakan Streaming Engine. Layanan Dataflow saat ini dibatasi hingga 15 persistent disk per instance worker saat menjalankan tugas streaming. Rasio 1:1 antara worker dan disk adalah alokasi resource minimum.
4Harga Dataflow Shuffle didasarkan pada penyesuaian volume yang diterapkan pada jumlah data yang diproses selama operasi baca dan tulis saat mengacak set data Anda. Untuk mengetahui informasi selengkapnya, lihat Detail harga Shuffle Dataflow. Harga Dataflow Shuffle tidak berlaku untuk tugas Streaming Engine yang menggunakan tagihan berbasis resource.
5Unit Komputasi Streaming Engine: untuk tugas streaming yang menggunakan Streaming Engine dan model penagihan berbasis resource. Job ini tidak ditagih untuk data yang diproses selama pengacakan.
Biaya dihitung per tugas Dataflow melalui penyesuaian volume yang diterapkan pada total jumlah data yang diproses selama operasi Dataflow Shuffle. Tagihan aktual Anda untuk data Shuffle Dataflow yang diproses setara dengan dikenai biaya penuh untuk jumlah data yang lebih kecil daripada jumlah yang diproses oleh tugas Dataflow. Perbedaan ini menghasilkan metrik data shuffle yang diproses dan dapat ditagih lebih kecil daripada metrik total data shuffle yang diproses.
Tabel berikut menjelaskan cara penerapan penyesuaian ini:
Data Dataflow Shuffle yang diproses | Penyesuaian tagihan |
---|---|
250 GiB pertama | 75% pengurangan |
4.870 GiB berikutnya | 50% pengurangan |
Data tersisa di atas 5.120 GiB (5 TiB) | tidak ada |
Misalnya, jika pipeline Anda menghasilkan total data Shuffle Dataflow yang diproses sebesar 1.024 GiB (1 TiB), jumlah yang dapat ditagih dihitung sebagai berikut:
250 GiB * 25% + 774 GiB * 50% = 449,5 GiB * tarif pemrosesan data Shuffle Dataflow regional
Jika pipeline Anda menghasilkan 10.240 GiB (10 TiB) total data Shuffle Dataflow yang diproses, jumlah data yang dapat ditagih adalah:
250 GiB * 25% + 4.870 GiB * 50% + 5.120 GiB = 7.617,5 GiB
Dataflow Prime adalah platform pemrosesan data yang dibangun berdasarkan Dataflow untuk meningkatkan pemanfaatan resource dan diagnostik terdistribusi.
Resource komputasi yang digunakan oleh tugas Dataflow Prime dihargai berdasarkan jumlah Unit Komputasi Data (DCU). DCU merepresentasikan resource komputasi yang dialokasikan untuk menjalankan pipeline Anda. Resource Dataflow lain yang digunakan oleh tugas Dataflow Prime, seperti Persistent Disk, GPU, dan snapshot, ditagih secara terpisah.
Untuk mengetahui informasi selengkapnya tentang region yang tersedia beserta zonanya, lihat halaman Region dan Zona Compute Engine.
Unit Komputasi Data (DCU) adalah unit pengukuran penggunaan Dataflow yang melacak jumlah resource komputasi yang digunakan oleh tugas Anda. Resource yang dilacak oleh DCU mencakup vCPU, memori, data Dataflow Shuffle yang diproses (untuk tugas batch), dan data Streaming Engine yang diproses (untuk tugas streaming). Tugas yang menggunakan lebih banyak resource memiliki penggunaan DCU yang lebih banyak dibandingkan dengan tugas yang menggunakan lebih sedikit resource. Satu DCU sebanding dengan resource yang digunakan oleh tugas Dataflow yang berjalan selama satu jam pada pekerja 1 vCPU 4 GB.
Anda akan ditagih untuk jumlah total DCU yang digunakan oleh tugas Anda. Harga satu DCU bervariasi berdasarkan apakah Anda memiliki tugas batch atau tugas streaming. Saat Anda menggunakan Dataflow Prime dengan penagihan berbasis resource, Anda akan ditagih berdasarkan total resource yang digunakan, bukan byte yang diproses.
Jenis Tugas | Default* (USD) | Dataflow CUD - 1 Year* (USD) | Dataflow CUD - 3 Year* (USD) |
---|---|---|---|
Batch | US$0,06 / 1 count | - | - |
Streaming | US$0,089 / 1 count | US$0,0712 / 1 count | US$0,0534 / 1 count |
Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda pada SKU Cloud Platform.
Anda tidak dapat menetapkan jumlah DCU untuk tugas Anda. DCU dihitung oleh Dataflow Prime. Namun, Anda dapat mengurangi jumlah DCU yang digunakan dengan mengelola aspek tugas berikut:
Untuk mengidentifikasi pengoptimalan ini, gunakan antarmuka pemantauan Dataflow dan antarmuka detail eksekusi.
Di Dataflow, Anda akan dikenai biaya untuk resource berbeda yang digunakan oleh tugas Anda, seperti vCPU, memori, Persistent Disk, dan jumlah data yang diproses oleh Dataflow Shuffle atau Streaming Engine.
Data Compute Unit menggabungkan semua resource kecuali penyimpanan ke dalam satu unit pengukuran. Anda akan ditagih untuk resource Persistent Disk dan jumlah DCU yang digunakan berdasarkan jenis tugas, batch atau streaming. Untuk informasi selengkapnya, lihat Menggunakan Dataflow Prime.
Tugas batch dan streaming Anda yang ada akan terus ditagih menggunakan model Dataflow. Saat Anda mengupdate tugas untuk menggunakan Dataflow Prime, tugas tersebut akan menggunakan model harga Dataflow Prime, yang akan ditagih untuk resource Persistent Disk dan DCU yang digunakan.
Penyimpanan, GPU, snapshot, dan resource lainnya ditagih dengan cara yang sama untuk Dataflow dan Dataflow Prime.
Resource penyimpanan ditagih dengan tarif yang sama untuk tugas streaming, batch, dan FlexRS. Anda dapat menggunakan opsi pipeline untuk mengubah ukuran disk atau jenis disk default. Dataflow Prime menagih Persistent Disk secara terpisah berdasarkan harga di tabel berikut.
Item | Default (USD) |
---|---|
Penyimpanan - Persistent Disk Standar | US$0,000054 / 1 gibibyte hour |
Penyimpanan - Persistent Disk SSD | US$0,000298 / 1 gibibyte hour |
Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda pada SKU Cloud Platform.
Layanan Dataflow saat ini dibatasi hingga 15 persistent disk per instance worker saat menjalankan tugas streaming. Setiap persistent disk bersifat lokal untuk setiap virtual machine Compute Engine. Rasio 1:1 antara worker dan disk adalah alokasi resource minimum.
Tugas yang menggunakan Streaming Engine menggunakan boot disk 30 GB. Tugas yang menggunakan Dataflow Shuffle menggunakan disk boot 25 GB. Untuk tugas yang tidak menggunakan penawaran ini, ukuran default setiap persistent disk adalah 250 GB dalam mode batch dan 400 GB dalam mode streaming.
Penggunaan Compute Engine didasarkan pada jumlah rata-rata worker, sedangkan penggunaan Persistent Disk didasarkan pada nilai pasti --maxNumWorkers. Persistent Disk didistribusikan ulang sehingga setiap worker memiliki jumlah disk terlampir yang sama.
Resource GPU ditagih dengan tarif yang sama untuk tugas streaming dan batch. FlexRS saat ini tidak mendukung GPU. Untuk mengetahui informasi tentang region dan zona yang tersedia untuk GPU, lihat Ketersediaan region dan zona GPU dalam dokumentasi Compute Engine.
Item | Default (USD) |
---|---|
GPU NVIDIA® Tesla® P100 | US$1,752 / 1 hour |
GPU NVIDIA® Tesla® V100 | US$2,976 / 1 hour |
GPU NVIDIA® Tesla® T4 | US$0,42 / 1 hour |
GPU NVIDIA® Tesla® P4 | US$0,72 / 1 hour |
GPU NVIDIA® Tesla® L4 | US$0,672048 / 1 hour |
GPU NVIDIA® Tesla® A100 (40 GB) | US$3,72 / 1 hour |
GPU NVIDIA® Tesla® A100 (80 GB) | US$4,713696 / 1 hour |
Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda pada SKU Cloud Platform.
Untuk membantu Anda mengelola keandalan pipeline streaming, Anda dapat menggunakan snapshot untuk menyimpan dan memulihkan status pipeline. Penggunaan snapshot ditagih berdasarkan volume data yang disimpan, yang bergantung pada faktor-faktor berikut:
Anda dapat mengambil snapshot tugas streaming menggunakan konsol Dataflow atau Google Cloud CLI. Tidak ada biaya tambahan untuk membuat tugas dari snapshot Anda guna memulihkan status pipeline Anda. Untuk informasi selengkapnya, lihat Menggunakan snapshot Dataflow.
Item | Default (USD) |
---|---|
Penyimpanan | US$0,000205479 / 1 gibibyte hour |
Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda pada SKU Cloud Platform.
Confidential VM untuk Dataflow mengenkripsi data yang digunakan pada VM Compute Engine worker. Untuk mengetahui detail selengkapnya, lihat Ringkasan Confidential VM.
Penggunaan Confidential VM untuk Dataflow menimbulkan biaya tambahan per-vCPU dan per-GB yang tetap.
Harga berlaku global dan tidak berubah berdasarkan region Google Cloud.
Item | Default (USD) |
---|---|
CPU | US$0,005479 / 1 hour |
Memori | US$0,0007342 / 1 gibibyte hour |
Selain penggunaan Dataflow, tugas mungkin menggunakan resource berikut, masing-masing dikenakan biaya sesuai dengan harganya sendiri, termasuk tetapi tidak terbatas pada:
Anda dapat melihat total resource vCPU, memori, dan Persistent Disk yang terkait dengan tugas di panel Job info di bagian Resource metrics. Anda dapat melacak metrik berikut di Antarmuka Pemantauan Dataflow:
Anda dapat menggunakan metrik Total shuffle data processed untuk mengevaluasi performa pipeline dan metrik Billable shuffle data processed untuk menentukan biaya tugas Dataflow.
Untuk Dataflow Prime, Anda dapat melihat jumlah total DCU yang digunakan oleh sebuah tugas di panel Job info pada Resource metrics.
Gunakan Kalkulator Harga Google Cloud untuk membantu Anda memahami perhitungan tagihan.
Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda pada SKU Cloud Platform.