Visão geral do Dataplex

O Dataplex é uma malha de dados inteligente que unifica dados distribuídos e automatiza o gerenciamento e a governança de dados. Com o Dataplex, é possível usar a IA para facilitar consultas de dados, garantia de qualidade e insights de negócios.

O Dataplex realiza a governança em grande escala. Considere, por exemplo, uma empresa de varejo global que gera grandes quantidades de dados de vendas, inventário e clientes armazenados no Cloud Storage, no Spanner e no Pub/Sub. Com os dados distribuídos entre os sistemas, gerenciar a governança, garantir a qualidade e manter a conformidade é complexo e demorado. O Dataplex simplifica esse processo fornecendo uma visualização central para descobrir, criar perfis, validar, rastrear a linhagem e controlar o acesso aos recursos de dados organizacionais.

Por que usar o Dataplex?

O Dataplex governa os dados com os seguintes recursos:

  • Catalogação de metadados. Extraia metadados de recursos Google Cloud (no BigQuery, Cloud SQL, Spanner, Vertex AI, Pub/Sub, Dataform, Metastore do Dataproc) e de terceiros que você importa para o Dataplex e tenha um instantâneo dos seus recursos de dados.
  • Descoberta de dados. Procure dados estruturados e não estruturados em buckets do Cloud Storage para extrair e catalogar os metadados.
  • Insights de dados. Use a IA para gerar perguntas em linguagem natural sobre seus dados, descobrir padrões, avaliar a qualidade dos dados e realizar análises estatísticas.
  • Criação de perfil de dados. Identifique características comuns dos dados de coluna nas tabelas do BigQuery, como valores de dados típicos, distribuição de dados e contagens nulas, que podem informar a classificação de dados e a garantia de qualidade.
  • Qualidade dos dados. Defina e avalie a qualidade dos dados nas tabelas do BigQuery, validando-os com base nas políticas organizacionais e registrando alertas se os dados não atenderem aos critérios de qualidade.
  • Glossário de negócios. Gerencie terminologias e definições relacionadas a negócios em toda a organização e vincule termos às colunas da tabela para promover um entendimento consistente do uso de dados.
  • Linhagem de dados. Acompanhe como os dados se movimentam nos sistemas: de onde vêm, para onde são transmitidos e quais transformações são aplicadas a eles.

O Dataplex oferece suporte a um ciclo de vida de dados completo, desde a descoberta distribuída até os insights de negócios. Os recursos de governança também estão disponíveis no BigQuery.

A seguir