O que é UUID (Universally Unique Identifier)?

15/03/2024

10 min de leitura

Por Équipe Fabra Money

Entenda o que é UUID, como funciona a estrutura de 128 bits, as diferentes versões (v1, v4, v7) e por que é essencial para sistemas distribuídos e bancos de dados.

No vasto universo do desenvolvimento de software e sistemas distribuídos, a necessidade de identificar recursos de forma única e inequívoca é primordial. É aqui que entra o UUID, ou Universally Unique Identifier. Se você já se deparou com uma sequência alfanumérica longa e aparentemente aleatória como "550e8400-e29b-41d4-a716-446655440000", você encontrou um UUID. Este guia completo vai desvendar todos os mistérios por trás dessa tecnologia fundamental.

Diferente de IDs incrementais simples (como 1, 2, 3), os UUIDs são projetados para serem gerados de forma independente em diferentes sistemas sem o risco de colisão. Isso significa que dois computadores, em lados opostos do planeta, podem gerar um UUID ao mesmo tempo e a probabilidade de serem idênticos é tão pequena que, para fins práticos, é considerada zero. Essa característica torna o UUID o padrão ouro para bancos de dados modernos, APIs e arquiteturas de microserviços.

Neste artigo, exploraremos a anatomia de um UUID, as diversas versões existentes (desde a clássica v1 até a moderna v7), as diferenças fundamentais entre UUID e GUID, e os casos de uso onde eles brilham. Seja você um desenvolvedor experiente ou alguém curioso sobre como a internet organiza seus dados, este guia fornecerá uma compreensão profunda e prática sobre o que é UUID.

Definição e Origem: O Coração do Identificador Único

UUID é o acrônimo para Universally Unique Identifier (Identificador Único Universal). Trata-se de um número de 128 bits usado para identificar informações em sistemas de computação. A principal vantagem do UUID é que ele não requer um registro central ou coordenação entre os sistemas que o geram. Isso permite que sistemas distribuídos criem identificadores com total autonomia, garantindo que não haverá conflitos de dados ao consolidar informações de fontes distintas.

O padrão original foi definido pela Open Software Foundation (OSF) como parte do Distributed Computing Environment (DCE). Posteriormente, foi formalizado pela ISO/IEC e pela IETF através da RFC 4122. Essa padronização garante que UUIDs gerados por diferentes bibliotecas e linguagens de programação sejam compatíveis entre si, seguindo a mesma estrutura e semântica.

Visualmente, um UUID é representado por 32 dígitos hexadecimais, divididos em cinco grupos separados por hifens, no formato 8-4-4-4-12. Por exemplo: `123e4567-e89b-12d3-a456-426614174000`. Apesar de parecer uma string aleatória, cada seção tem um propósito específico, indicando a versão, a variante e, em algumas versões, o timestamp ou o endereço MAC do hardware que o gerou.

A Estrutura Técnica de 128 bits

A magia do UUID reside nos seus 128 bits. Para colocar isso em perspectiva, existem 2^128 (aproximadamente 3.4 × 10^38) combinações possíveis. Esse número é tão astronômico que é difícil de visualizar: é maior do que o número de grãos de areia na Terra. É essa vastidão que permite a geração aleatória sem medo de duplicatas. Mesmo gerando bilhões de UUIDs por segundo, levaria milênios para encontrar uma colisão.

Estruturalmente, o UUID é dividido em campos que variam conforme a versão. No entanto, dois campos são fixos em todas as implementações modernas seguindo a RFC 4122: o campo de variante e o campo de versão. O campo de versão (o primeiro dígito do terceiro grupo) identifica qual algoritmo foi usado para gerar o UUID (ex: 1, 4 ou 7). O campo de variante determina o layout exato dos bits para garantir compatibilidade com sistemas legados da Microsoft ou outros padrões.

A representação canônica em hexadecimal facilita a leitura humana e o armazenamento em sistemas que tratam strings. Contudo, internamente, muitos bancos de dados de alta performance (como PostgreSQL e SQL Server) armazenam UUIDs como tipos binários nativos de 16 bytes. Isso economiza espaço de armazenamento e acelera as operações de indexação e busca, unindo a conveniência da unicidade universal com a eficiência técnica necessária para grandes volumes de dados.

UUID vs GUID: Existe Alguma Diferença Real?

Uma dúvida muito comum entre desenvolvedores é a diferença entre UUID e GUID (Globally Unique Identifier). Na prática, para a maioria dos cenários modernos, os termos são usados como sinônimos. GUID é o termo preferido pela Microsoft e é amplamente utilizado no ecossistema Windows, .NET e SQL Server. UUID é o termo padrão da indústria, definido pela IETF e utilizado em sistemas Unix, Linux, Java, Python e na web.

Tecnicamente, o GUID da Microsoft é uma implementação específica do padrão UUID. Embora existissem algumas diferenças sutis em implementações muito antigas, as versões atuais do GUID seguem a RFC 4122. Portanto, se você gerar um UUID v4 em uma aplicação Python e armazená-lo em uma coluna do tipo UNIQUEIDENTIFIER no SQL Server, tudo funcionará perfeitamente.

Em resumo: UUID é o nome do padrão universal, enquanto GUID é a nomenclatura adotada pela Microsoft. Se você está trabalhando em um ambiente multiplataforma, é mais comum falar em UUID. Se o seu foco é estritamente o desenvolvimento Windows ou Azure, você ouvirá mais sobre GUIDs. Ambos cumprem a mesma missão: garantir que aquele identificador seja o único no planeta (e no universo).

Versões do UUID: Qual Escolher?

O padrão UUID define várias versões, cada uma com um método de geração distinto. As mais comuns são a v1, v4 e a recente v7. Entender as diferenças é crucial para escolher a ferramenta certa para o seu projeto. A versão 1 baseia-se no tempo (timestamp) e no endereço MAC da máquina. Embora garanta unicidade, ela tem problemas de privacidade, pois expõe o momento da criação e a identidade do hardware.

A versão 4 (v4) é a mais popular atualmente. Ela é quase inteiramente aleatória (exceto pelos bits de versão e variante). Por ser baseada em números aleatórios de alta entropia, a v4 é ideal para a maioria das aplicações web, onde você não quer expor metadados sobre o sistema ou o tempo de criação. É o padrão padrão para chaves primárias em bancos de dados modernos que não requerem ordenação temporal nativa.

A versão 7 (v7) é a "nova queridinha" dos engenheiros de software. Ela combina o melhor dos dois mundos: possui um componente de timestamp (como a v1) mas usa aleatoriedade para o restante dos bits (como a v4). A grande vantagem da v7 é que ela é "ordenável" (time-ordered). UUIDs v7 gerados sequencialmente estarão em ordem alfabética/numérica, o que melhora drasticamente a performance de índices em bancos de dados como B-Trees, evitando a fragmentação que ocorre com a v4 aleatória.

•UUID v1: Baseado em tempo e endereço MAC (Hardware).
•UUID v3: Baseado em hash MD5 de um nome e namespace.
•UUID v4: Completamente aleatório (Recomendado para uso geral).
•UUID v5: Baseado em hash SHA-1 (similar à v3, mas mais seguro).
•UUID v7: Baseado em tempo + aleatoriedade (Ideal para Bancos de Dados).

Por Que Usar UUID em Vez de IDs Incrementais?

IDs incrementais (1, 2, 3...) são fáceis de entender, mas falham miseravelmente em sistemas distribuídos. Se você tem dois servidores de banco de dados rodando de forma independente, ambos vão tentar criar o registro "1", causando um conflito de chave primária. Com UUIDs, cada servidor pode gerar IDs livremente sem nunca precisar "pedir permissão" ao outro ou a um nó central.

Outra vantagem crítica é a segurança por obscuridade. Se a URL do seu perfil é `site.com/user/123`, um atacante pode facilmente adivinhar que o usuário `124` também existe. Se você usa UUIDs, a URL se torna `site.com/user/550e8400-e29b-41d4-a716-446655440000`. É impossível para um script malicioso iterar sobre esses IDs para minerar dados privados de forma sequencial.

Além disso, UUIDs facilitam a movimentação de dados entre ambientes. Você pode gerar um ID no front-end (no navegador do usuário), usá-lo para referenciar um objeto em cache e depois enviá-lo para o back-end para persistência definitiva. O ID permanece o mesmo durante todo o ciclo de vida do recurso, eliminando a necessidade de "mapear" IDs temporários para IDs definitivos do banco de dados.

Crie identificadores únicos aleatórios instantaneamente

UUIDs em Bancos de Dados: Performance e Melhores Práticas

Muitos desenvolvedores temem o impacto de performance ao usar UUIDs como chaves primárias. É verdade que uma string de 36 caracteres ocupa mais espaço que um inteiro de 4 bytes. No entanto, como mencionado, usar o tipo de dado nativo (16 bytes binários) mitiga grande parte desse custo. O real problema com a v4 aleatória é a fragmentação de índices, pois novos registros são inseridos em posições aleatórias da árvore do índice.

Para resolver o problema da performance, a recomendação moderna é utilizar o UUID v7. Por ser ordenável, ele se comporta de forma similar a um ID incremental em termos de inserção no banco de dados, mantendo os novos registros no "final" do índice. Isso reduz drasticamente o custo de escrita e mantém a eficiência de leitura alta, unindo os benefícios da unicidade distribuída com a performance de índices sequenciais.

Ao projetar sua API, você também deve considerar como expõe esses UUIDs. Embora no banco de dados eles sejam binários, na API eles devem ser strings hexadecimais padrão. Algumas linguagens permitem abreviar o UUID usando codificações como Base64 para URLs mais curtas (ex: ShortUUID), mas o padrão hexadecimal ainda é o mais reconhecido e suportado por ferramentas de debug e logs.

Casos de Uso Comuns para UUIDs

Microserviços: Em uma arquitetura onde dezenas de serviços precisam criar entidades que serão futuramente agregadas, o UUID garante que o "Pedido ID" gerado pelo serviço de vendas nunca colidirá com um ID gerado pelo serviço de logística.

Sistemas Offline: Aplicativos mobile que precisam funcionar sem internet podem gerar UUIDs localmente para novos registros. Quando o aparelho sincronizar com o servidor, os dados serão inseridos sem conflitos, mesmo que milhares de usuários tenham criado registros simultaneamente.

Rastreamento e Logs: Identificar uma transação específica que atravessa múltiplos sistemas (do front-end ao banco de dados, passando por filas de mensagens) é muito mais simples com um UUID de correlação. Você pode buscar esse ID em todos os logs de todos os servidores para reconstruir o caminho exato de uma requisição.

Tokens e Sessões: Embora não substituam tokens JWT assinados, UUIDs são frequentemente usados como identificadores de sessão em cookies ou como tokens de "esqueci minha senha" de uso único, devido à sua imprevisibilidade.

Ferramenta compatível com padrões Microsoft e RFC 4122

A Probabilidade de Colisão: É Realmente Zero?

Tecnicamente, a probabilidade não é zero, mas é tão baixa que é considerada desprezível. Para o UUID v4, a chance de encontrar uma duplicata após gerar 1 bilhão de UUIDs por segundo durante 100 anos é de cerca de 0,00000000006%. Em termos estatísticos, é muito mais provável que um meteoro destrua o seu data center do que ocorra uma colisão natural de UUIDs gerados corretamente.

No entanto, essa segurança depende da qualidade do gerador de números aleatórios (PRNG) utilizado. Se o seu sistema usa uma "semente" (seed) fraca ou repetida, a aleatoriedade é comprometida e o risco de colisão aumenta drasticamente. Por isso, é fundamental utilizar bibliotecas confiáveis e ferramentas profissionais para a geração desses identificadores.

Resumindo: você pode dormir tranquilo sabendo que seus UUIDs são únicos. Eles são a base para a integridade de dados em larga escala na computação moderna, permitindo que a web cresça de forma descentralizada e resiliente.

O UUID é mais do que apenas uma string longa; é uma peça fundamental da infraestrutura digital que permite a descentralização e a escalabilidade dos sistemas modernos. Ao entender o que é UUID e as nuances entre suas versões, você ganha o poder de projetar arquiteturas de dados mais robustas, seguras e eficientes.

Seja escolhendo a versatilidade da v4 para suas aplicações web ou a performance da v7 para seus bancos de dados, o uso de identificadores únicos universais é um passo decisivo para qualquer projeto que pretenda crescer e se integrar com outros sistemas sem dores de cabeça.

Esperamos que este guia tenha esclarecido suas dúvidas sobre UUIDs. Agora que você domina a teoria, que tal colocar em prática? Use nossas ferramentas para gerar seus próprios identificadores e comece a construir sistemas verdadeiramente universais.