A Snowflake Cortex AI transforma a forma como as organizações tiram partido da inteligência artificial ao trazer capacidades avançadas de IA diretamente para a Snowflake Data Cloud. Em vez de mover dados para serviços externos de IA, o Cortex AI permite aplicar modelos de linguagem de grande dimensão (LLMs), pesquisa e analítica diretamente onde os seus dados residem — de forma segura, governada e integrada.
Como parte da estratégia global de IA da Snowflake, o Cortex AI fornece um conjunto abrangente de serviços geridos: desde funções LLM para processamento de texto até ferramentas especializadas como o Cortex Analyst para consultas em linguagem natural e o Cortex Search para recuperação inteligente de informação.
Neste artigo, vamos explorar o conjunto Cortex AI e demonstrar uma das suas capacidades mais recentes: o AI_REDACT, para deteção e remoção automática de informação pessoal identificável (PII) em texto não estruturado.
O que é o Snowflake Cortex AI?
O Cortex AI transforma a Snowflake de uma plataforma de dados num ambiente de execução nativo de IA. Em vez de tratar a IA como uma stack separada, o Cortex integra a inteligência diretamente nos fluxos de trabalho de dados, eliminando os desafios operacionais, de segurança e de conformidade que tradicionalmente acompanham a adoção de IA em contexto empresarial.
Princípio central: IA onde os seus dados vivem.
O Cortex AI opera dentro do perímetro de segurança da Snowflake, respeitando todas as políticas de governação existentes, controlos RBAC e requisitos de residência de dados, ao mesmo tempo que fornece acesso a modelos líderes da indústria da Google, OpenAI, Anthropic, Meta, Mistral, entre outros.
O Conjunto Cortex AI
O Cortex AI é composto por cinco componentes integrados:
Snowflake Intelligence Interface conversacional de IA unificada que permite aos utilizadores de negócio analisar e agir sobre dados usando linguagem natural, sem necessidade de SQL. Exemplo: Um gestor de vendas pergunta: “Mostra-me a receita do Q4 por região” e obtém visualizações instantâneas sem escrever consultas.
Cortex Agents Orquestram tarefas sobre dados estruturados e não estruturados, coordenando o Cortex Analyst, o Cortex Search e LLMs. Exemplo: Um agente recupera automaticamente contratos de clientes, analisa dados de vendas e gera recomendações de renovação.
Cortex Analyst Serviço totalmente gerido que converte perguntas em linguagem natural em consultas SQL precisas, usando modelos semânticos. Exemplo: “Que produtos tiveram queda de vendas no último trimestre?” é convertido em SQL otimizado contra o data warehouse.
Cortex Search Serviço RAG gerido que combina pesquisa semântica por vetores com correspondência por palavras-chave para chatbots de IA e pesquisa documental. Exemplo: Pesquisar milhões de tickets de suporte para encontrar problemas semelhantes e respetivas resoluções.
Cortex LLM Functions Funções SQL e Python que fornecem acesso direto a modelos de linguagem de grande dimensão para geração, classificação, extração e análise de texto. Use AI_SUMMARIZE para condensar documentos extensos ou AI_EXTRACT para extrair entidades-chave de texto não estruturado.
Como o Cortex Code e o Cortex AI Trabalham em Conjunto
O Cortex AI é mais poderoso quando combinado com o Cortex Code. Enquanto o Cortex AI fornece funções de inteligência baseadas em SQL — sumarização, classificação, redação, análise de sentimento e pesquisa semântica — assume que os pipelines de dados, esquemas e estruturas de governação já estão definidos. É aqui que o Cortex Code desempenha um papel fundamental.
O Cortex Code acelera:
Criação de modelos de dados
Geração de projetos dbt
Validação de governação
Orquestração de workflows
Criação de scaffolding de aplicações
Depois de construída essa estrutura, as funções do Cortex AI podem operar com segurança sobre datasets curados, sem expor dados brutos ou não governados.
Em ambientes empresariais, esta separação é importante: o Cortex Code garante disciplina arquitetural, enquanto o Cortex AI permite execução inteligente. Em conjunto, suportam um modelo seguro e escalável de adoção de IA dentro da Snowflake, desde a infraestrutura até à inferência.
Cortex AI em Ação: Analítica Segura com AI_REDACT
Vamos demonstrar uma das capacidades mais recentes do Cortex AI: a deteção e redação automática de PII em texto não estruturado usando o AI_REDACT, disponibilizado em General Availability em dezembro de 2025.
O AI_REDACT é uma função Cortex AI totalmente gerida que utiliza um LLM para detetar, localizar e redigir PII em dados de texto não estruturado. A função está disponível nativamente em regiões selecionadas (AWS EUA, AWS Europa, Azure EUA/Europa). Caso não esteja disponível na sua região, é necessário ativar inferência entre regiões. Organizações com requisitos rigorosos de residência de dados devem verificar a disponibilidade regional ou avaliar se a inferência entre regiões está alinhada com as suas políticas de conformidade antes da implementação.
Pontos importantes: o AI_REDACT e o Dynamic Data Masking são complementares. O Dynamic Data Masking protege colunas estruturadas de PII (NIF, email, números de telefone). O AI_REDACT destina-se a campos de texto não estruturado onde a PII aparece misturada com outro conteúdo — feedback, notas ou mensagens — em que o mascaramento ao nível da coluna não é aplicável.
The O Cenário
A sua organização recolhe feedback de clientes, tickets de suporte e respostas a inquéritos que contêm insights valiosos, mas também informação pessoal identificável (PII), como nomes, emails, números de telefone e moradas. Precisa de analisar estes dados para identificar tendências e sentimento, mas o RGPD, HIPAA e outras regulamentações exigem que a PII seja removida primeiro.
Abordagem tradicional: construir padrões regex complexos para cada tipo de PII, rever manualmente casos limite e atualizar constantemente as regras à medida que os formatos evoluem — ou recorrer a ferramentas externas dispendiosas.Com o Cortex AI_REDACT: deteção e redação automática de PII usando IA numa única função SQL, sem regex e sem serviços externos.
Passo 1: Preparar os Dados
Crie uma tabela com feedback de clientes contendo vários tipos de PII (informação pessoal identificável) incorporados em texto de forma livre. Isto simula dados do mundo real, em que os clientes incluem naturalmente informações pessoais ao fornecer feedback.
#sql
-- Customer feedback with PII embedded in free-form text
CREATE OR REPLACE TABLE raw_customer_feedback (
feedback_id INTEGER
,feedback_text TEXT
,created_at TIMESTAMP_NTZ
);
-- Insert sample feedback with various types of PII
INSERT INTO raw_customer_feedback VALUES
(1, 'Hi, my name is Sarah Johnson and I love your product! You can reach me at sarah.j@email.com or call 415-555-0123 if you have questions.', '2026-01-20 10:15:00')
,(2, 'John Smith here, living at 123 Main Street, San Francisco, CA 94102. The delivery was late but the product quality is excellent. My order number was ORD-98234.', '2026-01-20 11:30:00')
,(3, 'Terrible experience! I called support and gave them my SSN 123-45-6789 and credit card 4532-1234-5678-9010. Still no resolution after 3 weeks.', '2026-01-20 14:45:00')
,(4, 'Amazing service! Emma Wilson from Boston here. The team helped me within minutes. Highly recommend!', '2026-01-20 16:20:00')
,(5, 'Product arrived damaged. I am Michael Chen, customer ID CUST-55421. Please contact me at (650) 555-7890 or mchen@company.com to arrange replacement.', '2026-01-21 09:00:00')
;
Passo 2: Redigir Toda a PII com AI_REDACT
Utilize o AI_REDACT para identificar e mascarar automaticamente todos os tipos de PII no texto. A IA compreende o contexto: sabe que “Sarah Johnson” é um nome, “415-555-0123” é um número de telefone e “123 Main Street, San Francisco, CA 94102” é uma morada, mesmo quando escrito em linguagem natural.
#SQL
CREATE OR REPLACE TABLE redact_customer_feedback
as
SELECT
feedback_id,
SNOWFLAKE.CORTEX.AI_REDACT(feedback_text) AS redacted_text,
created_at
FROM raw_customer_feedback;
Para alguns casos de uso, pode ser necessário redigir apenas categorias específicas de PII. O AI_REDACT permite especificar quais os tipos a mascarar, mantendo outra informação visível. Isto é útil quando precisa de preservar certos dados para análise, protegendo apenas a informação mais sensível.
#SQL
SELECT
feedback_id,
SNOWFLAKE.CORTEX.AI_REDACT(
feedback_text,
ARRAY_CONSTRUCT('NAME', 'EMAIL', 'PHONE_NUMBER')
) AS redacted_text,
created_at
FROM raw_customer_feedback;
Passo 3: Análise de Sentimento com Privacidade Garantida
Combine o AI_REDACT com outras funções de IA do Cortex para realizar análises, mantendo a conformidade com a privacidade. Aqui, analisamos o sentimento sobre feedback redigido, garantindo que a PII nunca entra no nosso pipeline de análise.
#SQL
SELECT
feedback_id,
redacted_text,
SNOWFLAKE.CORTEX.AI_SENTIMENT(
redacted_text
) AS sentiment_score
FROM redact_customer_feedback;
Considerações ao Utilizar o AI_REDACT
Embora o AI_REDACT simplifique significativamente a deteção de PII, tenha em conta:
A função funciona melhor com texto em inglês bem estruturado. A deteção baseada em IA pode ocasionalmente produzir falsos positivos (redigir algo que não é PII) ou falsos negativos (não detetar PII). Para conformidade crítica, combine o AI_REDACT com métodos tradicionais de validação durante a implementação inicial. Teste sempre exaustivamente com amostras representativas antes de colocar em produção, garantindo alinhamento com as políticas da sua organização.
Desempenho e Otimização de Custos do AI_REDACT
O AI_REDACT está otimizado para throughput e processamento em lote. A Snowflake recomenda processar muitos registos a partir de grandes tabelas SQL, em vez de operações linha a linha. O processamento em lote é geralmente mais adequado para funções de IA. Utilize um warehouse com tamanho máximo MEDIUM ao chamar o AI_REDACT, uma vez que warehouses maiores não aumentam o desempenho e podem gerar custos desnecessários.
Resultado: construiu um pipeline analítico compatível com privacidade que remove automaticamente PII antes da análise de sentimento — sem regex, sem revisão manual e sem serviços externos. A IA compreende o contexto e lida com variações como “o meu nome é X”, “X aqui”, moradas escritas naturalmente, entre outras.
Principais Vantagens do Cortex AI
Sem movimentação de dados:
processamento de dados sensíveis
in-place
, mantendo conformidade e governação sem exfiltração.
Segurança empresarial:
herda RBAC, mascaramento de dados e auditoria da Snowflake. Os modelos não treinam com os seus dados.
Flexibilidade de modelos:
acesso a múltiplos LLMs (Claude, GPT-4, Mistral, Llama, Gemini) através de uma interface unificada.
Eficiência de custos:
pagamento por utilização em créditos, sem infraestrutura separada ou compromissos mínimos.
Integração perfeita:
funciona com workflows Snowflake existentes e plataformas de BI.
Considerações e Limitações do Snowflake Cortex AI
Dependência da plataforma: requer que os dados residam na Snowflake para tirar pleno partido das capacidades.
Personalização limitada: menor controlo sobre fine-tuning de modelos comparativamente a plataformas dedicadas de ML.
Variabilidade dos LLMs: resultados podem ser não determinísticos e exigir validação em casos críticos.
Preparação dos dados: a eficácia depende de dados bem estruturados e governados.
Variabilidade de custos: preços baseados em créditos podem escalar rapidamente sem monitorização adequada.
Disponibilidade regional: nem todas as funções e modelos estão disponíveis em todas as regiões; alguns requerem inferência entre regiões, com implicações de residência de dados.
Maturidade das funcionalidades: algumas capacidades ainda estão a evoluir e podem carecer de profundidade empresarial. Verifique sempre o estado GA antes de produção.
Preços e Gestão de Custos
O Cortex AI utiliza preços baseados em consumo de créditos, variando por modelo, operação e ferramentas utilizadas. É importante monitorizar regularmente os custos e desativar serviços não utilizados.Os principais fatores que influenciam o custo incluem:
Seleção do modelo: modelos maiores (Claude, GPT-4) são significativamente mais caros do que modelos menores (Mistral 7B, Gemma).
Cortex Search: os custos acumulam-se continuamente, mesmo sem consultas; suspenda ou elimine sempre serviços não utilizados.
Volume de dados: processar mais texto aumenta os custos proporcionalmente.
Monitorização do consumo: acompanhe regularmente a utilização para identificar e eliminar desperdícios.
Monitorização de custos ao nível da organização:
SELECT SERVICE_TYPE, SUM(credits_used) AS total_credits
FROM SNOWFLAKE.ORGANIZATION_USAGE.METERING_DAILY_HISTORY
WHERE service_type ilike '%AI_SERVICES%'
AND usage_date >= DATEADD(day, -30, CURRENT_DATE()) --Last Month
GROUP BY SERVICE_TYPE;
Para um detalhe dos custos por serviço específico de IA, consulte as seguintes account usage views:
SNOWFLAKE.ACCOUNT_USAGE.CORTEX_AISQL_USAGE_HISTORY
SNOWFLAKE.ACCOUNT_USAGE.CORTEX_ANALYST_USAGE_HISTORY
SNOWFLAKE.ACCOUNT_USAGE.DOCUMENT_AI_USAGE_HISTORY
SNOWFLAKE.ACCOUNT_USAGE.CORTEX_SEARCH_SERVING_USAGE_HISTORY
Conclusão
O Snowflake Cortex AI torna a inteligência artificial de nível empresarial acessível e prática para equipas de dados. Ao trazer LLMs, pesquisa e analítica diretamente para a plataforma, elimina a complexidade de integração, respeitando simultaneamente os requisitos de governação. O Cortex AI funciona de forma integrada tanto com dados estruturados (tabelas, SQL) como não estruturados (texto, documentos), permitindo insights abrangentes com IA em todo o seu património de dados.
O exemplo de AI_REDACT demonstrou como é simples criar pipelines analíticos compatíveis com privacidade. A função utiliza IA para compreender o contexto e identificar PII em linguagem natural, lidando com variações como “o meu nome é X” ou moradas escritas de forma natural, sem padrões regex frágeis. Combine o AI_REDACT com outras funções do Cortex, como AI_SENTIMENT, AI_COMPLETE ou AI_SUMMARIZE, para analisar texto sensível de forma segura, mantendo a conformidade com RGPD, HIPAA e CCPA.
Keyrus & Snowflake
Como Premier Snowflake Partner, ajudamos as organizações a adotar o Cortex Code e o Cortex AI de forma coordenada, garantindo que os ganhos de produtividade não ultrapassam a maturidade da governação. A nossa abordagem alinha engenharia de plataforma, monitorização FinOps e capacitação em IA para criar arquiteturas de IA empresariais sustentáveis dentro da Snowflake. Saiba mais sobre a nossa parceria ou contacte-nos para iniciar o seu ecossistema Cortex.
O que é o Snowflake Cortex AI?
O Snowflake Cortex AI é um serviço totalmente gerido que fornece acesso de baixa latência a modelos de linguagem de grande escala (LLMs) líderes da indústria e a capacidades de pesquisa diretamente na Snowflake Data Cloud. Permite aos utilizadores realizar tarefas de IA como sumarização, tradução e extração de dados utilizando SQL padrão ou Python, sem mover os dados para fora do perímetro de segurança.
O que é o Snowflake Cortex Code?
O Snowflake Cortex Code é um agente de IA com reconhecimento de contexto, integrado nativamente na plataforma Snowflake. Ao contrário dos assistentes genéricos de programação com IA, compreende o seu ambiente específico — incluindo esquemas, permissões RBAC, políticas de governação e relações entre dados — para gerar código pronto para produção através de prompts em linguagem natural.
Qual é a diferença entre o Cortex AI e o Cortex Code?
através de prompts em linguagem natural. Q2: Qual é a diferença entre o Cortex AI e o Cortex Code? O Cortex AI aplica IA e machine learning diretamente aos seus dados através de funções SQL (como análise de sentimento ou classificação). O Cortex Code é um agente de desenvolvimento que o ajuda a construir infraestrutura de dados — gerando pipelines dbt, DAGs do Airflow e aplicações Streamlit. O Cortex AI potencia a inteligência nos seus dados; o Cortex Code acelera a forma como constrói soluções na Snowflake.
Como é que o Snowflake Cortex AI é tarifado?
O Cortex AI funciona com um modelo de preços baseado em créditos, apenas por consumo. Os custos são determinados pelo modelo específico utilizado (por exemplo, GPT‑4 vs. Mistral 7B) e pelo volume de tokens processados. Não existem custos iniciais nem taxas separadas de gestão de infraestrutura.
Qual é a diferença entre o Cortex Analyst e o Cortex Search?
- O Cortex Analyst foi concebido para dados estruturados; converte perguntas em linguagem natural em consultas SQL precisas, utilizando um modelo semântico. - O Cortex Search é um serviço RAG (Retrieval‑Augmented Generation) gerido para dados não estruturados, que combina pesquisa vetorial e correspondência por palavras‑chave para suportar chatbots e descoberta de documentos.
A Snowflake utiliza os meus dados para treinar os modelos do Cortex AI?
Não. Uma das principais vantagens do Cortex AI é que a Snowflake não utiliza os dados dos clientes para treinar os modelos base subjacentes. Todo o processamento ocorre dentro do perímetro governado da Snowflake, garantindo que os seus dados proprietários e informações sensíveis permanecem privados e seguros.
Como funciona o AI\_REDACT na Snowflake?
O AI\_REDACT é uma função do Cortex AI que utiliza LLMs para detetar e mascarar automaticamente informações de identificação pessoal (PII) em texto não estruturado. Ao contrário das abordagens tradicionais baseadas em expressões regulares, compreende o contexto para identificar nomes, moradas e identificadores sensíveis incorporados em linguagem natural, como em tickets de suporte ao cliente ou e‑mails.
Posso utilizar as funções do Cortex AI em qualquer região?
A maioria das funções do Cortex AI está disponível nas principais regiões da AWS e do Azure. No entanto, funções específicas como o AI\_REDACT ou determinados modelos de alto desempenho podem exigir inferência entre regiões (“cross‑region inference”) caso ainda não estejam alojadas nativamente na região específica onde a sua implementação Snowflake se encontra.
Como posso monitorizar os custos e a utilização do Cortex AI?
As organizações podem acompanhar os gastos relacionados com IA consultando a vista METERING_DAILY_HISTORY no esquema ORGANIZATION_USAGE, filtrando especificamente pelo tipo de serviço AI_SERVICES. Isto fornece uma discriminação transparente do consumo de créditos em todas as funções de IA.
Que modelos estão disponíveis através do Snowflake Cortex AI?
A Snowflake disponibiliza acesso a uma variedade de modelos de elevado desempenho de fornecedores como a Google (Gemini), a Meta (Llama), a Mistral AI, a Anthropic (Claude) e a OpenAI (GPT‑4). Isto permite aos utilizadores escolher o tamanho de modelo e o nível de desempenho mais adequados ao seu caso de utilização específico.
Porque devo utilizar o AI\_REDACT em vez do Dynamic Data Masking?
O Dynamic Data Masking foi concebido para colunas estruturadas (como uma coluna dedicada a “SSN”). O AI\_REDACT foi desenvolvido para “blocos” de texto não estruturado, onde a PII está oculta dentro de frases. A utilização conjunta de ambos proporciona uma defesa em várias camadas para a privacidade dos dados e a conformidade regulamentar (RGPD, HIPAA).
O que é a IA (Inteligência Artificial)?
IA (Inteligência Artificial) O campo abrangente da criação de máquinas capazes de realizar tarefas que exigem inteligência semelhante à humana: raciocínio, reconhecimento de padrões, tomada de decisões e compreensão da linguagem.
O que é ML (Machine Learning)?
ML (Machine Learning) Um subconjunto da IA em que os sistemas aprendem a partir de dados, em vez de serem explicitamente programados. Os modelos de ML melhoram com a experiência; identificam padrões e fazem previsões sem que lhes sejam dadas regras explícitas.
O que são LLMs (Large Language Models / Modelos de Linguagem de Grande Escala)?
LLM (Large Language Models / Modelos de Linguagem de Grande Escala) Modelos de IA treinados com enormes quantidades de texto, capazes de compreender e gerar linguagem humana. São a tecnologia por detrás de ferramentas como o ChatGPT, o Claude e o Microsoft Copilot.
O que significa AI Literacy?
O termo “AI literacy” (literacia em IA) é utilizado de forma algo vaga, pelo que vale a pena ser preciso. A literacia em IA é a capacidade de compreender, avaliar e trabalhar com inteligência artificial de forma eficaz, intencional, informada e responsável. Possui três dimensões interligadas: #1 – Compreensão conceptual: Saber o que é a IA, como funciona a um nível significativo (ainda que não técnico), o que distingue diferentes tipos de sistemas de IA e como selecionar o tipo certo de ferramentas de IA que acrescentem valor à organização. #2 – Capacidade aplicada: Ser capaz de identificar onde a IA pode acrescentar valor no seu trabalho, como interagir eficazmente com ferramentas de IA, como utilizá‑las de forma a gerar resultados mensuráveis e como avaliar os outputs recebidos. #3 – Consciência ética e de governação: Compreender os riscos que a IA introduz, os enviesamentos que pode transportar e as práticas responsáveis que devem orientar a sua utilização.
O que é a governação da IA?
A Governação da IA é um conjunto de regras, normas e políticas implementadas para garantir que a inteligência artificial é utilizada de forma adequada, ética, legal e responsável. Muitas vezes, gere riscos como enviesamentos e violações de privacidade, ao mesmo tempo que permite a inovação. A governação da IA assegura que as tecnologias de IA são desenvolvidas, utilizadas e mantidas de uma forma que maximiza os resultados e a confiança, mantendo os riscos e a segurança sob controlo. Em suma, a governação da IA maximiza os benefícios dos investimentos em IA, ao mesmo tempo que minimiza os riscos e potenciais impactos negativos. Com mais de 28 anos de experiência acumulada em dados e inteligência artificial, a Keyrus ajuda a definir a governação de IA adequada para criar vantagem competitiva a partir da IA.
