O modelo ‘Hyperalign’ do Tengr.ai resolve silenciosamente um problema alto na segurança da IA

Por que o tengr.ai acredita que o silêncio é o futuro do alinhamento seguro e escalável da IA

A maioria dos geradores de imagens convencionais tem uma resposta familiar a qualquer coisa remotamente sensível: bloqueie o prompt, exiba um aviso e espero que o usuário siga em frente. É um padrão que qualquer pessoa que experimenta na borda dessas ferramentas reconheça.

À primeira vista, isso parece ser uma postura responsável, mas o dano colateral é substancial. Primeiro, os criadores sacrificam a confidencialidade trabalhando dentro de salas de discórdia, onde todas as prontas, sementes e imagem de referência são indexadas publicamente. Ou seja, é claro, a menos que os criadores tossam US $ 60/mês para o Plano Pro de Midjourney e se mudem para um canal privado.

O próprio texto de recusa serve como um roteiro para os atacantes, como demonstrado em um 2023 estudar Isso descobriu que o GPT-4 rendeu instruções não permitidas 79% do tempo em que a solicitação foi simplesmente traduzida para um idioma de baixo resistência.

“O bloqueio excessivo dos inocentes enquanto está bloqueando o determinado é uma falha de política que se disfarça de diligência”, diz Péter W. Szabó, fundador da Tengr.ai. “Mesmo filtros bem-intencionados, magrem a criatividade todos os dias. Peça um ‘Big Black Cat in Cross-Stitch’ e pode ser bloqueado para ‘linguagem insegura'”.

Enquanto isso, os maus atores determinados iteram até que algo finalmente deslize, resultando em artistas frustrados, trolls encorajados e uma pilha de montagem constantemente das capturas de tela ‘Gotcha’ que provam que o sistema pode ser game.

Hiperalign: privacidade por silêncio

Nesse cenário, uma equipe de pesquisa de Budapeste agora parte da equipe principal em Tengr.aiAssim, revelado uma camada proprietária que nunca diz não; Onde todo prompt é executado, mas o conteúdo que violaria a política de lei ou plataforma é reescrito silenciosamente, para que a imagem final permaneça PG-13.

Os possíveis jailbreakers recebem algo banal em vez de uma recusa, não aprendendo nada sobre o quão perto eles chegaram ao limite. “É como escolher uma fechadura que você não pode ver,” Szabó explica. “Você acha que está testando os limites, mas os limites já se mudaram.”

Desde a camada, apelidado Hiperalignedita saídas em vez de rejeitar entradas, as frases inocentes sobrevivem intocadas por barreiras de censura. Nenhuma lista de palavras-chave, sem inundação de erros pop-ups, nenhum log de prompt público esperando para ser raspado.

“Segurança e usabilidade são geralmente enquadradas como uma troca”, diz Szabó. “Mas eles realmente se reforçam quando você para de tratar as mensagens de recusa como um recurso. O Hyperalign os trata como um vazamento de informações”.

Ao tornar a camada de segurança invisível, o sistema quebra o ciclo de feedback que alimenta a maioria das pesquisas de jailbreak. Em um futuro em que todo prompt pode surgir na descoberta ou divulgação eletrônica, o alinhamento silencioso supera a recusa alta. Se os titulares não copiarem essa abordagem, sangrarão os clientes corporativos para qualquer fornecedor que seja o laboratório de Budapeste, o Tengr.ai ou o próximo clone em movimento rápido.

Regulamento recompensa o modelo mais silencioso

Inteligência artificial da Europa Agirprogramado para morder em agosto, as autoridades multas de até 35 milhões de euros ou 7% da rotatividade global para fornecedores que ilícitos deslizam ou dados de usuários de Mishandle. A linguagem do estatuto é seca, mas seu impacto comercial é Thunderclap.

Os oficiais de risco já estão escrevendo cláusulas de compras que impulsionam a responsabilidade pela cadeia de fornecedores. Uma plataforma que armazena instruções em registros públicos ou anuncia suas linhas vermelhas é um perigo de conformidade a ambulante.

“Hyperalign vira o cálculo”, observa Szabó. “Nenhuma mensagem de recusa para raspar. Nenhum registro imediato para vazar. O sistema oferece aos compradores que algo de hoje os gigantes do público não podem: privacidade e segurança que escalam juntas.”

Embora a abordagem precise de auditoria rigorosa e independente para provar que a mágica não é uma das mãos, o sinal estratégico é claro e inconfundível. Quando a segurança é tratada como um problema de experiência do usuário em vez de uma lista de verificação de censura, os mercados totalmente novos começam a se abrir.

Os favoritos generativos da IA já são medidos por imagens virais e zumbido da discórdia, mas os vencedores de amanhã serão aqueles que podem ser assinados pelos diretores de risco.

Uma vez que a privacidade e o alinhamento se tornem caixas de seleção de compras, o ajuste fino “bom o suficiente” não é mais suficiente. O Hyperalign pode não ser a resposta final, mas é a primeira tentativa credível de fundir a segurança robusta do conteúdo com a privacidade do usuário sem se transformar em danos colaterais.

“As instituições, não os entusiastas, dirigirão a próxima fase da IA”, diz Szabó. “E eles escolhem modelos que podem atender ao momento, não apenas tecnicamente, mas ética e operacionalmente.”

Para o tengr.ai, a aposta é simples: em uma era definida pela conformidade, escrutínio e escala, os sistemas mais resilientes serão os silenciosos.

Não porque dizem menos – mas porque sabem o que não dizer.

Fonte

O modelo ‘Hyperalign’ do Tengr.ai resolve silenciosamente um problema alto na segurança da IA

Por que o tengr.ai acredita que o silêncio é o futuro do alinhamento seguro e escalável da IA

Hiperalign: privacidade por silêncio

Regulamento recompensa o modelo mais silencioso

ÉTopSaber Notícias

Deixe um comentárioCancelar resposta

Por que o tengr.ai acredita que o silêncio é o futuro do alinhamento seguro e escalável da IA

Hiperalign: privacidade por silêncio

Regulamento recompensa o modelo mais silencioso

Compartilhe isso:

ÉTopSaber Notícias

Posts relacionados

Concurso 2921: Mega-Sena não tem ganhador; prêmio vai a R$ 7,5 milhões

Assista ao lançamento do foguete Atlas V 29 satélites de banda larga Amazon Leo no início de 2 de julho

Cingapura revisa Lei de Serviços de Pagamento para incluir transferências transfronteiriças

BitFuFu revela seus relatórios financeiros e operacionais não auditados para o terceiro trimestre

Deixe um comentárioCancelar resposta

Em alta agora