das-interview---ein-pdf-steuert-die-maschine-

Knodge.eu - Navegação e desenvolvimento

Bem-vindo ao Knodge.eu, o centro europeu do conhecimento.

A entrevista: "Um PDF controla a máquina"

Mareike (VBU) em conversa com Markus Schulte-Huermann sobre o futuro dos sistemas de IA adaptáveis.

**Mareike

*Olá Markus, o mercado da IA é dominado por gigantes americanos como a OpenAI e a Google. Porque é que o mundo - e a ciência europeia em particular - precisa de uma plataforma como a Knodge?

**Markus

Utilizamos o motor da Google (Gemini), mas utilizamo-lo num contentor isolado - semelhante à forma como se constrói um motor Ferrari no seu próprio chassis. Na Europa, conduzimos um Ferrari de forma diferente e, por isso, precisamos de um chassis dedicado.

A diferença fundamental é: o ChatGPT é um "sabe-tudo" para as massas - ótimo para a poesia, mau para os factos. Knodge, por outro lado, é uma ferramenta de precisão. Construímos um sistema operativo que utiliza os seus próprios dados para dar respostas válidas em vez de alucinar com a Internet.

Com o knodge.eu, estamos a construir um laboratório de conhecimentos específicos e confidenciais. É uma espécie de sistema operativo ou segundo cérebro - mas simplesmente mais do que um chatbot.

Mareike

*Na ciência, a "alucinação" (factos inventados pela IA) é um grande problema. Como é que Knodge garante que os resultados da investigação permanecem válidos?

**Markus

Não adivinhamos, apenas pesquisamos o seu conteúdo. Para isso, utilizamos o princípio RAG (Retrieval Augmented Generation). Desta forma, podem ser criados muitos pequenos hubs baseados em provas, cuja resposta é uma nota de entrega digital composta por metadados, DOI, etc., por assim dizer. O que conta aqui não é a redação pomposa, mas sim o conteúdo e a fonte.

Mareike

*Fala do "Protocolo de Contexto Científico" (SCP). O que é que isso significa exatamente para um laboratório moderno?

**Markus

Há muito tempo que ando a pensar neste tema. Para mim, o ponto de viragem veio com uma publicação da Universidade de Xangai, em 30 de dezembro de 2025. Reconheci imediatamente o potencial para a robótica. O SCP é o elo que faltava. É um protocolo normalizado que não só lê dados, como os interpreta para desencadear acções. Pense nisto da seguinte forma: Anteriormente, era necessário um engenheiro para dar novos parâmetros ao robot. Com o SCP, o robot lê ele próprio o novo protocolo PDF e reajusta-se. O PDF controla a máquina. Este é o passo da "informação" para a "instrução".
À primeira vista, isto parece muito rebuscado, exagerado e perigoso, mas penso que, se o deixarmos penetrar um pouco, aperceber-nos-emos da sua necessidade. Precisamos de especificar o SCP globalmente para a Europa.
No futuro, poderá também ser utilizado para dotar os robots humanóides de conhecimentos ou para definir o âmbito das suas tarefas. Em termos gerais, um PDF controla a máquina.

Mareike

*A proteção de dados é sagrada na UE e nas universidades. Muitas instituições proíbem o ChatGPT porque os dados acabam nos servidores dos EUA. Como é que resolvem isto?

**Markus

Oh sim - muitas pessoas usam o ChatGPT sem se registarem e acreditam que são anónimas. Mas o que acontece é exatamente o contrário. Todas as consultas no ChatGPT estão na rede e são potencialmente visíveis. O endereço IP ou a identificação do chip do computador para utilizadores anónimos faz o resto; a identificação é 99% garantida.

No Knodge.eu, todos têm de se registar com um endereço de e-mail - é tudo. Após o registo, não há qualquer rastreio ou algo semelhante. Um pedido à IA é executado através do Knodge.eu como um pedido de portal e é completamente independente do utilizador. A IA da Google é iniciada individualmente para cada portal. Não existe uma ligação direta entre o utilizador e a IA. Todos os documentos e conteúdos são armazenados num bucket storage na UE. A base de dados com os parâmetros de controlo está localizada numa infraestrutura completamente diferente, e os servidores reais também são operados de forma completamente separada dos dados. Todos os dados são armazenados de forma anónima e encriptada. Não temos palavras-passe que possam ser transmitidas e temos um verdadeiro início de sessão único para todos os utilizadores.

Não sei o que mais poderíamos fazer para nos tornarmos ainda mais seguros. A Google garante-nos contratualmente uma "utilização privada" absoluta. Tecnicamente, isto significa: zero registo, zero formação. Os seus dados de investigação sensíveis nunca serão utilizados para tornar o modelo de IA mais inteligente para outros.

(Nota: os documentos PDF podem, opcionalmente, ser vendidos de forma explícita através do Knodge.eu; nós oferecemo-los e podem ser utilizados para treinar modelos específicos, mas este é um processo separado).

Mareike

*Atualmente, a investigação é global e colaborativa. Como é que o Knodge ajuda a quebrar os silos de conhecimento entre as universidades?

Markus

Estamos a trabalhar nisto como parte da normalização no SCP. Chamamos-lhe a nova função "Wrigge" (beta). Um exemplo - a VUB pode ter um portal, o UKE Hamburg outro. Um centro de nível superior pode perguntar: "Existem contradições entre os resultados de Bruxelas e Hamburgo?" sem ter de copiar os dados em bruto. Isto permite a realização de meta-análises em tempo real, para além das fronteiras institucionais. Desta forma, transformamos o conhecimento passivo em papel num controlo ativo do processo (SCP), dando assim resposta às preocupações dos investigadores em matéria de dados. IA privada, não formação. Queremos que os cientistas passem menos tempo a pesquisar e a formatar e mais tempo a descobrir. Knodge é a ferramenta para isso.

Mareike

*Uma última questão técnica: muitas instituições têm regras de conformidade extremamente rigorosas e não estão autorizadas a utilizar nuvens externas. Estas instituições estão então excluídas do Knodge?

Markus

Não, pelo contrário. É essa a beleza da nossa arquitetura: o Knodge é completamente contentorizado.
Isso significa que:
Oferecemos a nossa nuvem europeia segura, mas também podemos instalar uma instância Knodge "on-premise", ou seja, diretamente no centro de dados da universidade ou da empresa. O sistema é então operado de forma totalmente independente. E graças à função "Wrigge", pode ainda ligar esta ilha local de forma segura a outros parceiros, se assim o desejar. Seja na nuvem ou na sua própria cave - a tecnologia permanece a mesma.

Mareike

*Obrigado pela entrevista, Markus.