A Positron AI, líder em hardware de inferência de IA com eficiência energética, anunciou hoje uma rodada de financiamento da série B com excesso de demanda de US$ 230 milhões e uma avaliação após o investimento superior a US$ 1 bilhão.

Thomas Sohmers (L), CTO and cofounder, and Mitesh Agrawal (R), CEO of Positron AI (Credit: Kavita Agrawal)

A rodada foi coliderada pela ARENA Private Wealth, Jump Trading e Unless, e inclui investimentos novos e estratégicos da Qatar Investment Authority (QIA), Arm e Helena. Também participaram os atuais investidores como Valor Equity Partners, Atreides Management, DFJ Growth, Resilience Reserve, Flume Ventures e 1517. O financiamento valida a missão da Positron de converter a inferência de IA drasticamente mais barata e energeticamente eficiente em larga escala.

"Agradecemos o entusiasmo dos investidores, que por si só reflete a demanda do mercado", disse Mitesh Agrawal, Diretor Executivo da Positron AI. "A disponibilidade de energia emergiu como um gargalo crucial para implementar a IA. E nosso chip de última geração irá fornecer 5 vezes mais tokens por watt em nossas cargas de trabalho principais em comparaçãoàfutura GPU Rubin da Nvidia. A memória é o outro grande gargalo na inferência, sendo que nosso silício personalizado Asimov de última geração será lançado com mais de 2304 GB de RAM por dispositivo no próximo ano, contra apenas 384 GB do Rubin. Isto será um diferencial crucial em cargas de trabalho como vídeo, negociação, modelos com trilhões de parâmetros e qualquer aplicação que exija uma enorme janela de contexto. Também esperamos superar o Rubin em desempenho por dólar para cargas de trabalho específicas que exigem muita memória."

A Positron vem estabelecendo o nível de infraestrutura que torna a IA utilizável em larga escala, reduzindo o custo e a energia necessários para executar modelos modernos. O produto comercial da empresa, Atlas, é um sistema de inferência projetado para implantação e escalonamento rápidos. O Atlas também é totalmente fabricado nos EUA, com silício e sistema produzidos internamente, o que permite um aumento rápido da produção e um fornecimento confiável para clientes que precisam de capacidade com rapidez.

"A largura de banda e a capacidade da memória são dois dos principais fatores limitantes para escalonar cargas de trabalho de inferência de IA para modelos de última geração", disse Dylan Patel, Fundador e Diretor Executivo da SemiAnalysis, empresa de consultoria e investimentos da Positron. A SemiAnalysis é uma empresa líder em pesquisa especializada em semicondutores e infraestrutura de IA, provendo informações detalhadas sobre toda a sequência de computação. "A Positron adota um enfoque exclusivo para o problema de escalonamento de memória e, com seu chip Asimov de última geração, pode oferecer uma capacidade de memória de alta velocidade por chip muito maior que a de provedores de silício tradicionais ou emergentes."

Jump Trading lidera após implementação do Atlas

Um dos principais destaques da rodada é a decisão da Jump Trading de coliderar após se tornar cliente inicialmente.

"Para as cargas de trabalho que nos interessam, os gargalos estão cada vez mais na memória e na potência, e não na capacidade computacional teórica", disse Alex Davies, Diretor de Tecnologia da Jump Trading. "Em nossos testes, o Positron Atlas apresentou uma latência de ponta a ponta cerca de 3 vezes menor do que um sistema comparável baseado em H100 nas cargas de trabalho de inferência que avaliamos, em um formato refrigerado a ar, pronto para produção e com uma cadeia de fornecimento que podemos planejar. Quanto mais aprofundávamos nossos testes, mais concordávamos com o roteiro da Positron (Asimov e sistemas Titan) como uma plataforma que prioriza memória e está projetada para futuras cargas de trabalho. Investimos porque a Positron combina a tração atual com um roteiro que pode remodelar a curva de custos e as capacidades para inferência."

"A Jump Trading procurou a Positron como cliente", disse Agrawal. "Ao conhecerem nosso roteiro para o Asimov, nosso silício personalizado, e o Titan, nosso sistema de última geração, optaram por se tornar coinvestidores líderes. Um cliente se tornar investidor é uma das validações mais fortes que podemos receber. Isto sinaliza tanto convicção técnica como demanda real."

Construindo em direção ao Asimov e Titan: Uma plataforma com foco em memória para inferência de próxima geração

Como próxima geração de silício personalizado da Positron, o Asimov foi projetado ao considerar a realidade de que as cargas de trabalho de IA modernas são cada vez mais limitadas pela largura de banda e capacidade da memória, e não apenas pelas falhas de computação. O Asimov foi projetado para suportar 2 terabytes de memória por acelerador e 8 terabytes de memória por sistema Titan, com largura de banda de memória semelhanteàda GPU Rubin de próxima geração da NVIDIA. Em escala de rack, isto se traduz em uma capacidade de memória bem superior a 100 terabytes.

"À medida que a inferência de IA se expande, a eficiência e o design do sistema se tornam mais importantes do que os pontos de referência primários", disse Eddie Ramírez, Vice-Presidente de Comercialização da Unidade de Negócios de IA em Nuvem da Arm. "O enfoque centrado em memória da Positron, construído sobre a tecnologia Arm, reflete a estreita cooperação entre sistemas e um amplo ecossistema integrado para oferecer ganhos escaláveis ??de desempenho por watt na infraestrutura de IA de última geração."

Esta arquitetura, que prioriza a memória, permite cargas de trabalho de inferência de alto valor, incluindo modelos de linguagem extensos com longo contexto, fluxos de trabalho com agentes e modelos de mídia e vídeo de última geração. A Positron está a caminho de completar a produção de seu chip Asimov apenas 16 meses após o financiamento da série A em junho, que proporcionou ao mesmo recursos para lançar por completo o processo de design, sendo que a empresa pretende manter este ritmo com os chips futuros. "Para nós, a velocidade de desenvolvimento é uma vantagem competitiva essencial", disse Agrawal. "Competir com a Nvidia significa igualar sua frequência de entregas, e estruturamos nossa organização em torno desta meta."

"A Positron vem resolvendo um dos gargalos mais importantes da IA: oferecer inferência em escala, ao respeitar restrições de energia e custo do mundo real", disse Ari Schottenstein, Chefe de Alternativas da ARENA Private Wealth. "A combinação do sucesso atual com o Atlas, além de um caminho viável para o Asimov, cria uma rara oportunidade de definir uma nova categoria em infraestrutura de IA."

A Positron está criando esta plataforma com um ecossistema de líderes do setor, incluindo Arm, Supermicro e outros parceiros importantes de tecnologia e cadeias de fornecimento.

Impulso e trajetória de crescimento

A Positron prevê um intenso crescimento de receita em 2026, posicionando a empresa para se tornar uma das empresas de semicondutores de crescimento mais rápido da história, chegando a uma posição comercial consolidada em larga escala em cerca de 2,5 anos após seu lançamento. A empresa trabalha com diversos clientes pioneiros em computação em nuvem, computação avançada e setores verticais de alto desempenho, e continua expandindo suas implementações e programas para clientes.

Sobre a Positron AI

A Positron AI desenvolve hardware e software específicos para que a inferência de IA seja consideravelmente mais barata e eficiente em termos de energia. O produto comercial da Positron, Atlas, foi projetado para implantação rápida e escalável, e o silício personalizado de última geração da empresa, Asimov, tem como meta finalizar o projeto no fim de 2026, com produção no início de 2027. Os sistemas da Positron são projetados para atender cargas de trabalho de IA de longo contexto e de última geração com excelente custo-benefício. Saiba mais em positron.ai.

