Como usar o Chat Inteligente e o Notas Inteligentes do Galaxy AI

O Galaxy AI1 traz recursos para potencializar a vida das pessoas e facilitar as tarefas do dia a dia. O Notas Inteligentes2 e o Chat Inteligente, por exemplo, permitem organizar suas ideias e anotações com mais eficiência.

Seja numa reunião de trabalho, ou durante uma aula, escreva as suas observações e, com poucos cliques, formate, resuma, corrija ou traduza todo o texto com o Galaxy AI.

O Notas Inteligentes traz o recurso Assistente de Transcrição3, que transcreve áudios capturados pelo aplicativo Gravador no seu dispositivo Galaxy. O Galaxy AI também pode resumir e traduzir a transcrição, facilitando o compartilhamento de uma ata de reunião, por exemplo.

Para usar os recursos de inteligência artificial do Notas Inteligentes, basta abrir o app Notas, selecione o ícone de opções dentro de uma nota e então no símbolo de estrelas do Galaxy AI.

Clique aqui para assistir o vídeo completo.

Chat Inteligente

Ao iniciar um novo emprego ou trabalhar com um novo colega, pode ser desafiador determinar qual seria a melhor resposta para algumas mensagens. Mas com o Galaxy AI, o tom das suas mensagens será alinhado ao do interlocutor, graças ao Chat Inteligente. Ele auxilia no tom das suas conversas4, deixando-as mais profissionais ou leves, além de traduzi-las em tempo real no seu app de mensagens favorito.

Para usar o Chat Inteligente, após escrever a mensagem no aplicativo, toque no ícone de estrelas do Galaxy AI, depois em Estilo de Escrita e selecione a sugestão que melhor se adequa ao momento, seja ele profissional, casual, educado ou até para mídias sociais, com sugestões de hashtags.

Galaxy AI em mais smartphones

O Galaxy AI foi apresentado durante o lançamento da linha Galaxy S24, em janeiro de 2024, e inclui a inteligência artificial em tarefas cotidianas, como o resumo e tradução de textos e mensagens, a transcrição de áudios e a edição de fotos.

Em março de 2024, o Galaxy AI chegou a mais smartphones Samsung Galaxy – Galaxy S23, Galaxy S23+, Galaxy S23 Ultra, Galaxy S23 FE, Galaxy Z Fold5 e Galaxy Z Flip5 e os tablets Galaxy Tab S9, Galaxy Tab S9+ e Galaxy Tab S9 Ultra de maneira gradual – por meio da atualização da interface One UI para a versão 6.1.

Para mais informações sobre o Galaxy AI, visite a Samsung Newsroom Brasil e a Loja Online Samsung para mais informações e conteúdos sobre a ferramenta.

1 Galaxy AI é a inteligência artificial da Samsung. A Samsung não faz promessas ou garantias quanto à precisão, completude ou confiabilidade das saídas fornecidas pelas funcionalidades de IA. O login na conta Samsung pode ser necessário para usar determinadas funcionalidades de IA da Samsung.

2 O recurso Notas Inteligentes requer uma conexão de rede e login na conta Samsung. Existe um limite de caracteres. A disponibilidade do serviço pode variar conforme o idioma. A precisão dos resultados não é garantida.

3 O Assistente de Transcrição requer uma conexão de rede e login na conta Samsung. O Assistente de Transcrição está disponível apenas no aplicativo Samsung Gravador de Voz pré-instalado ou em arquivos gravados usando o aplicativo Samsung Telefone pré-instalado. A funcionalidade de gravação de voz no aplicativo Samsung Telefone pré-instalado pode não ser suportada em alguns países. Os arquivos de áudio devem ter menos de 3 horas de duração para serem processados. A funcionalidade de resumo no Assistente de Transcrição pode ser ativada quando um certo número de caracteres é alcançado. A disponibilidade do serviço pode variar conforme o idioma. A precisão dos resultados não é garantida.

4 A funcionalidade de sugestão de tom no Chat Inteligente requer uma conexão de rede e login na conta Samsung. É necessário atender aos requisitos de comprimento para ativar a funcionalidade. A disponibilidade do serviço pode variar conforme o idioma. A precisão dos resultados não é garantida.

[Entrevista] “É o avanço tecnológico da Samsung mais importante em décadas”, Sandra Chen aborda os desafios de lançar os Galaxy Book4 series, os primeiros notebooks feitos para Inteligência Artificial

Sandra Chen, diretora sênior da área de notebooks e tablets da Samsung Brasil, lidera a divisão de notebooks há mais de uma década, e desde 2022, também é responsável pela divisão de tablets no país.

Em entrevista exclusiva à Samsung Newsroom Brasil, Sandra compartilha insights sobre os desafios do mercado, destacando a evolução dos produtos e do consumidor – cada vez mais versátil e exigente – ao longo da última década, e aborda também os desafios para lançar o primeiro notebook feito para a Inteligência Artificial.

Newsroom: Você completa 12 anos de Samsung em 2024, liderando notebooks e tablets no Brasil. Quais mudanças você presenciou nesse mercado nos últimos anos?

Chen: O mercado de notebooks passou por transformações significativas nos últimos anos, e nós tesmunhamos diversas evoluções de produtos e demandas. Anteriormente, os notebooks mainstream eram os mais procurados, mas, à medida que as necessidades dos consumidores foram amadurecendo, o mercado se adaptou para oferecer produtos com recursos voltados para suprir estas expectativas e necessidades.

Atualmente, o mercado oferece produtos voltados para uma rotina mais flexível, com produtos mais leves, finos, velozes e com alto desempenho e segurança, especialmente voltados para a produtividade e, agora, voltados também à Inteligência Artificial.

Newsroom: O ano de 2024 vem se tornando o ano dos computadores com inteligência artificial. Qual a importância desse movimento para o mercado e, mais especialmente, para a Samsung?

Chen: A inteligência artificial é o avanço tecnológico mais importante que tivemos em mais de uma década. Não vimos tanto potencial para mudar o dia a dia das pessoas desde que os smartphones foram inventados. Ou mesmo a própria internet. E embora estejamos adentrando uma nova era para os consumidores, Inteligência Artificial é um território conhecido para a Samsung. Estamos na vanguarda das tecnologias de AI há muitos anos e a chegada da Inteligência Artificial para PCs representa uma transformação significativa no mercado, uma nova era, por assim dizer.

A Samsung responde a essa demanda introduzindo no mercado o primeiro notebook feito para a Inteligência Artificial fabricado no Brasil. Com isso, oferecemos a melhor experiência em produtividade para uso doméstico, profissional e em qualquer atividade, redefinindo os limites do que é possível realizar com um PC.

Newsroom: Do ponto de vista prático, o que um notebook com Inteligência Artificial pode oferecer para as pessoas?

Chen: Facilidade é a palavra-chave quando se trata dos benefícios proporcionados pelos notebooks Galaxy Book4 series. Essa tecnologia reduz significativamente o tempo necessário para realizar tarefas operacionais, permitindo que as pessoas tenham mais tempo para momentos de criatividade e produtividade. A Inteligência Artificial traz economia de tempo em tarefas que costumavam demandar um esforço maior, permitindo ao usuário se concentrar em ações mais estratégicas e criativas.

Outro exemplo de benefício que a Inteligência Artificial traz é vista em nossa parceria com a Microsoft, por meio do Windows Copilot, um recurso que integra perfeitamente o smartphone aos notebooks Samsung.

Com o Copilot e os notebooks Galaxy Book4 series, os consumidores podem acessar informações do smartphone diretamente do PC de forma rápida e inteligente. É um recurso que te permite redigir e enviar mensagens no seu smartphone diretamente do notebook, algo que trará mais agilidade ao dia a dia das pessoas, por exemplo.

Newsroom: Com notebooks e tablets, quais são as necessidades deste consumidor? Mobilidade passou a ter mais importância? Tecnologias como a tela sensível ao toque passaram a ter maior protagonismo nos notebooks?

Chen: O consumidor contemporâneo é extremamente versátil e busca dispositivos que ofereçam mobilidade e conectividade contínua. Seja para uso profissional ou entretenimento, eles procuram por produtos confiáveis e seguros que se adaptem às suas diversas atividades diárias, onde quer que elas estejam.

É essencial para este consumidor continuar uma atividade de onde ele parou, independente do dispositivo. Isso está bastante presente nos novos notebooks Galaxy Book4 series, que permitem aos consumidores iniciarem um trabalho no notebook e darem continuidade no smartphone ou tablet.

Além da mobilidade, a segurança é primordial para o consumidor brasileiro de notebooks e a Samsung oferece segurança de ponta com a plataforma Samsung Knox, que oferece segurança a nível governamental em seus dispositivos. A tecnologia touch também ganha destaque nos notebooks Galaxy Book4 series, que trazem tela sensível ao toque em todos os notebooks anunciados – Galaxy Book4 Ultra, Book4 Pro e Book4 360. Poder tocar na tela do notebook proporciona uma experiência fluida entre os produtos Samsung Galaxy e seus consumidores, elevando o padrão de interação e usabilidade a um novo patamar.

Newsroom: Aproveitando que o assunto é tela sensível ao toque, como o mercado de notebooks pode conquistar o consumidor geração Z, que nasce com acesso a esse tipo de tela?

Chen: Observando minhas próprias filhas, de 4 e 8 anos, percebo que o uso intuitivo da tela sensível ao toque é algo natural para elas, assim como para a grande maioria da Geração Z. O Galaxy Book4 leva em consideração essa familiaridade com smartphones e tablets, oferecendo uma experiência similar na categoria de notebooks.

Por muito tempo, especulou-se sobre o declínio do notebook em favor dos tablets, mas isso não aconteceu. Com a evolução das demandas dos consumidores, os produtos se tornaram mais interconectados, proporcionando uma produtividade e conectividade aprimorada, inclusive entre eles.

A Samsung pioneiramente integra essas tecnologias, democratizando a experiência de uso para nossos consumidores e indicando um futuro em que os dispositivos serão híbridos, combinando teclado e tela de toque em um só produto. E essa integração é tão fluida que, após pouco tempo de uso, será difícil imaginar um notebook sem tela de toque.

Newsroom: Quanto ao Ecossistema Galaxy, como o Galaxy Book4 series se integra a ele?

Chen: O Ecossistema Galaxy é uma experiência única e exclusiva da Samsung que diferencia nossos produtos de qualquer outro fabricante. Ele é construído com base em nossa filosofia de colaboração aberta e os usuários de smartphones, tablets e notebooks já estão familiarizados com essa integração, como a facilidade de alternar o uso dos fones Galaxy Buds entre dispositivos Galaxy.

Com o Galaxy Book4 series, levamos essa integração a um novo nível, oferecendo uma versatilidade que atende às demandas dos consumidores modernos. Além dos benefícios do Ecossistema Galaxy, os donos do Galaxy Book4 series podem agilmente transferir arquivos entre dispositivos com o Quick Share1, e tornar o smartphone ou tablet em uma segunda tela, ou mouse e teclado, com o Samsung Dex2.

Essas são algumas das muitas maneiras pelas quais o Galaxy Book4 enriquece a experiência do Ecossistema Galaxy, oferecendo mais praticidade e funcionalidade às pessoas.

Newsroom: Por que a escolhe de chipsets Intel para os Galaxy Book4?

Chen: Trabalhar com parceiros faz parte da filosofia central da Samsung, pois acreditamos fortemente na colaboração aberta com outros líderes do setor que compartilham o objetivo comum de fornecer as melhores experiências de PC aos consumidores.

Escolhemos o mais recente chipset Intel® Core™ Ultra para a série Galaxy Book4, em combinação com a herança de hardware e o ecossistema conectado da Samsung, para oferecer a melhor experiência de produtividade à medida que entramos e lideramos a nova era do da Inteligência Artificial no PC.

A série Galaxy Book4 da Samsung exibe um desempenho sem precedentes através de um novo processador Intel® Core™ Ultra que combina a mais recente unidade de processamento central (CPU), unidade de processamento gráfico (GPU) e unidade de processamento neural (NPU). O NPU incorporado, Intel AI Boost, foi adicionado para processamento rápido e eficiente de grandes quantidades de dados, proporcionando excelente desempenho de multitarefa e gráficos.

Esta parceria visa transformar a experiência móvel do nosso ecossistema, focando no engajamento do usuário, produtividade e criatividade sem comprometer a confiança na privacidade e segurança nos aparelhos Galaxy.

Newsroom: Quais outras parcerias foram firmadas para o desenvolvimento do Galaxy Book4 series?

Chen: Firmar parcerias é parte da filosofia de colaboração aberta da Samsung, e o Galaxy Book4 series é resultado destas parcerias. A Intel nos proporciona os chipsets com NPU avançado que permitem o desempenho de Inteligência Artificial de última geração, enquanto a NVIDIA entrega visuais de ponta impressionantes com as placas de vídeo GeForce RTX™, presentes nos Galaxy Book4 Ultra e Pro. O Galaxy Book4 series também é resultado de nossa parceria com a Microsoft, que além do sistema operacional, oferece o Copilot.

1 Disponível no dispositivo Galaxy com One UI 2.1 ou versões posteriores instaladas; o Quick Share usa Bluetooth Low Energy e Wi-Fi. O tipo, o número, a capacidade e a data de validade transferíveis dos arquivos, além da quantidade de compartilhamentos de arquivos simultâneos no Private Share, podem ser limitados.
 

2 O Samsung Dex é suportado no PC com Windows 10 e Mac OS 10.14 (Mojave) e 10.13 (High Sierra). Alguns aplicativos podem não funcionar ou precisam de um licença de uso (paga) no Dex.

Android anuncia pacote de soluções baseadas em IA antirroubo de celular

O Google anunciou nesta quarta-feira, 15, uma série de novos recursos para Android com o objetivo de proteger usuários contra roubo de celulares. . O “pacote” inclui soluções baseadas em inteligência artificial que identifica quando um celular foi furtado e gera o bloqueio de tela, além de um “espaço privado” no celular para agrupar aplicativos sensíveis sob uma camada adicional de segurança.

Parte das novas funcionalidades antirroubo será disponibilizada ainda este ano para usuários com Android 10+ por meio de atualização do Google Play Services; outros recursos serão incluídos na atualização do Android 15. Conheça abaixo as soluções que têm como objetivo proteger seus usuários antes, durante e depois de uma tentativa de roubo:

  1. Espaço privado: proteção aprimorada de dispositivos e dados para impedir o roubo antes que aconteça

Enquanto alguns ladrões visam apenas o dispositivo, muitos buscam extrair dados valiosos e transferir fundos do seu telefone, o que pode ser mais lucrativo do que o próprio hardware. O “espaço privado” é uma inovação recente que possibilita a criação de uma seção segregada no telefone, ocultável e protegida por um PIN separado. Esse recurso oferece segurança adicional para aplicativos que podem conter informações confidenciais, como dados financeiros ou de saúde.

  1. Bloqueio de tela automático com tecnologia de IA para quando seu telefone for roubado

O recurso de detecção de roubo é uma adição que utiliza a IA desenvolvida pelo Google para identificar se alguém tenta arrancar o telefone da sua mão e fugir, seja correndo, pedalando ou de outra forma. Caso um comportamento típico de roubo seja detectado, a tela do telefone será bloqueada instantaneamente, dificultando o acesso dos ladrões aos seus dados.

  1. Bloqueie seu dispositivo e aja rapidamente após seu telefone ser roubado com o recurso de bloqueio remoto

Você terá a capacidade de bloquear a tela do seu telefone por meio do Encontre Meu Dispositivo com apenas o seu número de telefone e uma autenticação rápida, utilizando qualquer dispositivo. Essa função proporciona tempo para que você recupere os detalhes da sua conta e acesse opções adicionais úteis no Encontre Meu Dispositivo, como enviar um comando completo de redefinição de fábrica para limpar totalmente o dispositivo.

O Google também anunciou um recurso que tem como objetivo impedir o reset de um dispositivo Android e assim desestimular novos roubos. Saiba mais detalhes sobre essa e outras soluções antirroubo no blog do Google Brasil: Novos recursos do Android para proteger seus dados contra roubo.

Recursos de segurança aprimorados

Ainda neste ano, o Google Play Protect usará IA no dispositivo para detectar aplicativos que possam estar envolvidos em fraude ou phishing. Essa detecção de ameaças ao vivo analisará como os aplicativos usam permissões confidenciais e interagem com outros aplicativos para detectar comportamentos suspeitos em tempo real. Se o Google Play Protect encontrar algo que pareça malicioso, o aplicativo será enviado ao Google para análise adicional e avisaremos os usuários ou desativaremos o aplicativo se confirmarmos que ele está realizando atividades prejudiciais. Tudo isso é feito sem coletar quaisquer dados pessoais.

Outras novidades

Encontre novos conteúdos com IA no Google TV

Com mais de 220 milhões de dispositivos ativos em todo o mundo e uma base de usuários em rápido crescimento, o Google TV ajuda você a descobrir conteúdo mais rapidamente com recomendações baseadas em IA, para que você possa passar mais tempo assistindo e menos tempo pesquisando. Agora, com o modelo Gemini, é ainda mais fácil escolher o que assistir com descrições geradas por IA na tela inicial, personalizadas para você com base em seu gênero e preferências de ator. As descrições geradas por IA também preencherão descrições ausentes ou não traduzidas de filmes e programas, para que você não fique adivinhando.

Adicionar itens à Carteira do Google a partir de uma foto

Além de salvar versões digitais de itens que contêm códigos de barras e códigos QR na sua Google Wallet, em breve nos EUA você poderá criar uma versão digital da maioria dos passes que contêm apenas texto. Basta tirar uma foto dos passes diários, como ingressos para eventos, cartões de biblioteca, cartões de seguro automóvel, cartões de associação de academia e muito mais, e criar uma versão digital na sua Google Wallet para acesso rápido.

Além dessas inovações, o Google também está lançando outras funcionalidades que melhoram a experiência geral no Android. Saiba mais clicando aqui.

FGV EAESP realiza 2ª edição do Tech Day sobre inteligência artificial nos negócios

O Departamento de Tecnologia e Data Science (TDS), o Alumni e as entidades estudantis da Escola de Administração de Empresas de São Paulo da Fundação Getulio Vargas (FGV EAESP) realizam a 2ª edição do Tech Day – Inteligência artificial nos negócios: aplicações, benefícios, impactos e tendências –dia 22 de maio, a partir das 15h, na sede da FGV EAESP. Os interessados em participar devem se inscrever neste link: Link.

O evento tem por objetivo promover a integração entre a formação acadêmica, o ambiente executivo e os projetos voltados para aplicação prática de Inteligência Artificial e Data Science nos negócios, visando gerar valor social e econômico em benefício do desenvolvimento do Brasil.

Além disso, serão apresentadas propostas de pesquisas aplicadas e estudos de casos empresariais, desenvolvidos por alunos e ex-alunos dos cursos de graduação, MBAs, mestrado e doutorado, tanto acadêmicos quanto profissionais.

Confira a programação completa: Link

[Entrevista] Inteligência Artificial rápida, leve e em dispositivos: como a Samsung Research desenvolveu recursos de IA que oferecem tradução em tempo real

Os dispositivos móveis habilitados para o Galaxy AI1 permitem que as pessoas desfrutem de comunicação contínua e sem barreiras em ainda mais países. Agora com suporte para árabe, indonésio e russo, os recursos Intérprete e Tradução Simultânea2 foram expandidos de 13 para 16 idiomas.

A Samsung Research combinou dados e tecnologia de ponta. Juntamente com o time de P&D da área de Mobile eXperience (MX), os pesquisadores aprimoraram ainda mais essa tecnologia para desenvolver recursos de tradução impulsionados por Inteligência Artificial – que podem ser usados para tradução em tempo real durante chamadas e em vários aplicativos.

A Samsung Newsroom se reuniu com Yoonjung Choi e Yonghyun Ryu, do Global AI Center da Samsung Research, para saber mais sobre esses ambiciosos recursos.

Comunicação fluida e segurança robusta com Inteligência Artificial em dispositivos

A Inteligência Artificial é o grande diferencial dos recursos Intérprete e Tradução Simultânea da Galaxy AI, apresentados no lançamento da linha Galaxy S24 no início deste ano.

Ao empregar recursos de computação avançados, os smartphones com Inteligência Artificial integrada podem oferecer serviços sem depender de servidores ou da nuvem. As pessoas podem ficar tranquilas sabendo que seus dados permanecerão privados e seguros, pois as informações não são compartilhadas com fontes externas.

O Global AI Center da Samsung Research contribuiu para integrar tecnologia proprietária em seu modelo de tradução por Inteligência Artificial, visando disponibilizar esses recursos para mais pessoas.

Prevendo uma ampla gama de aplicações, a equipe da Samsung Research e o time de P&D de MX obtiveram uma grande quantidade de dados. “Coletamos dados coloquiais para tradução em tempo real durante chamadas no recurso Tradução Simultânea e dados relacionados a viagens para o recurso Intérprete”, explica Yoonjung Choi, que liderou o projeto. “Para fornecer uma tradução mais precisa, estudamos e incorporamos a linguagem casual usada em salas de bate-papo e tags HTML usadas em navegadores da web”.

Como a Samsung Research treinou seu modelo de Inteligência Artificial

O modelo de tradução por Inteligência Artificial da equipe da Samsung Research é baseado em tecnologia de deep learning, ou aprendizagem profunda, que aprende com dados próprios.

Yonghyun Ryu, responsável pela pesquisa e desenvolvimento de Inteligência Artificial, comparou esse processo à criação de um filho. “Da mesma forma que uma criança precisa de excelentes recursos educacionais e cuidadores para crescer e prosperar, é essencial ter bons dados linguísticos e pesquisadores talentosos ao desenvolver um modelo de tradução por Inteligência Artificial de alto desempenho”, descreveu ele.

Desde 2013, a Samsung Research fornece serviços de tradução internos, conduzindo pesquisa e desenvolvimento relacionados à tradução por Inteligência Artificial e acumulando dados de alta qualidade.

A equipe de especialistas em deep learning da Samsung Research desempenhou um papel importante no treinamento do modelo de Inteligência Artificial.

“Se ocorrerem traduções incorretas durante o processo de pesquisa e desenvolvimento, é necessário identificar o problema e fazer melhorias. No entanto, isso pode ser desafiador e demorado para pesquisadores que não tenham capacidades e experiência suficientes”, explica. “Nossos pesquisadores usaram experiência e conhecimento próprios para analisar rapidamente a causa do problema e encontrar uma solução para aprimorar o modelo de tradução por IA”.

Para avaliar o desempenho das traduções do Galaxy AI, a equipe da Samsung Research utilizou métricas quantitativas baseadas em conjuntos de testes, bem como avaliações qualitativas feitas por tradutores humanos e pelo time de P&D de MX.

Além disso, a equipe ganhou credibilidade ao participar de competições globais de tradução automática. “Embora a participação exija tempo e esforço, o bom desempenho nas competições proporciona impulso para pesquisa e desenvolvimento”, enfatiza Ryu. “Conseguimos alcançar resultados sólidos porque os membros de nossa equipe puderam discutir livremente novas ideias e testá-las”.

Cordialidade e pontuação: compreendendo as peculiaridades de cada idioma

Cada idioma carrega consigo características únicas de sua cultura, que podem abranger nomes, inflexões tonais e símbolos de pontuação distintos. Para garantir traduções precisas, o modelo de tradução por Inteligência Artificial leva em conta todas essas particularidades linguísticas. Por exemplo, em coreano e japonês, os nomes são traduzidos de forma a manter um tom respeitoso.

A Samsung colaborou com centros regionais de P&D para compreender plenamente os idiomas em seus contextos culturais. “Trabalhando em estreita colaboração com pesquisadores e linguistas de outros países, conseguimos oferecer uma tradução mais precisa e completa”, afirma Choi.

Ao mesmo tempo, lidar com idiomas diferentes muitas vezes envolve tentativa e erro. “O vietnamita, por exemplo, é uma língua tonal. No entanto, percebemos durante o processo de pesquisa que os vietnamitas muitas vezes omitem tons em conversas casuais durante o bate-papo”, explica. “Precisávamos de dados adicionais para ajudar os recursos a traduzir frases sem tons”. Para o tailandês, a Samsung Research desenvolveu um separador de frases especial porque o idioma não utiliza pontuação.

Por que a tecnologia leve é a chave para modelos eficazes de IA em dispositivos

A Samsung Research começou a desenvolver seu modelo de tradução por Inteligência Artificial em dispositivos em 2019. “Ao contrário dos modelos de IA baseados em servidores, os modelos de IA integrados nos dispositivos devem operar exclusivamente utilizando os recursos dos dispositivos das pessoas”, afirma Ryu. “Desenvolver tecnologia leve que utilize recursos mínimos é fundamental”. Para alcançar essa leveza, a equipe empregou tecnologias de “destilação de conhecimento” e “quantização”.

A destilação de conhecimento consiste em extrair informações de um modelo grande e de alto desempenho, entregando-o a um modelo menor, de forma semelhante à maneira como um professor resume um tópico para que o aluno possa assimilar as informações com mais facilidade e eficiência.

Já a quantização simplifica os algoritmos de Inteligência Artificial para reduzir o tamanho do modelo, acelerando o processo e aumentando a velocidade de resposta.

Ryu comparou a quantização ao desenho de morangos. “Você precisa de uma ampla gama de cores para pintar morangos realistas, mas os morangos também podem ser feitos apenas com vermelho e verde”, explica. “Quantização é o processo de minimizar o número de cores necessárias para desenhar morangos, esforçando-se para torná-lo o mais próximo possível da realidade”.

No campo da Inteligência Artificial, a destilação e a quantização do conhecimento são abordagens bem conhecidas para tornar os modelos mais leves. No entanto, implementá-las em escala comercial não é fácil devido às diferenças nos métodos e fatores experimentais detalhados de cada pesquisador.

A Samsung Research desenvolveu tecnologia patenteada, descobrindo uma técnica de quantização eficiente e criando um algoritmo acelerado baseado nela. “Através de experimentações constantes, encontramos uma maneira ideal de tornar o modelo mais leve”, comenta Choi.

Ao combinar o modelo de tradução por Inteligência Artificial de alta qualidade com algoritmos que tornam os modelos mais leves e aceleram o tempo de resposta, nasceram recursos de IA leves e rápidos em dispositivos.

A cultura por trás da língua: como seria o modelo de tradução por IA perfeito?

Os pesquisadores do Global AI Center da Samsung Research têm objetivos ambiciosos ao liderar o campo da IA em dispositivos. “Meu objetivo final é facilitar a comunicação entre os usuários e pessoas que falam outros idiomas”, afirma Choi.

Ryu compartilhou sua visão para construir o tradutor perfeito. “Um dia, queremos criar um tradutor que realmente compreenda as culturas por trás das línguas que traduz, equipado com um extenso conjunto de conhecimentos. Meu desafio é desenvolver um tradutor que o mundo nunca viu antes”.

Os recursos de tradução por Inteligência Artificial em dispositivos da Samsung permitem que qualquer pessoa com um dispositivo móvel habilitado se comunique livremente – sem se preocupar com conexão à Internet ou vazamento de informações.

No futuro, a equipe da Samsung Research continuará liderando inovações no campo da IA, em rápida evolução, e trazendo novos patamares de conveniência às pessoas.

Com uso da inteligência artificial, geladeiras Evolution, da Samsung, garantem eficiência energética

A Samsung conta com um portfólio completo de geladeiras que se adequam às exigências do novo padrão brasileiro do Inmetro ao se encaixarem no mais alto nível de eficiência energética estabelecido pelo órgão, o A+++. Mas, além dessas características, as novas geladeiras da linha Evolution – nos modelos RT38, RT42, RT53 e RB50 – contam com recursos que auxiliam na economia de energia, e a inteligência artificial (AI) é parte fundamental desse processo.
   ‎‎ 
Esses são os primeiros modelos Duplex e Duplex Inverse conectados da marca. Isso significa que a presença da AI, junto ao ecossistema SmartThings, faz com que as geladeiras sejam aliadas da economia na conta de luz no fim do mês.

Outra característica de destaque é a presença da tecnologia Digital Inverter, que ajuda a economizar até 40% na conta de energia². As geladeiras também oferecem garantia de 20 anos no compressor.

Economia com as geladeiras Evolution da Samsung

Um exemplo de aplicação da AI nas geladeiras da linha Evolution é o AI Energy Mode, que usa a tecnologia para monitorar os padrões de uso e consumo das residências para fornecer informações úteis que ajudam a economizar energia. Isso é feito na forma de estimativas de custo do consumo, oferecendo informações sobre o gasto diário, semanal e mensal das geladeiras.

Oferecendo mais uma opção de economia no dia a dia, as geladeiras Evolution da Samsung contam com Wi-Fi, que permite que os usuários ativem ou desativem funções a partir de qualquer lugar, mesmo que não estejam em casa. Além disso, por meio do SmartThings, ele é notificado caso a porta não tenha sido fechada corretamente, por exemplo, ou se uma oscilação de temperatura significativa acontecer no interior do eletrodoméstico.

Por fim, especificamente nos modelos Duplex (RT38, RT42 e RT53), a tecnologia POWERvolt está presente e funciona para impedir que o equipamento tenha problemas durante picos de energia, pois faz com que as geladeiras funcionem ininterruptamente entre 90V e 310V. Essa característica faz com que a Samsung tenha um portfólio de geladeiras Duplex bivolt bastante robusto.

Design que se adequa a vários ambientes

As geladeiras Evolution também se destacam por seu design minimalista e atemporal, em um corpo de linhas retas, com portas planas, puxadores embutidos e painel digital interno, formando o produto ideal para combinar com a decoração da cozinha, pois se adapta a diversos conceitos e projetos.

Google I/O: Três novas maneiras de se manter produtivo com o Gemini para Google Workspace

O Gemini para Google Workspace ajuda pessoas e empresas a aproveitar melhor seus aplicativos do Google, desde redigir e-mails no Gmail até organizar planos de projetos no Planilhas. No último ano, mais de um milhão de pessoas e dezenas de milhares de empresas usaram IA generativa no Workspace quando precisavam de um suporte extra ou de uma dose de inspiração.

Hoje, o Google anunciou novas maneiras de fazer mais na sua vida pessoal e profissional com o Gemini para Google Workspace. O Gemini, no painel lateral do Workspace, agora usa o Gemini 1.5 Pro e está chegando a mais pessoas. Também foram adicionados novos recursos ao Gemini no aplicativo do Gmail para dispositivos móveis e expandindo o suporte a idiomas para o recurso Ajude-me a escrever no Docs e no Gmail.

Acesse o Gemini 1.5 Pro no painel lateral dos aplicativos Workspace

A partir de hoje, o Gemini, no painel lateral junto ao Gmail, Docs, Drive, Apresentações e Planilhas, usará o Gemini 1.5 Pro. Com uma janela de contexto mais longa e um raciocínio mais avançado, o Gemini pode responder a uma maior variedade de perguntas e fornecer respostas mais esclarecedoras. Além disso, é fácil começar com resumos que aparecerão no painel lateral, sugestões de prompts e muito mais.

Graças à janela de contexto mais longa, o Gemini pode fazer referência a conjuntos de dados maiores. Por exemplo, se a escola do seu lho enviar uma enxurrada de e-mails todos os meses, você poderá usar o painel lateral do Gmail para perguntar coisas como “resuma os e-mails da Maywood Park Elementary School” e obter instantaneamente os detalhes e itens de ação mais importantes. Precisa compartilhar detalhes do hotel para a reunião familiar? Basta digitar @ no painel lateral do Gmail para encontrar o documento correto em seu Drive e, em seguida, pedir ao Gemini o nome do hotel e as informações de contato do gerente de vendas. Depois, você pode inserir facilmente os resultados em um e-mail para que seus familiares tenham os detalhes de que precisam.

O painel lateral Gemini no Workspace agora está disponível para usuários do Workspace Labs e do Gemini para Workspace Alpha. Ele estará disponível no próximo mês (desktop) para empresas e usuários por meio dos planos Gemini para Workspace e Google One AI Premium.

Carrossel de ativos:

  • Gemini no painel lateral do Gmail resumindo e-mails recentes (exemplo Maywood Park Elementary).
  • O painel lateral do Gemini in Docs fornece um resumo e sugestões de prompts (exemplo do Grand Canyon).
  • O painel lateral do Gemini no Drive responde a uma pergunta sobre um arquivo no Drive (exemplo de cotação de remodelação de porão).

Experimente os novos recursos do Gemini no aplicativo Gmail para dispositivos móveis

O Google também lançou novos recursos no aplicativo do Gmail para dispositivos móveis, ajudando você a acessar facilmente o Gemini e manter a produtividade em qualquer lugar.

Resuma e-mails: acompanhar longas conversas de e-mail pode ser entediante em qualquer dispositivo, mas é especialmente desaador em telas pequenas. Com esse recurso, o Gemini pode analisar conversas de e-mail e fornecer uma visão resumida diretamente no aplicativo Gmail. Basta tocar no botão “resumir” na parte superior do seu tópico de e-mail para obter os destaques. Ele estará disponível para usuários do Workspace Labs esta semana e para todos os clientes do Gemini para Workspace e assinantes do Google One AI Premium no próximo mês.

Resposta inteligente contextual: durante anos, os usuários do Gmail economizaram tempo com as sugestões do Resposta inteligente, e as opções conforme você digita da Escrita inteligente, além dos rascunhos completos de e-mail do Ajude-me a escrever. Em breve, o Gemini no Gmail oferecerá sugestões de respostas ainda mais detalhadas e diferenciadas com base no contexto do seu tópico de e-mail. Com a “Resposta Inteligente Contextual”, você pode editar ou simplesmente enviar como está. Estará disponível para usuários do Workspace Labs em dispositivos móveis e, a partir de julho, na web.

Perguntas e respostas do Gmail: em breve, quando você clicar no novo ícone do Gemini no aplicativo para dispositivos móveis, o Gemini no Gmail oferecerá opções úteis, como “resumir este e-mail”, “listar as próximas etapas” ou “sugerir uma resposta”. E semelhante ao painel lateral da área de trabalho, você pode usar a caixa de prompt aberta quando tiver solicitações mais especícas. Por exemplo, você pode pedir ao Gemini para “encontrar a oferta do empreiteiro de telhados” que está armazenada em algum lugar da sua caixa de entrada. Ou talvez você não queira procurar no seu Drive o documento com detalhes sobre o seu clube do livro. Em vez disso, você poderá simplesmente perguntar ao Gemini : “Quais são as questões para discussão na minha próxima reunião do clube do livro?” As perguntas e respostas do Gmail estarão disponíveis para usuários do Workspace Labs em dispositivos móveis e na Web a partir de julho.

Carrossel de ativos:

Resumir: Gmail no aplicativo do Gemini para celular Respostas inteligentes contextuais: GemininoaplicativodoGmailparacelular PerguntaserespostasdoGmail:Geminino aplicativo do Gmail para celular

Use o recurso ‘Ajude-me a Escrever’ em português

Recentemente, o Google anunciou o recurso Traduza para mim no Google Meet, com detecção automática de idioma e legendas traduzidas em tempo real em mais de 60 idiomas para ajudar pessoas de todo o mundo a se conectarem. Agora, estamos adicionando suporte a idiomas para mais recursos do Gemini para Workspace. Nas próximas semanas, o recurso Ajude-me a escrever no Gmail e no Docs passará a oferecer suporte para espanhol e português no desktop e continuaremos adicionando mais idiomas ao longo do tempo.

Para começar a usar esses recursos e vários outros recém-anunciados para os aplicativos Gemini para web e dispositivos móveis, conra o conteúdo Gemini para Workspace, para clientes empresariais, e o plano Google One AI Premium voltado aos usuários. E se você está procurando maneiras de aproveitar ao máximo o Gemini para Workspace, leia nossa série Além do prompt no blog do Workspace.

Google I/O: A busca na era Gemini

Nos últimos 25 anos, apesar de muitas mudanças tecnológicas, o Google continua a reimaginar e expandir o que a Busca do Google pode fazer. O Google aprimorou os principais sistemas de qualidade da informação para ajudá-lo a encontrar o que há de melhor na internet e construímos uma base de conhecimento com bilhões de informações sobre pessoas, lugares, entre outras coisas. Tudo para que você possa obter informações confiáveis num piscar de olhos.

Agora, com a IA generativa, a Busca pode fazer mais do que você imaginou. Com ela, você pode perguntar o que passar pela cabeça ou qualquer coisa que precisa ser feita – desde uma pesquisa e planejamento, até um brainstorming. O Google cuidará do trabalho braçal.

Tudo isso é possível graças a um novo modelo do Gemini personalizado para a Busca do Google. O novo recurso combina os recursos avançados da nossa IA com nossos mais avançados sistemas de pesquisa — incluindo raciocínio em várias etapas, planejamento, multimodalidade e longas janelas de contexto.

Obtendo respostas rápidas com a IA

Às vezes você quer uma resposta rápida, mas não tem tempo para analisar tudo que está por aí. Com os Resumos de IA, a Busca fará o trabalho para você.

Os Resumos de IA já foram usados bilhões de vezes por meio de nosso experimento no Search Labs e as pessoas gostam de poder obter um panorama rápido de um tópico e links para saber mais. Descobrimos que com os Resumos de IA, as pessoas usam mais a Busca e cam mais satisfeitas com os resultados.

A partir de hoje, O Google vai disponibilizar os Resumos de IA para todos nos Estados Unidos, e a experiência estará disponível em mais países em breve. Ou seja, esta semana, milhões de usuários terão acesso aos Resumos de IA e esperamos levá-las a mais de um bilhão de pessoas até o final do ano.

Com os Resumos de IA, as pessoas podem visitar uma diversidade muito maior de sites e obter ajuda com questões mais complexas. E à medida que expandimos esse recurso, continuaremos a nos concentrar no envio de tráfego de valor para editores e criadores. Como sempre, os anúncios continuarão a aparecer em espaços dedicados em toda a página, com rótulos claros para distinguir entre resultados orgânicos e patrocinados.

Fazendo perguntas mais complexas

Com os recursos de raciocínio em várias etapas do Gemini, os resumos ajudarão em questões cada vez mais complexas: ao invés de dividir sua pergunta em diversas consultas, você pode fazer perguntas mais complexas, com todas as nuances e ressalvas que você tiver em mente, tudo de uma vez só.

Por exemplo, talvez você esteja procurando um novo estúdio de ioga ou pilates e queira um que seja popular entre os habitantes locais, convenientemente localizado para seu deslocamento diário e que também ofereça um desconto para novos membros. Em breve, com apenas uma consulta, você poderá perguntar algo como “encontre os melhores estúdios de ioga ou pilates em Boston, mostre detalhes sobre suas ofertas de matrícula e tempo de caminhada a partir de Beacon Hill”.

Planejando com antecedência

Além de encontrar a resposta ou informação certa para uma pergunta complexa, a Busca também poderá planejar com você.

Com os recursos de planejamento do Gemini, diretamente na Busca, você pode obter ajuda para criar planos para tudo o que precisar, começando com refeições e férias. Pesquise por algo como “crie um plano de refeições para um grupo, que seja fácil de preparar e que tenha duração de 3 dias” e você terá um ponto de partida com uma ampla variedade de receitas de toda a web.

Se quiser mudar alguma coisa, você pode facilmente solicitar os ajustes necessários, como trocar a receita por um prato vegetariano no jantar. De forma simples, a Busca irá personalizar seu plano de refeições. E você poderá exportar rapidamente os ingredientes para uma lista de compras no Documentos ou Gmail.

O planejamento de refeições e viagens já está disponível no Search Labs em inglês nos EUA. Ainda este ano, adicionaremos recursos de personalização e mais categorias, como festas e exercícios.

Explorando uma página de resultados organizada por IA

Para as pesquisas que não têm uma resposta específica, encontrar a inspiração certa e considerar todas as suas opções pode dar muito trabalho. Em breve, quando você estiver procurando por ideias, a Busca usará IA generativa para fazer um brainstorming com você e criar uma página de resultados organizada por IA que facilita a exploração.

Ao invés de uma lista de links, você verá insights agrupados em títulos exclusivos gerados por IA, apresentando uma ampla variedade de perspectivas e tipos de conteúdo.

Para consultas em inglês feitas nos EUA, será possível começar a ver esta nova página de resultados da Busca, organizada por IA – começando em breve com restaurantes e receitas, seguida por filmes, músicas, livros, hotéis, compras e muito mais.

Obtendo ajuda da IA com vídeos

Pesquisar é muito mais do que palavras em uma caixa de texto. Frequentemente as perguntas que você tem são sobre as coisas que você vê ao seu redor, incluindo objetos em movimento.

Graças aos avanços na compreensão do vídeo, podemos levar a busca por imagens a um nível totalmente novo, com a capacidade de fazer perguntas também em vídeo. Com esse novo recurso, a Busca pode descobrir uma questão visual complexa e respondê-la para você.

Por exemplo, talvez você tenha comprado um toca-discos em um brechó, mas ele não funciona quando você o liga e a peça de metal com a agulha está flutuando, inesperadamente. Pesquisar com um vídeo economiza tempo e trabalho para encontrar as palavras certas para descrever esse problema, e você terá um resumo de IA com etapas e recursos para solucionar esses problemas.

A busca com vídeo estará disponível em breve para usuários do Search Labs, em inglês, nos EUA e expandiremos para mais regiões ao longo do tempo.

Este é apenas um vislumbre de como o Google está reinventando a forma de pesquisar, combinando o que há de melhor na Busca atual com os recursos do Gemini. Em breve, o Google fará pesquisas, planejamento, brainstorming e muito mais.

Google I/O: Faça mais com o Gemini – Experimente o 1.5 Pro e mais recursos inteligentes

O Gemini foi projetado para ser seu assistente pessoal de IA – conversacional, intuitivo e útil. Quer você o use pelo aplicativo ou por meio da experiência na web, o Gemini pode ajudá-lo a realizar tarefas complexas e ajudar no seu dia-a-dia.

Agora o Google está fazendo diversas atualizações, incluindo uma janela de contexto mais ampla, novos recursos de análise de dados, conexões com aplicativos adicionais do Google e opções mais personalizáveis, para que você possa colaborar com o Gemini mais inteligente e personalizado de todos os tempos.

Analise documentos com a janela de contexto mais ampla do mundo

Hoje o Google está trazendo ao mercado o Gemini 1.5 Pro , o modelo de última geração, para assinantes do Gemini Advanced . O Gemini 1.5 Pro traz para você os mais recentes avanços técnicos, incluindo uma janela de contexto bastante expandida, começando com 1 milhão de tokens – a mais longa de qualquer chatbot de consumo amplamente disponível no mundo. Uma janela de contexto tão ampla signica que o Gemini Advanced pode entender vários documentos grandes, com até 1.500 páginas no total, ou resumir 100 e-mails em segundos. Em breve a tecnologia será capaz de lidar com uma hora de conteúdo de vídeo ou bases de código com mais de 30.000 linhas.

Para aproveitar essa ampla janela de contexto, o Google está adicionando a capacidade de fazer upload de arquivos via Google Drive ou diretamente do seu dispositivo, diretamente no Gemini Advanced. Agora você pode obter rapidamente respostas e insights sobre documentos densos, como descobrir os detalhes da política de animais de estimação em seu contrato de aluguel ou comparar os principais argumentos de vários artigos de pesquisa extensos. E em breve, o Gemini Advanced atuará como analista de dados, descobrindo insights e criando visualizações e gráficos personalizados dinamicamente a partir de arquivos de dados carregados, como planilhas.

Gemini é nativamente multimodal e o 1.5 Pro traz grandes melhorias na compreensão de imagens. Por exemplo, você pode tirar uma foto de um prato no seu restaurante favorito e pedir uma receita, ou tirar uma foto de um problema de matemática e obter instruções passo a passo sobre como resolvê-lo – tudo a partir de uma única imagem.

O Gemini 1.5 Pro estará disponível para assinantes do Gemini Advanced em mais de 150 países e em mais de 35 idiomas.

Tenha conversas mais naturais com Gemini Live

O Google também está adicionando novas maneiras de interagir com o Gemini de forma mais natural, seja enviando mensagens de texto ou conversando. Com o Gemini no Mensagens do Google, agora você pode conversar com o Gemini no mesmo aplicativo em que envia mensagens para seus amigos.

E nos próximos meses, será lançado o Gemini Live para assinantes do Gemini Advanced, uma nova experiência de conversação móvel que utiliza nossa tecnologia de fala de última geração para tornar a conversa com o Gemini mais intuitiva. Com o Gemini Live, você poderá conversar com o Gemini e escolher entre uma variedade de vozes naturais com as quais ele pode responder. Você pode até falar no seu próprio ritmo ou interromper a resposta com perguntas esclarecedoras, como faria em qualquer conversa.

Digamos que você esteja se preparando para uma entrevista de emprego ou ensaiando para um discurso importante: basta pedir ajuda ao Gemini para se preparar. A IA irá sugerir habilidades que você pode destacar ao conversar com seu potencial empregador ou dicas para falar em público para acalmar seus nervos antes de subir ao pódio. Ainda este ano, você poderá usar sua câmera quando estiver ao vivo, abrindo conversas sobre o que você vê ao seu redor.

Faça planos complexos, como itinerários de viagem

Às vezes você gasta mais tempo pesquisando e organizando uma viagem do que aproveitando a viagem em si. A nova experiência de planejamento do Gemini Advanced irá além de mostrar uma lista de atividades sugeridas para criar um itinerário personalizado só para você.

Imagine que você pergunte ao Gemini: “Minha família e eu vamos para Miami no Dia do Trabalho. Meu lho adora arte e meu marido quer muito frutos do mar frescos. Você pode obter informações sobre meu voo e hotel no Gmail e me ajudar a planejar o m de semana?

Este prompt exige que o Gemini faça muito mais do que apresentar informações disponíveis publicamente como outros chatbots. A ferramenta leva em consideração o horário do seu voo, preferências gastronômicas e informações sobre museus locais, ao mesmo tempo que entende onde cada ponto de parada está localizado e quanto tempo levará para viajar entre cada atividade. Ele pega as informações do seu voo no Gmail, acessa o Google Maps para recomendações de restaurantes e museus próximos ao seu hotel e usa a Busca para recomendar outras atividades, como um passeio a pé pelo Design District ou na praia, para preencher o resto do dia. Ele sintetiza todas essas informações para você e cria um roteiro pessoal e personalizado que atende a todas as suas solicitações. E se você zer alterações ou adicionar mais detalhes, o itinerário será atualizado automaticamente.

Essa nova e dinâmica experiência de planejamento chegará ao Gemini Advanced nos próximos meses.

Google I/O: Gemini inova com modelo mais rápido, contexto mais amplo e assistentes de IA

Em dezembro, O Google lançou o seu primeiro modelo nativamente multimodal, o Gemini 1.0, em três tamanhos: Ultra, Pro e Nano. Apenas alguns meses depois, lançamos o 1.5 Pro , com desempenho aprimorado e uma janela de contexto mais ampla e inovadora de 1 milhão de tokens.

Desenvolvedores e clientes corporativos têm colocado o 1.5 Pro em uso de diferentes maneiras [inserir link para vídeo de caso de uso do 1.5 Pro] e achado incrivelmente úteis sua ampla janela de contexto, recursos de raciocínio multimodal e desempenho geral.

Com base no feedback dos usuários, foi observado que alguns aplicativos precisam de menor latência e menor custo para ser efetivo e isso nos inspirou a continuar inovando. Por isso, hoje estamos apresentando o Gemini 1.5 Flash: um modelo mais leve que o 1.5 Pro e projetado para ser rápido e eciente para servir em grande escala.

Tanto o 1.5 Pro quanto o 1.5 Flash estão disponíveis, em pré-visualização, com uma janela de contexto de 1 milhão de tokens no Google AI Studio e Vertex AI. Uma janela de contexto de 2 milhões de tokens já está disponível para desenvolvedores que usam API e para clientes do Google Cloud, por meio de uma lista de espera. E estamos integrando o 1.5 Pro aos produtos do Google, incluindo o Gemini Advanced e os aplicativos Workspace .

Também foi anunciando a próxima geração de modelos abertos, Gemma 2, e compartilhando o progresso sobre o futuro dos assistentes de IA a partir do Projeto Astra [inserir link para vídeo do YT].

Atualizações da família de modelos Gemini

1.5 Flash: Um modelo mais rápido e eficiente

1.5 Flash é a mais nova adição à família Gemini e o modelo mais rápido servido na API . Ele é otimizado para tarefas de alto volume e alta frequência em escala, é mais econômico para atender e apresenta nossa inovadora janela de amplo contexto.

Embora seja um modelo mais leve que o 1.5 Pro, ele é altamente capaz de realizar o raciocínio multimodal em grandes quantidades de informações, além de oferecer uma qualidade impressionante para seu tamanho. O 1.5 Flash é excelente em resumos, aplicativos de bate-papo, legendagem de imagens e vídeos, extração de dados de documentos e tabelas longas e muito mais. Isso ocorre porque ele foi treinado pelo 1.5 Pro por meio de um processo chamado “destilação”, no qual o conhecimento e as habilidades mais essenciais de um modelo maior são transferidos para um modelo menor e mais eciente.

Um 1.5 Pro ainda mais útil

Nos últimos meses, o Google melhorou significativamente o 1.5 Pro, o melhor modelo para desempenho geral em uma ampla gama de tarefas. Além de estender sua janela de contexto para 2 milhões de tokens, aprimoramos sua geração de código, raciocínio lógico e planejamento, conversação de múltiplas etapas e compreensão de áudio e imagem por meio de dados e melhorias algorítmicas.

A versão mais recente do 1.5 Pro alcança fortes melhorias em benchmarks públicos em vários domínios, como raciocínio e codificação, bem como desempenho de última geração em vários estudos de compreensão de imagem e vídeo, incluindo: MMMU , AI2D , MathVista , ChartQA , DocVQA , InfográcoVQA e EgoSchema .

O 1.5 Pro agora pode seguir instruções cada vez mais complexas e diferenciadas, incluindo aquelas que especificam o comportamento em relação a produto envolvendo função, formato e estilo. Melhoramos o controle sobre as respostas para casos de uso específicos, como criar a persona e o estilo de resposta de um agente de chat, ou automatizar fluxos de trabalho por meio de múltiplas chamadas de função. Além disso, permitimos que os usuários orientem o comportamento do modelo definindo instruções do sistema.

Também foi adicionada a compreensão de áudio na API Gemini e no Google AI Studio, de modo que o 1.5 Pro agora pode raciocinar entre imagem e áudio para vídeos enviados no Google AI Studio.

Atualizações do Gemini Nano, o modelo para dispositivos

O Gemini Nano está expandindo além de entradas apenas de texto para incluir também imagens. Começando com o Pixel, aplicativos que utilizam o Gemini Nano com multimodalidade serão capazes de compreender o mundo da mesma forma que as pessoas fazem — não apenas por meio de entrada de texto, mas também através de visão, som e linguagem falada.

A próxima geração de modelos abertos

Hoje, o Google também está compartilhando uma série de atualizações do Gemma , nossa família de modelos abertos construídos a partir da mesma pesquisa e tecnologia usada para criar os modelos Gemini.

Foi anunciando o Gemma 2, a próxima geração de modelos abertos para inovação responsável em IA. A novidade possui uma nova arquitetura projetada para desempenho e eficiência inovadoras e estará disponível em novos tamanhos.

A família Gemma também está se expandindo com o PaliGemma , o primeiro modelo de linguagem de visão inspirado no PaLI-3 . Além disso, foi atualizado o Responsible Generative AI Toolkit com LLM Comparator para avaliar a qualidade das respostas do modelo.

O progresso no futuro dos assistentes de IA

Como parte da missão do Google DeepMind de construir IA de forma responsável para beneifciar a humanidade, sempre buscamos desenvolver agentes universais de IA que pudessem ser úteis na vida cotidiana. É por isso que hoje estamos compartilhando o Projeto Astra: nossa visão para o futuro dos assistentes de IA.

Para ser verdadeiramente útil, um agente precisa compreender e responder ao mundo complexo e dinâmico, tal como as pessoas fazem – e absorver e lembrar o que vê e ouve para compreender o contexto e agir. Ele também precisa ser proativo e pessoal, para que os usuários possam conversar com ele naturalmente e sem atrasos.

Embora tenhamos feito um progresso incrível no desenvolvimento de sistemas de IA que podem compreender informações multimodais, reduzir o tempo de resposta a algo coloquial é uma difícil decisão de engenharia. Nos últimos anos, temos trabalhado para melhorar a forma como nossos modelos percebem, raciocinam e conversam para tornar o ritmo e a qualidade da interação mais naturais.

Esses agentes foram construídos em nosso modelo Gemini e em outros modelos específicos de tarefas, e foram projetados para processar informações mais rapidamente, codificando continuamente frames de vídeos, combinando a entrada de vídeo e fala em uma linha do tempo de eventos e armazenando essas informações em cache para uma recuperação eficiente.

Ao aproveitar os principais modelos de fala, também foi melhorada a forma como eles soam, proporcionando aos agentes uma gama mais ampla de entonações. Esses agentes podem entender melhor o contexto em que estão sendo usados e responder rapidamente na conversa.

É fácil imaginar um futuro onde você poderá ter um assistente especializado ao seu lado por meio do telefone ou dos óculos. E alguns desses recursos chegarão aos produtos do Google, como o aplicativo Gemini , ainda este ano.

Sempre inovando

O Google fez um progresso incrível até agora com a nossa família de modelos Gemini e estamos sempre nos esforçando para avançar ainda mais com o que há de mais moderno. Ao investir em uma linha de produção incansável de inovação, somos capazes de explorar novas ideias na fronteira, ao mesmo tempo que desbloqueamos a possibilidade de novos e empolgantes casos de uso do Gemini.