El avance de la inteligencia artificial no se detiene, y Google busca mantenerse a la vanguardia con Gemini, su nuevo modelo multimodal con el que busca mejorar la experiencia y su uso.
A través de un comunicado, la empresa presentó a la IA, a la que destacó como la “más capaz y generalista que jamás hayamos construido”.
“Fue construido desde cero para ser multimodal, lo que significa que puede generalizar y comprender, operar y combinar diferentes tipos de información, incluidos texto, imágenes, audio, video y código”, explicaron.
Eso, remarcaron, ayuda a la inteligencia artificial a “comprender y razonar perfectamente sobre todo tipo de interacciones desde cero, mucho mejor que los modelos multimodales existentes, y sus capacidades son de última generación en casi todos los dominios”.
Jornada laboral de tres días: la predicción de Bill Gates sobre la inteligencia artificial
Desde Google resaltaron su “notable capacidad para extraer información de cientos de miles de documentos mediante la lectura, el filtrado y la comprensión de la información”, como también su poder para “reconocer y comprender texto, imágenes, audio y más al mismo tiempo, por lo que comprende mejor la información matizada y puede responder preguntas relacionadas con temas complicados”.
En esta primera versión, contará con tres tamaños diferentes para poder ejecutarse de forma eficiente tanto en centros de datos como en dispositivos móviles: Gemini Ultra, que tendrá mayor capacidad para tareas altamente complejas; Gemini Pro; y Gemini Nano.
La versión Ultra fue reconocida por ser el “primer modelo que supera a los expertos humanos en MMLU (comprensión masiva de lenguajes multitarea, por sus siglas en inglés)”, con una puntuación del 90% en una evaluación sobre el conocimiento del mundo y su capacidad de resolución en un test que combina 57 materias como matemáticas, física, historia, derecho, medicina y ética.
EEUU busca regular la inteligencia artificial usando una ley de la Guerra Fría
Además, obtuvo un 59,4% en el nuevo punto de referencia MMMU “que consta de tareas multimodales que abarcan diferentes dominios y requieren un razonamiento deliberado”.
Por otro lado, desde Google aseguraron que evaluaron los “riesgos potenciales” que pueda tener Gemini, y trabajan con expertos para “probarlos y mitigarlos”.
“Hemos llevado a cabo investigaciones novedosas en áreas de riesgo potencial como ciberataques, persuasión y autonomía, y hemos aplicado las mejores técnicas de pruebas antagónicas de Google Research para ayudar a identificar problemas críticos de seguridad antes de la implementación de Gemini”, señalaron.
“La responsabilidad y la seguridad siempre serán fundamentales para el desarrollo y la implementación de nuestros modelos”, agregaron al respecto.