DeepSeek ha puesto a disposición de los usuarios su nueva versión de modelo de inteligencia artificial (IA) DeepSeek V3.1 de forma gratuita, que avanza hacia los agentes de IA al incluir capacidades de inferencia híbrida, ofreciendo tanto resultados con rapidez como respuestas más pausadas y elaboradas, además de mejorar su velocidad de pensamiento.
La compañía tecnológica china presentó DeepSeek V3.1 recientemente, cuando lo definió como su primer paso hacia “la era de los agentes”, al tratarse de un modelo que impulsa el uso de herramientas y las tareas de agentes en varios pasos con una mejora significativa, mediante la optimización posterior al entrenamiento.
Esto se debe, en parte, a que agrega capacidades de inferencia híbrida para “pensar y no pensar”. Es decir, ofrece dos modos de uso en un mismo modelo, al combinar las capacidades de pensamiento rápido de DeepSeek V3 para ofrecer respuestas rápidas, con el razonamiento de DeepSeek R1 para cuestiones más complejas.
Con el chat de DeepSeek los usuarios pueden utilizar el modo “sin pensar”, mientras que con el razonador de búsqueda de DeepSeek, los usuarios pueden acceder a un “modo de pensamiento”, ajustándose así a sus necesidades, ya sea para respuestas inmediatas como para análisis que requieran varios pasos. No obstante, ambas opciones disponen de 128K tokens de contexto.
Asimismo, la tecnológica también ha actualizado el modelo para una mayor eficiencia de pensamiento. Concretamente, DeepSeek V3.1-Think es capaz de alcanzar respuestas en menos tiempo que el modelo DeepSeek-R1-0528 manteniendo una calidad de respuesta comparable, según detalla la compañía en su web.
Ahora, los usuarios ya pueden descargar DeepSeek V3.1 de forma gratuita bajo licencia MIT de código abierto, a través de Hugging Face. No obstante, se deberá disponer de al menos 720 GB de almacenamiento libre y una GPU con, al menos, 24 GB de memoria, según ha podido conocer el medio Notebook Check.
Igualmente, se ha de tener en cuenta que según sus pruebas internas, se trata de un modelo útil para llevar a cabo tareas relacionadas con el desarrollo de código o tareas de matemáticas.