DeepSeek


DeepSeek.
Indudablemente, es la noticia del día, dejando aparte las cuestiones cotidianas de la política y las guerras. Hoy el mundo se asombra de como una compañía china que apenas alcanza los 150 empleados, ha podido desarrollar un modelo de inteligencia artificial que se presenta con una capacidad de "autoaprendizaje" que ensombrece lo que conocíamos hasta ahora y que básicamente circulaba con nombres como Bar, Gemini, Copilot, Chat GPT, etc.etc.
Así como estas, ofrecían un nivel básico en forma gratuita, DeppSeek, ofrece en las mismas condiciones su nivel máximo. 
Los chips que necesita este desarrollo de IA, además de ser mucho más baratos, consumen y necesitan muchos menos recursos, y el resultado inmediato ha sido la caída en bolsa de activos como NVIDIA, fabricante norteamericano.




DeepSeek destaca por ser de código abierto. Esto quiere decir que cualquier persona puede ver cómo funciona internamente. Es totalmente transparente, y cualquiera puede instalarse esta IA de forma local o usarla con total libertad. Un desarrollador o investigador puede descargarlo de GitHub y modificarlo para diversos escenarios, incluyendo algunos comerciales.. Esto contrasta con el secretismo de los modelos conocidos hasta ahora, totalmente privados.
Se suele tener la falsa percepción de que una de las cosas a favor del código privado y opaco de la mayoría de desarrolladoras es que la calidad de sus productos es superior. Sin embargo, DeepSeek es una prueba de que el código abierto puede igualar e incluso superar en unos aspectos a estas empresas.


DeepSeek ha sido desarrollado usando aprendizaje por refuerzo puro, sin datos etiquetados previamente. Esta es una hazaña técnica que hasta ahora se consideraba imposible, y que abre nuevas puertas al entrenamiento de este tipo de sistemas.
Este aprendizaje por refuerzo permite que el modelo sea capaz de aprender por sí mismo mediante prueba y error, igual que tú puedes aprender a montar en bici o a realizar algunas tareas.
Esto hace que el resultado inicial sea más errático e impreciso, pero el propio modelo va descubriendo y desarrollando estrategias de razonamiento únicas para seguir mejorando.

Una vez realizado este entrenamiento, DeepSeek refinó el modelo combinándolo con otros entrenamientos supervisados para pulirlo y crear la versión final de R1, que mantiene este componente pero añadiendo consistencia y pulido.
De cara al usuario, su funcionamiento es igual que el de otros modelos. Tienes una pantalla de inicio con una campo de escritura y varias opciones de funcionamiento, y luego a la hora de ver los resultados tienes una columna izquierda con un historial de DeepSeek con todos tus chats.
Para usarlo tienes que escribir una pregunta en lenguaje natural, igual que lo harías con una pregunta. Entonces, DeepSeek analizará las palabras de tu pregunta para encontrar el resultado, y luego buscará en la base de datos con la que fue entrenado o en Internet para obtener datos con los que componer una respuesta también en lenguaje natural.
Gracias a la manera en la que ha sido creado, este modelo puede entender contextos complejos de preguntas muy largas y elaboradas. Además, también puede ir aprendiendo y mejorando.
Su aplicación puede usarse gratis online o bajándose su app móvil, y no tiene ninguna cuota.

Ricard

Caminando hacia los ochenta o hasta que la vida quiera. Esto es solo una distracción, así que me lo tomo en serio, pero solo lo imprescindible. Pasémoslo bien.

11 Comentarios

Añade tus comentarios.
Siempre dentro del tema en cuestión y de forma respetuosa.
Emoticonos: 😀😁😂😅😈😉😋😎😤😡😳🙈🙉🙊🙏 (copia y pega)

Entrada més recent Entrada anterior