Hola soy Aldo la noticia del momento es la caída en la bolsa de valores de envidia y del surgimiento de dips el software de Inteligencia artificial chino que ha ocasionado justamente eso Qué sucedió realmente Qué es cierto y qué no lo es de la información que anda rondando por ahí será este el fin de Open Ai o de envidia o de Gula o de peresa Quédate que aquí te lo aclaramos [Música] [Música] antes de empezar me gustaría hablarles de nuestro auspiciador del día de hoy Surf Shark quizás hayan escuchado de las VPN o de las virtual private networks y no saben muy bien para qué les podrían servir Pues aunque no lo crean las podrían necesitar en cualquier momento Alguna vez se han conectado a una red wi-fi pública o han iniciado sesión en una red de trabajo o han ingresado a su cuenta bancaria desde una red doméstica en cualquiera de estos casos están expuestos a gente malintencionada que puede adquirir sus datos pero por suerte existen las VPN como surfshark que les da una conexión segura para sus dispositivos cuando acceden a la red y si su conexión Es segura su información también permanece privada y no solo eso como habrán escuchado una VPN también les puede dar acceso a contenido de otros países En plataformas como Netflix Prime y otras más particularmente yo estoy encantado con esto porque aquí no hay todas las plataformas y hay algunas series que quiero ver y esto sirve muy bien Qué deben hacer hacer solo Descargar surfshark crear una cuenta y ya está tampoco es caro Hoy está de suerte si quieren obtener surfshark con una excelente promoción pueden ir a surfshark. com bar platon o hacer clic en el enlace que estoy dejando en la descripción para obtener 4 meses extra aprovechen que esta gran oferta es limitada Ahora sí al video pongamos las cosas en contexto a estas alturas es casi imposible que alguno de los que está viendo este video no haya escuchado hablar de chat gpt si o no también deben saber que la empresa que creó este software de Inteligencia artificial es Open Ai ahora en este momento entrenar a los mejores modelos de Inteligencia artificial es increíblemente caro por qué dirás Pues porque para empezar se requiere una enorme cantidad de recursos tanto computacionales como humanos míralo desde esta perspectiva imagina que estás enseñándole a un niño a leer y entender millones de libros al mismo tiempo para que esto sea posible necesitas un super niño y herramientas super avanzadas y mucha energía sí los modelos de inteligencia artificial como chat gpt necesitan procesar enormes cantidades de datos que incluyen libros artículos sitios web y más estos datos se usan para entrenar el modelo pero no basta con solo tener la información las computadoras deben analizarla y aprender patrones esto se hace utilizando chips especializados llamados gpus o unidades de procesamiento gráfico o tpus que son unidades de procesamiento tensorial los cuales son como motores superpotentes diseñados para manejar cálculos complejos estas máquinas inas No solo son caras de comprar sino que también consumen mucha electricidad mientras trabajan Además este entrenamiento es un proceso que puede durar semanas o incluso meses Durante este tiempo las computadoras no están vagando están funcionando sin descanso para ajustar billones de conexiones internas las cuales permiten al modelo entender mejor el lenguaje o realizar tareas específicas Cuanto más grande y avanzado sea el modelo más potencia y tiempo se necesita lo que aumenta Los costos Y por último todo eso no se maneja solo por su puesto detrás hay equipos de expertos en Inteligencia artificial hay matemáticos hay ingenieros y hay científicos que diseñan supervisan y mejoran el modelo estas personas suelen estar altamente calificadas y por lo tanto también es costoso tenerlas en el equipo todos estos factores juntos hacen que entrenar un modelo de Inteligencia artificial sea extremadamente caro lo cual explica Por qué solo las empresas con grandes recursos pueden permitirse desarrollar estas tecnologías Open Ai anthropic y otras empresas H más de 100 millones de dólares solo en computación Okay entendida esa parte veamos ahora al bolondrón el bolondrón se armó porque la empresa deeps que fue fundada hace relativamente poco en el 2023 en China apareció y dijo qué tontos yo puedo hacer esto por solo 5 millones de dólares XD XD Y eso es lo que puso al mundo de la Inteligencia artificial conmocionado Bueno a los desarrolladores de estas tecnologías porque las máquinas también deben estar en modo XD por ahora qué hicieron los desarrolladores de dip siic los desarrolladores de dips repensar todo desde cero para entender esto mejor imagina que estás escribiendo números muy largos con muchas cifras decimales en la Inteligencia artificial tradicional los modelos almacenan Y procesan estos números con 32 bits de precisión lo que se llama punto flotante de 32 bits o fp32 esto permite que los cálculos sean muy exactos pero también ocupa mucha memoria y consume más energía los desarrolladores de deeps se preguntaron realmente necesitamos tanta precisión dijeron No en muchas tareas los modelos de Inteligencia artificial no necesitan que cada número tenga tanta exactitud sino la suficiente para hacer cálculos correctos entonces en lugar de usar 32 bits para representar cada número usaron solamente 8 bits o fp8 reducir la precisión a 8 bits significó que cada número ocupó cuatro veces menos espacio en la memoria y solamente esta pequeña acción redujo en un 75 por la cantidad de memoria necesaria y esto permitió entrenar modelos muchos más grandes y avanzados con la misma cantidad de recursos computacionales es como si en lugar de escribir cada número con cuatro decimales como 3. 14 15 simplemente lo redondeará a 3.
14 manteniendo la mayoría de la información relevante Sin desperdiciar espacio Este cambio en la arquitectura permitió a deeps entrenar modelos con costos mucho menor En comparación con otras empresas haciendo que su Inteligencia artificial sea más accesible y eficiente una optimización Aparentemente simple pero que tiene un impacto enorme luego está su sistema de tokens múltiples para entender esto mejor hagamos la comparación de cómo leen los niños pequeños versus Cómo leen los adultos un niño que está aprendiendo a leer va palabra por palabra despacio y con pausas por ejemplo el gato se sentó por otro lado una adulto puede leer frases completas a la vez comprendiendo el contexto más rápido el gato se sentó en la alfombra por ejemplo la mayoría de los modelos de Inteligencia artificial funcionan como el niño pequeño generan palabras una por una prediciendo cada token de manera individual antes de pasar al siguiente Esto hace que el proceso sea más lento porque el modelo necesita revisar su propio trabajo en cada paso antes de seguir adelante tips en cambio usa una técnica llamada predicción de tokens múltiples en lugar de predecir solo una palabra a la vez genera varias palabras de una sola vez y luego verifica si estas son correctas según sus investigaciones este método es dos veces más rápido y mantiene un 90 por de precisión En comparación con los métodos tradicionales y por qué esto es importantes te preguntarás Pues porque cuando una Inteligencia artificial procesa miles de millones de palabras al día una mejora del doble de velocidad significa un ahorro inmenso en tiempo y recursos computacionales además esto permite respuestas más rápidas en ap apliaciones en tiempo real y reduce también el costo de operación Pero lo más ingenioso es que crearon un sistema experto que puede optimizar el funcionamiento de su Inteligencia artificial La idea es brillante porque rompe con la forma tradicional en la que los modelos de Inteligencia artificial suelen trabajar imagina una Inteligencia artificial que intenta ser médico abogado ingeniero chef y artista todo al mismo tiempo tener todo ese conocimiento en una sola mente es increíblemente difícil como ya habrás imaginado y consume muchísimos recursos porque necesita almacenar y procesar toda esa información todo el tiempo incluso cuando no se necesita esto es como llevar una enciclopedia gigante para cada pequeña consulta entonces dipstick pensó y si no fuera una sola Inteligencia artificial gigante sino un equipo de especialistas Ah Y es que en su enfoque el modelo principal Está compuesto por muchos expertos más pequeños cada uno especializado en un área específica uno para matemáticas otro para medicina otro para derecho y así y así y así la magia está en que estos expertos no están siempre activos cuando la Inteligencia artificial recibe una pregunta o tarea primero analiza Qué tipo de respuesta necesita si es un problema matemático solo se activa el experto en matemáticas si es una consulta legal llama al experto en derecho y así Esto hace que el sistema sea mucho más eficiente porque no está utilizando recursos para procesar todo el conocimiento a la vez Además este enfoque tiene otra ventaja permite que cada experto sea extremadamente bueno en su área ya que que no necesita abarcar otros campos es como si en lugar de contratar a una sola persona que sabe un poco de todo tuvieras un equipo de especialistas que sabe Mucho sobre temas específicos En otras palabras dips diseñó su Inteligencia artificial como un equipo de expertos que trabajan juntos activándose Solo cuando sean necesarios lo cual reduce también el uso de recursos mejora la precisión y hace que el sistema sea mucho más eficiente y escalable es como tener un equipo de superhéroes donde cada uno usa sus superpoderes Solo cuando se necesita a no ser que se llamen Los Avengers y la última Innovación es la de los parámetros Qué son los parámetros te preguntarás imagina que un modelo de Inteligencia artificial es como un gran equipo de personas trabajando juntas cada persona en este equipo tiene una tarea específica que ayuda al grupo a resolver problemas como responder preguntas o realizar cálculos en este caso cada persona representa un parámetro un parámetro es básicamente un valor que el modelo de Inteligencia artificial ajusta durante su entrenamiento para aprender patrones y tomar decisiones Cuantos más parámetros tiene un modelo más inteligente puede ser porque tiene más capacidad para aprender cosas complejas sin embargo También necesita más recursos computacionales para funcionar porque tiene que mantener a todos esos miembros del equipo trabajando al mismo tiempo en los modelos tradicionales de Inteligencia artificial como los de Open Ai hay 1. 8 billones de parámetros y todos están activos todo el tiempo sin importar qué tarea está resolviendo la Inteligencia artificial es como tener un equipo enorme de personas trabajando juntas Aunque solo unas pocas sean realmente necesarias para una tarea específica como se imaginarán esto consume mucha energía memoria y tiempo deeps hizo algo ingenioso diseñó su modelo con 671 millones de parámetros en total pero solo activa los que realmente necesita para resolver una tarea específica que son aproximadamente 37,000 millones de parámetros a la vez los resultados de todas estas innovaciones han sido alucinantes el costo de capacitación que normalmente toma 100,0000 pasó solamente costar 5,0000 las gpu necesarias pasaron de 100,000 a solo 2,000 Los costos de interfaz de programación de aplicaciones o los Api son 95 más baratos Y por último deeps puede ejecutarse en un gpu para juegos en lugar de un Hardware de centro de datos eso significa que no necesitas tarjetas gráficas especializadas y extremadamente caras diseñadas específicamente para centros de datos sino que pueden funcionar en tarjetas gráficas más accesibles y de uso doméstico como que se usan para jugar videojuegos ya sé lo que estás pensando parece muy bueno para ser verdad si o no debe haber algún truco y aquí viene la parte más interesante es de código abierto qué rayos es eso espera relájate tranquilo que te explico un código abierto significa que cualquier persona puede ver analizar y usar su tecnología sin restricciones su código fuente es público lo que permite que desarrolladores investigadores y empresas revisen cómo funciona su Inteligencia artificial no es un sistema cerrado secreto como los modelos de Open Ai o Google sino que cualquiera puede verificar su trabajo y asegurarse de que no haya errores sesgos ocultos o problemas técnicos inesperados esto también significa que otras personas pueden aprender de su tecnología Y mejorarla en lugar de mantener sus avances como un secreto comercial deeps ha decidido compartir su conocimiento con la comunidad de Inteligencia artificial para que el progreso sea más rápido y colaborativo cualquier programador empresa o universidad puede tomar su modelo modificarlo y adaptarlo a sus propias necesidades sin depender de una sola compañía para muchos el hecho de que su código sea público y que haya documentos técnicos explicando cada detalle demuestra que el éxito de deeps no es magia sino el resultado de una ingeniería increiblemente inteligente e innovadora así que todo parece indicar que no hay truco misterioso ni solución oculta lo que han logrado es gracias a ideas brillantes métodos innovadores y una optimización eficiente del uso de recursos así parece ser pero eso no todo al hacer que su tecnología sea completamente transparente dips está cambiando las reglas del juego en la Inteligencia artificial a nivel mundial está permitiendo que cualquiera en el mundo pueda entender cómo funciona aprender de ello y contribuir a su Mejora y esto es importante porque rompe con el modelo de que solo las grandes empresas tecnológicas pueden participar en esto ya no es necesario un centro de datos de miles de millones de dólares unas cuantas gpu de calidad podrían ser suficientes pero para envidia por supuesto puesto esto es aterrador todo su modelo de negocio se basa en la venta de gpu supercas con márgenes del 90 por.