Podcasts

265: Una semana de inteligencia artificial generativa

En este episodio, exploramos los últimos modelos de inteligencia artificial, como Gemini de Google, Titan de Amazon y Claude de Anthropic. Además, analizamos el intento de Beeper de llevar iMessage a Android. ¡Sumérgete en las últimas innovaciones tecnológicas y descubre cómo están dando forma al futuro!

Enlaces a las noticias destacadas:

Transcripción Automática

Bueno, antes de empezar quería contarte una experiencia y creo que me estoy inclinando por el iPad de 13 pulgadas o 12.

9 lo que sea y es que ahora que estuve viajando, le metí este como Remote Desktop al Mac y pude controlar mi Mac como desde el iPad, como cuando quería hacer una actividad que requiriera del Mac, entonces usé el iPad como bocina, lo único es que tenía que tener conexión a internet, pero funcionó bien, como que lo pude hacer, no es la cosa más como perfecta, pero hay otras aplicaciones que voy a probar porque por ahora lo probé con el Google que es el Remote Desktop, pero también lo puedes hacer como, por ahí vi un app en Mastodon que ahí mencionó que hace lo mismo, entonces estaré probando, pero el problema que tenía es que cuando estaba, pues la pantalla es muy chiquita, como que para hacer, yo trabajo como que en R y para hacer eso si es la pantalla muy chiquita, entonces no sé, como que quiero seguir probando y creo que por esta razón me inclinaría por la pantalla de 12 pulgadas porque si estoy viajando y quiero usar el Mac, entonces solamente hago, me meto a esa aplicación y controlo mi Mac personal desde el iPad, así que hago lo mejor de los dos mundos, entonces creo que por ahora me estoy inclinando por el grande.

Vale, a ver lo que yo sigo con las 11 pulgadas, dicen que viene para este principio de año 2024, creo que para primavera, con pantalla soledad, así es que habrá que esperar, pero yo todavía sigo pensando que si quieres trabajar con el Remote Desktop, obviamente una pantalla grande es necesario.

Sí, vamos a ver en qué queda ahí, pero sí, yo esta prueba que le hice, también la hice pensando en marzo, que es ese rumor que sale en los nuevos, y sí, por ahora creo que me voy por el de 12 pulgadas, no sé si tal vez debería esperar a que salga ir a cargar uno, a ver cómo es la diferencia de tamaño, pero en fin, esa nota de lado para arrancar con más drama en el mundo de inteligencia artificial, y es que esta semana Google anunció su nueva iteración, su nueva versión de su asistente, no asistente, pero su modelo generativo de inteligencia artificial que se llama Gemini, y lo mostraron que es lo que donde se resaltaba, es que es multimodal, es decir que en teoría le puedes hablar, le puedes mostrar imagen, le puedes escribir, entonces puede trabajar de diferentes maneras, y dicen que también ha mejorado muchísimo la parte de programación, que los elementos también como que con los suites de aplicaciones, creo que también se están integrando pues al modelo pequeño que funciona con el Pixel 8 Pro, entonces no sé, cuando yo vi estos vídeos dije wow, voy a volver a empezar a usar Bard más, porque también dicen que va a ser integrado ya a Bard, no sé, antes de que saltemos a la polémica, no sé qué pensaste o qué vistas acá.

Yo vi el vídeo de la demostración que hicieron con ese Gemini y la verdad es que era bastante como si fuese algo digamos muy avanzado, como muy futurista diría, es como ya básicamente en el vídeo muestra esas interacciones como una persona con ojos, con boca, con oídos y que con la que estás interactuando o está básicamente te está hablando y te está escribiendo lo que ve, y como dices tú, este modelo multimodal pues que puede ver algo y luego expresarlo con voz o expresarlo con texto, convertir, hacer estas conversiones internas de diferentes modos y la verdad es que quedé bastante impresionado en este primer vídeo, pero bueno, luego vino lo que vino.

Sí, hay que darle reconocimiento a los periodistas que empujaron esto, porque empezaron a preguntar, y Admite que en algunos momentos han sido recortados pues para hacer el vídeo, pero después también se dieron cuenta que todo el vídeo fue hecho de mentiras, lo que estaban haciendo en vez de lo que en vez de que lo que parecía que estaban, lo que parecía que estaba haciendo es que tenían una cámara que el asistente podía leer y interactuar con eso lo que estaba viendo y que estaba respondiendo, pero en verdad lo que estaba haciendo es que le tomaban una foto o algo, le alimentaban esa foto y por texto le preguntan al asistente que escribiera la foto, entonces toda esta parte mágica que se veía que tenía no era tan así y creo que es como la segunda o tercera vez que Google ya, no sé, cuando hicieron Word fue lo mismo, empezaron a lanzar que era algo que estaba cambiando el mundo y después tenían errores, tenían cosas que estaban también como montajes, entonces yo no sé qué le pasa a Google a esa compañía tan grande que tenía todo para ser la número uno en inteligencia artificial y que llegó este startup y se les está comiendo pues el almuerzo, el desayuno, la comida y sí, no sé, no sé, no sé.

Sí, como dices tú, pues aquí Google parece que nos ha mentido de alguna manera, pero yo creo que aquí lo que en este vídeo lo que querían es mostrar una visión que ellos tienen de lo que quieren que el producto llegue a ser, pero el vídeo lo lanzaron como si esto es el producto y por lo que te comentaba al principio se veía muy futurista porque básicamente parecía como una especie de humanoide que está viendo las cosas y está escribiendo lo que está viendo, lo que está viendo esa cámara y está interactuando, hablando, describiendo y luego bueno nos dimos cuenta que no era así, que había un proceso detrás, pero de todas maneras yo sigo pensando que bueno esto es una idea de lo que ellos tienen en un futuro cercano que no es tan diferente a lo que va a ser, pero bueno nos dejaron un poco, nos dieron esa visión futurista y luego se dieron cuenta de que realmente pues no es tan futurista, pero sí, aquí Google está poniéndose las pilas con este Gemini, ahora han lanzado este, digamos, este nombre de marketing y vamos a verlo integrado en el Pixel 8 Pro.

También sabemos que va a tener varias modalidades, un ultra para tareas más complejas, muy complejas, luego una versión pro que se puede como escalar y para diferentes tipos de tareas y luego una versión nano, digamos, un modelo eficiente que puede hacer tareas en dispositivos como puede ser el Pixel 8 Pro que ya han dicho que va a ser el primer smartphone con este Gemini Nano integrado.

Yo sí, no, lo que quería decir es que lo que si toca hacer es seguir probando todos, como que yo lo que estaba haciendo, vos has probado el de Cloud, el Cloud AI o Antropic, el que es de esa compañía de Antropic, sí, como que ahorita también tuve una noticia esa semana y es que antes vos le pasabas un texto y estaba muy limitado pues a lo largo del texto que podía recibir como input, pero ahora hay como que 150 mil palabras, una cosa así, entonces le puedes dar un código completo y te lo ayuda a procesar, entonces lo que estaba haciendo yo es últimamente probando los tres, como que ayer estaba que quería escribir una cosa, entonces le puse los tres el mismo input, los tres me devolvieron algo y usé esos tres como para armar un solo texto y era lo que terminó siendo para mí y el otro que también, no sé, esta semana también hubo anuncios de Amazon que anunciaron que están integrando estos modelos de lenguaje a AWS, lo que estaba lo que podías hacer antes es que puedes conectar tu AWS a alguno de esos modelos y usar tus recursos de cómputo para correrlos, pero ahora también sacaron sus propios modelos y se llama Titan, creo que se llama el de Amazon, he estado probando para generar imágenes y funciona bastante bien, creo que es un experimento que voy a hacer ahorita con el podcast de subirlo a YouTube y usar estos generadores de imágenes para crear los, sí, como el thumbnail para YouTube, entonces es un experimento que estaré corriendo en las próximas semanas para ver cómo nos va, qué genera, pero sí todos los thumbnails van a ser generados por este modelo, por ahora el de Amazon que encontrado porque, no sé si has usado generadores de imágenes, pero el de, yo el otro que tengo es el de el de Bing, pero Bing solamente te genera imágenes cuadradas y para un thumbnail necesitas una imagen rectangular y el de Amazon te deja escoger las dimensiones, entonces por ahora me estaría fingiendo por eso, al menos que alguien tenga una mejor propuesta.

Sí, la verdad es que han surgido tantos de estos modelos, en cada compañía está ahora metiéndose en su propio modelo y como dices tú, unos son mejores para unas cosas que otros, la única compañía que todavía no ha hablado nada y creo, no sé si es un poco secretista con esto, es Apple, todos los rumores apuntan para el año que viene, pero creo que aquí se está quedando atrás, pero sí, básicamente están las compañías de toda la vida, como Amazon, Google, Microsoft y luego todas estas otras que han ido surgiendo alrededor, pero yo creo que esto va a ser como, un poco va a ser como los buscadores, que hay varios, está Google, está, bueno, Yahoo ya no sé si existe, pero está el de Bing, está DuckDuckGo y cada uno tiene unas partes más fuertes y luego después de todo pues hay que ver, hay que elegir qué más se acopla a tu estilo y con esto de la inteligencia artificial pues también yo creo que va a haber siempre uno más fuerte en una área que en otra, pero bueno, vamos a tener bastante de dónde elegir.

Sí, vamos a ver en qué avanza esto, yo tengo un presentimiento que el de Apple va a ser completamente diferente y que ellos lo van a usar para como usos aplicados.

Sí, yo creo que también va a ser como integrado, no va a ser algo que tú puedas acceder a él, digamos a esta inteligencia artificial vía texto o algo, va a estar integrado en aplicaciones, integrado en Sili, pero no va a ser algo como definido como esto es, aquí tienes una cajita donde puedes meter tu input y puedes luego preguntar o lo que sea, poner imágenes y preguntar, sino que va a ser algo completamente metido en el sistema operativo y que va a hacer que va a continuar protegiendo su, digamos, su jardín amurallado de Apple y va a ser algo que vas a poder utilizarlo dentro de su ecosistema, pero no va a ser algo, digamos, que de fuera puedas acceder a él.

Sí, y en otras noticias, de acá hablando ya de Apple, que hubo, no sé cómo explicarlo, pero tuvimos esto, era del Nothing Phone que lanzaron esta aplicación de iMessage, después tuvieron que cancelar porque se dieron cuenta que estaban, que era cero privado y que estaban mandando mensajes en texto puro, sin encriptar y después salió esta compañía que se llama Veeper y lo que ellos hicieron sí fue completamente diferente y es que estaban haciéndose pasar por un dispositivo de Apple y mandaban los mensajes directamente al servidor de Apple y básicamente decían «este celular donde está llegando este mensaje es un iPhone o un dispositivo de Apple» entonces lo leía como un iMessage y podías tener casi que todas las funciones de iMessage ahí ya integradas.

Apple reaccionó rápido, les cerró ese acceso, ellos dijeron «estamos buscando otra forma de hacerlo» entonces pasó como esta pelea de un gato y ratón a ver quién va tapando los huecos más rápido y yo creo que acá, no sé como acá ya comprobaron como que técnicamente en parte ingeniería que técnicamente pueden abrir el protocolo de Apple, que el iMessage lo pueden abrir y yo creo que eso se va a ir viendo a Apple cada vez peor, como viendo que una compañía tercera como que no sé en un par de semanas pudieron crear un iMessage para Android y que ellos están como que simplemente tumbándolo, cerrándolo, creo que aca va a llegar mucha presión y que van a tener que en algún momento sacar un app y sacar su iMessage para Android o algo porque eso se está viendo, no sé, para mí es feo, como que no sé si la razón técnica de ellos de que siendo que seguridad, que tal cosa y por eso tumbaron esos accesos, pero no sé, es feo.

Yo, bueno, vi el Viper Mini, también salió un vídeo donde comentaban cómo funcionaba básicamente lo que habían hecho de la tecnología inversa o que habían visto cómo funciona el iMessage y básicamente habían hecho una aplicación para interactuar con los servidores de iMessage.

Decían que esta ingeniería reversa en Estados Unidos no es ilegal mientras sea para compatibilidad, para creo que era algo así como si era para interoperabilidad, no es ilegal, pero claro, se habían jactado bastante de todo esto, pensaban que utilizar unos estos códigos para hacerse pasar por un dispositivo Apple, pero que dicen que Apple de todas maneras tiene tantos otros.

Aparte de los iPhones y los iPads, hay otros dispositivos de empresas privadas que interaccionan con iMessage y que probablemente no nos iban a tomar a la molestia de bloquear estos dispositivos, digamos que se hacían pasar por dispositivos de Apple y hemos visto que Apple directamente lo ha cortado.

Y yo creo que tú dices que aquí Apple va a tener que hacer algo.

Yo creo que Apple va a seguir defendiendo.

El iMessage se ha convertido en algo tan icónico de los iPhones que yo creo que no quiere abrirse.

De hecho, la Unión Europea con esto de los gatekeepers, que va a obligar a algunas compañías a abrir sus protocolos o a interaccionar entre diferentes protocolos como puede ser WhatsApp y el iMessage de Apple en Europa no se considera un gatekeeper porque no tiene suficientes usuarios.

Pero en Estados Unidos yo creo que ahí sí que más de la mitad de la población utiliza este iMessage y yo creo que no van a querer dejar esta parte.

Ellos siempre alegan la privacidad y la seguridad, pero es algo, es parte de su ecosistema y yo creo que no vamos a ver nunca de parte de Apple un API para otros dispositivos o otros sistemas operativos.

Mientras no haya una ente como puede ser la Unión Europea que los obligase.

Pero en este caso por ahora la Unión Europea nos va a obligar.

Pero yo creo que no vamos a ver esta apertura del iMessage.

Yo tampoco estoy alineado con tu punto de vista, solo que se ve tan mal, que van a tener más presión cada vez más para abrirlo.

Pero sí, como que no creo.

Es una ventaja que tienen Estados Unidos y ninguna otra parte del mundo.

Tal vez no sé si es porque en Japón hay muchos iPhones también, pero todo el mundo usa otro mensaje.

Sí, solamente en Estados Unidos para gente.

Yo solamente uso el iMessage para hablar con vos, con mi hermano y con mi esposa.

El resto de gente no.

Sí, aquí yo también, la gente que tiene iPhone, que la familia, mis hermanos tienen.

Ahí utilizamos el iMessage.

Pero luego el WhatsApp es el estándar de facto.

Pero yo siempre que hay alguien que sé que tiene iMessage, prefiero utilizar iMessage por la parte de privacidad.

Porque claro, cuando estás utilizando WhatsApp estás dando información de dónde estás, con quién interactúas.

Ya sabemos todo lo que lo que meta recoge.

Yo tuve esa pelea de que todo el mundo usará Signal y nunca.

Sí, yo tuve un tiempo que conseguí bastante gente, pero luego me di cuenta de que era como una batalla perdida y tuve que cerrar Signal y volver a WhatsApp.

Sí, ahí yo estuve en las mismas.

Bueno, y creo que ya en este mes vas a poder volver a Threads.

Sí, sí, parece que finalmente el 14 de diciembre se lanza Threads en la Unión Europea.

Como en Estados Unidos ya lleva varios, bueno, en Estados Unidos y bastantes otros países a nivel mundial lleva ya unos cuantos meses, sabíamos que en la Unión Europea lo que le había parado era toda la regulación que hay aquí.

Y fue accesible las primeras semanas, luego se cerró.

Y finalmente el 14 de diciembre han puesto incluso una cuenta atrás con el lanzamiento de Threads.

No sé si a estas alturas Threads tiene algún, sigue, o tiene algún valor.

No sé cómo de bien les está yendo.

Yo creo que este experimento se va a quedar en nada.

No sé, no sé tú qué opinas, pero creo que yo he visto muchos de los influencers de tecnología, por ejemplo, que las primeras veces escribieron algún mensaje en Threads cuando salió, pero luego ya básicamente lo dejaron de lado.

Siguen utilizando Twitter o X y Instagram.

Pero el Threads es algo que no sé, no sé si añade algo, algún valor a lo que tenemos ahora.

Si la gente, los usuarios que básicamente han sido usuarios que han pasado, han migrado de Instagram, no sé si realmente tiene aportado esta red.

No sé tú qué opinas.

No, yo estoy alineado.

Tengo que, yo la verdad, borré la aplicación después de como un mes, dos meses, porque la dejé, nunca la volví a abrir.

Tendría que volverla a dar una oportunidad a ver ya con el ecosistema más avanzado, más maduro, si le encuentro algún tipo de valor.

Pero si no, la verdad lo dejé de utilizar también.

Y una pregunta así de lado.

¿Aprovechaste el Cyber Monday o el Black Friday para algo o nada?

No, al final no compré nada.

Estoy esperando tantas cosas que pensé, porque pensaba en unos auriculares de caceración de sonido, porque tengo unos Beats Studio ya antiguos.

Había visto los Pro, pero luego pensé que los AirPod Max van a salir, el nuevo modelo con USB-C de aquí poco, porque se cumplió esta semana, se cumplieron tres años creo que, desde que se lanzaron.

Entonces, al final decidí esperarme.

No sé tú cómo fue.

No, solo lo que hemos hablado del disco duro del SSD para Time Machine y ya.

Como que eso es lo único que compré.

Sí ha sido una mejora grande porque ya no suena, como que no tengo ese sonido.

Casi prendí el otro disco duro de la caja que hacía su boya, pero este hace el backup mucho más rápido y no suena.

Entonces 100% contento con esa compra.

Pero bueno, eso fue todo por hoy.

Aquí me despido, Daniel Lorenzo-Ramos.

Y aquí Hermano Ferrero.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Botón volver arriba