Unichain - Sponsor Image Unichain - Faster swaps. Lower fees. Deeper liquidity. Explore Unichain on web and wallet. Friend & Sponsor Learn more
Podcast

LIMITLESS: Aravind Srinivas: La apuesta del CEO de Perplexity para acabar con Google

Aravind Srinivas, CEO de Perplexity, se une al programa para explorar cómo los agentes de IA, la personalización y los nuevos modelos de navegación podrían transformar la experiencia de Internet.
Aug 19, 202501:09:40
1
0

Inside the episode

Aravind:
[0:00] Comet es, básicamente lo llamamos navegador la velocidad del pensamiento. Así que todos tenemos como un montón de pensamientos mientras estamos en el navegador. Y no llegamos a terminarlos todos porque cada tarea que tenemos en la cabeza lleva mucho tiempo. Así que Comet pretende unificar la perplejidad y el navegador de una manera muy nativa, donde la perplejidad evoluciona de sólo darte respuestas a realizar acciones por ti. Y perplexity pasa de extraer el contexto de la web a extraer todo el contexto.

Josh/Ejaaz:
[0:35] Si estás escuchando esto, significa que estás suscrito a Bankless, el mejor podcast de criptografía del mundo. Pero hay otro programa que deberías conocer llamado Limitless. Limitless, se puede pensar en una especie de Bankless, excepto que en lugar de cripto, estamos explorando las fronteras de la inteligencia artificial. Es todo lo que te gustaría saber sobre la IA condensado en estos episodios de 25 minutos. Piensa en cómo extraer valor de forma óptima de ChatGPT, qué modelo utilizar si quieres descargar gran parte de la productividad y el trabajo que haces en el día a día. Y también hablamos con la gente que lo está haciendo realidad. El episodio de hoy no es diferente. Nos acompaña el CEO de Perplexity, una de las aplicaciones de consumo de IA más populares del mundo, que nos dice que básicamente Google Chrome y Safari están muertos. Puedes tirarlos. Ya no los necesitas. Está construyendo el futuro de los navegadores. De hecho, Perplexity acaba de hacer una oferta para comprar Google Chrome. Así que es un juego de altas apuestas sobre cómo nos relacionamos con Internet, pensando a través de la lente de cómo optimizar para una experiencia AI primero. Me pareció fascinante, y espero que a ti también. Así que si te gusta este episodio, hazme un favor. Significa mucho para mí. Si puedes ir a la descripción, haz clic en el enlace, suscríbete a Limitless, visítanos en las redes sociales, compártelo con tus amigos. Realmente va un largo camino en el apoyo a la misión. Hoy, estoy acompañado por David, a quien conoces y amas, yo mismo, Josh, así como nuestro co-anfitrión, Ejaz, donde dejamos caer algunos alfa sobre cómo adelantarse a estas tendencias, sobre cómo adelantarse a la tendencia del navegador AI y descargar gran parte de su productividad a la IA para que tenga más tiempo para hacer las cosas que desea

Josh/Ejaaz:
[1:54] hacer. Así que sin más preámbulos, vamos a entrar de lleno en el episodio. Con el CEO de Perplexity.

David:
[1:58] E n el salvaje oeste de DeFi, la estabilidad y la innovación lo son todo, por eso deberías echar un vistazo a FRAX Finance, el protocolo que revoluciona las stablecoins, DeFi y Rolex. El núcleo de FRAX Finance es FRAX USD, que está respaldado por el fondo biddle institucional de BlackRock.

David:
[2:12] FRAX diseñó FRAX USD para obtener los mejores rendimientos de su clase a través de DeFi, T-bills y rendimientos de carry trade, todo en uno. Sólo tienes que ir a FRAX.com y apostar para obtener algunos de los mejores rendimientos en DeFi. ¿Quiere aún más? Traslade su FRAX USD a la capa 2 de FRAX Still para obtener el mismo rendimiento más puntos FraxTile y explore el variado ecosistema de capa 2 de FraxTile con protocolos como Curve, Convex y muchos más, que recompensan a los primeros en adoptarlos. Frax no es sólo un protocolo, es una nación digital impulsada por el token FXS y gobernada por su comunidad global. Adquiera FXS a través de Frax.com o su DEX de confianza, póngalo en juego y ayude a dar forma al futuro de Frax Nation. ¿Listo para unirte a la vanguardia de DeFi? Visite Frax.com ahora para empezar a ganar con FraxUSD y FraxUSD apostado. Y para los oyentes de Bankless, puede utilizar frax.com slash r slash bankless al pasar a Fraxel para obtener ventajas exclusivas de Fraxel y recompensas potenciadas. Imagina un mundo donde las finanzas tradicionales se encuentran con el poder de blockchain sin problemas.

David:
[3:04] Eso es en lo que Mantle es pionero con blockchain para la banca, una nueva categoría revolucionaria en la intersección de TradFi y Web3. En el corazón está UR, la primera aplicación de dinero del mundo construida completamente sobre cadena. Le ofrece una cuenta Swiss iBand que combina monedas fiduciarias como el euro, el franco suizo, el dólar estadounidense o el renminbi con criptomonedas, todo en un mismo lugar. Disfrute de la usabilidad del mundo real y de la confianza y programabilidad de blockchain. Las transacciones se publican directamente en la cadena de bloques, es compatible con TradFi Rails y cuenta con futuros DeFi integrados. UR transforma Mantle Network en la plataforma definitiva para servicios financieros en cadena, unificando pagos, comercio y activos como el MI4, el protocolo METH y Functions FBTC, respaldado por subvenciones para desarrolladores, incentivos para el ecosistema,

David:
[3:43] Y la distribución superior a través de la aplicación UR, las estaciones de recompensa y el fondo de lanzamiento de Bybit. Para los titulares de MNT, cada actividad económica en la que están impulsa el valor de nuevo a usted, encarnando toda la pila y el crecimiento futuro de este ecosistema super app. Siga Mantle en X en Mantle subrayado oficial para las últimas actualizaciones sobre blockchain para la banca. Eso es X.com slash Mantle underscore official. El universo de la Capa 2 de Ethereum está repleto de opciones, pero si estás buscando el mejor lugar para aparcar y mover tus tokens, tu próxima parada es Unichain. En primer lugar, la liquidez. Unichain aloja el despliegue Uniswap V4 más líquido de cualquier Layer 2, lo que le proporciona pools más profundos para pares emblemáticos como ETH USDC. Más liquidez significa mejores precios, menos deslizamiento y swaps más fluidos. Exactamente lo que desean los operadores. Las cifras lo respaldan. Unichain lidera todas las Layer 2 en valor total bloqueado para Uniswap v4. Y no sólo es profundo. Es rápido y totalmente transparente. Creada especialmente para ser la base de DeFi y de la liquidez entre cadenas. Cuando se trata de costes, Unichain es una obviedad. Las comisiones por transacción son un 95% más baratas que las de la mainnet de Ethereum, lo que reduce drásticamente el precio de crear liquidez o acceder a ella. ¿Quieres estar al tanto de Unichain?

David:
[4:44] Visita unichain.org o síguenos en Unichain on X para estar al día de todas las novedades.

Aravind:
[4:48] Estamos aquí con Arvind Sreenivas de Perplexity. Arvind, bienvenido a Limitless. Gracias por recibirme.

David:
[4:53] Arvind, queremos aprender algo de ti. En general, en Limitless entendemos que el futuro va a ser muy diferente de lo que es hoy, empezando probablemente por Internet. Así que queremos saber cómo crees que Internet será diferente dentro de cinco años y cómo esa tesis tuya ha influido en el liderazgo de tu empresa, Perplexity.

Aravind:
[5:12] Nunca es fácil imaginar el mundo dentro de cinco años, incluso en circunstancias normales. Y vivimos en un mundo muy diferente en el que la IA avanza a un ritmo al que no estamos acostumbrados. Así que mentiría si dijera que sé cómo será el mundo dentro de cinco años. Y en realidad no creo que nadie lo sepa. Porque es muy difícil trabajar en escenarios en los que las capacidades de la IA evolucionan constantemente cada pocos meses. Tres meses antes, todas las capacidades de los agentes eran cadenas de acciones y las llamadas a cadenas de herramientas no eran fiables.

Aravind:
[5:54] Podías ver sus contornos, pero no estaban tan bien definidos como ahora. E incluso hoy en día, no es tan fiable como se necesita para tener realmente un empleado por persona que es sólo una IA. Así que definitivamente, sólo estoy haciendo apuestas aquí. Que habrá un montón de agentes que navegar por la web, navegar por Internet, e ir y hacer tareas para las personas. Ya no vamos a navegar por Internet para cosas que no nos parecen divertidas.

Aravind:
[6:27] En cierto sentido, a nadie le gusta pagar sus tarjetas de crédito. A nadie le gusta mover dinero de una cuenta bancaria a otra. A nadie le gusta usar sitios web antiguos para reservar hoteles. A nadie le gusta usar estas arcaicas interfaces para encontrar, ya sabes, un coche de alquiler, o una cita de última hora con el médico en una ciudad nueva. Estas son todas las cosas como, ya sabes, los diferentes sitios web en realidad no tienen buenos sitios web para tratar. Tienen errores. No hay atención al cliente. Tienes que encontrar su número en alguna parte. Tienes que encontrar detalles de cuatro o cinco lugares diferentes, encontrar un abogado para algo. Todas estas son formas muy difíciles en las que la web está diseñada hoy. Y la IA no ha resuelto eso hasta ahora. La IA ha logrado asimilar información de muchas fuentes diferentes y resumirla. Eso es lo que esencialmente comenzó la perplejidad. Pero el próximo paso para la IA es honestamente como quitar los aspectos mundanos y aburridos de tener que hacer el trabajo real por ti. Así es. Y entonces lo que pasa es que simplemente vas y navegas por Internet por diversión en sitios web que te parecen encantadores.

Aravind:
[7:35] Y diferentes propietarios de sitios web pueden hacer que sus sitios web parezcan encantadores porque la IA puede escribir mucho código. Así que mi apuesta para el futuro es que va a ser glorioso. Tengo una visión muy optimista de que la gente se va a divertir mucho más. Y el entretenimiento va a ser una forma en la que la monetización se produzca aún más en los próximos años, los creadores, como los podcasters como tú, como muchos, muchos otros formatos de comunicación y de intercambio de información van a extenderse. Y así la gente también va a tener más tiempo en sus manos. Como muchas de las formas en que las empresas de IA están motivando sus herramientas. Es como, hey, la gente apenas tiene tiempo. Así que deja que la IA haga el trabajo por ti.

Aravind:
[8:18] Eso es solo parcialmente cierto. La gente tiene mucho tiempo. Lo que pasa es que el trabajo les parece aburrido. Por eso el tiempo se extiende para llenar ese vacío. Por ejemplo, si asignas dos horas para hacer algo que sólo toma 15 minutos, si el trabajo de 15 minutos es tan aburrido y tienes que lidiar con tantos flujos de trabajo aburridos, aún así pasas dos horas haciéndolo. Y eso es algo así como por qué la gente odia hacer el trabajo. Y se cansan y luego no quieren hacer nada más. Así que creo que esa parte va a desaparecer, esperemos. y eso significa que todos vamos a tener mucho más diversión entre nosotros y consumir la web y en nuestra propia forma personalizada. Vamos a tener IAs que nos digan proactivamente qué ir a consumir. También podemos consumir nosotros mismos. Puedes activar y desactivar la dependencia de la IA que quieras en tu vida. Así que va a ser un mundo con mucha agencia y mucha curiosidad. Esa es una de las razones por las que hemos construido una marca en torno a la curiosidad, porque creemos que es la única emoción humana que, perdón, característica humana, yo no diría emoción, sino característica humana que es aún más importante en la era de la IA, especialmente saber cómo utilizar las IA, así como saber qué hacer en un mundo donde las IA son capaces de hacer un montón de cosas que solíamos hacer.

David:
[9:33] Profundiza un poco más en eso, la curiosidad como principal impulso humano para navegar por Internet. ¿Por qué es tan importante la curiosidad? ¿Y qué aspecto tendrá la curiosidad humana cuando tengamos todas estas herramientas increíbles?

Aravind:
[9:49] ¿A nuestra disposición? Así que creo que el mundo tiene más IA que la cantidad de habilidades necesarias para hacer uso de ella hoy en día. La mayoría de las IA son bastante buenas. Como, sí, ya sabes, hay errores cometidos por todas estas IAs, alucinaciones, a veces como que los chatbots son demasiado psicofánticos. Ya sabes, como que no son capaces de completar tareas de forma fiable. Sí, pero mantener incluso el estado actual en el que se puede escribir código para usted, construir sitios web para usted, hacer su investigación para usted, responder a cualquier pregunta que usted tiene ya es como increíble. Increíble, pero comparado con la cantidad de gente que lo usa a diario, no es tan alto. La mayoría de la gente todavía está haciendo el trabajo de la manera tradicional. Tenemos un navegador llamado Comet. Básicamente es capaz de permitirte ver un vídeo de YouTube con la ayuda de una IA. Ya ni siquiera tengo que ver los vídeos completos. Es capaz de ayudarme a redactar correos electrónicos, publicaciones de LinkedIn, correos electrónicos de contratación, mensajes de contratación, seleccionar candidatos con los que ponerme en contacto, recuperar todos esos correos electrónicos antiguos que no quiero leer, darme de baja del spam. Ya es capaz de ayudarme a hacer todas estas cosas. Pero a veces tengo que ser curioso para ver cómo puedo darle nuevos usos que aún no he probado. Depende de mi creatividad. Depende de mí canalizar esa capacidad adicional que me da. Así que yo diría que ese es el aspecto actual en el que la curiosidad es útil a corto plazo.

Aravind:
[11:16] A largo plazo, cuando todos estos son como, usted acaba de tomar por sentado que, ya sabes, por defecto, usted tiene que tener la IA con usted para todo lo que haces. Supongamos que ese es el estado. Todavía tienes que ser curioso en términos de ¿en qué trabajas? ¿Cuál es el próximo proyecto que empiezas? ¿Qué tipo de estímulos puedes proporcionar a la IA, aunque te ayude a realizar las tareas?

Aravind:
[11:37] Se trata de que canalices qué preguntas hacer, qué proyecto original empezar a trabajar inicialmente en esa imaginación, como, vale, supongamos que Einstein tenía todas las herramientas científicas, ¿no? Todavía está en él cuestionar, como, ¿qué pasa si viajamos a la velocidad de la luz? ¿Toda la mecánica newtoniana se rompe en ese régimen? ¿Deberíamos construir una comprensión del mundo completamente nueva? Vale, ¿por qué es una pregunta útil? Incluso si no supieras la respuesta a eso, como hacer estas preguntas y profundizar, o para el caso, como cuestionar la sabiduría de Einstein e ir al nivel de las subpartículas y trazar una distinción entre la naturaleza de las partículas y las ondas. Todas estas cosas son como cosas que los físicos solían hacer sólo por pura curiosidad. Y Jeffrey Hinton tenía mucha curiosidad sobre, por ejemplo, qué pasaría si construyéramos ordenadores que simularan el cerebro, a pesar de que la informática se centraba en programas deterministas.

Aravind:
[12:37] Fundamentalmente, la IA es básicamente programas estocásticos. Ni siquiera hoy en día se puede garantizar un resultado en IA. Así que ninguna decodificación LLM es siempre la misma. Así que la gente tenía su propia curiosidad científica para explorar cosas. Pero eso era, hasta ahora, un ejercicio puramente académico. Con el acceso a todas las herramientas de IA, ya no va a estar restringido a las élites. Ya no va a estar restringido a los profesores, los científicos. Así que cualquier persona con la curiosidad de un niño, cuando tienes un hijo muy temprano, como, o tienes a alguien en tu familia de niño y vas a pasar el rato con ellos, te hacen todas las preguntas más básicas que te hacen tropezar, ¿verdad? Es genial poder responderlas, pero también es como si nunca hubiera pensado en ello en profundidad. Simplemente daba por sentado lo que la gente me contaba o lo que leía en Internet. Creo que nos dirigimos hacia ese tipo de mundo.

Aravind:
[13:32] Y a medida que profundizas más y más y haces más preguntas, y si la IA realmente te ayuda a hacer más preguntas, como si no se limitara a responder a tu pregunta, sino que en realidad te sugiere más preguntas que hacer y te lleva a madrigueras de conejo, obtienes ese tipo de alegría que los primeros adoptantes de la web tuvieron con hipervínculos y Wikipedia y como páginas web incrustadas. Internet solía atraer a los bibliotecarios, historiadores, intelectuales y académicos. Así fue como empezó. Esa es la razón por la que Amazon comenzó a vender libros, porque quería atender a la primera audiencia de Internet, que resultó ser gente interesada en libros. Así que creo que así es como la IA se siente hoy en día para mí. Es realmente utilizada masivamente por los primeros en adoptarla que son pensadores y programadores e intelectuales y académicos. Pero a medida que las herramientas se vuelven más y más fáciles de usar y como las herramientas obtienen una gran cantidad de agencia, realmente va a ser mucho más accesible. Y así la persona normal que es curiosa va a tener en realidad un montón de superpoderes. Y es de esperar que eso cambie el mundo de forma muy positiva.

Josh/Ejaaz:
[14:38] Me encanta la forma en que enmarcas Internet y la IA como un vehículo para perseguir la curiosidad y la creatividad. Pienso en cuando cargué mi primer CD-ROM o cuando entré en RuneScape.

Josh/Ejaaz:
[14:53] por primera vez y pude explorar este nuevo mundo nativo de Internet. Tengo curiosidad, la IA se suele tildar de algo que automatizará el mundo. Y tu imagen de curiosidad y creatividad. ¿Crees que hay una delgada línea entre la IA que limita lo que un individuo puede mirar y explorar y buscar frente a algo que se puede utilizar como una herramienta para crear? Estoy pensando en cómo pisar esa línea cuando se construyen los productos que se construyen.

Aravind:
[15:24] Nuestro producto se construye para ayudar a navegar por la web y la búsqueda de manera más eficaz que el consumo a través organizado como 10 enlaces azules, ¿verdad? Y en mi opinión, como la habilidad de hacer una pregunta ni siquiera estaba allí. Todos nosotros como, yo diría que el uso de la terminología de aprendizaje automático, todos nosotros overfitted a la habilidad de escribir en un par de palabras clave y la apertura de los enlaces y la lectura de los enlaces y luego sintetizar y resumir la información pertinente a nuestra pregunta original en nuestras mentes.

Aravind:
[15:58] Y llegar a cualquier conclusión que tengamos. Eso es lo que hemos hecho en las dos últimas décadas, porque no podíamos disponer de una herramienta que nos permitiera formular directamente nuestras preguntas. Ahora eso está ahí. Así que lo que estamos haciendo más es como hacer más preguntas. La primera pregunta, pero también un montón de preguntas de seguimiento. Y eso nos lleva a una forma muy diferente de empezar. Como por ejemplo, déjame darte un ejemplo de cómo mi propia vida cambió. Antes, cuando quería leer y entender un tema, me gustaba ir y leer los artículos, las entradas del blog de una manera muy lineal. Hacía una revisión bibliográfica. Recopilaba un montón de recursos para leer esa fuente concreta de material. Y entonces, después de leer todo eso, llegaría a mis propias conclusiones. Todavía tendría un montón de preguntas, pero así es como lo haría. Así es como todo el mundo lo hacía. Ahora es muy diferente. Digamos que soy el CEO de la empresa. Ya no tengo tiempo para profundizar en nada. Pero quiero aprender, como ¿qué es esto nuevo de lo que todo el mundo habla? MCP es una palabra de moda y quiero saber qué es. No tengo que ir a leer documentación sobre Antropología y entradas de blog para entenderlo. Puedo ignorar la perspectiva del escritor e ir directamente a la perplejidad y preguntarme qué demonios es eso de MCP.

Aravind:
[17:23] Como, ya sabes, ¿es una palabra de moda? ¿Es algo profesional? ¿Todo lo que hace es una forma diferente de mover JSONs entre servidores y modelos o hay algo más? ¿Por qué todo el mundo lo llama USB-C para la inteligencia artificial o Internet?

Aravind:
[17:41] ¿Cuál es el problema? Por ejemplo, puedo preguntar cosas de forma que las preguntas guíen mi aprendizaje en lugar de que el material y la entrada del blog guíen mi aprendizaje.

Aravind:
[17:54] Porque de todos modos, después de leer cinco páginas diferentes, todavía tendría toneladas de preguntas. ¿Por qué no? Empecé con la pregunta y después de 20 preguntas, saqué mucho de ella. Y ahora puedo ir y leer el material en su totalidad. Al igual que es un muy, es una especie de dar la vuelta al orden. Esto es un gusto personal. No recomiendo a todo el mundo que haga esto, pero como no tengo mucho tiempo, así es como aprendo las cosas en este momento. Pasa lo mismo. Como lo que le pasa a mi cuerpo, como lo que estoy haciendo mis entrenamientos los alimentos que consumen en realidad no voy y como ver videos de youtube de como las dietas recomendadas por los culturistas y como al igual que la forma de como perder grasa sin como perder músculo como al igual que yo no tengo que ver como 20 videos en realidad sólo puedo hacer preguntas críticas acerca de los videos utilizando el navegador de comentarios dime como lo que es en realidad como contrarian en usted aquí y como yo puedo pedir que como referencia comprobar un montón de papeles Así que está dando lugar a una forma muy diferente para mí para consumir el conocimiento por ahí. Y sólo creo que esto va a ser aún más impresionante en el futuro. Los niños no tienen que consumir la web o Internet como lo hicimos cuando éramos niños. Y las interacciones por voz van a hacerlo aún más natural. Y luego tener la capacidad de sacar contexto de lo que estás viendo, hacer preguntas, va a hacer que se sienta aún más libre de dispositivos y más natural. Así que estoy más entusiasmado con la próxima generación.

Aravind:
[19:22] Son muy afortunados. Siento que, no sé vuestras edades, pero supongo que todos estáis en mi grupo de edad. Así que nosotros, estábamos bien. Al menos disfrutamos de la primera web. Creo que la generación que nos sigue se vio afectada por el empuje de las redes sociales. Y tienen un montón de conocimiento sólo por ver carretes y como cortos y todas estas cosas. Y no creo que eso sea muy bueno porque fundamentalmente, es negativo. Creo que la generación después de que va a ser como, ya sabes, ir a ver los carretes para mí y me dicen como lo que era probable interesante para mí. Yo confío en mi relación con mi agente, que me entiende de verdad y conoce mis preferencias, conoce mis metas y objetivos, para que consuma Internet por mí y me lo dé como yo quiero. Así que esa agencia y esa confianza que obtienes con tu IA para hacer cosas por ti y como para filtrar el ruido por ti y ayudarte a buscar la verdad y ayudarte a mantener la curiosidad. Eso es lo que queremos ayudar a crear a través de nuestros productos en esta empresa.

Josh/Ejaaz:
[20:28] Me encanta eso. Estás describiendo esencialmente un nuevo tipo de experiencia online o de navegación, ¿verdad?

Aravind:
[20:35] Cuando le mostré un comentario a Mark Andreessen, lo que quería saber era algo así como, ir a x.com, desplazarse a través de mis 100 tweets en mi feed, basado en mi historial de navegación, filtrar el ruido y sólo mostrarme los 20 más relevantes. Y lo hizo un trabajo increíble. Al igual que, como si esto es como casi en tiempo real donde voy a un sitio web, hago clic en un botón, ya sabes, ni siquiera tengo que escribir todo este mensaje.

Aravind:
[21:00] Y luego simplemente renderiza el sitio web en la forma en que quiero consumirlo. Ningún propietario de sitio web o constructor de algoritmos tiene tiempo para personalizar todo para cada persona a un nivel de grano fino, ¿verdad? Elon Musk hará un cambio en el algoritmo X... Y entonces empezarás a ver un montón de mensajes políticos o empezarás a ver un montón de memes. Empezarás a ver un montón de videos al azar o contenido de anime. No tienes ni idea de por qué de repente estás viendo todo esto. Y tampoco es culpa suya. Él sólo está tratando de maximizar algunas métricas para la empresa o tal vez para sí mismo. Como si fuera de su propiedad. Y ese es el, bueno, como que no quiero que sigamos viviendo en. Tenemos que tener la agencia para hacer como las cosas de la manera que queremos.

Josh/Ejaaz:
[21:48] Sí, suena como si estuvieras describiendo el mundo actual que navegamos y buscamos en línea es una especie de sobreadaptación para las habilidades que no necesitamos en este momento. Entonces, ¿qué

Aravind:
[22:00] ¿Crees que son.

Josh/Ejaaz:
[22:01] ¿Las habilidades importantes en las que deberíamos centrarnos ahora entonces? como esa nueva audiencia más joven que está entrando en Internet hoy en día?

Aravind:
[22:08] Yo diría que el pensamiento crítico, Así que aquí está una habilidad que he aprendido a adquirir con el tiempo, que es cada vez que lees un libro o una biografía de alguien, a menos que esté escrito por alguien bastante neutral, por lo general es un artículo buff en ellos, ¿verdad? Como por lo general es como algo que colaboró con y, ya sabes, la intención de mostrar la empresa o ellos mismos en una luz muy positiva. Así que terminas recibiendo una perspectiva muy sesgada. Así que me encantaría tener una IA cuando estoy leyendo un libro juntos y revisar críticamente cualquier capítulo y me dicen perspectivas que son contrarias a lo que el autor tiene también. Así que eso es lo que hago cuando leo libros ahora mismo. Tengo un asistente en mi navegador y le pregunto: "Oye, basándote en lo que has leído en este capítulo conmigo, dime qué cosas debería tener en cuenta sobre las que el autor podría estar equivocado". Y eso es sólo yo estar buscando como más perspectivas, como ligeramente el Peter Thiel-ish como la ideología contraria. Una vez más, no para ser contraria por el gusto de hacerlo. Sólo quiero saber todo lo posible. Y así es el pensamiento crítico sin duda será esencial.

Aravind:
[23:26] Y entonces como la razón por la que puedes consumir todo de la manera que quieras definitivamente te ayuda a como no entrar en cámaras de eco. Así que espero que eso abra la mente para que la mayoría de la gente cuestione muchas de las cosas que ve en la web. Y creo que la web va a estar llena de un montón de bazofia AI también. No quiero dar la impresión de que la IA es una tecnología asombrosa... Va a haber mucha desinformación generada por la IA, vídeos fotorealistas que ni siquiera se puede decir si son reales o no, y el contenido será escrito mucho más por la IA que por humanos en Internet. Así que la única manera de luchar contra esto es en realidad con la ayuda de una IA como la nuestra o como lo que otras personas están construyendo que te ayudan a buscar la verdad y te guían hacia ella, incluso sin mucho esfuerzo de tu parte a través del tipo correcto de indicaciones que están como ya almacenadas en caché y te ayudan a consumir las cosas de la manera que quieres y como honestamente trabajan para ti, como realmente como mantener tus intereses. Imagínate un mundo en el que los agentes hacen las compras y las reservas de viajes por ti, ¿verdad?

Aravind:
[24:33] Y podría haber un mundo en el que, ya sabes, cualquiera que sea la empresa que elija hacer esto, intente que los anunciantes traten de llamar la atención del agente en lugar de la tuya, como anuncios a nivel de agente. ¿Cómo proteger al usuario que no quiere que esto suceda? La forma en que potencialmente podría funcionar es que el usuario y el agente tengan su propio contrato, un apretón de manos.

Aravind:
[24:57] Todo es en forma de un prompt del sistema y ese prompt está protegido. No se puede inyectar. Esto no existe hoy en día. Se puede inyectar a cualquier cosa. Así que esto no funcionaría hoy. Pero imagina un futuro donde podamos hacer esto de forma fiable. Entonces no importa lo que el anunciante intente hacer para que el agente los prefiera sobre algún otro comerciante, el prompt del usuario al agente los protege del tipo de mecanismo publicitario. Así que necesitamos todo el tipo de, como desarrollar versiones de como los sistemas actuales. Es muy incipiente hoy en día. Se siente como los primeros días de Internet, pero eso es lo que me gustaría como para asegurarse de que al igual que las personas están protegidas incluso contra AI slop y la publicidad y todo lo que en el futuro.

David:
[25:39] Existe esta noción en el diseño UX de que una mejor UX implica menos clics por parte de los humanos. Si conseguimos que pulsen menos veces para obtener lo que quieren, eso se considera una buena experiencia de usuario. Y veo algo de esto, el mismo tipo de sentimiento que se aplica a los agentes de IA donde, oh, en realidad podemos conseguir que los agentes de IA hagan cosas en nombre de sus usuarios. Y eso realmente pone a los humanos en un papel muy pasivo. Y veo los pros y los contras de eso, ¿verdad? A veces no quiero pensar tanto y solo quiero que me entretengan y me hagan sentir bien. También me preocupan los costes de que mi cerebro se apague con más frecuencia como mi modo por defecto. ¿Cómo se piensa en el diseño de la perplejidad, cómo se piensa en este humano activo frente a pasivo en el asiento del conductor cuando podemos automatizar las cosas? Pero entonces también como tal vez también queremos fomentar un conductor más activo cuando se trata de como la gestión de estas herramientas. ¿Qué opinas de este equilibrio?

Aravind:
[26:38] Sí, es una buena pregunta. Pensamos en ello en el sentido de mantener al usuario activo en el proceso. Así que, al menos en el caso de las consultas agénticas en las que se pide a perplexity que investigue en profundidad sobre GLP-1, el agente vuelve y hace preguntas aclaratorias al usuario para que éste pueda aportar más información. Creo que ChatGPT también hace esto. ChatGPT te obliga explícitamente a responder. Perplexity no obliga al usuario a responder. Creo que nuestro diseño es mejor porque a veces, cuando no sabes nada sobre un tema, ni siquiera sabes lo suficiente como para responder. Así que tu respuesta no importa. Así que no necesitas bloquear al usuario para responder. Pero esto es al menos una manera en la que usted puede permanecer a lo largo y guiar al agente hacia como hacer algo que usted quiere, ¿verdad? Y luego algunas otras formas en las que lo hacemos en el navegador de comentarios, por ejemplo, si vas y le pides que compre algo, todavía te pedirá confirmación antes de proceder. Te dará advertencias, oh, esto va a costar $ 100, ¿estás seguro de que quieres gastar? Así que todavía va a mantener tu cerebro activo, ya que hace el trabajo. Pero estoy tomando una más, estoy ampliando y mirando a su pregunta a un nivel más filosófico. Al igual que si los agentes son, en algún momento usted confía en ellos, son más inteligentes que tú. Es como si hubieras contratado a alguien más inteligente que tú. ¿Y por qué necesitas microgestionarlos? Entonces, ¿dónde aplicas tu capacidad intelectual?

Aravind:
[28:00] No es muy diferente a, ya sabes, como si estuvieras dirigiendo una empresa y contrataste a dos personas y son de clase mundial. Y lo están haciendo todo. Y si no vas a trabajar, la empresa funciona bien. ¿Qué haces entonces? O haces otra empresa o inicias otro negocio adyacente a tu negocio actual que te ayude a hacer crecer el negocio actual aún más, o empiezas a hacer más apuestas dentro de la misma empresa contratando a un conjunto diferente de personas y tratando de amplificar lo que puedes hacer dentro de la empresa, ¿verdad? Así que supongo que así es como yo lo veo. Si te quedas de brazos cruzados y no haces nada, sí, creo que va a haber un deterioro cognitivo seguro. Y creo que eso se aplica aún más en la era de la IA donde si las IAs son capaces de hacer muchas cosas por nosotros y por lo tanto lo damos por sentado y Bill Gates tiene esta cosa de que la gente tiene semanas de trabajo de tres días o semanas de trabajo de dos días en un mundo donde las IAs funcionan realmente bien. Creo que eso está bien. Por cierto, no estoy en contra de un futuro en el que la gente sólo trabaje dos o tres días a la semana y se relaje los cuatro días restantes.

Aravind:
[29:02] Todo esto de los cinco días a la semana fue, La Revolución Industrial lo hizo por nosotros. Henry Ford fue una de las principales razones por las que sucedió. Porque en ese momento, la única manera de maximizar la eficiencia de la producción era que la gente acudiera a las fábricas e hiciera el trabajo. Luego las máquinas empezaron a hacer muchas más cosas y la gente empezó a encontrar diferentes tipos de trabajos y software e internet. Todas estas cosas son la forma en que empezamos a evolucionar para hacer frente a todos estos cambios.

Aravind:
[29:27] Así que estoy seguro de que encontraremos más formas de mantenernos ocupados. Al mismo tiempo, estoy seguro de que habrá algunas personas que se retiren y se dediquen a otras pasiones, como el senderismo y la fotografía y, ya sabes, la creación de contenidos, el podcasting. Hay muchas maneras diferentes en las que puedes tener tu propia vida. Y eso es como hacer el mundo más multidimensional. Al igual que algunas personas me dicen, ya sabes, San Francisco sigue siendo unidimensional. Usted viene aquí, usted acaba de cumplir hermanos tecnología. como todos ellos hablan de AI en los cafés y nadie, al igual que se siente como, ya sabes, tú, se siente muy bien. La energía es increíble, pero la gente que le gusta vivir en Nueva York o Londres y, ya sabes, entras en un bar y son como alguien, te encuentras con alguien que es como tocar un instrumento. Conoces a alguien que es un artista. Conoces a alguien que hace como espectáculos o como standup comedy y luego ingenieros. Hay como un montón de diferentes tipos de personas en Nueva York y que atrae, ya sabes, de la gente a esa ciudad. Creo que el hecho de que la inteligencia artificial mejore cada vez más puede hacer que la sociedad se sienta de una manera más global en todo el mundo, y no sólo restringida a unas pocas ciudades.

Josh/Ejaaz:
[30:34] Arvind, a la gente le encanta la perplejidad. Cuando les dije a algunos de mis amigos que ibas a venir, se entusiasmaron. Lo usan todo el tiempo para ver resultados deportivos, el tiempo, sugerencias para apostar. Y encuentro que la gente tiene esta afinidad con la perplejidad. Y me gustaría que me ayudaras a entender por qué. Así que si soy un usuario, si soy alguien que está escuchando este podcast, que utiliza ChatGPT, que utiliza Gemini, y no está muy seguro de cuál es la ventaja de perplejidad. ¿Puedes describir la ventaja única que tenéis por la que la gente querría utilizar el servicio y lo que estáis haciendo en segundo plano para cumplir realmente esa promesa?

Aravind:
[31:03] Número uno, establecimos la marca en torno a la precisión y el conocimiento. Así que no pretende ser un asistente que, en general, sea, ya sabes, Rather, no pretende ser un chatbot de inteligencia artificial que te hable de todo. Así que puedes ir a ChatChapD y tener un mal día. ¿Puede motivarme?

Aravind:
[31:23] Perplexity no está pensado para eso. Así que no estamos intentando crear un producto que sirva para buscar, investigar, saber y conocer hechos, y que sea bueno para ser tu compañero de chat o un compañero, todo en uno. Gemini y ChatChapD intentan hacer eso. Así que como resultado de optimizar realmente para una cosa, que es el conocimiento y los hechos y la investigación y dar la respuesta al usuario de la manera más consumible, como la mayor densidad por píxel, como en términos de ancho de banda de información, hacemos un mejor trabajo. Y también somos más rápidos en dar la misma respuesta. Así que realmente nos preocupamos por, ya sabes, lo que el usuario necesita para, como, como decir, incluso si el usuario no tiene que ser muy preciso en sus indicaciones, que tipo de entender su intención y dar la respuesta más rápida y mejor. Así que el curso de deportes, usted está diciendo que hemos hecho un montón de trabajo en eso porque cuando usted está pidiendo la puntuación de un juego, no siempre devolver la respuesta en un muro de texto. No es, no es divertido. Quieres estos widgets. Tu cerebro está acostumbrado a consumir esos píxeles.

Aravind:
[32:28] No quieres actualizaciones en vivo, gráficos de acciones. Como si a veces no quisieras hacer inmersiones profundas en los ingresos de una empresa o en sus finanzas. Construimos muchos cuadros de mando para eso. Usted no quiere ser capaz de comparar dos acciones diferentes. Usted no quiere ser capaz de profundizar en como los resultados anteriores o como, ya sabes, como el equipo diferente, como la Fórmula Uno, por ejemplo, como usted quiere ser capaz de seguir las actualizaciones en vivo en el juego. Así que hemos trabajado mucho para ofrecer la máxima información posible.

Aravind:
[32:56] Ancho de banda de información, como píxeles consumibles. Y todavía no hemos completado, como si no hubiéramos hecho un buen trabajo en el tenis todavía. Creo que todavía estamos rezagados en el fútbol. Así que todavía hay mucho trabajo por hacer, pero al menos nos preocupamos lo suficiente por esto. Y queremos que la gente pueda acudir a nosotros para hacernos preguntas sobre cualquier cosa del mundo. Y esa es la forma en que pensamos en la construcción de la última respuesta motor. Y cómo son.

Josh/Ejaaz:
[33:21] ¿Estás haciendo esto? ¿Qué pasa entre bastidores? ¿Así que cuando hago una consulta con perplejidad? ¿Cuál es la magia que está sucediendo detrás? ¿Estás enrutando? Recientemente tuvimos el CEO de OpenRouter en que tipo de descrito cómo se puede ruta consultas a diferentes modelos. ¿Estás agregando los datos tú mismo? ¿Está usted raspando la web y sirviéndola a lo largo de su propio modelo? ¿Qué ocurre cuando pulso Intro en el cuadro de búsqueda?

Aravind:
[33:39] Sí, cada consulta se clasifica. A veces es una consulta deportiva, a veces meteorológica, financiera o una consulta normal que no necesita widgets. Todas las consultas se clasifican y, en función del clasificador, se generan distintas interfaces de usuario. Y luego, para ciertas consultas que requieren datos realmente precisos, no quieres usar sólo enlaces web. En realidad quieres usar un proveedor de datos que te dé un volcado de datos en tiempo real. Eso es lo que necesitas para las finanzas. Eso es lo que necesitas para los deportes. Eso es lo que necesitas para el tiempo. Eso es lo que hacemos. Para algunas consultas, en realidad necesitas comerciantes o un inventario de hoteles o ese tipo de cosas. Lo hacemos para viajes y comercio. Para algunas consultas, necesitas proveedores de datos de restaurantes locales. Lo hacemos con Yelp, por ejemplo. Y para otras consultas, sólo necesitas la web normal donde sacas un montón de enlaces y resumes el contenido en ellos. Eso es lo que hacemos para la mayoría de las consultas. Eso es una larga cola.

Aravind:
[34:40] Y tienes que decidir si quieres formatearlo en markdown o tablas o en uno o dos párrafos. Y si la consulta ha llegado por teléfono o por la web, si ha llegado por teléfono, intenta ser un poco más conciso porque la gente no quiere leer mucho texto por teléfono.

Aravind:
[34:57] Y también tienes que decidir si quieres razonar y pensar más para ciertas consultas que son un poco más ambiguas. Por ejemplo, digamos que quieres preguntar cuál es la diferencia de edad entre los cinco mayores multimillonarios y sus esposas o algo así, ¿no? Quieres preguntar, ¿quiénes son los cinco multimillonarios? Fulano de tal. Sí. ¿Quiénes son sus esposas? Tal y tal. ¿Cuál es la edad de estas 10 personas, sus fechas de nacimiento? Y luego quieres calcular las diferencias. Así que tienes que razonar un poco y luego dar la respuesta en forma de tabla. Así que el modelo tiene que adaptarse automáticamente en función de la consulta, cuánto razonamiento y cuántos pasos de razonamiento aplicar. Todo ello también se basa en las decisiones del clasificador. Así que tenemos, esencialmente pensar en nosotros como la construcción de este router gigantesco, información complicada para la curiosidad de la humanidad y las necesidades de conocimiento. Eso es básicamente lo que estamos haciendo. Y si podemos hacer esto a escala para todos los idiomas, todos los tipos de consultas, todos los tipos de verticales, todos los tipos de tareas básicas del día a día, hay como un tremendo valor en eso. Ni siquiera importa si somos dueños del modelo o no. Sólo el valor del enrutador en términos de saber qué modelos usar para qué consultas y qué tipo de interfaces de usuario usar y cuánto cálculo aplicar por consulta y obtener la mayoría de las respuestas correctas y hacerlo con una latencia y una interfaz de usuario deliciosas es básicamente nuestro objetivo.

Josh/Ejaaz:
[36:16] Bien, ahora tenemos este conjunto de herramientas. Tomáis las complejidades y las fusionáis en un conjunto de datos. Y parece que eres realmente excepcional en algunas cosas. Hemos mencionado los deportes. Sé que mucha gente también lo usa. Mucha gente ha estado rogando en Twitter, en realidad, por una perplejidad para reemplazar Bloomberg en términos de finanzas, ya que puede hacer un montón de gráficos. Y parece que es realmente fuerte en algunas de estas categorías.

Josh/Ejaaz:
[36:36] Donde están poniendo mucho de su tiempo y esfuerzo es en el propio navegador con Comet. Y quiero presentar Comet a la gente que no lo entiende. Es tu nuevo navegador de IA. Me encantaría que lo compartieras con nosotros porque parece que llevas un tiempo perplejo. Como que has estado viviendo en terreno alquilado. Para usar perplejidad, normalmente tendría que ir a Chrome o iría a Safari o usaría como un navegador diferente que no es nativo de ustedes. Pero ahora lo que estás haciendo es crear la pila completa, ¿verdad? Estás creando el navegador desde tu escritorio. Ejecutas la aplicación, controlas toda la pila. ¿Puedes presentarnos qué es Comet y cómo funciona? Sí.

Aravind:
[37:06] Así que Comet es, básicamente lo llamamos navegador la velocidad del pensamiento. Todos tenemos un montón de pensamientos mientras estamos en el navegador y no llegamos a terminarlos todos porque cada tarea que tenemos en la cabeza lleva mucho tiempo. Así que Comet pretende unificar la perplejidad y el navegador de una manera muy nativa, donde la perplejidad evoluciona de sólo darte respuestas a realizar acciones por ti. Y perplexity pasa de extraer el contexto de la web a extraer todo el contexto, el historial de tu navegador, tu Google Calendar, tu Gmail, otras pestañas que puedas haber tenido abiertas en algún momento, tu Slack, tus otras herramientas de trabajo. Y así puede extraer todo el contexto personal relevante y el contexto web y tener la agencia para ir a tomar acciones por ti y disponible contigo en todas partes en la barra de búsqueda, en la barra lateral, en la página de nueva pestaña. Así que sea cual sea la página web en la que estés, te ayuda contextualmente, ¿verdad? Eso es lo más importante. Tu trabajo comienza con algo de contexto. Estás en Google Doc y estás pidiendo ayuda para editar el documento. Estás en Google Sheets y estás pidiendo ayuda para obtener información de la web que te ayude a rellenar la hoja. Estás haciendo un trabajo y estás intentando sacar contexto relevante del pasado que podrías haber intercambiado en correos electrónicos con tus colegas para ayudarte a redactar algo.

Aravind:
[38:28] Estás a punto de entrevistar a alguien y quieres sacar todos los antecedentes. Sólo quieres hacerlo como, oye, prepárame para mi día de mañana, y lo va a hacer por ti como parte del aviso. Así que queremos que sea mucho más intuitivo, búsquedas mucho más personales, un contexto mucho más personal, y en realidad sólo eliminar los aspectos mundanos de tratar con sitios web aburridos. Así que eso es lo que Comet estaba destinado a hacer, y se levantó a un gran comienzo. Y está justo en el punto dulce donde está casi allí, pero no del todo todavía. Y creo que ahí es donde uno quiere estar para subirse a la ola de los modelos que mejoran y luego cerrar el círculo de la fiabilidad total.

Josh/Ejaaz:
[39:09] Sí, quiero hablar sobre el factor de forma y el tipo de opciones de diseño para Kama porque pienso mucho acerca de la inteligencia, cómo va a mejorar con el tiempo y lo más importante, cómo vamos a participar con él a medida que ascendemos en esta curva de crecimiento. Y cuando pienso en la conclusión a la que llegué, parece ser un poco diferente a la del navegador. Así que cuando pienso en un navegador y mencionaste esto antes, hay una especie de dos usos para él, ¿verdad? Hay dos cubos. Está la productividad, y luego está el ocio. Y la productividad es el tipo de trabajo que haces. Soy yo preparando la agenda para los episodios. Soy yo comprando detergente o reservando viajes. Y luego para el ocio, es como, estoy viendo videos de YouTube. Estoy viendo Netflix. Estoy desplazando mi línea de tiempo X. Eso me encanta. Eso se siente muy singularmente humano para mí. Y quiero mantener eso. Eso se siente especial para mí. Así que me imagino que ese cubo de productividad se abstrae a través de los agentes. Y parecía un poco descabellado hace unas semanas. Pero entonces probé el agente de OpenAI, y me dije, espera, esto es genial. Obviamente elimina todas las interfaces, las complejidades del navegador, y simplemente me da la respuesta. Entiende mi pila de preferencias. Lo sabe todo. Tengo curiosidad por saber qué decisión de diseño tomasteis para conservar el factor de forma del navegador frente a ir directamente al flujo de trabajo del agente, que elimina todas las interfaces, la publicidad, y te da la respuesta que estás buscando.

Aravind:
[40:18] Así que el trabajo comienza desde donde estás, no desde un chatbot vacío. Por ejemplo, estás redactando una nota para un memorándum y quieres sacar contexto de lo que ya has hablado con tus colegas en Slack.

Aravind:
[40:38] Ni siquiera quieres copiar y pegar el memo y preguntar, hey, ¿puedes sacar todo el contexto del pasado que podría haber discutido con David y Yas o algo así, ¿verdad? Como si literalmente quisieras tener al asistente justo a tu lado y simplemente decir.

Aravind:
[40:52] ¿Puedes sacar el contexto relevante que podría estar perdiendo aquí? Y ni siquiera tienes que decir que lo saque de Slack. Automáticamente sabrá qué sacar y lo editará por ti en el momento. Las otras ventajas son que como este constante como el cambio de pestañas y copiar pegar contexto aquí y allá, y luego tomar las salidas de un lugar, poner de nuevo en otro lugar, todo eso ahorrado para usted cuando usted acaba de tener de forma nativa incrustado en donde quiera que estés. Y en términos de decisiones arquitectónicas como el agente ChatGPT es mucho más lento que el navegador Comet. La gente ha hecho comparaciones y lo que sea que te lleve 11 minutos hacer en el agente ChatGPT probablemente te lleve menos de un minuto en Comet porque hay muchas ventajas en sólo analizar la información en el lado del cliente y sólo usar el lado del servidor para el razonamiento del modelo de frontera pero no tener que crear una sesión completa en el lado del servidor de tu navegador cliente y luego hacer todo el cálculo allí. Hay de nuevo otro viaje de ida y vuelta entre eso y como donde los modelos se alojan en realidad y luego como en realidad como enviar el resultado de nuevo a usted, al cliente. Es como muy lento y poco fiable y, a veces se queda atascado y reintentos y ni siquiera saben lo que está pasando en comparación con tener como el control total en el cliente, que es mucho más seguro. Las contraseñas no necesitan ser comunicadas. Todo se almacena localmente. Todo tu contenido es local. Nunca tienes que preocuparte por una sesión del lado del servidor de lo que sea que estés haciendo.

Aravind:
[42:17] Y como todo es mucho más rápido porque sólo hay como una forma, como dos vías de comunicación entre como cualquier información en el cliente y lo que los modelos se están ejecutando en el servidor, pero eso es todo. Así, y como, por ejemplo, es posible que desee tomar ayuda incluso en su ex o Netflix o YouTube, ¿verdad? Como estoy en YouTube, sólo quiero decir, hey, hay este podcast estos chicos hicieron con Arvind, y sólo quiero conseguir que exactamente lo que Arvind dijo sobre ChatGPT agente. ¿Puedes sacarlo de, puedes editar exactamente el clip donde sólo habla de esto y subirlo como un video separado a YouTube y ayudarme a verlo? No somos capaces de hacer todas estas cosas todavía, pero muy en los horizontes de suceder. Usted puede tirar exactamente de la marca de tiempo correcto y usted no tiene que ir a mostrar la transcripción, comando F, agente de chat GPT, y luego otra vez, como moverse alrededor de esos, el control deslizante de reproducción en términos de donde exactamente empecé a hablar, todo lo que no es necesario. Es mucho mejor. Así que también puede ayudarte con tareas personales, como, como un montón de trabajo.

David:
[43:21] Como, como a veces

Aravind:
[43:21] Simplemente estás viendo YouTube y puedes, puede que quieras sacar toda la transcripción y usarla para tu, tu próxima cosa más tarde, o enviársela a alguien muy rápidamente. o mientras estás viendo YouTube, puede que quieras como reservar una cena al margen. Todo puede ser, y es posible que sólo quieren como ver si el agente está haciendo progresos y sólo puede consumir su contenido. Todo es mucho más fluido e integrado en un entorno. Es el producto más pegajoso que la humanidad ha construido hasta ahora. Y desde los últimos 20 años o como casi 30 años, como hemos estado usando navegadores. Sí, como que ha cambiado un poco. Firefox innovó en el concepto de pestañas. Google innovó en el concepto de pestañas como procesos separados. Pero aparte de eso, no ha habido muchos cambios. Así que por primera vez, somos capaces de ofrecerte una interfaz de usuario familiar, pero dándote mucha más autonomía. Eso es básicamente lo que decidimos hacer. Y está bien. Si eventualmente la agencia es tan confiable que no necesitas abrir tu navegador. Sólo tienes que escribir en la página de nueva pestaña y lo hace todo por ti. Está completamente bien. Pero pensamos en un futuro donde la gente seguirá haciendo el trabajo, pero lo harán con mucha más ayuda de la IA, pero seguirán manteniendo toda la agencia. Creo que ese es el tipo de futuro en el que creemos. Y creo que integrar la IA directamente en el navegador es un enfoque mejor.

Josh/Ejaaz:
[44:42] Sí, creo que el navegador tiene 35 años, 1990. Así que llevamos usándolo mucho tiempo. Está claro que es muy pegajoso. Y cuando mencionaste las ventajas de usar ahora el navegador Comet, estoy de acuerdo. De hecho, amablemente tuvimos acceso a él. Pudimos probarlo y probarlo. Y es mucho más rápido que el uso de la función de agente, ya que tiene todas las integraciones incorporadas. Tenía mis cuentas de Google. Tenía todas mis integraciones de inicio de sesión. Pero mi pregunta es: ¿qué pasa cuando, con el tiempo, se vuelven más rápidos, cuando los agentes colapsan el tiempo y la latencia y ya no tienes que poner en marcha una máquina virtual? No se tarda tanto. Y realmente es como una experiencia sin navegador. Sé que la gente está trabajando en dispositivos de hardware para llevar esto a la realidad y eliminar gran parte de la interfaz. Entonces, ¿cree que el navegador seguirá siendo el factor de forma a medida que avancemos? ¿O crees que Kama acabará evolucionando hacia algo más abstracto que una simple caja con una pequeña pestaña en la parte superior?

Aravind:
[45:32] Mira, no soy partidario de que el navegador siga siendo el front-end para el consumo de información. No creo que eso sea necesario para que el navegador sea relevante. Esa es toda la cuestión. El tiempo que tarda el agente en hacer el trabajo por ti no es un cuello de botella porque los modelos sean más inteligentes. Es puramente una elección arquitectónica de hilar sesiones del lado del servidor para cada una de tus pestañas de navegación o servicios de terceros. Y los modelos serán cada vez más inteligentes y fiables a la hora de controlar estos sitios web. Pero, fundamentalmente, lo que ocurre es que estás creando una sesión de navegador en el servidor. Eso es todo lo que ocurre. Y sigues necesitando la infraestructura de un navegador, ya sea en el cliente o en el servidor, ya sea headless o como en el front-end.

Aravind:
[46:27] Sigues necesitando toda la infraestructura para hacerlo, ¿verdad? Por ejemplo, cuando pides en Comet que compren esto en DoorDash, no estamos abriendo DoorDash y haciendo que el agente lo represente en píxeles y haga clic en las cosas. En realidad se hace de una manera mucho más eficiente, pero sólo consumiendo directamente el JavaScript y tomando acciones allí. Le damos la parte delantera en términos de la barra de progreso para ver lo que está pasando. Eso es sólo más destinado a la transparencia y como la fiabilidad del usuario, pero el agente no tiene que consumir en la forma en que lo consumen. Así que eso no es realmente como un servidor o una decisión del cliente. Se trata más bien de por dónde empezar. ¿Dónde estás la mayor parte del tiempo? ¿Vas a estar principalmente en el chat bot? ¿Es ahí donde vas a pasar la mayor parte del tiempo? En ese caso, tiene sentido mover el navegador de nuevo a la nube y mantenerte en el chat. Pero no es así como somos, ¿verdad? En realidad estamos la mayor parte del tiempo en el navegador. Estamos abriendo el chat bot como otra pestaña o Google como otra pestaña o perplejidad como otra pestaña, pero estamos sobre todo en el navegador. Estamos como tú y yo en Riverside ahora. Pero Riverside, lo estoy grabando en Comet ahora mismo. Antes solo funcionaba en Chrome, pero ahora funciona. Ok. Sí, hemos corregido el error.

Aravind:
[47:42] Mira, aquí está la cosa. Estoy en Riverside. Estamos hablando. Puede que quiera que Comet nos escuche mientras hablamos y lo incluya en nuestra conversación. Y, ya sabes, también puede como venir y hacer un podcast junto con nosotros o como responder a nuestras preguntas. Te pierdes todas estas experiencias cuando estás atrapado en esta única ventana de chatbot todo el tiempo. y se siente vacío y no hay como un nuevo contexto todo el tiempo. Mientras que en el navegador, que acaba de abrir como Twitter o como enlace, ya sabes, vas a Twitter y como desplazarse a través de unos pocos feeds y luego su mundo ya es como caótica e interesante. Y te pierdes todo eso si te quedas en el chatbot y siempre tienes que pensar qué añadir al chatbot. Creo que por eso pensamos que el navegador es más interesante porque el contexto sigue llegando. Así que tu curiosidad no tiene límites en cuanto a lo que puedes hacer con él.

David:
[48:35] Lo que estoy pensando, lo que estoy viendo que está sucediendo aquí es esta noción de que la IA simplemente va a venir y mejorar todas nuestras vidas de todas estas maneras diferentes. Y va a venir a través de estos asistentes. Y lo que estoy viendo con el navegador, con este modelo de navegador, el modelo común, es lo que estás haciendo con perplejidad es que estás haciendo una apuesta que el factor de forma del navegador es el factor de forma asistente más útil para tomar la inteligencia desenfrenada de estos modelos LLM de OpenAI y todas estas cosas. Y estás apostando a que, de acuerdo, haremos que el asistente sea sólo el navegador. Y hay otros, tal vez competidores por ahí que tal vez usted no primero ...

Aravind:
[49:13] El asistente necesita tener navegación, tanto si conserva el frente del navegador como si no. Es cierto. Y luego creo que en el móvil, en realidad no lo vas a usar como un usuario en la web. En el móvil, en realidad no vas a abrir pestañas en el navegador del móvil. En realidad sólo vas a ir a las aplicaciones individuales. No vas a ir a x.com en mi navegador móvil. Vas a abrir x como una aplicación. Así que en el móvil, la forma en que el asistente aprovecha la funcionalidad del navegador es llamando a las aplicaciones de terceros, lo que no puedes, el sistema operativo te restringe llamar a las aplicaciones de terceros. No puedo abrir DoorDash. No puedo abrir Uber, Amazon, o Twitter o LinkedIn, e ir a hacer cosas por ti allí. El sistema operativo no me permite hacer eso como otra aplicación. Siri potencialmente puede hacerlo, pero eso es porque ni siquiera es una aplicación. Es nativa del sistema operativo. Por eso, tener el navegador como una aplicación independiente explícita y ayudarme a ejecutar una sesión de servidor en la nube o hacerlo en tu cliente como un proceso en segundo plano tiene mucha flexibilidad en cuanto a todo lo que puedo dejar que haga el asistente más allá de responder preguntas.

David:
[50:25] Y supongo que va a haber un puñado de productos que son como este, donde están tratando de hacer un factor de forma útil para la IA alrededor de su persona. Y uno de ellos es un navegador, porque como has dicho, pasamos gran parte de nuestro tiempo en un navegador. Otro es, ya sabes, tal vez la gente no está realmente pensando intuitivamente en esto como un competidor, pero yo lo veo en la misma categoría que esas cosas colgantes, esos dispositivos físicos. Correcto. Donde es sólo otro factor de forma y se supone que le ayudará a utilizar la IA. Y este es un, no es un navegador, pero es esta cosa que está contigo en la vida real. Estás lejos de tu escritorio, estás lejos de tu teléfono, tu teléfono está en tu bolsillo, pero es otro factor de forma de algo que se supone que te ayuda y hace tu vida mejor. ¿Y es así como ves la categoría de lo que estás construyendo? ¿Intenta crear el mejor factor de forma posible para crear un asistente de inteligencia artificial útil?

Aravind:
[51:15] Sí, sin duda. En mi opinión, la memoria y el contexto que puedes extraer del navegador son insuperables. Creo que la gente cree en el colgante y en lo que sea.

David:
[51:25] Cosa que puedes poner

Aravind:
[51:26] En, la cadena, collar.

David:
[51:29] En gran medida no probado.

Aravind:
[51:30] Sí, vidrio, como grabar todo lo que estás hablando. Y fundamentalmente, es una forma menos eficiente de almacenar cosas. Drena la batería en comparación con el aprovechamiento de la batería de tu teléfono o tu MacBook, que es lo que hace el navegador. y también se han invertido muchos más recursos de ingeniería en hacer que los navegadores no consuman batería ni memoria, y que tengan un código bien entendido para optimizar. Los chips son mucho más potentes. Así que eso es lo que le falta al colgante. Tiene que drenar constantemente tu Bluetooth en el teléfono y seguir subiendo cosas al servidor, seguir utilizando la conexión a Internet de tu teléfono. Así que no está hecho para, y tal vez usted ni siquiera necesita para grabar tanto. Se siente como una exageración. Mientras que por otro lado, cada sitio web al que has ido, tener acceso a tu correo electrónico y calendario, ¿cuáles son todas las reuniones a las que has asistido?

Aravind:
[52:24] Tus vuelos, tus planes para cenar. Como si ya supiera tanto como para poder ayudarte sólo a través del contexto del navegador. Y también me parece menos espeluznante en términos de tener que ir constantemente alrededor de este dispositivo y grabar a la gente sin su permiso, mientras que el navegador sólo obtiene tu propio contexto personal y sólo con tu propio permiso, por cierto. Y puedes elegir hacer cosas de incógnito. Así que esa es otra ventaja que creo que tiene el navegador. Y si quieres que tu teléfono grabe una reunión en particular, siempre puedes elegir hacerlo. Es bastante fácil. Hay aplicaciones de grabación. Puedes tener como aplicaciones existentes, tener un botón de grabación y luego, ya sabes, registrar todo el contexto, volcarlo en tu disco local allí en la propia aplicación. Se puede almacenar localmente en el cliente, no tiene que ser empujado al servidor.

Aravind:
[53:09] El contexto se puede extraer de ahí. El navegador puede hacer todas estas cosas. Es bastante fácil hacer todas estas cosas. Por eso no creo mucho en el hardware. Creo que el hardware es muy interesante cuando vas al nivel de los AirPods. Como cuando tengo un AirPod y puedo hablar con él mientras camino y tiene cámaras y realmente puedo hacer preguntas sobre restaurantes, menús. Me da una forma completamente nueva de, como, como ir de compras en línea. Hay muchas de estas ventajas que tienes con el vidrio o el AirPod donde el vidrio puede ayudarte a renderizar cosas. El AirPod puede ayudarte a ver y hablar. Así que creo en ellos, pero no soy un gran creyente en dispositivos que necesitan grabar cada cosa que estás hablando y luego tomar todo eso como contexto.

Aravind:
[53:54] y empujarlo en un chat en el servidor. No creo que sea necesario.

Josh/Ejaaz:
[53:57] Es gracioso. Josh, hemos hablado de diferentes factores de forma de ida y vuelta antes, y que tipo de conjetura en los AirPods con una cámara que era capaz de tipo de ver y sentir todo. Perplexity es la primera empresa importante de IA en lanzar el navegador de IA, ¿no? Y no es ningún secreto que OpenAI y Google van a lanzar nuevos navegadores o navegadores mejorados. Y usted mencionó en un podcast anterior, creo que fue con Y Combinator, que la razón por la que Google no creó un tipo separado de motor de búsqueda y no integró la IA directamente en su motor de búsqueda fue porque no funcionaba o trabajaba de la misma manera. Y mi pregunta para ti es, si OpenAI lanza un buscador mañana, ¿cuál crees que es el principal foso que Perplexity Comet tiene sobre todos los demás? ¿Es ese tipo de flujos humanos naturales e intuitivos que describes? ¿Es ahí donde va a jugar mejor? ¿O son estos flujos agénticos? ¿Puedes ayudarnos a entender cómo son?

Aravind:
[55:04] Quiero decir, creo que van a trabajar en un navegador. ya ha sido comunicado por la prensa. Entonces, ¿cuál sería el modo? Creo que el modo, obviamente, va a ser en torno a tener un mejor producto, moviéndose más rápido, el envío de nuevas cosas que no son sólo lo que hemos enviado ya, pero las cosas que tienen que ver con los procesos de larga duración, como tipo de código equivalente a la nube para las tareas de navegación del día a día. A algunas personas les gusta pensar en el navegador como el IDE de tu vida. Y entonces el agente de codificación podría ser lo que falta fundamentalmente. Como ahora tienes agentes síncronos que hacen cosas por ti en tiempo real, pero los agentes asíncronos están haciendo cosas en segundo plano o como tomar mucho más tiempo, pero puede asumir tareas más difíciles que necesita ser cosido juntos, mucho más largo contexto de gestión, memoria con estado, todas esas cosas todavía falta. Así que tenemos que construir eso.

Aravind:
[55:59] Querrán trabajar en todo eso también. Y a diferencia de un chatbot en el que sólo se envían características, un navegador es un compromiso masivo para ser multiplataforma y actualizaciones constantes y toneladas de correcciones de errores, teniendo que lidiar con tantas versiones diferentes de los sistemas operativos, y tanto en móviles como en escritorio. Y un montón de decisiones arquitectónicas entre lo que dice en el cliente y el servidor, la seguridad, las garantías de privacidad, las versiones empresariales para que la gente lo use con seguridad en el trabajo, un montón de errores y fallos de gestión del contexto, tener que lidiar constantemente con nuevos modelos.

Aravind:
[56:39] Tener la capacidad de utilizar múltiples modelos, no sólo uno, de modo que las capacidades de los agentes en diferentes modelos siempre van a ser, ya sabes, nunca las mismas. Así que tenemos muchas ventajas al ser una empresa centrada en el producto frente a ser una empresa modelo que construye clústeres de computación y Stargate y genera vídeos como Sora, como chatbot de compañía. Como la generación de imágenes, búsqueda. Hay como 20, 30 proyectos diferentes que hacen y los navegadores es uno de ellos. Para nosotros, es todo. Así que estamos apostando la casa en ella. Y si somos una startup muy pequeña que tiene muy poca financiación, obviamente vamos a perder. Pero, afortunadamente, no somos eso. Tenemos una distribución razonable y tenemos un montón de financiación. Así que un montón de grandes talentos aquí. Así que creo que es una apuesta muy natural para tomar, incluso si una empresa establecida como OpenAI quiere trabajar en lo mismo. Sólo valida nuestra tesis aún más. Y también estamos apostando por el hecho de que los modelos de código abierto van a ponerse al día con las capacidades de los de frontera y vamos a ser capaces de migrar fuera de los modelos cerrados para lo que hacemos hoy en día. Y seguiremos utilizando los modelos cerrados para cosas que hoy no podemos hacer, como cosas nuevas y vanguardistas.

Josh/Ejaaz:
[57:54] Como dije antes, ustedes fueron los primeros en lanzar un navegador de IA. Si tuviéramos que pensar en factores de forma para el futuro, ya has mencionado que no eres un fanático de los dispositivos de hardware. Si tuvieras que aumentar tu navegador en el futuro, ¿qué es lo siguiente que construirías?

Aravind:
[58:13] Sí, ya lo he dicho antes, creo que el siguiente paso después del navegador es el sistema operativo, esa es la última frontera, porque la única razón por la que construyes un navegador para hacer muchas cosas, es que no puedes controlar iOS o Android. No, puedes bifurcarlo y hacer de Android lo que quieras, pero, realmente no puedes hacer que un fabricante de teléfonos distribuya tu versión de Android sin obtener la aprobación de Google para ello. Y si ellos no son la búsqueda por defecto, no te van a dejar distribuir una versión de Android con la Play Store y con las principales aplicaciones de Google como Google Maps y YouTube y Gmail y Calendar y así sucesivamente. Y si no distribuyen sus aplicaciones y dejan que otros distribuyan las suyas en tu versión de Android, ningún fabricante de teléfonos se verá incentivado a vender esos teléfonos en ningún mercado. Así que básicamente tienes que construir una super aplicación que pueda llamar a cualquier otra aplicación de tal manera que ni siquiera necesites la tienda de aplicaciones. Pero es por eso que necesitas el navegador, porque el navegador esencialmente...

Aravind:
[59:20] Una vez que se convierte en todo aplicación y puede llamar Ubers y comprar cosas en Amazon y UIs generativas son todos tan rápido y ágil y no se siente como si estuvieras perdiendo en las aplicaciones, usted todavía necesita cosas como X e Instagram WhatsApp para enviar mensajes a la gente como que es muy difícil de conseguir en torno a la falta de tener aplicaciones así que creo que esto es una visión mucho más grande que como usted sabe incluso el envío del navegador donde usted tiene que convencer realmente a las empresas de medios sociales y al igual que otras personas que en realidad como usted sabe ignorar la tienda de juego y aplicaciones de envío junto con usted hace una nueva versión de Android y luego convencer como un fabricante de teléfonos masiva como Samsung o Motorola o alguien como los OEM más grandes para enviar este teléfono en el mercado. Ese es el objetivo final. Y no creo que nos hayamos graduado para trabajar en eso.

Aravind:
[1:00:08] El mejor paso para llegar allí y merecer el derecho a intentarlo es enviar un navegador móvil realmente increíble y conseguir una gran cantidad de distribución en esto y realmente mejorar la fiabilidad y la latencia del producto hasta el punto de que la gente sienta que el navegador es la aplicación todo y se siente como un sistema operativo por sí mismo. Y están dispuestos a probar un nuevo teléfono que puede tener como una nueva versión de Android. Y creo que ese es el, en mi opinión, una vez que completes ese último paso en la trayectoria, ese será el verdadero final del monopolio de Google, en mi opinión, porque entonces es cuando no pueden controlar nada aquí. Al igual que en Android, que el control era una búsqueda por defecto y el 68% de sus ingresos es la publicidad móvil.

Aravind:
[1:00:54] Así que si quito la búsqueda de Google por defecto y te dejo usar un asistente para todas tus necesidades de búsqueda y puedes navegar por la web y la información, todo hecho de una manera fluida.

Aravind:
[1:01:05] La mayoría de los ingresos de los anuncios de búsqueda se reducen como resultado de eso. Así que en realidad hay que conseguir cuota de mercado, como a través de la distribución en los teléfonos, y que necesita como fabricante de teléfonos masiva como Samsung que te respalde. Así que este es básicamente el final del juego. Y también hay que construir un buen modelo de negocio en torno a los agentes y, ya sabes, los ingresos de suscripción para las personas que quieren como la experiencia de Internet y como los servicios a través de este nuevo factor de forma. Así que el mundo tiene que cambiar mucho para que estas cosas sucedan, pero no estamos trabajando en la perplejidad como un, como un, como un proyecto a corto plazo. Al igual que, va a tomar una década para darse cuenta de todo esto y un bebé pasos en el camino. Y Comet es el primer paso hacia eso.

David:
[1:01:49] Creo que si hay una gran lección que aprendí de este episodio, es la noción, el razonamiento de por qué un iOS nativo de AI, el software del sistema operativo debe, debe, debe ser AI primero. Al igual que eso es en última instancia, donde en última instancia terminamos.

Aravind:
[1:02:03] También podrías considerar construir como Windows o no exactamente Windows, sino un rival de Windows o Mac OS. Pero, de nuevo, acabarás teniendo los mismos problemas. Microsoft podría no querer enviar sus aplicaciones a tu sistema operativo porque simplemente no quieren alentar a un rival. Y es por eso que todas las aplicaciones de Microsoft, como las aplicaciones de Office 365 apestan en Linux. Y esa es una de las razones por las que Linux ha fracasado en su distribución.

David:
[1:02:30] Esto nos lleva a preguntarnos si el juego final es un sistema operativo nativo de Inteligencia Artificial, que es más probable que Apple finalmente resuelva su mierda y convierta iOS en nativo de Inteligencia Artificial, Microsoft tiene Windows y descubren cómo hacer que Windows sea nativo de Inteligencia Artificial, o tal vez un chat, Gbt y Open Ai están tratando de entrar en este juego, o como una startup más joven como Perplexity, ¿son estos los jugadores del juego o cómo?

Aravind:
[1:02:58] Google también sigue siendo relevante.

David:
[1:03:00] Google es relevante para Google. Si vemos un sistema operativo nativo de IA, vendrá de uno de estos jugadores, Apple, Microsoft, ChatGPT, Google y Perplexity.

Aravind:
[1:03:10] Creo que sí. O Meta, nunca se sabe. Pero creo que sí. Estos son los principales actores. E incluso tengo la suerte de ser considerado en esta lista. Todos los demás tienen 10 a 100X más capital, tal vez 1.000X también. Por lo tanto, y por lo que es definitivamente, pero yo diría que la principal ventaja en términos de restricciones estructurales existe con Apple.

Aravind:
[1:03:34] Básicamente, sí, como que van a perder la cuota de ingresos por publicidad de Google. Si cambian la forma en que funciona la búsqueda y Safari. Pero eso es algo que podrían perder de todos modos si el juez falla en ese sentido en el caso del DOJ. Así que si van a perder de todos modos, podrían ir a por todas en esta visión.

Aravind:
[1:03:57] y cambiar el iPhone para que sea más nativo de IA. Google, por otro lado, no podrá hacerlo tan rápido en los teléfonos Android. Podrían intentarlo en los teléfonos Pixel, donde la distribución es mucho más pequeña, por lo que en realidad no pierden muchos anuncios, y podrían sentir el mercado y luego tratar de profundizar en los otros OEM, pero tienen más limitaciones y restricciones aquí. Y OpenAI no tiene la capacidad de construir su propio dispositivo. Al igual que tiene los mismos problemas que tenemos en términos de convencer a Samsung para ir a hacer esto con ellos. Y de manera similar, Meta tiene los mismos problemas. No tiene búsqueda, no tiene un navegador, no tiene grandes modelos. Y Microsoft, ya sabes, Windows no tiene el teléfono. Abstracción. Así que no va a ser multiplataforma como Google o Apple puede hacer.

Josh/Ejaaz:
[1:04:44] Bueno, Arvind, quiero decir gracias y felicitaciones por tener un asiento en la mesa. No es una hazaña fácil. Quiero decir, usted ha pasado de, lo que, la mitad de mil millones de dólares a 18 mil millones en 18 meses o algún crecimiento escandaloso como eso. Así que enhorabuena por todo el éxito. Para la gente que está escuchando, que siente curiosidad por lo que estamos hablando hoy, ¿cómo dirías que es la mejor manera de llegar a la perplejidad? ¿Cómo querrías introducir a la gente en el uso de tu producto? ¿A dónde deberían dirigirse?

Aravind:
[1:05:05] Perplexity.ai, esa es la web de aterrizaje. En las aplicaciones móviles, iPhone, y App Store y Play Store, solo tienes que escribir perplexity en Play Store o App Store. Ignora los anuncios de la parte superior, como la publicidad de Gemini y Claude y esas cosas.

Josh/Ejaaz:
[1:05:19] Me encanta.

Aravind:
[1:05:20] Ve directamente a nuestra aplicación, sí.

Josh/Ejaaz:
[1:05:22] Increíble. Bueno, Arvind, muchas gracias por tomarse el tiempo para unirse a nosotros hoy. Te lo agradecemos mucho.

No Responses
Buscar en Bankless