Bright Data venció a Elon Musk y Meta en los tribunales: ahora su plataforma de inteligencia artificial de 100 millones de dólares se enfrenta a las grandes tecnológicas.

Seleccione idioma

Spanish

Down Icon

Seleccione país

England

Down Icon

Bright Data venció a Elon Musk y Meta en los tribunales: ahora su plataforma de inteligencia artificial de 100 millones de dólares se enfrenta a las grandes tecnológicas.

Bright Data venció a Elon Musk y Meta en los tribunales: ahora su plataforma de inteligencia artificial de 100 millones de dólares se enfrenta a las grandes tecnológicas.

Únase al evento en el que los líderes empresariales confían desde hace casi dos décadas. VB Transform reúne a quienes desarrollan una verdadera estrategia de IA empresarial. Más información.

Bright Data , la empresa israelí de raspado web que derrotó a Meta y a X de Elon Musk en un tribunal federal, presentó el miércoles un conjunto integral de infraestructura de inteligencia artificial diseñado para brindar a los sistemas de inteligencia artificial acceso sin restricciones a datos web en tiempo real, una capacidad que la compañía argumenta que las plataformas de Big Tech están tratando de monopolizar.

El anuncio de Deep Lookup , Browser.ai y los protocolos mejorados de recopilación de datos representa una expansión drástica para la empresa, con una década de antigüedad, que se ha transformado de un servicio especializado en web scraping a lo que su director ejecutivo, Or Lenchner, llama "una infraestructura única para empresas de IA". Esta decisión se produce en un momento en que las empresas de inteligencia artificial tienen cada vez más dificultades para acceder a la información web actual necesaria para impulsar chatbots, agentes autónomos y otras aplicaciones de IA.

“La inteligencia de los LLM actuales ya no es su factor limitante; el acceso sí lo es”, afirmó Lenchner en una entrevista exclusiva con VentureBeat. “Hemos dedicado la última década a luchar por el acceso abierto a los datos web públicos, y estas nuevas ofertas nos llevan a un nuevo capítulo en nuestro camino, uno caracterizado por datos verdaderamente accesibles y el consiguiente auge de agentes con conocimiento del contexto”.

El lanzamiento se produce tras las destacadas victorias legales de Bright Data en 2024, cuando jueces federales desestimaron las demandas de Meta y X , que alegaban que la compañía había extraído ilegalmente sus plataformas. Estos fallos sentaron un precedente legal crucial que define qué constituye " datos públicos " en internet: información que puede consultarse sin iniciar sesión y, por lo tanto, puede recopilarse y utilizarse legalmente.

Los casos judiciales revelaron que tanto Meta como X habían sido clientes de Bright Data incluso mientras demandaban a la empresa, lo que pone de relieve la postura contradictoria que han adoptado muchos gigantes tecnológicos respecto al web scraping. Las sentencias tienen implicaciones más amplias para la industria de la IA, que depende en gran medida de los datos web para entrenar y operar modelos lingüísticos.

“Se reveló en el tribunal que ambos eran clientes de Bright Data, porque todos necesitamos datos, todos, especialmente quienes construyen modelos”, explicó Lenchner. “Somos la única empresa con los recursos financieros, e incluso diría que con el coraje, para hacerlo”.

El juez William Alsup , quien presidió el caso X, escribió que dar a las empresas de redes sociales "libertad absoluta para decidir, bajo cualquier criterio, quién puede recopilar y usar datos" corre el riesgo de crear "monopolios de información que perjudicarían el interés público". El fallo estableció que los datos visibles sin credenciales de inicio de sesión constituyen información pública que puede ser extraída legalmente.

Bright Data ha presentado una contrademanda contra X , alegando que la plataforma violó las leyes antimonopolio al intentar crear un monopolio de datos para beneficiar a xAI, la empresa de inteligencia artificial de Musk. «La única razón por la que X intenta impedir que Bright Data permita a sus clientes extraer datos de X es que será la única entidad que podrá disfrutar de los datos de calidad relevantes que X produce», declaró Lenchner.

Los nuevos productos de la compañía abordan lo que Lenchner identifica como los tres requisitos fundamentales para los sistemas de IA: algoritmos, capacidad de cómputo y acceso a datos. Si bien Bright Data no desarrolla algoritmos de IA ni proporciona recursos computacionales, aspira a convertirse en la solución definitiva para el tercer requisito.

La Búsqueda Profunda funciona como un motor de búsqueda en lenguaje natural diseñado para responder preguntas empresariales complejas y multifacéticas en tiempo real. A diferencia de los motores de búsqueda generales o los chatbots de IA que ofrecen resúmenes, la Búsqueda Profunda se especializa en resultados completos para consultas que empiezan por "encontrar todo". Por ejemplo, los usuarios pueden preguntar por "todas las compañías navieras que pasaron por los canales de Panamá y Suez en 2023 cuyos ingresos del tercer trimestre disminuyeron más del 2 %".

El sistema se nutre del enorme archivo web de Bright Data, que actualmente contiene más de 200 mil millones de páginas HTML y añade 15 mil millones mensuales. Para el próximo año, se espera que el archivo supere los 500 mil millones de páginas. "No se trata solo de páginas web aleatorias, sino de lo que realmente importa al mundo, porque nuestros 20 000 clientes representan miles de millones de usuarios de internet", señaló Lenchner.

Browser.ai representa lo que la compañía denomina "el primer navegador nativo de IA imbloqueable de la industria". Diseñado específicamente para agentes autónomos de IA, este servicio basado en la nube imita el comportamiento humano para acceder a sitios web sin activar los sistemas de detección de bots. Admite comandos de lenguaje natural y puede realizar interacciones web complejas, como reservar vuelos o restaurantes.

La infraestructura del navegador ya procesa más de 150 millones de acciones web a diario, según la empresa. «Casi todos son clientes», afirmó Lenchner sobre las empresas de agentes de IA que han recaudado una financiación significativa. «Porque lo que descubrimos, y ellos también, es que solucionamos el problema de acceder a un sitio web sin ser bloqueado y ejecutar acciones en él».

Los servidores MCP (Protocolo de Contexto de Modelo) proporcionan una capa de control de baja latencia que permite a los agentes de IA buscar, rastrear y extraer datos en tiempo real. Este protocolo permite a los desarrolladores crear sistemas de IA que puedan actuar con información actualizada en lugar de depender únicamente de los datos de entrenamiento.

La ventaja competitiva de Bright Data reside en lo que Lenchner describe como una "obsesión" por superar los mecanismos de bloqueo de sitios web. La empresa cuenta con más de 5500 solicitudes de patente sobre su tecnología y opera la red proxy más grande del mundo, con más de 150 millones de direcciones IP en 195 países.

"Tenemos una visión muy completa de internet", explicó Lenchner. "Llevamos mucho tiempo mapeando internet y, desde hace tiempo, también archivando grandes fragmentos de internet".

El enfoque de la empresa implica técnicas sofisticadas para imitar el comportamiento humano, utilizando dispositivos reales, direcciones IP y huellas dactilares del navegador en lugar de simples scripts automatizados. Esto dificulta enormemente la detección y el bloqueo de sitios web.

“La única forma de bloquearnos, prácticamente, es ocultar los datos tras el inicio de sesión; entonces ni lo intentaremos”, dijo Lenchner. “A veces hay una nueva lógica de bloqueo que no resolveremos de inmediato. Nuestro equipo de investigación tardará 12 horas, tres días como máximo, y la desbloquearemos”.

Los ingresos superan los 100 millones de dólares a medida que la demanda de IA se dispara después de ChatGPT

Si bien Bright Data sigue siendo propiedad privada de una firma de capital privado, Lenchner confirmó a VentureBeat que los ingresos recurrentes anuales de la compañía superan con creces los 100 millones de dólares. El negocio ha experimentado un crecimiento explosivo desde el lanzamiento de ChatGPT a finales de 2022, a medida que las empresas de IA se apresuraban a acceder a datos de entrenamiento e información en tiempo real.

“A partir de marzo de 2023, que es prácticamente cuando GPT-3 cambió el mundo, el caso de uso de la IA, o lo que llamamos datos para IA, se disparó para nosotros como empresa”, dijo Lenchner. “Todo lo demás también está creciendo, porque todos necesitamos más datos, punto. Pero este caso de uso es simplemente nuevo”.

La empresa presta servicios a más de 20.000 empresas, incluyendo compañías de la lista Fortune 500 y grandes laboratorios de inteligencia artificial. Entre sus clientes tradicionales se incluyen plataformas de comercio electrónico que rastrean los precios de la competencia, empresas de servicios financieros que buscan información de mercado y empresas que realizan estudios de mercado.

Bright Data ha invertido considerablemente en infraestructura de cumplimiento normativo para abordar las preocupaciones sobre la privacidad en torno a la recopilación de datos. La empresa cumple con las normativas europeas del RGPD y la CCPA de California , notificando automáticamente a los usuarios cuando su información personal se recopila de fuentes públicas y ofreciendo opciones de eliminación.

“El reglamento y la legislación son claros desde la entrada en vigor del RGPD europeo y, al menos, de las regulaciones de California y la CCPA”, explicó Lenchner. “Si recopilamos su dirección de correo electrónico, por ejemplo, le enviaremos automáticamente un correo electrónico que diga: 'Hola, aquí somos nosotros. Recopilamos su información personal del dominio público. Aquí tiene un botón enorme que puede pulsar si desea revisarla y, obviamente, puede solicitar su eliminación'”.

La empresa cuenta con un amplio equipo de cumplimiento normativo y una extensa documentación de sus prácticas, lo cual resultó valioso durante los procedimientos judiciales. «Las empresas nos aprecian especialmente porque nuestra postura ética fue examinada minuciosamente en los tribunales estadounidenses en dos ocasiones», afirmó Lenchner.

La batalla por el acceso a los datos web refleja tensiones más amplias en la industria de la IA sobre el control de la información y la ventaja competitiva. A medida que los sistemas de IA se vuelven más sofisticados, el acceso a datos web actualizados y completos se vuelve cada vez más valioso, y a la vez polémico.

Lenchner predice que la web se volverá más cerrada con el tiempo, de forma similar a cómo Google mantiene acceso exclusivo a sus capacidades de rastreo web, mientras que otros deben usar servicios alternativos. "Algunos gigantes tecnológicos tendrán acceso gratuito a todos los sitios web con sus agentes", afirmó. "El resto necesitará usar nuestra infraestructura o la de terceros".

La empresa también está observando nuevas tendencias, incluidas empresas que utilizan chatbots de IA para fines de marketing y el surgimiento de nuevos protocolos como MCP que permiten a los agentes de IA interactuar con los servicios web de manera más efectiva.

“Todos estos tipos que consumen cantidades masivas de datos, y todos los que los usamos, están contribuyendo a desarrollar el cerebro de los robots”, dijo Lenchner. “No importa que tengas un chatbot que hable con un humano, porque eso es lo que eventualmente hará un robot”.

La transformación de Bright Data, de servicio de web scraping a proveedor de infraestructura de IA, refleja la rápida evolución de las necesidades de la industria de la inteligencia artificial. A medida que las empresas se apresuran a implementar agentes de IA y sistemas autónomos, el acceso a datos web en tiempo real se vuelve tan crucial como la potencia de procesamiento y la sofisticación algorítmica.

Los precedentes legales establecidos por las victorias judiciales de Bright Data podrían ser tan significativos como sus innovaciones técnicas, y podrían influir en la forma en que toda la industria de la IA accede y utiliza la información web. Dado que las principales plataformas tecnológicas restringen cada vez más el acceso a los datos mientras desarrollan simultáneamente sus propios sistemas de IA, los proveedores de infraestructura independientes como Bright Data podrían volverse esenciales para mantener el equilibrio competitivo en el ecosistema de la IA.

“Somos una empresa de infraestructura”, enfatizó Lenchner. “Somos ingenieros muy talentosos que casi no van a ningún lado; solo nos sentamos frente a nuestras computadoras y escribimos código. Lo estamos haciendo bien. No tenemos intención de hacer nada más”.

La versión beta de Deep Lookup se lanza el martes para clientes empresariales, con acceso público general disponible mediante lista de espera. Browser.ai y los servidores MCP ya están disponibles para clientes empresariales a través de la plataforma existente de Bright Data.

Perspectivas diarias sobre casos de uso empresarial con VB Daily

Si quieres impresionar a tu jefe, VB Daily te tiene cubierto. Te ofrecemos información exclusiva sobre lo que las empresas están haciendo con la IA generativa, desde cambios regulatorios hasta implementaciones prácticas, para que puedas compartir tus conocimientos y maximizar el retorno de la inversión.

Lea nuestra Política de Privacidad

Gracias por suscribirte. Consulta más boletines de VB aquí .

Se produjo un error.

venturebeat

venturebeat

Noticias similares

Todas las noticias
Animated ArrowAnimated ArrowAnimated Arrow