Nº 780 · Ia

DeepSeek, free?

27 de enero, 2025 · revisión 1

Publicado originalmente en LinkedIn, en enero de 2025. Lo muevo acá como historial.

Hablemos de forma concreta. ¿Funciona bien y dan ganas de usar DeepSeek en producción? Sí, pero ¿qué nos detiene?

Hay que ver con detención puntos críticos que no podemos pasar por alto: la ubicación de los servidores y los costos.

Costos

Existen dos modelos (sin descuentos, por 1M de tokens):

  • deepseek-chat (64K ↑ 8K ↓) = $0.14 (input) + $1.10 (output)
  • deepseek-reasoner (64K ↑ 32K ▼ 8K ↓) = $0.55 (input) + $2.19 (output)

Comparando cuánto más económico es deepseek-chat que otras APIs (sin considerar calidad):

  • 4o: ~95%
  • claude 3.5-sonnet: ~97%
  • gemini 1.5-pro: ~98%
  • llama 3.2-11B: ~93%

Para modelos CoT (Chain of Thoughts) como o1, es casi un 99.2% más económico.

🧐 Resumen hasta aquí: DeepSeek es casi un ~95% más económico que cualquier modelo a la fecha (enero de 2025).

Hasta aquí, todo luce de maravilla: los costos nos acompañan para hacer mucho más con menos. Podrías tener hasta un ~95% más de uso por casi el mismo costo que un modelo actual. Entonces, en teoría, ¿podrías usar deepseek-reasoner para obtener mejor resultado por casi el mismo costo que tu modelo actual?

Sí y no. Las razones:

  1. Sí, porque para 10.700 tokens de entrada, aun con CoT, el costo de output (considerando casi 5x de tokens por CoT) cuesta aproximadamente $0.0061 en total: entre 4 y 30 veces más económico que otros modelos.
  2. No, porque para tareas que no requieren CoT el costo de output aumenta de 2.5x hasta 5x, y ya es altamente impredecible dependiendo del input.

Incluso hacer despliegue de modelos fine-tuning en/desde HuggingFace, de menor cantidad de parámetros (potencialmente menor calidad), como Qwen o Llama, sigue siendo más caro incluso que los modelos por API actuales. En esa estrategia se habla de precios por hora de VM + GPU + red, lo que tiene sentido para una operación de escala casi 24/7.

Evidentemente, DeepSeek en la teoría suena bien; en la realidad tendrás costos de 3/4 de lo que pagas hoy, tanto en v3 como en R1, lo que sigue siendo favorable. PERO...

🧐 Resumen hasta aquí: no es buena idea usar R1 como comodín, aunque cueste casi 3/4 de lo que cuesta la misma tarea en otros modelos.

Servidores

Este es un punto crítico: por más que algo sea casi gratis, con algo pagas, ¿no? Nuestros datos. Esto ya es de facto en internet.

La tentación de bajos costos frente a rendimiento nos lleva a querer cambiar a DeepSeek (no CoT) para hacer más, pero la privacidad no es un detalle menor.

Por lo tanto, veamos desde lo más sencillo, las políticas de privacidad:

¡Esto es un tremendo problema (y no solo por los datos)! De hecho, actualmente solo Cloudflare conoce la distribución exacta de sus servidores.

Haciendo un rápido escaneo de dominios e IPs, al parecer los grandes proveedores de infraestructura para DeepSeek son Huawei y Alibaba Cloud, mayoritariamente Huawei. Ambas empresas, por historia, bajo el apoyo del gobierno chino.

¿Y podríamos decir que el riesgo de los datos pasaría con cualquier proveedor? Sí, en cierto sentido político; pero el gobierno chino no es un país con ideologías occidentales, así que sobre esos datos realmente podrías solicitar su eliminación, aunque en la práctica no dependerá de la legislación china, sino del criterio.

Y es que justamente DeepSeek no está ofreciendo modelos no logging; es decir, que no almacenen ni usen los datos para “entrenar” (que sería lo de menos) futuros modelos.

🧐 Resumen hasta aquí: DeepSeek ubica sus servidores en China, recolecta datos y los almacena en China; por lo tanto, los datos quedan bajo legislación china.

Dumping

😅 Disclaimer: lo que leerás es una especulación personal con ciertos fundamentos. Tomar con precaución.

Hay casos históricos donde el gobierno chino ha subsidiado altos costes iniciales de manufactura y/o distribución para penetrar mercados a través de precios altamente competitivos, desplazando competidores o forzándolos a buscar formas de reducir costos. Ejemplos: acero, paneles solares, autos eléctricos.

Habitualmente el mecanismo de regulación por país es el aumento de aranceles de importación; pero en el caso del SaaS generalmente se regula a través de impuestos, y no hay casos anti-dumping que graven más impuestos por origen del servicio digital.

Pero hay ventajas y desventajas:

  • Ventajas: mejores precios y reducción gradual de costos en el mercado.
  • Desventajas: competencia desleal y distorsión insostenible de precios.

Y es el último punto el que posiblemente/eventualmente puede crear un colapso en el mercado de la IA. Es decir, esa temida burbuja.

Principalmente porque, financieramente, se buscará acelerar procesos de investigación con mayor inversión, lo que provoca deuda descontrolada bajo un falso panorama de precios que no será recuperable en el corto-mediano plazo.

🧐 Resumen hasta aquí: posiblemente el gobierno chino esté ejecutando una estrategia de dumping como moneda de cambio.

Algunos de los fundamentos que podemos considerar en la ecuación son:

  1. La restricción de hardware de vanguardia, como el de Nvidia (esto tendería a aumentar los costes, no a reducirlos).
  2. El costo de entrenamiento / inferencia es altamente inconsistente ($0.006 por 1000 tokens de entrenamiento | $6M / 1T tokens).

Pero hay un punto muy revelador: la inferencia es mucho más costosa que el entrenamiento, y la única declaración oficial de inversores de DeepSeek es High-Flyer, un fondo de cobertura cuyo cofundador es el mismo que el de DeepSeek. Ese fondo tiene ~$7B en activos, contrastado con las inversiones en OpenAI de Microsoft (+$13B), SoftBank ($500M) y más.

Podríamos decir que el costo de inferencia lo recuperan a través del ingreso de la API. Pero es tan bajo el ingreso que los números no dan, incluso considerando que ofrecen el uso de R1 sin límite de pago a todo público.

Ideas finales

Resumiendo todo el análisis, y considerando que los antecedentes de empresas como DeepSeek no son rentables (y ninguna lo es aún), es altamente improbable que un solo fondo de inversión —del mismo fundador de DeepSeek, con menos liquidez que los inversores de la industria— esté apalancando el total de costos para ofrecer los anómalos precios competitivos. Lo que hace pensar que hay dumping por parte del gobierno chino, vía subsidio directo o indirecto.

Todas estas teorías podrían quedar completamente invalidadas si Google lanza su modelo de precios de Gemini 2.0 a valores equivalentes o menores que DeepSeek V3, lo que según mi lógica solo ocurriría si vemos que esos precios competitivos no se publican antes del término de febrero.

780
Fechaene 2025
Revisión1