DeepSeek trỗi dậy: Kỷ nguyên mới của sáng tạo AI

Câu chuyện của DeepSeek đúng kiểu "từ zero đến hero", đầy tham vọng, sáng tạo và cả những cú lội ngược dòng ngoạn mục. Trong một thread siêu hot trên Twitter, Henry the 9th đã kể lại hành trình từ một startup nhỏ xíu đến khi DeepSeek trở thành "ông kẹ" trong làng AI mã nguồn mở, dám đối đầu với mấy ông lớn như OpenAI hay Anthropic.

Từ giấc mơ quỹ đầu tư đến cú lật kèo ngoạn mục

Câu chuyện bắt đầu từ năm 2007, khi ba kỹ sư Xu Jin, Zheng Dawei và Liang Wenfeng gặp nhau tại Đại học Chiết Giang. Họ mơ mộng lập một quỹ đầu tư (quant fund) dựa trên AI xịn sò, ưu tiên tuyển người tài năng hơn là kinh nghiệm. Nghe thì hơi "ngông", nhưng chính cách làm này đã đặt nền móng cho High-Flyer, một quỹ đầu tư nổi tiếng với văn hóa sáng tạo và tò mò
Nhưng đời đâu như mơ. Đến năm 2022, High-Flyer gặp loạt biến căng: lỗ nặng, bị chính phủ Trung Quốc siết chặt vì ngành quỹ đầu tư bị "soi", cộng thêm chỉ số CSI300 tụt dốc không phanh. Tình hình lúc đó đúng kiểu "ngàn cân treo sợi tóc"

Cú xoay chuyển định mệnh

Thay vì ngồi khóc, High-Flyer quyết định chơi lớn: năm 2023, họ tách ra thành DeepSeek, tập trung hoàn toàn vào nghiên cứu AI. Đây không chỉ là cách "né" mấy quy định khó nhằn, mà còn là chiến lược tận dụng nguồn lực sẵn có, bao gồm cả 10.000 GPU NVIDIA A100 siêu khủng. DeepSeek vẫn giữ phong cách tuyển dụng "chất chơi", ưu tiên mấy bạn trẻ mới ra trường, đam mê cháy bỏng, hơn là mấy ông "lão làng" trong ngành AI

DeepSeek vươn mình: Từ "tay mơ" thành "tay to"

Chỉ trong vòng 1 năm, DeepSeek đã chứng minh họ không phải dạng vừa. Đầu năm 2024, họ tung ra DeepSeek v2, giảm chi phí huấn luyện và cải thiện hiệu suất đáng kể. Đặc biệt, bản R1-lite-preview đã khiến cả làng AI phải trầm trồ, khi lần đầu tiên có đối thủ xứng tầm với mô hình o1 của OpenAI, với khả năng suy luận logic và giải quyết vấn đề trong thời gian thực

Sự xuất hiện của DeepSeek đã làm rung chuyển thị trường AI, mở màn cho cuộc chiến giá cả. Các ông lớn như ByteDance, Tencent, Baidu, và Alibaba buộc phải xem lại chiến lược giá. DeepSeek được ví như "Pinduoduo của làng AI" nhờ mô hình giá rẻ, giúp công nghệ AI tiên tiến đến gần hơn với mọi người

DeepSeek v3: Món quà Giáng Sinh "chất như nước cất"

Đỉnh cao là vào Giáng Sinh 2024, DeepSeek tung ra DeepSeek v3, ngang ngửa với ChatGPT-4o và Claude 3.5 Sonnet, nhưng chi phí huấn luyện chỉ bằng một phần nhỏ. Những cải tiến như Dự đoán Đa Token (Multi-Token Prediction) và Huấn luyện FP8 Mixed Precision đã đặt ra tiêu chuẩn mới cho ngành
DeepSeek không chỉ giỏi về công nghệ mà còn rất "thấu hiểu lòng dân". Giá API của họ chỉ $0.14 cho 1 triệu token, so với mức $7.50-$15 của OpenAI. Điều này mở ra hàng loạt ứng dụng mới, từ tóm tắt sách giá rẻ đến phân tích mã bảo mật hàng ngày

Kết

DeepSeek là minh chứng sống động cho câu "có ít làm nhiều". Với những bộ óc trẻ trung, dám nghĩ khác và kiên trì đến cùng, họ đã làm nên chuyện lớn, phá vỡ thế độc quyền và mở ra cơ hội mới cho ngành AI. Hành trình từ một quỹ đầu tư "hụt hơi" đến "ông lớn" AI của DeepSeek là nguồn cảm hứng cho bất kỳ ai quan tâm đến tương lai của công nghệ.
Nếu bạn muốn biết AI sẽ đi về đâu, hãy theo dõi DeepSeek. Chắc chắn sẽ còn nhiều điều thú vị để học hỏi và ngưỡng mộ!