6 phút đọc

Bí mật đằng sau Startup Pháp với khả năng đánh bại OpenAI

Mistral giới thiệu mô hình ngôn ngữ quy mô lớn mới nhất—và đạt thỏa thuận với Microsoft

Spotify:

Nhiều cuộc đua đã ngã ngũ trước cả khi bắt đầu. Ngành công nghiệp phát triển các mô hình ngôn ngữ quy mô lớn (LLM) dường như cũng không ngoại lệ. Những thuật toán này chính là nền tảng cho trí tuệ nhân tạo "tạo sinh" như ChatGPT. OpenAI dường như đang bỏ xa các đối thủ.

Không những sở hữu LLM mạnh nhất thế giới mang tên GPT-4, công ty này còn đang thu hút hàng loạt tài năng, nguồn dữ liệu, và sức mạnh tính toán nhằm xây dựng những mô hình tinh vi hơn nữa. Nhờ đó, OpenAI ngày càng hấp dẫn người dùng, mang về thêm vốn để đầu tư cho các thuật toán siêu việt.

Nhưng một startup từ Pháp tên Mistral đang nỗ lực phá vỡ thành công của OpenAI trong thế giới AI. Mới đây, startup này đã giới thiệu một LLM mới. Mistral-Large, mặc dù nhỏ hơn GPT-4 về lượng tham số (một thước đo phổ biến cho sức mạnh mô hình), nhưng tiệm cận khả năng lập luận của GPT-4.

Mistral cũng ra mắt Le Chat (phát âm là "le sha", giống tiếng Pháp hơn là tiếng Anh), một đối thủ cạnh tranh với ChatGPT. Bên cạnh đó, họ thông báo một thỏa thuận với Microsoft, ông lớn trong làng AI và cũng đã hợp tác sâu rộng với OpenAI. Gã khổng lồ công nghệ sẽ sở hữu lượng cổ phần nhỏ trong Mistral và cung cấp các mô hình của công ty Pháp này thông qua nền tảng đám mây Azure.

Mistral minh chứng cho một ngành công nghiệp đang ngày càng mở rộng—và bớt "Mỹ" hơn. Nếu thành công trong việc thách thức OpenAI nghiêm túc, đây sẽ là bằng chứng không thể chối cãi rằng trong thế giới AI, kích thước không phải là tất cả. "Vấn đề không còn nằm ở việc ai lớn hơn—mà là ai sáng tạo hơn và nhanh hơn," Arthur Mensch, CEO của Mistral, khẳng định.

Sự trỗi dậy của công ty Pháp này nhanh như cơn gió Mistral mà họ lấy làm tên. Mới thành lập chưa được một năm với vỏn vẹn 25 nhân viên, các LLM của họ đang dẫn đầu nhóm các mô hình nguồn mở ngày càng lớn mạnh. Những mô hình này có cơ chế thống kê được chia sẻ công khai và có thể được tinh chỉnh bởi bất kỳ ai, trái ngược với các "hộp đen" độc quyền như GPT-4.

Giúp Mistral thu về khoản đầu tư ấn tượng lên tới 490 triệu Euro (531 triệu USD), đưa giá trị công ty lên hơn 2 tỷ USD. Các nhà đầu tư lớn không thể không kể đến những tên tuổi hàng đầu ngành đầu tư mạo hiểm Thung lũng Silicon như Andreessen Horowitz và General Catalyst, cũng như các nhân vật tiếng tăm trong làng công nghệ như Eric Schmidt, cựu lãnh đạo Google.

Thành công sớm của Mistral đến từ sự pha trộn khéo léo các yếu tố kỹ thuật then chốt của AI - tài năng, dữ liệu, sức mạnh tính toán - cùng tầm nhìn chính trị ngày càng quan trọng khi các chính phủ đánh giá tiềm năng của công nghệ này. Xét về nhân tài, Mistral là "thiên duyên tiền định" giữa nền tảng giáo dục kỹ thuật Pháp và các tập đoàn công nghệ lớn của Mỹ, theo Stanislas Polu, đồng sáng lập Dust, một công ty AI khác có trụ sở tại Paris.

Ba trong số sáu nhà đồng sáng lập Mistral, cũng như bộ não kỹ thuật - Arthur Mensch, Timothée Lacroix và Guillaume Lample—đều là sản phẩm của các trường kỹ thuật hàng đầu của Pháp. Giống như nhiều nhà khoa học AI ưu tú, họ đã từng làm việc tại các phòng nghiên cứu của Google và Meta.

Tuy nhiên, bộ ba này phát triển các LLM tại các cơ sở của hai "ông lớn" Mỹ ngay tại thủ đô Paris, chứ không phải ở London hay Thung lũng Silicon. Điều này đưa họ vào nhóm khoảng 100 người trên toàn thế giới thực sự am hiểu cách huấn luyện các mô hình AI tiên tiến nhất.

Họ cũng tỏ ra đặc biệt giỏi trong việc tập hợp dữ liệu huấn luyện—yếu tố thứ hai tạo nên thành công trong AI. CEO Mensch từ chối tiết lộ cách thức Mistral xử lý tập dữ liệu, khẳng định đó là lợi thế cạnh tranh của công ty. Tuy nhiên, những người trong ngành xác nhận rằng Mistral thực sự lọc bỏ rất "thông minh" những thông tin trùng lặp hoặc phi lý.

Nhờ đó, mô hình của Mistral có kích thước nhỏ hơn rất nhiều, tính bằng hàng tỷ tham số thay vì ước tính con số lên tới 1.8 nghìn tỷ như GPT-4 (cả hai công ty đều không công bố chính xác kích thước mô hình). Điều này cho phép khách hàng chạy các mô hình này ngay trên máy tính của họ mà không cần những trung tâm dữ liệu khổng lồ như nhiều mô hình độc quyền khác.

Theo Mensch, sự tập trung vào tuyển chọn dữ liệu của Mistral cho phép họ sử dụng tài nguyên tính toán - yếu tố quan trọng thứ ba trong thế giới AI - hiệu quả hơn các đối thủ. Huấn luyện mô hình mới nhất của Mistral tiêu tốn ít hơn nhiều so với khoảng 100 triệu đô la mà OpenAI dường như đã chi cho quá trình phát triển GPT-4. Cách tiếp cận của Mistral cũng giảm chi phí cho khách hàng khi họ muốn tinh chỉnh và vận hành mô hình với dữ liệu riêng của mình.

Về mặt kỹ thuật, các startup như Mistral đang hưởng "lợi thế của kẻ đi sau", thừa hưởng toàn bộ những thành tựu của OpenAI và các công ty đi trước, Jeannette zu Fürstenberg thuộc General Catalyst phân tích. Quan trọng hơn cả, kỹ năng về kỹ thuật của Mistral được bổ sung bởi sự nhạy bén về chính trị, một lợi thế trong bối cảnh nhiều chính phủ tin rằng sở hữu các LLM nội địa đem lại ưu thế kinh tế và chiến lược.

Câu hỏi hiện nay là liệu Mistral, một công ty vẫn chưa tạo ra doanh thu đáng kể, có thể chuyển hoá sự kết hợp chính trị-công nghệ này thành lợi nhuận hay không. Công ty này đặt cược rằng nhiều doanh nghiệp, đặc biệt là ở Châu Âu, muốn kiểm soát chặt chẽ các LLM hơn mức OpenAI sẵn sàng trao cho họ, và cũng không muốn bị trói buộc vào một nền tảng công nghệ Mỹ khác. Những khách hàng này, theo cách nghĩ của Mistral, sẽ sẵn sàng trả tiền để Mistral duy trì và vận hành các mô hình của họ.

Một nỗi lo mà các khách hàng tiềm năng có thể gặp phải là thế giới sẽ điều tiết các mô hình nguồn mở như thế nào. Cuộc tranh luận nảy lửa về việc chúng có trao quyền cho những kẻ xấu chế tạo vũ khí sinh học hoặc mạng đã dần hạ nhiệt. Trọng tâm thảo luận giữa các nhà hoạch định chính sách đang chuyển từ rủi ro sang phần thưởng tiềm năng: tính minh bạch cao hơn, nhiều đổi mới, và giảm sự phụ thuộc vào số ít các công ty quyền lực đang kiểm soát công nghệ này.

Đến nay, các cơ quan quản lý ở cả hai bờ Đại Tây Dương vẫn dung thứ cho các LLM nguồn mở. Nhưng nếu các mô hình tiếp tục trở nên tinh vi hơn, hoặc bị phát hiện lạm dụng, chẳng hạn như góp phần lan truyền thông tin sai lệch trong các cuộc bầu cử khắp thế giới năm nay, thì ông O có thể sẽ đối mặt nhiều khó khăn.

Dĩ nhiên, ngăn chặn phản ứng tiêu cực từ chính giới sẽ nằm trong lợi ích hàng đầu của Mistral - nhưng thành công trong công tác vận động hành lang luôn có hai mặt. Sự khoan nhượng từ giới quản lý có thể mở đường cho nhiều đối thủ "nguồn mở" hơn nữa. Ngày 20 tháng 2, Silo AI, một công ty Phần Lan, đã công bố một LLM mới thậm chí còn mở hơn cả sản phẩm của Mistral, cung cấp cả thông tin về dữ liệu huấn luyện và phần mềm sử dụng.

Một phiên bản mới, dự kiến ra mắt trong vài tháng tới, hứa hẹn sẽ có năng lực xử lý các ngôn ngữ châu Âu khác tương đương trình độ hiện tại với tiếng Phần Lan và tiếng Anh.

Quan trọng nhất, vẫn còn là một câu hỏi lớn liệu kích thước có đóng vai trò quyết định hay không. GPT-5, mô hình tiếp theo của OpenAI, sẽ là bài kiểm tra thực lực.

Nếu vượt xa Mistral-Large thì những lời phát biểu của Mensch về sáng tạo và tốc độ sẽ không còn ý nghĩa. Chúng ta hãy cùng chờ đợi sự cạnh tranh giữa hai ứng dụng AI này nhé.

Bí mật đằng sau Startup Pháp với khả năng đánh bại OpenAI

Bài đăng gần đây

Comments