Trong cộng đồng AI mã nguồn mở, ai cũng nhận thấy khoảng cách giữa họ và các “ông lớn” công nghệ không chỉ đơn thuần là sức mạnh tính toán. Ai2 đang nỗ lực thu hẹp khoảng cách này, bằng cách cung cấp cơ sở dữ liệu và mô hình mã nguồn mở và gần đây nhất là Tülu 3 – một quy trình hậu huấn luyện mở, dễ điều chỉnh, giúp chuyển đổi các mô hình ngôn ngữ lớn (LLM) từ dạng “thô” sang dạng ứng dụng thực tiễn.

Khác với quan niệm phổ biến, các mô hình ngôn ngữ “nền tảng” sau khi được huấn luyện xong chưa sẵn sàng để triển khai. Tiền huấn luyện là bước cần thiết, nhưng chưa đủ. Thậm chí, nhiều chuyên gia tin rằng tiền huấn luyện có thể sớm không còn là yếu tố quan trọng nhất.
Giá trị thực sự được tạo ra ở giai đoạn hậu huấn luyện. Đây là giai đoạn “nhào nặn” mô hình từ một mạng lưới khổng lồ, chứa đựng lượng kiến thức đồ sộ, nhưng chưa được tinh chỉnh, có thể tạo ra cả nội dung tiêu cực lẫn tích cực.
Các công ty lớn thường giữ bí mật về quy trình hậu huấn luyện của họ. Lý do là, mặc dù ai cũng có thể thu thập dữ liệu web và xây dựng mô hình bằng các phương pháp tiên tiến, nhưng việc tinh chỉnh mô hình để phục vụ cho các mục đích cụ thể, ví dụ như hỗ trợ trị liệu tâm lý hay phân tích nghiên cứu, lại là một thách thức hoàn toàn khác biệt.
Ai2 (trước đây là Viện AI Allen) đã lên tiếng về sự thiếu minh bạch trong các dự án AI “mở” như Llama của Meta. Mặc dù mô hình này miễn phí sử dụng và điều chỉnh, nhưng nguồn dữ liệu, quy trình tạo ra mô hình thô và phương pháp huấn luyện để sử dụng chung vẫn được giữ kín. Điều này không hẳn là xấu, nhưng cũng không thực sự “mở”.
Ngược lại, Ai2 cam kết tối đa hóa tính minh bạch, từ việc công khai dữ liệu, quy trình thu thập, quản lý, làm sạch dữ liệu, đến phương pháp huấn luyện được sử dụng để tạo ra các LLM như OLMo.
Tuy nhiên, thực tế là rất ít nhà phát triển có đủ năng lực để tự vận hành LLM, và càng ít người có thể thực hiện hậu huấn luyện như Meta, OpenAI hay Anthropic. Nguyên nhân một phần là do thiếu kiến thức chuyên môn, một phần do quy trình này phức tạp và tốn thời gian.
Với mong muốn dân chủ hóa khía cạnh này của hệ sinh thái AI, Ai2 đã phát triển Tülu 3. Đây là phiên bản cải tiến vượt bậc so với quy trình hậu huấn luyện trước đó (Tülu 2). Kết quả thử nghiệm cho thấy Tülu 3 đạt hiệu suất tương đương với các mô hình “mở” tiên tiến nhất hiện nay. Để đạt được điều này, Ai2 đã dành nhiều tháng nghiên cứu, thử nghiệm, phân tích các thông tin được hé lộ từ các công ty lớn, và thực hiện nhiều lần huấn luyện lặp đi lặp lại.
Tülu 3 bao gồm toàn bộ quy trình, từ việc lựa chọn trọng tâm cho mô hình (ví dụ: giảm khả năng đa ngôn ngữ, tăng cường toán học và lập trình), đến việc áp dụng các kỹ thuật quản lý dữ liệu, học tăng cường, tinh chỉnh, điều chỉnh siêu tham số và quy trình huấn luyện. Mục tiêu là tạo ra một mô hình hiệu quả, tập trung vào các kỹ năng cần thiết.
Ý nghĩa quan trọng của Tülu 3 là giúp cộng đồng AI mã nguồn mở giảm sự phụ thuộc vào các công ty tư nhân. Trước đây, việc xây dựng LLM tùy chỉnh thường phải sử dụng tài nguyên của các công ty lớn hoặc thuê dịch vụ từ bên thứ ba, dẫn đến chi phí cao và rủi ro bảo mật.
Ví dụ, với các công ty nghiên cứu và dịch vụ y tế, việc sử dụng API của OpenAI hoặc hợp tác với Scale để tùy chỉnh mô hình nội bộ đều tiềm ẩn rủi ro liên quan đến dữ liệu người dùng nhạy cảm. Tülu 3, cùng với các mô hình mã nguồn mở như OLMo, mang đến giải pháp thay thế hiệu quả, cho phép triển khai và kiểm soát toàn bộ quy trình huấn luyện ngay tại chỗ.
Bản thân Ai2 cũng đang sử dụng Tülu 3, đây là minh chứng rõ ràng nhất cho hiệu quả của công cụ này. Mặc dù các kết quả thử nghiệm hiện tại sử dụng Llama làm mô hình nền tảng, Ai2 dự kiến sẽ sớm ra mắt mô hình dựa trên OLMo và được huấn luyện bởi Tülu 3, hứa hẹn mang đến những cải tiến vượt trội hơn nữa, đồng thời hoàn toàn là mã nguồn mở.
Tin tài trợ
- Vũ trụ
Premium
Hubble của NASA và ESA công bố hình ảnh ngoạn mục về lõi thiên hà Xì gà
Bức ảnh mới nhất từ Kính viễn vọng không gian Hubble của NASA và ESA vừa hé lộ những chi tiết chưa từng thấy về thiên hà Messier 82 (M82), nơi hàng triệu ngôi sao rực rỡ đang ẩn mình sau những đám mây bụi và khí với hình thù độc đáo. Bức ảnh mang […] - Thủ thuật
Premium
Lý do màn hình nhấp nháy khi chơi game và cách khắc phục
Hiện tượng màn hình nhấp nháy khi chơi game đã trở thành một nỗi ám ảnh đối với nhiều game thủ, gây khó chịu và ảnh hưởng đáng kể đến trải nghiệm. Theo các chuyên gia công nghệ, nguyên nhân chính của vấn đề này có thể nằm ở chính công nghệ đồng bộ hóa […] - Mobile
Premium
iPhone 17 Pro và iPhone Air vừa ra mắt đã dính lỗi trầy xước
Ngay khi vừa được bày bán tại các Apple Store trên toàn cầu, bộ đôi iPhone 17 Pro và iPhone Air – hai mẫu máy đang nhận được sự quan tâm đặc biệt của cộng đồng công nghệ – đã bắt đầu ghi nhận những phản ánh đầu tiên về hiện tượng trầy xước. Điều […] - Khám phá
Premium
Jimmy Kimmel bị đình chỉ: ‘Văn hóa tẩy chay’ hay áp lực chính trị?
Mới đây, đài truyền hình ABC, thuộc sở hữu của Disney, đã đột ngột đình chỉ chương trình nổi tiếng Jimmy Kimmel Live. Quyết định này được đưa ra ngay sau khi nam MC có một bình luận gây tranh cãi về vụ án mạng liên quan đến Charlie Kirk. Sự việc nhanh chóng trở […]
Bài viết liên quan
Thiết bị ‘siêu máy tính AI’ cá nhân của Nvidia sẵn sàng ra mắt thị trường vào 15/10
California thiết lập khung pháp lý cho các ứng dụng chatbot AI
Fan hâm mộ Taylor Swift phản ứng trước nghi vấn cô dùng hình ảnh tạo bởi AI trong chiến dịch quảng bá
Nền tảng ChatGPT của OpenAI chính thức trình làng tính năng tích hợp đa ứng dụng
Nội bộ OpenAI đang đối mặt với những thách thức từ chiến lược truyền thông xã hội mới của công ty
Toyota bổ sung khoản vốn 1,5 tỷ USD, khẳng định niềm tin vào các dự án startup công nghệ
OpenAI công bố mô hình Sora 2 và ứng dụng chia sẻ video, mục tiêu cạnh tranh với Tiktok
Thông tin sai lệch của nền tảng Deepseek AI về chủ quyền biển đảo Việt Nam gây tranh cãi
DeepSeek: Từ A đến Z về ứng dụng trò chuyện AI được giới công nghệ quan tâm
Robot siêu nhỏ “đi bộ trên nước” lấy cảm hứng từ côn trùng nước
Microsoft ra động thái hạn chế quân đội Israel sử dụng dịch vụ đám mây và AI
Insta360 Wave ra mắt: Loa hội nghị AI có 8 micro, tự động tóm tắt cuộc họp và pin 12 giờ
Elon Musk ‘hạ giá’ Grok, mời chào Chính phủ Liên bang Mỹ với giá ‘rẻ như cho’
Databricks chi 100 triệu USD, tích hợp mô hình OpenAI vào sản phẩm để thúc đẩy doanh nghiệp ứng dụng
Spotify ban hành quy định mới về dán nhãn âm nhạc do AI sáng tác
Google Cloud đẩy mạnh chiến lược, không ngừng mở rộng phạm vi hoạt động
Gemini 2.5 Deep Think giành huy chương vàng tại ICPC 2025
Việt Nam đứng trước thách thức và cơ hội lớn trong làn sóng phát triển AI
Tham vọng của Thượng nghị sĩ Scott Wiener: Buộc Big Tech tiết lộ rủi ro từ trí tuệ nhân tạo

ĐĂNG KÝ NHẬN TIN
NGAY HÔM NAY
Đăng ký để nhận thông tin sớm nhất về những câu chuyện nóng hổi hiện nay trên thị trường, công nghệ được cung cấp hàng ngày.
Bằng cách nhấp vào “Đăng ký”, bạn chấp nhận Điều khoản dịch vụ và Chính sách quyền riêng tư của chúng tôi. Bạn có thể chọn không tham gia bất cứ lúc nào.


Nhận xét (0)