Vào thứ năm, công ty khởi nghiệp này đã thông báo rằng ứng dụng ChatGPT dành cho máy tính để bàn macOS giờ đây có thể đọc mã trong một số ứng dụng lập trình dành cho nhà phát triển, chẳng hạn như VS Code, Xcode, TextEdit, Terminal và iTerm2.

Điều này có nghĩa là các nhà phát triển sẽ không còn phải sao chép và dán mã của họ vào ChatGPT nữa, vốn đã trở thành một cách phổ biến để sử dụng chatbot này. Giờ đây, khi tính năng này được bật, OpenAI sẽ tự động gửi đoạn mã mà bạn đang làm việc thông qua chatbot của mình dưới dạng ngữ cảnh, cùng với lời nhắc của bạn.
Tuy nhiên, không giống như các công cụ lập trình AI phổ biến như Cursor hay GitHub Copilot, ChatGPT hiện không thể tự viết mã trực tiếp vào các ứng dụng dành cho nhà phát triển.
Tính năng này, được gọi là “Work with Apps” (Làm việc với Ứng dụng), còn lâu mới là một tác nhân AI, nhưng OpenAI cho biết việc giúp ChatGPT hiểu các ứng dụng khác là một “khối xây dựng quan trọng” hướng tới việc xây dựng các hệ thống tác nhân. Một trong những thách thức lớn nhất mà các tác nhân AI phải đối mặt hiện nay là làm cho chúng hiểu phần còn lại của màn hình máy tính của bạn, trái ngược với lời nhắc hoặc phản hồi của chính chúng.
OpenAI cho biết họ đang tập trung tính năng này vào các ứng dụng lập trình để bắt đầu; điều này có thể là do các trợ lý lập trình AI đã trở thành một trong những trường hợp sử dụng phổ biến nhất cho các mô hình ngôn ngữ lớn (LLM). Tính năng này hiện có sẵn cho người dùng Plus và Teams và sẽ được triển khai cho Enterprise và Edu trong vài tuần tới. OpenAI cho biết ChatGPT sẽ có thể hoạt động với các loại ứng dụng khác trong tương lai, đặc biệt là các ứng dụng dựa trên văn bản có thể được sử dụng cho các tác vụ viết.

Trong một bản demo, một nhân viên của OpenAI đã mở ứng dụng ChatGPT và môi trường Xcode chứa một dự án đơn giản mô phỏng hệ mặt trời – mặc dù nó thiếu Trái đất. Nhân viên này đã chọn một tab Xcode trong ChatGPT, điều này báo cho chatbot AI xem xét ứng dụng và nhắc chatbot “thêm các hành tinh còn thiếu”. Chatbot đã có thể hoàn thành nhiệm vụ, viết một dòng mã để biểu thị Trái đất phù hợp với định dạng của phần còn lại của dự án. Tuy nhiên, họ vẫn phải dán câu trả lời của ChatGPT trở lại môi trường của mình.
Để đọc các ứng dụng khác nhau, OpenAI chủ yếu dựa vào API trợ năng của macOS để đọc văn bản và dịch nó sang ChatGPT, theo trưởng nhóm sản phẩm máy tính để bàn của OpenAI, Alexander Embiricos. Trình đọc màn hình trên macOS, giúp tính năng VoiceOver của Apple hoạt động, đã xuất hiện được gần hai thập kỷ. Nó thường được coi là khá đáng tin cậy đối với hầu hết các ứng dụng phổ biến, nhưng không phải tất cả mọi thứ.
Đối với một số ứng dụng, chẳng hạn như VS Code của Microsoft, Work with Apps yêu cầu người dùng cài đặt một tiện ích mở rộng đặc biệt để truy vấn nội dung. Và, như tên cho thấy, trình đọc màn hình của Apple chỉ có thể đọc văn bản, vì vậy nó không thể giúp ChatGPT hiểu các yếu tố hình ảnh, chẳng hạn như ảnh, hướng của đối tượng hoặc video.
Work with Apps sẽ gửi 200 dòng mã cuối cùng của bạn thông qua ChatGPT cùng với mọi lời nhắc cho một số ứng dụng nhất định. Đối với những ứng dụng khác, tất cả mã trong cửa sổ trước nhất của bạn sẽ được sử dụng làm đầu vào cho chatbot. Bạn có thể đánh dấu các phần mã hoặc văn bản để giúp ChatGPT tập trung vào đúng phần của dự án, nhưng ChatGPT cũng sẽ bao gồm văn bản xung quanh nó. Tất cả điều này nghe có vẻ như sẽ sử dụng rất nhiều mã thông báo đầu vào.

Hiện chưa rõ OpenAI có kế hoạch mở rộng tính năng này sang các ứng dụng khác không tương thích với trình đọc màn hình của Apple như thế nào. Anthropic, một trong những đối thủ cạnh tranh của OpenAI, đã phát hành một hệ thống AI phân tích ảnh chụp màn hình của máy tính để bàn của người dùng để hiểu và sử dụng các ứng dụng khác. Thành thật mà nói, cách tiếp cận của Anthropic còn nhiều điều đáng mong đợi ở trạng thái hiện tại: Nó chậm và mắc nhiều lỗi. Tuy nhiên, đó là một phiên bản tác nhân AI có mục đích chung hơn, không dựa vào API và có thể làm được nhiều việc hơn là chỉ đọc văn bản trong một cửa sổ khác.
“Đây không có nghĩa là một tác nhân; đó là một cách để cộng tác với các công cụ lập trình để bắt đầu, và sẽ có nhiều công cụ hơn nữa sắp ra mắt”, Embiricos cho biết. “Về phía các tác nhân, tôi nghĩ đây là một khối xây dựng thực sự quan trọng. Ý tưởng rằng ChatGPT hiểu hoặc có thể làm việc với tất cả nội dung mà bạn có để nó có thể giúp ích cho nó.”
Bước tiến này hướng tới các tác nhân đặc biệt đáng chú ý khi có những báo cáo gần đây rằng OpenAI sắp phát hành một tác nhân AI có mục đích chung, có tên mã là “Operator”, theo Bloomberg. Công cụ này dự kiến sẽ ra mắt vào đầu năm 2025 và sẽ cạnh tranh với các nỗ lực ban đầu khác về tác nhân AI có mục đích chung, chẳng hạn như Computer Use của Anthropic hoặc tác nhân “Jarvis” được báo cáo của Google.
OpenAI lần đầu tiên phát hành các tính năng này trên macOS, ngay trước khi Apple ra mắt tích hợp với ChatGPT vào tháng 12. Hiện chưa rõ khi nào Work with Apps sẽ có mặt trên Windows, hệ điều hành được tạo ra bởi nhà tài trợ lớn nhất của OpenAI, Microsoft.
Bài viết liên quan
Người dùng Bluesky tranh luận về dữ liệu cá nhân và huấn luyện AI
Người dùng Bluesky tranh luận về dữ liệu cá nhân và huấn luyện AI
Người dùng ‘phù phép’ ảnh, xóa bỏ watermark bằng AI mới của Google
Người dùng ‘phù phép’ ảnh, xóa bỏ watermark bằng AI mới của Google
Google sẽ loại bỏ trợ lý ảo khỏi phần lớn điện thoại trong năm nay
Google sẽ loại bỏ trợ lý ảo khỏi phần lớn điện thoại trong năm nay
Notepad sắp được tích hợp tính năng tóm tắt bằng AI
Notepad sắp được tích hợp tính năng tóm tắt bằng AI
Dự án Kaito: AI phân tích dữ liệu crypto, “bão táp” sau airdrop
Dự án Kaito: AI phân tích dữ liệu crypto, “bão táp” sau airdrop
Google ra mắt Gemini tùy chỉnh: AI giờ đây ‘hiểu’ bạn hơn
Google ra mắt Gemini tùy chỉnh: AI giờ đây ‘hiểu’ bạn hơn
Sam Altman khoe khả năng viết của ChatGPT: AI có thể thay thế nhà văn hay chỉ là bản sao vô hồn?
Sam Altman khoe khả năng viết của ChatGPT: AI có thể thay thế nhà văn hay chỉ là bản sao vô hồn?
Teledyne FLIR ra mắt camera nhiệt phóng xạ: “Mắt thần” cho drone, AI và công nghiệp
Teledyne FLIR ra mắt camera nhiệt phóng xạ: “Mắt thần” cho drone, AI và công nghiệp
Manus AI ra mắt AI Agent “siêu năng lực”: Giải quyết vấn đề phức tạp, vượt trội chatbot thông thường
Manus AI ra mắt AI Agent “siêu năng lực”: Giải quyết vấn đề phức tạp, vượt trội chatbot thông thường
Meta thành công ‘tape-out’ chip AI đầu tiên, sử dụng công nghệ TSMC
Meta thành công ‘tape-out’ chip AI đầu tiên, sử dụng công nghệ TSMC
OpenAI ra mắt công cụ mới giúp doanh nghiệp tạo chatbot AI “thông minh” hơn
OpenAI ra mắt công cụ mới giúp doanh nghiệp tạo chatbot AI “thông minh” hơn
Google Gemini: Cuộc cách mạng AI tại nơi làm việc
Google Gemini: Cuộc cách mạng AI tại nơi làm việc
Tự động hóa lịch trình với nút AI mới của Google trong Gmail
Tự động hóa lịch trình với nút AI mới của Google trong Gmail
PlayStation: Sony đang phát triển nhân vật game thông minh AI
PlayStation: Sony đang phát triển nhân vật game thông minh AI
Sony mạnh tay gỡ bỏ hơn 75.000 bài hát deepfake AI
Sony mạnh tay gỡ bỏ hơn 75.000 bài hát deepfake AI
Mistral OCR: API nhận dạng ký tự quang học với độ chính xác “vượt trội”
Mistral OCR: API nhận dạng ký tự quang học với độ chính xác “vượt trội”
AI “phát điên” sau khi được tinh chỉnh bằng mã lỗi, đưa ra lời khuyên bạo lực và ủng hộ phát xít
AI “phát điên” sau khi được tinh chỉnh bằng mã lỗi, đưa ra lời khuyên bạo lực và ủng hộ phát xít
Maserati MC20 lập kỷ lục tốc độ mới với “tài xế robot” AI
Maserati MC20 lập kỷ lục tốc độ mới với “tài xế robot” AI
Google “mạnh tay” với tìm kiếm AI bất chấp lỗi “ảo giác”
Google “mạnh tay” với tìm kiếm AI bất chấp lỗi “ảo giác”

ĐĂNG KÝ NHẬN TIN
NGAY HÔM NAY
Đăng ký để nhận thông tin sớm nhất về những câu chuyện nóng hổi hiện nay trên thị trường, công nghệ được cung cấp hàng ngày.
Bằng cách nhấp vào “Đăng ký”, bạn chấp nhận Điều khoản dịch vụ và Chính sách quyền riêng tư của chúng tôi. Bạn có thể chọn không tham gia bất cứ lúc nào.
5
s
Nhận xét (0)