Khám phá Google Gemini: Mọi điều cần biết về AI tạo sinh đột phá

07:32 28/02/2025

15 phút đọc

Google đang tạo ra làn sóng mới với Gemini, bộ sản phẩm chủ lực bao gồm các mô hình, ứng dụng và dịch vụ AI tạo sinh. Vậy Gemini là gì? Bạn có thể sử dụng nó như thế nào? Và nó so sánh với các công cụ AI tạo sinh khác như ChatGPT của OpenAI, Llama của Meta và Copilot của Microsoft ra sao?

Khám phá Google Gemini: Mọi điều cần biết về AI tạo sinh đột phá - techlade

Để giúp bạn dễ dàng theo dõi những phát triển mới nhất của Gemini, chúng tôi đã tổng hợp hướng dẫn tiện dụng này và sẽ cập nhật liên tục khi có các mô hình, tính năng và tin tức mới về kế hoạch của Google cho Gemini được phát hành.

Gemini là gì?

Gemini là dòng mô hình AI tạo sinh thế hệ tiếp theo, được Google ấp ủ từ lâu. Được phát triển bởi các phòng thí nghiệm nghiên cứu AI DeepMind và Google Research, nó có bốn phiên bản:

  • Gemini Ultra: Mô hình rất lớn.
  • Gemini Pro: Mô hình lớn – mặc dù nhỏ hơn Ultra. Phiên bản mới nhất, Gemini 2.0 Pro Experimental, là sản phẩm chủ lực của Google.
  • Gemini Flash: Phiên bản “tinh gọn” và nhanh hơn của Pro. Nó cũng có một phiên bản nhỏ hơn và nhanh hơn một chút, được gọi là Gemini Flash-Lite, và một phiên bản có khả năng lập luận, được gọi là Gemini Flash Thinking Experimental.
  • Gemini Nano: Hai mô hình nhỏ: Nano-1 và Nano-2 có khả năng cao hơn một chút, được thiết kế để chạy ngoại tuyến.

Tất cả các mô hình Gemini được huấn luyện để đa phương thức – nghĩa là có thể hoạt động và phân tích nhiều hơn là chỉ văn bản. Google cho biết chúng đã được huấn luyện trước và tinh chỉnh trên nhiều loại âm thanh, hình ảnh và video công khai, độc quyền và được cấp phép; một tập hợp các cơ sở mã; và văn bản bằng các ngôn ngữ khác nhau.

Điều này làm cho Gemini khác biệt với các mô hình như LaMDA của chính Google, vốn chỉ được huấn luyện trên dữ liệu văn bản. LaMDA không thể hiểu hoặc tạo ra bất cứ thứ gì ngoài văn bản (ví dụ: bài luận, email, v.v.), nhưng điều đó không nhất thiết xảy ra với các mô hình Gemini.

Chúng tôi lưu ý rằng tính đạo đức và hợp pháp của việc huấn luyện mô hình trên dữ liệu công khai, trong một số trường hợp mà không có sự hiểu biết hoặc đồng ý của chủ sở hữu dữ liệu, là không rõ ràng. Google có chính sách bồi thường AI để bảo vệ một số khách hàng nhất định của Google Cloud khỏi các vụ kiện nếu họ gặp phải, nhưng chính sách này có những ngoại lệ. Hãy tiến hành thận trọng – đặc biệt nếu bạn có ý định sử dụng Gemini cho mục đích thương mại.

Sự khác biệt giữa ứng dụng Gemini và mô hình Gemini là gì?

Khám phá Google Gemini: Mọi điều cần biết về AI tạo sinh đột phá - techlade

Gemini tách biệt và khác biệt với các ứng dụng Gemini trên web và thiết bị di động (trước đây là Bard).

Các ứng dụng Gemini là các ứng dụng khách kết nối với các mô hình Gemini khác nhau và lớp giao diện giống như chatbot lên trên. Hãy coi chúng như giao diện người dùng cho AI tạo sinh của Google, tương tự như ChatGPT và dòng ứng dụng Claude của Anthropic.

Ứng dụng Gemini trên web có tại đây. Trên Android, ứng dụng Gemini thay thế ứng dụng Google Assistant hiện có. Và trên iOS, ứng dụng Google và Google Search đóng vai trò là ứng dụng khách Gemini của nền tảng đó.

Trên Android, gần đây cũng có thể hiển thị lớp phủ Gemini trên đầu bất kỳ ứng dụng nào để hỏi các câu hỏi về nội dung trên màn hình (ví dụ: video YouTube). Chỉ cần nhấn và giữ nút nguồn của điện thoại thông minh được hỗ trợ hoặc nói, “Hey Google”; bạn sẽ thấy lớp phủ bật lên.

Ứng dụng Gemini có thể chấp nhận hình ảnh cũng như lệnh thoại và văn bản – bao gồm các tệp như PDF và sắp tới là video, được tải lên hoặc nhập từ Google Drive – và tạo hình ảnh. Như bạn mong đợi, các cuộc trò chuyện với ứng dụng Gemini trên thiết bị di động được chuyển sang Gemini trên web và ngược lại nếu bạn đăng nhập vào cùng một Tài khoản Google ở cả hai nơi.

Gemini Advanced

Các ứng dụng Gemini không phải là phương tiện duy nhất để tuyển dụng sự hỗ trợ của các mô hình Gemini với các tác vụ. Dần dần nhưng chắc chắn, các tính năng được truyền tải bởi Gemini đang dần được đưa vào các ứng dụng và dịch vụ chủ lực của Google như Gmail và Google Docs.

Để tận dụng tối đa những điều này, bạn sẽ cần Gói AI Premium của Google One. Về mặt kỹ thuật là một phần của Google One, Gói AI Premium có giá 20 đô la và cung cấp quyền truy cập vào Gemini trong các ứng dụng Google Workspace như Docs, Maps, Slides, Sheets, Drive và Meet. Nó cũng cho phép những gì Google gọi là Gemini Advanced, mang đến các mô hình Gemini tinh vi hơn của công ty cho các ứng dụng Gemini.

Người dùng Gemini Advanced cũng nhận được thêm các tính năng ở đây và ở đó, chẳng hạn như quyền truy cập ưu tiên vào các tính năng mới, khả năng chạy và chỉnh sửa mã Python trực tiếp trong Gemini và “cửa sổ ngữ cảnh” lớn hơn. Gemini Advanced có thể ghi nhớ nội dung của – và lý luận trên – khoảng 750.000 từ trong một cuộc trò chuyện (hoặc 1.500 trang tài liệu). Điều đó so với 24.000 từ (hoặc 48 trang) mà ứng dụng Gemini vani có thể xử lý.

Gemini Advanced cũng cung cấp cho người dùng quyền truy cập vào tính năng Nghiên cứu chuyên sâu của Google, sử dụng “lý luận nâng cao” và “khả năng ngữ cảnh dài” để tạo báo cáo nghiên cứu. Sau khi bạn nhắc chatbot, nó sẽ tạo một kế hoạch nghiên cứu nhiều bước, yêu cầu bạn phê duyệt và sau đó Gemini mất vài phút để tìm kiếm trên web và tạo báo cáo mở rộng dựa trên truy vấn của bạn. Nó có nghĩa là để trả lời các câu hỏi phức tạp hơn chẳng hạn như, “Bạn có thể giúp tôi thiết kế lại nhà bếp của tôi không?”

Google cũng cung cấp cho người dùng Gemini Advanced tính năng bộ nhớ, cho phép chatbot sử dụng các cuộc trò chuyện cũ của bạn với Gemini làm ngữ cảnh cho cuộc trò chuyện hiện tại của bạn. Người dùng Gemini Advanced cũng được tăng cường sử dụng NotebookLM, sản phẩm của công ty biến PDF thành podcast do AI tạo.

Người dùng Gemini Advanced cũng có quyền truy cập vào phiên bản thử nghiệm Gemini 2.0 Pro của Google, mô hình chủ lực của công ty được tối ưu hóa cho các vấn đề mã hóa và toán học khó.

Một tính năng độc quyền khác của Gemini Advanced là lập kế hoạch chuyến đi trong Google Search, tạo hành trình du lịch tùy chỉnh từ lời nhắc. Có tính đến những thứ như thời gian bay (từ email trong hộp thư đến Gmail của người dùng), sở thích ăn uống và thông tin về các điểm tham quan địa phương (từ dữ liệu Google Search và Maps), cũng như khoảng cách giữa các điểm tham quan đó, Gemini sẽ tạo hành trình tự động cập nhật để phản ánh bất kỳ thay đổi nào.

Gemini trên các dịch vụ của Google cũng khả dụng cho khách hàng doanh nghiệp thông qua hai gói, Gemini Business (bản bổ trợ cho Google Workspace) và Gemini Enterprise. Gemini Business có giá thấp nhất là 6 đô la cho mỗi người dùng mỗi tháng, trong khi Gemini Enterprise – bổ sung thêm ghi chú cuộc họp và phụ đề được dịch cũng như phân loại và gắn nhãn tài liệu – nhìn chung đắt hơn, nhưng được định giá dựa trên nhu cầu của doanh nghiệp. (Cả hai gói đều yêu cầu cam kết hàng năm.)

Gemini trong Gmail, Docs, Chrome, công cụ dành cho nhà phát triển,…

Trong Gmail, Gemini nằm trong bảng điều khiển bên có thể viết email và tóm tắt các chuỗi tin nhắn. Bạn sẽ tìm thấy bảng điều khiển tương tự trong Docs, nơi nó giúp bạn viết và tinh chỉnh nội dung của mình và động não các ý tưởng mới. Gemini trong Slides tạo ra các slide và hình ảnh tùy chỉnh. Và Gemini trong Google Sheets theo dõi và sắp xếp dữ liệu, tạo bảng và công thức.

Chatbot AI của Google gần đây đã có mặt trên Maps, nơi Gemini có thể tóm tắt các đánh giá về quán cà phê hoặc đưa ra các đề xuất về cách dành một ngày để tham quan một thành phố nước ngoài.

Phạm vi tiếp cận của Gemini cũng mở rộng đến Drive, nơi nó có thể tóm tắt các tệp và thư mục và cung cấp thông tin nhanh về một dự án. Trong khi đó, trong Meet, Gemini dịch phụ đề sang các ngôn ngữ bổ sung.

Gemini gần đây đã có mặt trên trình duyệt Chrome của Google dưới dạng công cụ viết AI. Bạn có thể sử dụng nó để viết một cái gì đó hoàn toàn mới hoặc viết lại văn bản hiện có; Google cho biết họ sẽ xem xét trang web bạn đang truy cập để đưa ra các đề xuất.

Ở những nơi khác, bạn sẽ tìm thấy gợi ý về Gemini trong các sản phẩm cơ sở dữ liệu, công cụ bảo mật đám mây và nền tảng phát triển ứng dụng (bao gồm Firebase và Project IDX) của Google, cũng như trong các ứng dụng như Google Photos (nơi Gemini xử lý các truy vấn tìm kiếm bằng ngôn ngữ tự nhiên), YouTube (nơi nó giúp động não ý tưởng video) và trợ lý ghi chú NotebookLM.

Code Assist (trước đây là Duet AI for Developers), bộ công cụ hỗ trợ do AI cung cấp của Google để hoàn thành và tạo mã, đang giảm bớt khối lượng công việc tính toán nặng nề cho Gemini. Các sản phẩm bảo mật của Google được hỗ trợ bởi Gemini cũng vậy, như Gemini trong Threat Intelligence, có thể phân tích các phần lớn mã có khả năng độc hại và cho phép người dùng thực hiện tìm kiếm bằng ngôn ngữ tự nhiên để tìm các mối đe dọa đang diễn ra hoặc các chỉ số bị xâm nhập.

Tiện ích mở rộng Gemini và Gems

Được công bố tại Google I/O 2024, người dùng Gemini Advanced có thể tạo Gems, chatbot tùy chỉnh được hỗ trợ bởi các mô hình Gemini. Gems có thể được tạo từ các mô tả bằng ngôn ngữ tự nhiên – ví dụ: “Bạn là huấn luyện viên chạy bộ của tôi. Hãy cho tôi một kế hoạch chạy hàng ngày” – và chia sẻ với những người khác hoặc giữ riêng tư.

Gems khả dụng trên máy tính để bàn và thiết bị di động ở 150 quốc gia và hầu hết các ngôn ngữ. Cuối cùng, họ sẽ có thể khai thác một tập hợp các tích hợp mở rộng với các dịch vụ của Google, bao gồm Google Calendar, Tasks, Keep và YouTube Music, để hoàn thành các tác vụ tùy chỉnh.

Nói về tích hợp, các ứng dụng Gemini trên web và thiết bị di động có thể khai thác các dịch vụ của Google thông qua cái mà Google gọi là “tiện ích mở rộng Gemini”. Gemini ngày nay tích hợp với Google Drive, Gmail và YouTube để trả lời các truy vấn như “Bạn có thể tóm tắt ba email cuối cùng của tôi không?” Cuối năm nay, Gemini sẽ có thể thực hiện các hành động bổ sung với Google Calendar, Keep, Tasks, YouTube Music và Utilities, các ứng dụng dành riêng cho Android kiểm soát các tính năng trên thiết bị như hẹn giờ và báo thức, điều khiển phương tiện, đèn pin, âm lượng, Wi-Fi, Bluetooth, v.v.

Trò chuyện thoại chuyên sâu Gemini Live

Một trải nghiệm có tên Gemini Live cho phép người dùng trò chuyện thoại “chuyên sâu” với Gemini. Nó có sẵn trong các ứng dụng Gemini trên thiết bị di động và Pixel Buds Pro 2, nơi có thể truy cập ngay cả khi điện thoại của bạn bị khóa.

Khi Gemini Live được bật, bạn có thể làm gián đoạn Gemini trong khi chatbot đang nói (bằng một trong số các giọng nói mới) để hỏi một câu hỏi làm rõ và nó sẽ thích ứng với cách nói của bạn trong thời gian thực. Tại một số thời điểm, Gemini được cho là có được khả năng hiểu trực quan, cho phép nó nhìn thấy và phản hồi với môi trường xung quanh của bạn, thông qua ảnh hoặc video được chụp bởi camera của điện thoại thông minh của bạn.

Live cũng được thiết kế để đóng vai trò như một huấn luyện viên ảo, giúp bạn diễn tập cho các sự kiện, động não ý tưởng, v.v. Ví dụ: Live có thể đề xuất những kỹ năng cần làm nổi bật trong một cuộc phỏng vấn xin việc hoặc thực tập sắp tới và nó có thể đưa ra lời khuyên về nói trước đám đông.

Bạn có thể đọc bài đánh giá của chúng tôi về Gemini Live tại đây. Cảnh báo spoiler: Chúng tôi nghĩ rằng tính năng này còn một chặng đường dài phía trước trước khi nó trở nên siêu hữu ích – nhưng phải thừa nhận rằng đó là những ngày đầu.

Tạo hình ảnh thông qua Imagen 3

Khám phá Google Gemini: Mọi điều cần biết về AI tạo sinh đột phá - techlade

Người dùng Gemini có thể tạo tác phẩm nghệ thuật và hình ảnh bằng mô hình Imagen 3 tích hợp của Google.

Google cho biết Imagen 3 có thể hiểu chính xác hơn các lời nhắc văn bản mà nó dịch sang hình ảnh so với phiên bản tiền nhiệm, Imagen 2, và “sáng tạo và chi tiết” hơn trong các thế hệ của nó. Ngoài ra, mô hình tạo ra ít tạo tác và lỗi hình ảnh hơn (ít nhất là theo Google) và là mô hình Imagen tốt nhất cho đến nay để hiển thị văn bản.

Quay trở lại tháng 2 năm 2024, Google đã buộc phải tạm dừng khả năng tạo hình ảnh con người của Gemini sau khi người dùng phàn nàn về sự thiếu chính xác về mặt lịch sử. Nhưng vào tháng 8, công ty đã giới thiệu lại thế hệ người dùng cho một số người dùng nhất định, cụ thể là người dùng tiếng Anh đã đăng ký một trong các gói Gemini trả phí của Google (ví dụ: Gemini Advanced) như một phần của chương trình thí điểm.

Gemini cho thanh thiếu niên

Vào tháng 6, Google đã giới thiệu trải nghiệm Gemini dành cho thanh thiếu niên, cho phép học sinh đăng ký thông qua tài khoản trường học Google Workspace for Education của họ.

Gemini dành cho thanh thiếu niên có “các chính sách và biện pháp bảo vệ bổ sung”, bao gồm quy trình giới thiệu được điều chỉnh và “hướng dẫn sử dụng AI” để (như cách Google diễn đạt) “giúp thanh thiếu niên sử dụng AI một cách có trách nhiệm.” Mặt khác, nó gần giống hệt với trải nghiệm Gemini tiêu chuẩn, cho đến tính năng “kiểm tra kỹ lưỡng” xem xét trên web để xem các phản hồi của Gemini có chính xác hay không.

Gemini trong các thiết bị nhà thông minh

Khám phá Google Gemini: Mọi điều cần biết về AI tạo sinh đột phá - techlade

Ngày càng có nhiều thiết bị do Google sản xuất sử dụng Gemini để tăng cường chức năng, từ Google TV Streamer đến Pixel 9 và 9 Pro đến Nest Learning Thermostat mới nhất.

Trên Google TV Streamer, Gemini sử dụng sở thích của bạn để sắp xếp các đề xuất nội dung trên các đăng ký của bạn và tóm tắt các bài đánh giá và thậm chí toàn bộ các mùa phim truyền hình.

Trên bộ điều nhiệt Nest mới nhất (cũng như loa, camera và màn hình thông minh Nest), Gemini sẽ sớm tăng cường khả năng đàm thoại và phân tích của Google Assistant.

Người đăng ký gói Nest Aware của Google vào cuối năm nay sẽ nhận được bản xem trước các trải nghiệm mới do Gemini cung cấp như mô tả AI cho cảnh quay camera Nest, tìm kiếm video bằng ngôn ngữ tự nhiên và tự động hóa được đề xuất. Camera Nest sẽ hiểu những gì đang xảy ra trong nguồn cấp dữ liệu video thời gian thực (ví dụ: khi một con chó đang đào trong vườn), trong khi ứng dụng Google Home đồng hành sẽ hiển thị video và tạo tự động hóa thiết bị với một mô tả (ví dụ: “Những đứa trẻ có để xe đạp của chúng trên đường lái xe không?”, “Hãy để bộ điều nhiệt Nest của tôi bật hệ thống sưởi khi tôi đi làm về vào mỗi thứ Ba”).

Ngoài ra, vào cuối năm nay, Google Assistant sẽ nhận được một số nâng cấp trên các thiết bị Nest và các thiết bị nhà thông minh khác để làm cho các cuộc trò chuyện trở nên tự nhiên hơn. Các giọng nói được cải thiện đang trên đường đến, ngoài khả năng đặt câu hỏi tiếp theo và “[dễ dàng hơn] qua lại.”

Các mô hình Gemini có thể làm gì?

Khám phá Google Gemini: Mọi điều cần biết về AI tạo sinh đột phá - techlade

Vì các mô hình Gemini là đa phương thức, chúng có thể thực hiện một loạt các tác vụ đa phương thức, từ phiên âm giọng nói đến tạo chú thích cho hình ảnh và video trong thời gian thực. Nhiều khả năng trong số này đã đạt đến giai đoạn sản phẩm (như đã đề cập trong phần trước) và Google đang hứa hẹn nhiều hơn nữa trong tương lai không xa.

Tất nhiên, hơi khó để tin lời công ty. Google đã không thực hiện đúng lời hứa với lần ra mắt Bard ban đầu. Gần đây hơn, nó đã gây xôn xao dư luận với một video có chủ đích thể hiện khả năng của Gemini mà ít nhiều mang tính chất tham vọng – không phải trực tiếp.

Ngoài ra, Google không cung cấp giải pháp khắc phục cho một số vấn đề cơ bản với công nghệ AI tạo sinh ngày nay, chẳng hạn như xu hướng mã hóa và tạo ra những thứ (tức là ảo giác). Các đối thủ của nó cũng không, nhưng đó là điều cần lưu ý khi cân nhắc sử dụng hoặc trả tiền cho Gemini.

Giả sử vì mục đích của bài viết này rằng Google đang trung thực với những tuyên bố gần đây của mình, thì đây là những gì các cấp độ khác nhau của Gemini có thể làm bây giờ và những gì họ sẽ có thể làm khi họ đạt đến tiềm năng đầy đủ của mình:

Những gì bạn có thể làm với Gemini Ultra

Gemini Ultra nổi bật với khả năng đa phương thức, cho phép xử lý và kết hợp thông tin từ nhiều nguồn khác nhau như văn bản, hình ảnh, video và âm thanh. Google giới thiệu Ultra có thể hỗ trợ giải quyết bài tập vật lý, phân tích dữ liệu khoa học, và thậm chí nhận diện lỗi trong bài làm.

  • Ứng dụng:
    • Phân tích và trích xuất thông tin từ các bài báo khoa học.
    • Cập nhật biểu đồ dữ liệu bằng cách tự động tạo công thức.
    • Hỗ trợ giải quyết các vấn đề phức tạp đòi hỏi khả năng suy luận đa bước.
  • Khả năng hình ảnh: Ultra có khả năng tạo ảnh “gốc”, không thông qua bước trung gian như các mô hình khác. Tuy nhiên, tính năng này chưa được triển khai rộng rãi.
  • Truy cập: Ultra hiện có sẵn qua API trên Vertex AI và AI Studio, dành cho các nhà phát triển.

Gemini Pro: Hiệu suất vượt trội cho mã hóa và xử lý yêu cầu phức tạp

Gemini Pro, đặc biệt là phiên bản 2.0 Pro, được tối ưu hóa cho hiệu suất mã hóa và khả năng xử lý các yêu cầu phức tạp.

  • Ưu điểm:
    • Hiệu suất vượt trội trong các bài kiểm tra về mã hóa, suy luận, toán học và độ chính xác thông tin.
    • Khả năng xử lý lượng lớn dữ liệu đầu vào, lên đến 1,4 triệu từ, 2 giờ video hoặc 22 giờ âm thanh.
    • Tích hợp tính năng “code execution” để giảm thiểu lỗi trong mã được tạo ra.
    • Khả năng tùy chỉnh thông qua Vertex AI, cho phép sử dụng dữ liệu từ các nguồn bên thứ ba hoặc dữ liệu doanh nghiệp.
  • AI Studio: Cung cấp các mẫu để tạo yêu cầu trò chuyện có cấu trúc, điều chỉnh phạm vi sáng tạo và cài đặt an toàn.
  • Vertex AI Agent Builder: Cho phép tạo các “agent” hỗ trợ bởi Gemini để tự động hóa các tác vụ.

Gemini Flash: Nhỏ gọn, linh hoạt và mạnh mẽ

Gemini Flash được thiết kế cho “kỷ nguyên agent”, tập trung vào tốc độ và khả năng xử lý đa phương thức.

  • Đặc điểm:
    • Tạo ảnh và âm thanh gốc, đồng thời sử dụng các công cụ như Google Search và tương tác với API bên ngoài.
    • Hiệu suất vượt trội so với các mô hình thế hệ trước, ngay cả trong mã hóa và phân tích hình ảnh.
    • Phiên bản “thinking” có khả năng suy luận ngược để giải quyết vấn đề.
    • Gemini 2.0 Flash-Lite là phiên bản nhỏ hơn, hiệu suất cao, giá cả và tốc độ tương đương.
  • Ứng dụng: Tóm tắt văn bản, ứng dụng trò chuyện, chú thích hình ảnh và video, trích xuất dữ liệu.
  • Context Caching: Cho phép lưu trữ lượng lớn thông tin để truy cập nhanh chóng.

Gemini Nano: Chạy trực tiếp trên thiết bị di động

Gemini Nano là phiên bản nhỏ gọn, tối ưu hóa để chạy trực tiếp trên thiết bị di động.

  • Ứng dụng:
    • Tóm tắt bản ghi âm trong ứng dụng Recorder.
    • Gợi ý trả lời thông minh trong Gboard.
    • Magic Compose trong Google Messages.
    • Phát hiện lừa đảo trong cuộc gọi.
    • Tạo báo cáo thời tiết được cá nhân hóa.
    • Mô tả âm thanh cho người khiếm thị trong TalkBack.
  • Ưu điểm: Xử lý dữ liệu trực tiếp trên thiết bị, bảo vệ quyền riêng tư người dùng.

Chi phí sử dụng các mô hình Gemini

Google cung cấp các tùy chọn miễn phí và trả phí cho các mô hình Gemini thông qua API. Chi phí được tính dựa trên số lượng “token” đầu vào và đầu ra.

  • Gemini 1.5 Pro: Giá dao động tùy thuộc vào độ dài của yêu cầu.
  • Gemini 1.5 Flash, 2.0 Flash, 2.0 Flash-Lite: Có mức giá riêng cho từng phiên bản.
  • Gemini Nano: Hiện đang trong giai đoạn truy cập sớm.

Tương lai của Gemini: Project Astra và tích hợp với iPhone

  • Project Astra: Dự án của Google DeepMind nhằm tạo ra các ứng dụng và “agent” AI đa phương thức thời gian thực.
  • Tích hợp với iPhone: Apple đang đàm phán để sử dụng Gemini và các mô hình bên thứ ba khác trong bộ tính năng Apple Intelligence.

Google đang nỗ lực đưa Gemini trở thành nền tảng AI mạnh mẽ và linh hoạt, đáp ứng nhu cầu đa dạng của người dùng và nhà phát triển.

Chia sẻ bài viết:

Từ khoá:

Nhận xét (0)

Bài viết liên quan

ĐĂNG KÝ NHẬN TIN

NGAY HÔM NAY

Đăng ký để nhận thông tin sớm nhất về những câu chuyện nóng hổi hiện nay trên thị trường, công nghệ được cung cấp hàng ngày.

    Bằng cách nhấp vào “Đăng ký”, bạn chấp nhận Điều khoản dịch vụ và Chính sách quyền riêng tư của chúng tôi. Bạn có thể chọn không tham gia bất cứ lúc nào.