
 |
Giao diện cũ của Siri (phải) và màn hình nhiều màu sắc khi gọi Siri trên iOS 18.1. Ảnh: Tuấn Anh. |
Đêm 28/10, Apple chính thức phát hành những tính năng đầu tiên của bộ công cụ trí tuệ nhân tạo Apple Intelligence thông qua bản cập nhật iOS 18.1, iPadOS 18.1 và macOS 15.1.
Trước khi phát hành rộng rãi, Apple Intelligence đã được thử nghiệm trong vài tháng. Bộ công cụ hỗ trợ iPhone 15 Pro/15 Pro Max, toàn bộ dòng iPhone 16, iPad mini A17 Pro, iPad và Mac dùng chip M. Sau khi cập nhật thiết bị, người dùng cần đăng ký trong phần Cài đặt (Settings) để chờ đến lượt trải nghiệm.
Hiện tại, Apple Intelligence chỉ hỗ trợ tiếng Anh tại Mỹ. Những ngôn ngữ, tính năng tiếp theo sẽ được phát hành từ cuối năm nay, kéo dài đến 2025.
Tính năng đầu tiên của Apple Intelligence là Công cụ viết (Writing Tools). Người dùng có thể bôi đen văn bản trong bất kỳ ứng dụng để yêu cầu viết lại, hiệu đính và tóm tắt nội dung.
Apple Intelligence hỗ trợ chỉnh giọng văn theo phong cách chuyên nghiệp, thân thiện hoặc súc tích. Tính năng hiệu đính sẽ kiểm tra ngữ pháp, cấu trúc câu và chính tả, trong khi chế độ tóm tắt cho phép tổng hợp nội dung dưới dạng gạch đầu dòng hoặc kẻ bảng.
iOS 18.1 cũng nâng cấp trợ lý Siri với hiệu ứng mới, cho phép nhấn 2 lần vào nút Home ảo để nhập câu lệnh nếu không muốn dùng giọng nói.
Bản thân giọng nói của Siri cũng trở nên tự nhiên hơn. Công cụ này có thể nắm bắt câu lệnh khi người dùng nói vấp và duy trì ngữ cảnh sang câu kế tiếp. Trợ lý cũng hỗ trợ truy vấn hướng dẫn sử dụng thiết bị Apple.
 |
Tính năng viết lại và hiệu đính văn bản trong Apple Intelligence. Ảnh: Apple. |
Ứng dụng Ảnh (Photos) trên iOS 18.1 có 3 tính năng mới. Đầu tiên, người dùng có thể tìm ảnh, video bằng cách mô tả theo ngôn ngữ tự nhiên. Tiếp theo là công cụ Dọn dẹp (Clean Up), có thể xóa vật thể không mong muốn bằng AI. Cuối cùng, chế độ Kỷ niệm (Memory) cho phép tạo video bằng mô tả.
Trong ứng dụng Mail và Tin nhắn (Messages), Apple Intelligence mang đến 2 tính năng gồm Priority Messages, ưu tiên hiển thị các email cần xử lý gấp, chẳng hạn như lời mời ăn trưa trong ngày hoặc thẻ lên máy bay.
Khi xem hộp thư, người dùng có thể đọc email được tóm tắt, hoặc sử dụng công cụ riêng trong từng email. Ngoài ra, Smart Reply sẽ gợi ý nội dung trả lời, phân tích câu hỏi trong mail để đảm bảo không bỏ sót.
Apple Intelligence cũng hỗ trợ tóm tắt thông báo, cho phép cập nhật nhanh các thông báo liên tục như tin nhắn từ nhóm chat, tin tức... Tính năng Tập trung (Focus) bổ sung chế độ Giảm gián đoạn (Reduce Interruptions), có thể phân tích và chỉ tóm tắt những thông báo cần xử lý sớm.
 |
Tính năng mô tả để tìm ảnh và ghi âm/tóm tắt cuộc gọi trong Apple Intelligence. Ảnh: Apple. |
Người dùng có thể ghi âm cuộc gọi/ghi chú rồi chuyển thành văn bản hoặc tóm tắt. Nếu ghi âm cuộc gọi, người tham gia sẽ tự động được thông báo. Khi cuộc gọi kết thúc, Apple Intelligence cũng tạo bản tóm tắt nội dung chính.
Apple cũng hé lộ một số tính năng AI tiếp theo. Dự kiến phát hành vào tháng 12, iOS 18.2 mang đến nhiều công cụ mới như tạo ảnh (Image Playground), tạo emoji (Genmoji), tích hợp ChatGPT và Visual Intelligence cho iPhone 16.
Đến năm 2025, Apple dự kiến bổ sung chế độ thông báo ưu tiên (Priority Notifications), Siri sẽ có khả năng nhận biết nội dung trên màn hình và điều khiển ứng dụng.
Về ngôn ngữ, Apple Intelligence sẽ mở rộng sang tiếng Anh tại Australia, Canana, Ireland, New Zealand, Nam Phi và Vương quốc Anh từ tháng 12. Những ngôn ngữ khác sẽ được hỗ trợ từ tháng 4/2025 và bổ sung dần đến cuối năm sau, trong đó có tiếng Việt.
Những câu chuyện bên trong Apple
Văn hóa bí mật luôn là một điểm đặc biệt của Apple. Cuộc đời Steve Jobs, Tim Cook và quá trình sáng tạo những sản phẩm quan trọng như iPhone thường chỉ được tiết lộ qua những trang sách, nơi các tác giả dành nhiều năm để mang tới những câu chuyện hấp dẫn
" alt="Apple Intelligence chính thức phát hành"/>
Apple Intelligence chính thức phát hành

OpenAI đã gần chạm đến cột mốc mới. Hồi tháng 9, startup này hoàn thành vòng đào tạo đầu tiên cho Orion, mô hình trí tuệ nhân tạo được kỳ vọng vượt qua nhiều phiên bản trước đây và kể cả con người.
Tuy nhiên, nguồn tin của Bloombergcho biết Orion hoạt động chưa hiệu quả. Trong đợt thử nghiệm cuối mùa hè, mô hình này không trả lời tốt yêu cầu viết mã chưa được đào tạo. Nhìn chung, Orion chưa quá vượt trội so với GPT-4 hay GPT-3.5.
Sau nhiều năm trình làng các sản phẩm AI tiên tiến với tốc độ chóng mặt, nhiều công ty lớn trong ngành đang ghi nhận lợi nhuận giảm, còn chi phí phát triển mô hình tăng vọt.
Không chỉ OpenAI, phiên bản Gemini sắp ra mắt của Google chưa đáp ứng kỳ vọng nội bộ, trong khi Anthropic cũng lùi ngày phát hành mô hình Claude 3.5 Opus.
"Bong bóng AGI đang vỡ một chút"
Các công ty AI đang đối mặt một số thách thức. Ngày càng khó để tìm dữ liệu đào tạo chất lượng cao do con người tạo ra, chưa được khai thác nhằm xây dựng hệ thống AI tiên tiến. Trong khi đó, các nâng cấp nhỏ lẻ chưa đủ biện minh chi phí khổng lồ nhằm xây dựng và vận hành mô hình.
Theo nguồn tin nội bộ, OpenAI đã đưa Orion vào quy trình hậu đào tạo. Đây là giai đoạn nhận phản hồi và tinh chỉnh trước khi phát hành công khai. Tuy nhiên, OpenAI vẫn chưa hài lòng để phát hành rộng rãi mô hình, ít nhất đến đầu năm sau.
Đây là vấn đề mới tại Thung lũng Silicon những năm gần đây, đặc biệt sau khi ChatGPT ra mắt. Các công ty AI chật vật chạy theo "luật tỷ lệ" (scaling laws), trong đó sức mạnh tính toán, dữ liệu và mô hình lớn được kỳ vọng mở đường để AI ngày càng mạnh mẽ.
 |
CEO Sam Altman của OpenAI. Ảnh: Bloomberg. |
Tình trạng khó khăn cũng đặt dấu hỏi về mục tiêu tạo ra AI tổng quát (Artificial General Intelligence) mà các công ty theo đuổi.
Thuật ngữ này đề cập hệ thống AI giả định, có thể sánh ngang hoặc vượt trội con người trong những tác vụ vận dụng trí óc. Trước đây, lãnh đạo OpenAI và Anthropic cho rằng AGI có thể chỉ cách chúng ta vài năm nữa.
"Bong bóng AGI đang vỡ một chút", Margaret Mitchell, nhà khoa học đạo đức tại startup Hugging Face, cho biết. Bà nhấn mạnh cần có "các phương pháp đào tạo khác nhau" để mô hình AI hoạt động tốt với nhiều nhiệm vụ.
Trả lời Bloomberg, phát ngôn viên Google DeepMind cho biết công ty "hài lòng với quá trình xây dựng Gemini" và sẽ "chia sẻ thêm khi chúng tôi sẵn sàng". Trong khi đó, OpenAI và Anthropic đều từ chối bình luận.
Xây dựng AI ngày càng phức tạp
Công nghệ sau ChatGPT và nhiều chatbot AI xoay quanh dữ liệu đào tạo gồm các bài đăng trên mạng xã hội, bình luận online, sách và các thông tin khác trên Internet.
Theo Bloomberg, bộ dữ liệu trên vừa đủ để tạo ra sản phẩm biết làm thơ hay viết văn. Tuy nhiên, việc xây dựng hệ thống AI với trình độ cao hơn có thể cần nhiều nguồn dữ liệu, không chỉ Wikipedia hay YouTube.
 |
Thời gian ra mắt một số mô hình AI lớn. Ảnh: Bloomberg. |
OpenAI đã hợp tác các nhà xuất bản để sử dụng nguồn dữ liệu chất lượng cao, đồng thời giải quyết một số áp lực pháp lý ngày càng tăng từ giới xuất bản và nghệ sĩ về bản quyền dữ liệu.
Một số công ty còn tuyển dụng người có bằng sau đại học để dán nhãn dữ liệu liên quan đến ngành học, giúp cải thiện phản hồi từ chatbot khi truy vấn một số chủ đề nhất định.
So với dữ liệu từ web, các công việc trên đòi hỏi thời gian và chi phí cao hơn. Các công ty công nghệ còn dùng dữ liệu tổng hợp (synthetic), gồm văn bản/hình ảnh tạo bởi máy tính nhằm mô phỏng nội dung của người thật, song vẫn còn một số giới hạn.
"Điều này nhằm nhấn mạnh chất lượng và tính đa dạng của dữ liệu thay vì số lượng.
Chúng tôi có thể tạo ra lượng lớn dữ liệu tổng hợp, nhưng lại gặp khó trong việc tạo bộ dữ liệu độc đáo, chất lượng cao mà không có sự hướng dẫn của con người, đặc biệt trong vấn đề ngôn ngữ", Lila Tretikov, Giám đốc Chiến lược AI tại New Enterprise Associates, cho biết.
 |
CEO Dario Amodei của Anthropic. Ảnh: Bloomberg. |
Dù vậy, các công ty AI vẫn theo đuổi chiến lược "càng nhiều càng tốt". Để xây dựng sản phẩm AI trình độ ngang con người, họ tìm cách tăng sức mạnh tính toán, lượng dữ liệu và thời gian đào tạo, khiến chi phí đội lên.
Theo Amodei, các công ty có thể mất 100 triệu USD để đào tạo mô hình tiên tiến nhất trong năm nay, nhưng vài năm tới số tiền có thể lên đến 100 tỷ USD.
Cách tiếp cận khác
Một dấu hỏi khác đang trở thành tâm điểm tại Thung lũng Silicon. Vào tháng 3, Anthropic ra mắt 3 mô hình mới, khẳng định tùy chọn mạnh mẽ nhất (Claude Opus) vượt trội GPT-4 và Gemini trên một số thang chấm điểm (benchmark), chẳng hạn như lý luận cấp bậc sau đại học.
Trong vài tháng tiếp theo, Anthropic cập nhật 2 mô hình Claude nhưng không phải Opus. Đến tháng 10, một số nhà phân tích nhận thấy thông tin về 3.5 Opus, gồm thời điểm ra mắt đã bị xóa khỏi website Anthropic.
Tương tự đối thủ, Anthropic đang gặp khó trong việc phát triển Claude 3.5 Opus. Sau khi đào tạo, công ty đánh giá mô hình hoạt động tốt hơn phiên bản cũ, nhưng không nhiều như mong đợi khi xét quy mô và chi phí phát triển.
Đại diện Anthropic cho biết lý do xóa một số thông tin về 3.5 Opus đến từ thay đổi trong khâu marketing, chỉ hiển thị các mô hình đã phát hành và được benchmark.
Khi được hỏi liệu Opus 3.5 có ra mắt trong năm nay hay không, phát ngôn viên Anthropic dẫn lại lời của CEO Dario Amodei trong một podcast ngày 11/11, nói rằng công ty vẫn có kế hoạch phát hành mô hình nhưng từ chối tiết lộ thời gian cụ thể.
 |
Đại diện Google giới thiệu một số cải tiến cho mô hình Gemini. Ảnh: Google. |
Các công ty cũng tranh cãi về khả năng tiếp tục vận hành hoặc nâng cấp mô hình AI cũ, trong bối cảnh mô hình mới quá tốn kém nhưng hiệu quả có thể không vượt trội.
Hồi tháng 8, Google cập nhật mô hình Gemini với khả năng tạo ảnh con người. OpenAI cũng tập trung một số bản cập nhật, chẳng hạn như nâng cấp tính năng trợ lý giọng nói, giúp người dùng tương tác trôi chảy hơn với ChatGPT.
Gần đây hơn, OpenAI ra mắt bản thử nghiệm của mô hình tập trung lý luận o1. Google cũng đang nghiên cứu cách tiếp cận tương tự cho Gemini, tập trung nâng cấp cách xử lý truy vấn và phản hồi theo thời gian.
"Tất cả mô hình đã trở nên khá phức tạp, và chúng tôi không thể song song phát hành nhiều thứ như mong muốn", CEO Sam Altman chia sẻ trong chuyên mục Ask Me Anything trên Reddit. Ông thừa nhận OpenAI đối mặt "rất nhiều hạn chế và quyết định khó khăn" để sử dụng nguồn lực tính toán hiện có.
Altman tiết lộ OpenAI dự kiến ra mắt "một số sản phẩm rất tốt" vào cuối năm nay, nhưng sẽ không có GPT-5. Tương tự Google và Anthropic, OpenAI hướng người dùng đến công cụ AI hỗ trợ các nhu cầu sử dụng cụ thể, chẳng hạn như đặt vé máy bay, gửi email thay mặt người dùng.
Những câu hỏi chúng ta phải đối mặt trong thế giới AI
Chúng ta có rất nhiều câu hỏi về thế giới AI, mà đó đều là những nghi hoặc không dễ có ngay đáp án.
Cuốn sách Thời đại AI - Và tương lai loài người chúng ta trình bày cách AI làm thay đổi mối quan hệ của chúng ta với tri thức, chính trị và xã hội. Mục tiêu tối thượng của cuốn sách này là giải thích về AI và cung cấp cho độc giả những câu hỏi mà chúng ta sẽ phải đối mặt trong những năm tới lẫn bộ công cụ để bắt đầu trả lời chúng.
" alt="Chuyện gì đang xảy ra tại OpenAI, Google"/>
Chuyện gì đang xảy ra tại OpenAI, Google